記事

AIが自分で書いた日本語記事「1148字」

1/2

AIはどこまで職を奪うのか。メガバンクでは人員削減を発表している。明日はわが身か。プレジデント誌編集部は鬼の形相で電気通信大学をたずねた。

■AIは取材して記事を書く「記者」の仕事を奪うのか?

空前の人工知能(AI)のブームが到来している現在。チェスや将棋、囲碁で人間を負かすだけにとどまらず、AIはさまざまなビジネスの現場で人の仕事を代替しはじめている。

その波は、活字業界にも。海外では米紙「ワシントン・ポスト」が2016年からAI記者を本格的に選挙報道に活用しはじめ、国内でも日本経済新聞社がAIを活用した決算サマリーの配信を17年より開始している。

では、AI記者が『プレジデント』の記事を書いたらどうなるのか。アイドルの楽曲の作詞を行うAIを開発して注目を集めた電気通信大学大学院・坂本真樹教授の研究室に、プレジデントらしい記事を簡易的なAIで自動生成してもらった。テーマは、日々の動向に注目が集まるこの人、米・トランプ大統領。プレジデント誌でも彼のワイルドな行動を逐一、記事にさせていただいてきた。

▼AI記者が書いた! 「米・トランプ大統領」
※この記事はAIが書きました。ページ構成や写真の選択などは編集部員が担当しています。

トランプがこのままどんどん実行していくと、世界の終わりがやってきてもおかしくない

トランプは海外に渡った仕事をアメリカに戻すと言っているが、どれだけツイートをしても減税をしても戻ってこない。

米国には間違いなく減税が必要ですし、過去7年ほど衰退し続けて今やすっかりお粗末になってしまったインフラも再構築されるべきなので、本当に実行できるのであれば素晴らしい。もしこれが実現すれば、「トランプ相場」はさらに上昇し、その状態がしばらく続くと思われるので、この点に市場の期待が集まっています。

AFLO=写真

実際、トランプ氏が勝つとは誰も思っていませんでしたし、その後ここまで株価が上がることを予測していませんでした。これまで投資に消極的だった人もトランプ経済のスタートに合わせて、本腰を入れようと考え始めているかもしれない。

公約に掲げたことをほんとうに実行したら、米国も世界も深刻な問題を抱えることになります。アメリカ大統領が持っている権力と、時代の雰囲気をつくり出す能力は今なお大きく、我々が時代の1つの転換点に立っていることは間違いない。いたるところで破壊が起きているとトランプは言った。

これはただの私の希望だが、あのときのようにトランプも再交渉し、最終的にはアジアとアメリカ経済の統合が進展する機会が失われないことを望んでいる。「中国はTPPに裏口から入ってくる」とトランプは牽制してきた。

為替相場には、円安の後には円高になる「中心回帰性」があり、今まで円安に振れすぎていました

日本が円安誘導をしていると批判していただけに、この会談結果に、日本国内では円安ドル高基調が続くとの観測も多い。トランプが勝った後に円安になったのは日本経済にプラスでした。むしろ今は、トランプ氏の選挙中の発言から多くの人が『ドル買いに動くだろう』と予測し、実際にドル高円安に動いたことによって企業業績へのメリットがクローズアップされ、日経平均も上がっているというだけのこと。

トランプ政権への期待先行で日経平均が上がりすぎている感があるので、2万円以上はあっても一時的。長い目で見て2019年は円安トレンドが続く、というのが私の予測。ただし、米企業が国外で保有する約3兆ドルを国内に還流させるつもりだと、トランプ氏は言っています。

方向転換があれば円高に傾き、日経平均がガクッと落ちることも考えられます。足元はトランプ新政権への期待感から、米国株高、ドル高・円安が急速に進行しており、輸出企業を中心に業績の上方修正が期待されます。

その結果として、当初から高くなかった支持率は、直近の世論調査では40%前後と、さらに低下している状況だ。一連の相場は期待先行で、そう長くは続かないとの見方もあるが、個人投資家の中には、相場に出遅れて焦っている人も多いはずだ。

■AIが勝手に書いた「1148字」の衝撃の中身

世界の終わりがやってきてもおかしくない――。冒頭から終末予言のようなフレーズが登場。AIはどのようにしてこの文章を自動生成したのか、仕組みについて坂本教授に聞いた。

坂本真樹●電気通信大学大学院 情報理工学研究科 情報学専攻教授 東京大学大学院総合文化研究科言語情報科学専攻博士課程修了。言葉と感性の結びつきに着目した文系的な現象を、理工系的観点から分析し、人工知能に搭載することが得意。

「まず、いただいた『プレジデント』の1年分の記事のテキストデータをAIに“理解”させます。AI、つまり機械にとって文章はただの文字の羅列です。例えば、『ターゲット』という言葉は『タ』『ー』『ゲ』『ッ』『ト』。これを、『ターゲット』という意味のまとまりで区切るために、形態素解析(最小の単語単位に分解すること)をします。形態素解析は、AIに“言葉の辞書”を渡す作業とも言えます」

文字の羅列を言葉として理解したAI。次は文章作成かと思いきや、その前に文章の構造を「学習」させる必要があるという。

「人間も赤ちゃんにいきなり記事を書けと言っても無理ですよね? それと同じことです。AIに『プレジデント』の文章の特徴とルールを学習させるんです。AIに学習させる手法として今ホットなのはディープラーニングという4層以上のニューラルネットワーク(人間の神経回路網を人工ニューロンという数式的なモデルで表現したもの)なのですが、それが扱うのは10万記事くらいの大量のデータ。今回はデータ量が少なかったので、2層のニューラルネットワークを組み、いわゆる『教師あり学習』を行いました」

教師あり学習とは、機械に例題と正解のデータをペアで与えて、データの特徴やルールを学習させる機械学習のこと。AIが『プレジデント』の記事の特徴を学んだところで、いよいよ文章作成だ。まず、学んだ記事の中から“文章の材料”を抽出する。

■AIはどうやって日本語の文を構成するのか

「『トランプ』を含む文章と、その前後の一文を収集します。前後の一文も入れないと、『トランプは……』『トランプが……』とトランプを主語にした文が並ぶ不自然な文章が生成されてしまうからです。結果として、635文が収集できました。それを単語ごとにバラバラにして、100次元という大規模な空間上に配置します。任意の単語間には『意味的距離』が存在し、意味的に関連の強い単語がより近くに配置されます」

「意味的距離」を説明する坂本教授。

“意味的な近さ”は、文字通り意味が近いということではなく、ターゲットとなる単語と一緒に現れる頻度が高い、また文中におけるその単語との「距離」が近い、ということなのだそう。

「『Today is a very beautiful day』という文があったとします。『very』がターゲットの単語だとすると、そこから『a』と『beautiful』は1つ離れていて、『Today』は3つ離れている。これも『距離』と捉えます。今回は『トランプ』という単語をターゲットに、“言葉の意味空間”をつくりました」

文章の素ができたら、それらを並べる作業を行う。AIにとって文章を“書く”作業だ。

「まずは、先頭にくる文節をランダムに決定します。それと意味の近い文節を、意味の近い順に並べていき、文章を自動生成します」

これまでの工程で行ってきたことの複雑さに比べたら、とてもシンプルな手法に思える。これで、あれだけ自然な文章がつくれるとは驚きだ。しかし、よくよく読んでいくと、文体が乱れているうえ、文章の後半になるほど文のつながりが不自然になっている。

「今回は簡易的につくっているので文体がバラバラですが、ですます調・である調などの調整は可能です。また、2層のニューラルネットワークでつくっているため、文の展開が直前の文に依存するシンプルなつくりになっていますが、ディープラーニングを用いれば、全体の文脈を考慮したより自然な文章をつくることが可能です」

あわせて読みたい

「AI」の記事一覧へ

トピックス

ランキング

  1. 1

    社長辞任 勝者なき大塚家具騒動

    企業法務戦士(id:FJneo1994)

  2. 2

    橋下氏「否決なら住民投票無効」

    橋下徹

  3. 3

    堀江氏 餃子店1千万円支援に苦言

    女性自身

  4. 4

    安倍待望論も? 菅首相は裏方向き

    早川忠孝

  5. 5

    年末年始「17連休案」空振りの訳

    BLOGOS しらべる部

  6. 6

    誤報訂正せず 毎日新聞社に疑問

    音喜多 駿(参議院議員 / 東京都選挙区)

  7. 7

    仏再封鎖 医師「PCR数凄いのに」

    中村ゆきつぐ

  8. 8

    ソニー好決算 PS4や「鬼滅」も

    片山 修

  9. 9

    JTBがGoToトラベルの情報を独占

    文春オンライン

  10. 10

    JALの旅行前検査 医師が「ムダ」

    中村ゆきつぐ

ランキング一覧

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。