記事

ビッグデータがジャーナリズムを生む日

近著『グーグル ネット覇者の真実画像を見る』も話題を集めたスティーブン・レヴィ氏が、WIREDに非常に面白い記事を寄稿しています。邦訳もいずれどこかに掲載されるはず、というよりして欲しい内容:

Can an Algorithm Write a Better News Story Than a Human Reporter? (Wired)

「アルゴリズムは人間の記者より優れた記事を書けるか?」というタイトルなのですが、もちろん現時点でロボット記者のような存在が実現しているわけではありません。しかし現実は、私たちが想像しているよりもはるかに先へ進んでいることが語られています。

実際にどれほどの記事を自動生成できるまでに達しているのか。文中の例を引用してみましょう:

Friona fell 10-8 to Boys Ranch in five innings on Monday at Friona despite racking up seven hits and eight runs. Friona was led by a flawless day at the dish by Hunter Sundre, who went 2-2 against Boys Ranch pitching. Sundre singled in the third inning and tripled in the fourth inning … Friona piled up the steals, swiping eight bags in all …

今週月曜日にフライオナで開かれた5回制の試合で、フライオナは7つのヒットと8点を奪ったが、ボーイズ・ランチに10対8で敗れた。フライオナはハンター・サンダーが辛抱強いピッチングを行い、ボーイズ・ランチ相手に2対2と粘っていたが、3回に一塁打、4回に三塁打を浴びた……フライオナは盗塁を重ね、合計で8点を奪った……

一読すれば明らかですが、これは野球、それもリトルリーグの試合について報じたもの。野球に関する特有の表現も使われていて、非常に「それらしい」記事にまとまっています。ネイティブの人が読んだらまた違った印象を受けるのかもしれませんが、試合の様子を把握することは十分に可能であり、ここまで出来るならすぐにでも「ロボット記者」を雇いたいというローカルメディアもあるのではないでしょうか。

ではいったい、どのような技術でこれを実現したのか。記事ではNarrative Scienceという企業が紹介されているのですが、同社のキャッチフレーズは「データを物語と発見に変える(We Transform Data into Stories and Insight)」。つまり試合に関する様々なデータを収集、それを独自のアルゴリズムに投入することで記事を生成するわけですね。

マイケル・ルイスの『マネー・ボール画像を見る』を引き合いに出すまでもなく、野球は様々なデータから計測・分析することが可能なスポーツです。どのようなデータを集めれば良いか、どう集めれば良いかについては既に確立された方式があり、それに従えばある程度まで試合全体をデータに置き換えることができます。実際に先ほどの記事は、試合を観戦していた親たちがiPhoneアプリ経由で入力したデータを基に生成されたものであるとのこと。しかも試合終了とほぼ同時に記事が出来上がっていたそうです。

というわけで、汎用的にどんな記事でも書いてしまうロボットができたわけではなく、あくまでも野球といった特定の状況で、あらかじめ与えられたデータを基に記事を生成するシステムができたという話。文章表現についても、本物のジャーナリストにお願いしてテンプレートを作ってもらったのだとか。しかし特化型のプログラムにせよ、十分なデータさえ得られる領域ならば、同じように記事を書かせることができる可能性があります。実際にこの技術は、他のスポーツやファイナンスといった分野への応用が進められているとのこと。

また仮に狭い範囲にしか応用できない技術であったとしても、それがもたらす可能性は大きいと言えるでしょう。例えばこのアプリを無料配布して、全米のリトルリーグやマイナーリーグで行われる無数の試合が記録できれば、「リトルリーグ・ニュースサイト」のようなものが低コストでできるかもしれません。データがベースになっているのなら、例えば「30年ぶりの珍プレー・好プレーが起きた」といったニュース性の高いネタを拾うのも簡単なはずです(過去の試合データが蓄積されていることが前提になりますが)。さらにある程度自動化できる分野はロボットに任せ、人間の記者はより社会性・重要性が大きなテーマを追うという役割分担もできるでしょう。

今年2月に米サンタクララで行われたビッグデータ系イベント"Strata 2012"の中で、「スポーツとAR」をテーマにしたセッションがありました。よくテレビのスポーツ番組で見られるような、実際のプレー映像と様々な統計データ・補足CGを合成するという技術を提供する企業・Sportvision社の関係者が登壇されたのですが、彼らが面白いことを言っていました。米メジャーリーグでよりAR的な手法を可能にするために、試合中のあらゆるデータを自動的に記録する(カメラやセンサ類などで)仕組みを開発、導入を進める計画なのだそうです。いろいろと政治的・感情的な理由もあって(映画版の『マネーボール画像を見る』をご覧になった方なら想像がつくでしょう)、一筋縄ではいかないそうなのですが、実現すればスポーツジャーナリズムにとっても画期的な一歩となるでしょう。そこで収集されたデータを前述のようなアルゴリズムにインプットすれば、ゲームセットと同時にたちまち記事の一丁上がり、になるわけですから。

そしてビッグデータの取り組みが今後様々な分野で進められてゆけば、ロボット記者が活躍する領域も広がってゆくはずです。過去の統計データが参照できるような領域であれば、人間の記者が気付かなかった状況変化や、将来の状況変化の予兆を読み取って記事にするといったケースも生まれてくるかもしれません(何しろネット上の情報からインフルエンザの流行や将来の株価が把握できるぐらいですから)。もちろんそれがジャーナリズムの全てになり、人間の記者が一切いらなくなるという事態が起きる可能性は低いでしょう。しかし例えば、先ほどのような試合終了と同時の速報はロボットに任せ、人間は時間をかけて選手一人ひとりの心理描写を駆使した記事を書く――などというという補完関係を実現するマスメディアがいずれ登場してくるのではないでしょうか。

画像を見る
グーグル ネット覇者の真実 追われる立場から追う立場へ画像を見る
スティーブン・レヴィ 仲達志

あわせて読みたい

「テクノロジー」の記事一覧へ

トピックス

  1. 一覧を見る

ランキング

  1. 1

    BLOGOSサービス終了のお知らせ

    BLOGOS編集部

    03月31日 16:00

  2. 2

    なぜ日本からは韓国の姿が理解しにくいのか 識者が語る日韓関係の行方

    島村優

    03月31日 15:41

  3. 3

    「いまの正義」だけが語られるネット社会とウェブ言論の未来

    御田寺圭

    03月31日 10:09

  4. 4

    カーオーディオの文化史 〜ドライブミュージックを支えた、技術の結晶たち〜

    速水健朗

    03月30日 16:30

  5. 5

    BLOGOS執筆を通じて垣間見たリーマンショック後10年の企業経営

    大関暁夫

    03月31日 08:27

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。