記事

「データ革命」は社会に何をもたらすのか?

今日の横浜北部は昼間晴れていたのですが、午後から曇ってきました。

さて、日本でもビッグデータの活用などが色々と話題になっておりますが、NYタイムズのブルックスがまたまた興味深いコラムを書いておりましたのでその要約を。

===

データの哲学
by ディヴィッド・ブルックス

●今日台頭している哲学は何かと聞かれたら、私は「データ主義」だと答えるだろう。われわれは大量のデータを集めることができるようになってきており、これはわれわれの文化面での前提になっている。

●この前提とは、「計測できるものはすべて計測されるべきであり、データというのは、われわれの感情主義やイデオロギーなどを排除することを可能にする、透明性があって信頼できるレンズである。未来予測などのように、データはわれわれに驚くべきことを可能にしてくれる」というものだ。

●私は今年から来年にかけて、「データ革命」が生み出した新たな問題について理解できるようになればと考えている。その問題とは、

―われわれはどのような状況でデータではなく、自分たちの直観を信じればいいのか?
―その反対に、どのような状況でデータのほうを信じればいいのだろうか?
―統計分析を使えばどのような種類の出来事が予測可能になるのだろうか?
―その逆の出来事はどのような種類のものであろうか?

●実際のところ、私はこのような問題については正直疑問をもっている。なぜならわれわれは全てを数値化できるという考え方に引きずられがちだからだ。

●しかしまず最初に、データが得意とする二つのことについては賞賛すべきであろう。

●第一に、データというのはわれわれの現実についての直観的な見方が間違っているということを指摘するのにとても役立つものだ。

●たとえばバスケットボールをしたことがある/よく見る人だったら、選手が神懸かり的に調子がいいときや、逆にジンクスにハマっている時を経験することはおわかりいただけると思う。ところがある研究者たちによれば、六回連続でペナルティ・ショットを決めた選手が次の七回目のシュートを決める確率は、六回連続で失敗した場合とまったく同じだというのだ。

●ある選手が六回連続でシュートを決めた場合、通常われわれはこの選手が「ツイている」と感じるものである。ところが実際このような「良い調子」というのも、コインの裏表を繰り返している際に出てくるのと同じような「統計上のランダムなノイズ」にすぎず、一回それぞれのシュートの成功率というのは、結局はその選手の生涯シュート率に集約されてくるのだ。

●同様に、選挙を戦おうとする人々は選挙資金が豊富であればあるほど当選の確率は高まると考えるものだ。ところがこれも大きく見れば間違っている

●たとえばアメリカの州や国政選挙におけるデータで判明しているのは、資金が豊富に使われているテレビ広告などはほとんど効果がないことがわかっている。

●2004年の選挙の後に政治学者たちは選挙CMの効果を計測しようとしたが、その結果判明したのは、もしある候補者が一つの選挙区で対立候補よりも資金を大量投入して千回多く(これはかなり大きな差だ)CMを流したとしても、たった0.19%しか獲得票は上がらなかったということだ。

●2006年の選挙の後では、ある研究者が現職の議員たちが選挙戦に使った資金と最終的に勝利した時の対抗候補との獲得票の差を調べているが、ここでも資金の量と大勝したかどうかという点にはほとんど有意が見られなかったのだ。

●2012年の5月から6月にかけて、オバマ側の選対本部は対抗候補であるミット・ロムニーにたいして巨額の広告キャンペーンを展開したが、ある政治学者のブログでは「この広告の効果は短期的なものであった」と言っている。

●同様に、教師の多くは生徒ごとに学習スタイルが違うと直観的に考えている。つまり口で説明するのが好きな子もいれば、視覚的な説明を好む子もいるし、線的/包括的なやりかたがいい子もいる。

●つまり教師たちはそれぞれの子にあったやりかたをすれば成績が上がると考えるものだが、これを支持するような統計結果は何もないのだ。

●第二に、データはわれわれの気付かない行動のパターンを浮かび上がらせてくれる。

●たとえば、私はいままで「私は」(I)という言葉を多く使う人というのは普通の人よりも自己中心的な性格っを持った人なのかと思っていた。

●ところがテキサス大学のジェームス・ペネベイカーは、人間は何かに自信を持っているときは目の間の仕事などに意識を集中するもので、自分たちのことについてはほとんど何も語らないものであると述べている。

●つまり立場の高い人で、しかも自信を持っている人々というのは「私は」という言葉を使うことは少ないのだ。

●ペネベイカーはニクソン元大統領の政権時代に録音されたテープを分析している。ニクソンは「私は」という言葉を政権前半ではあまり使っていないのだが、ウォーターゲート事件が問題になって自信を失ってきた後半では「私は」という言葉を多く使うようになっている

●ルディー・ジュリアー二元ニューヨーク市長も同じで、彼は現役の市長時代にはあまり「私は」という言葉を使っていないのだが、体調を崩してガンであることが判明して、しかも結婚生活が破綻した二週間の間には、「私は」という言葉を多用している。

●自信を持っているオバマ大統領は、現代の他の大統領たちと比べてもあまり「私は」という言葉を使ってはいない。

●われわれの脳は微妙な言葉のパターンについてはあまり気付かないものだが、ペネベイカーのコンピューターはそれに気付くことができるのだ。

●たとえば若い世代の著者たちは暗い言葉や過去形を文章の中で使うことが多いが、古い世代の著者たちはよりポジティブな未来形の言葉を使うことが多いという。

●また、嘘をついている人物というのは、元気で親しみのある言葉(“pal” や“friend” )を使うことが多く、その逆に否定句(but やexcept、それにwithout)をあまり使わないのだ。

●これはつまり嘘の話をしている際には見たことも考えたこともないことを交えて離すことは難しいということだ。

●われわれはビートルズのメンバーの中ではジョン・レノンが最も知性が高いと考えがちだが、実際はポール・マッカートニーの詩のほうが柔軟で多様性のある構成をもっていて、ジョージ・ハリスンの詩は最も知覚的に複雑なのだ。

●まとめると、データ革命はわれわれの現在と過去を理解するための素晴らしい手段を与えつつある。しかしこれが将来の予測につながるのかは、まだわからない。

===

そういえば最近は文学関係の調査研究でも、ある著者の文体は誰の影響を受けているということまでわかるようになっているという記事がどこかにありましたね。

たしかにこれって最近の社会の「思想」や「哲学」ですよね。

しかもこれがコンピューターの検索機能などをはじめとする「テクノロジー」の影響を色濃く受けているというところが肝でしょうか。

やはりテクノロジーは社会に、そして社会はテクノロジーに影響を与えるわけです。

あわせて読みたい

「ビッグデータ」の記事一覧へ

トピックス

  1. 一覧を見る

ランキング

  1. 1

    在宅勤務で生産性低下した国は日本だけ? 背景に対面コミュニケーション依存の働き方

    非国民通信

    08月02日 15:12

  2. 2

    男性視聴者の眼福になっても女子選手が「肌露出多めのユニフォーム」を支持する理由

    PRESIDENT Online

    08月02日 15:27

  3. 3

    何をやっても批判される「老夫婦とロバ状態」の日本

    内藤忍

    08月02日 11:52

  4. 4

    「幻の開会式プラン」を報じた週刊文春が五輪組織委の"圧力"に負けずに済んだワケ

    PRESIDENT Online

    08月02日 10:36

  5. 5

    コロナ軽視派「6月で感染者数減少」予想大ハズレも、重症者数が大事、死亡者数が大事とすり替え

    かさこ

    08月02日 10:29

  6. 6

    この1週間を凌げば、オリンピックが終わります。もうしばらく我慢しましょう

    早川忠孝

    08月02日 14:37

  7. 7

    中国が支配するディストピア 香港の大量国外脱出「英国だけでも5年で最大83万人超」予測

    木村正人

    08月02日 18:29

  8. 8

    ワクチンの効果が着実に出ている中での一律の行動自粛要請は不適切

    岩屋毅

    08月02日 11:28

  9. 9

    神奈川県で過去最多1686人の感染確認 6日連続1000人超

    ABEMA TIMES

    08月02日 20:24

  10. 10

    家庭環境の差が自由研究にも…小学校の「夏休みの宿題」に存在価値はあるか

    ABEMA TIMES

    08月02日 09:58

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。