記事

仮説思考に基づかないビッグデータは単なる大量のデータです。 ‐ 村上知也

■データマイニングは宝探し!?


先日、見ていた夕方のニュース番組でビッグデータの活用について放送されていました。ビッグデータを活用するとこんなことがわかります、と、最初に出てきた例は、「夕方に おむつを買う男性はビールも買う」というものでした。

思わず飲んでいたビールを吹き出しそうになりました。ビックデータではなくて、データマイニングの事例ではないか・・・それも何年前、いえ、何十年前の事例でしょうか。

このデータマイニングの事例は、夕方頃、奥様に、「あなた!ぶらぶらしてないで、スーパーに行って子どものおむつでも買って来なさいよ!」と言われた男性は、仕方なく車でスーパーに行って、言われたとおりに買い物をします。でもせっかく来たのだから、自分のためにもビールくらい買っていこう、となるというものです。そのため、おむつとビールをスーパーの棚で並べて販売すると売上が増加しました。

おむつとビールが一緒に売れるとは、なかなか気づかない新しい視点だったといえるでしょう。このように、大量のデータを分析することで、今まで気づいていなかったことに気づき、売上がアップなどの成果が得られることが、データマイニングの目的といえます。

データマイニングのマイニングとは鉱山で採掘することを意味します。つまり、データマイニングは、山のようなデータの中から、役に立つ可能性のある貴重な情報を抽出することです。

しかしデータマイニングの成功事例として、このおむつとビール以外を見かけることはほとんどありません。簡単に貴重な金属を発掘できないのと同様に、大量のデータを分析さえすれば、なにか、新しい発見があるのではと考えることに無理があると言えるでしょう。

■ビッグデータの活用で、成果は出ているのか!?


そして時代は流れ、「ビッグデータ」がもてはやされています。では、ビッグデータにはどのような活用事例があるのでしょうか?

JALでは、28日前に予約するとチケットが安くなるという「先得チケット」を発売していますが、28日前を過ぎると、チケットの売上は急速に低下します。その後、お客様が直前期にチケットを購入して頂けるなら、割引なしで売れたと喜ぶところです。しかし、実際は、先得の期間を逃すと、旅行の日程自体を延期したり、チケットを購入しないお客様が多いことがわかりました。

そこで、28日前を逃さないため、割引になる実際の日付を大きく表示したり、いくらお安くなるのかの表示を大きく分かりやすくしました。その結果、チケットによっては売上が3倍になったものもあったそうです。

次に、JR東日本の子会社が2012年に発売したペットボトル入りのミネラルウォーターの「フロムアクア」は、2億件のビッグデータを用いて「移動中に飲む水」として商品開発されたとしています。フロムアクアはペットボトルの蓋がボトルとつながっており、蓋を落とさなくてすむ商品です。

フロムアクアの購買履歴を確認したところ、朝のラッシュ時間帯の購買が多いことが判明しました。さらに、居住エリア、購買エリア、時間帯別売り上げの3つの軸で分析した結果、「郊外居住者が朝の出勤前に乗車駅でフロムアクアを購入している」という購買行動がわかりました。その結果として、「移動中に飲みやすい水」を開発する必要が認識され、ペットボトルの蓋がとれないような商品が開発されたのです。

■仮説がないと、ビッグデータは価値を発揮できない


果たして、これらの事例はビッグデータの活用と言ってもいいでしょうか?総務省の情報通信白書では、ビッグデータとは、「事業に役立つ知見を導出するためのデータ」で、量的な特徴としては、数十テラバイトから数ペタバイトとしています。最近のパソコンのハードディスクでは1テラバイトを超すものも登場していますので、数ペタバイトというと、パソコンの数千倍の量のデータにあたります。両事例とも量的側面は満たしていそうです。

一方で、質的な特徴としては、「高解像、高頻度、多様性」が挙げられます。データを深堀りすることで更に分解でき(高解像)、リアルタイムで把握でき(高頻度)、数字情報だけではなくセンサー情報や画像・動画も含めて把握できることです(多様性)。

前述の2社の事例は、この3つの特徴を満たしていません。ビッグデータの定義に照らすとビッグデータの活用ではないと言えるでしょう。JR東日本の例では、2億件のビックデータを分析したと言っていますが、事前に仮説を立てれば、ビッグデータを集めなくても十分に商品開発可能ではないでしょうか。

仮説としては、次のようなことが考えられます。
「500mlのペットボトルの水を一気に飲み切ることは少ない。多くの人は一度に飲みきらず、ペットボトルを持ち歩く。」

この仮説が正しいかどうかを確かめるには、ビッグデータを活用せずとも、都市や郊外などいくつかの駅に調査員を派遣し、フロムアクアを購入した人にアンケートをかければ事足りたかもしれません。データを大量に集め、保管し、分析するにはお金がかかります。データを集める前にしっかり仮説立案しておけば、無駄にデータを貯める必要もなかったと言えるでしょう。

また、JALの事例でも、データを集め、検証する前に、「28日前の先得を逃した顧客は、そのままチケットを買わない」といった仮説を立てた上で、データを集めて検証したことでしょう。

重要なポイントは、2社とも、データを活用する前に仮説があって、その検証のためにデータを活用し、ビジネスにおいて十分な成果を出したことです。

とにかくたくさんの量のデータを集めて分析をすれば、なにか目新しい結果が見つかるという考えは捨てる必要があります。データを集める前に、仮説を立案することで、データを集める負荷は劇的に下がります。仮説が正しかったのかを検証するために、データは存在し、価値を発揮すると言えます。

はやりの言葉に踊らされず、自社や商品・サービスの状況に応じて仮説を立て、その上でのデータ収集・活用を進めていきたいものです。

《参考記事》
■ 理念経営を成功させたいのなら、朝礼での企業理念唱和は即刻中止しよう 
http://sharescafe.net/39989701-20140724.html
■ 仕事に「自己実現」を求めるな! 
http://sharescafe.net/35179535-20131127.html
■ デートの日に残業命令。残業を断って大丈夫!?: エンプロイメント・ファイナンスのすゝめ
http://blog.livedoor.jp/aoi_hrc/archives/31690024.html
■すき家の美しすぎる求人票と労働条件開示のあり方 
http://sharescafe.net/40287579-20140811.html
■起業家支援、女性活用など、成長戦略とは名ばかりの過干渉が国力衰退を招く
http://sharescafe.net/40159287-20140805.html

村上知也 中小企業診断士

あわせて読みたい

「ビッグデータ」の記事一覧へ

トピックス

  1. 一覧を見る

ランキング

  1. 1

    何をやっても批判される「老夫婦とロバ状態」の日本

    内藤忍

    08月02日 11:52

  2. 2

    コロナはインフルエンザ程度?インフルエンザで死ぬかと思った24歳の時の話

    かさこ

    08月01日 09:14

  3. 3

    コロナ軽視派「6月で感染者数減少」予想大ハズレも、重症者数が大事、死亡者数が大事とすり替え

    かさこ

    08月02日 10:29

  4. 4

    「幻の開会式プラン」を報じた週刊文春が五輪組織委の"圧力"に負けずに済んだワケ

    PRESIDENT Online

    08月02日 10:36

  5. 5

    新型コロナ感染者数が過去最多も 病院のひっ迫状況を強調するだけの尾身茂会長に苦言

    深谷隆司

    08月01日 17:19

  6. 6

    日産の小さな高級車「ノート オーラ」に中高年の支持が集まる理由

    NEWSポストセブン

    08月02日 10:43

  7. 7

    男性視聴者の眼福になっても女子選手が「肌露出多めのユニフォーム」を支持する理由

    PRESIDENT Online

    08月02日 15:27

  8. 8

    この1週間を凌げば、オリンピックが終わります。もうしばらく我慢しましょう

    早川忠孝

    08月02日 14:37

  9. 9

    在宅勤務で生産性低下した国は日本だけ? 背景に対面コミュニケーション依存の働き方

    非国民通信

    08月02日 15:12

  10. 10

    「日本人の給料はなぜ30年間上がっていないのか」すべての責任は日本銀行にある

    PRESIDENT Online

    08月01日 16:13

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。