記事
  • Willy

AKB48総選挙の結果を統計学で予測してみる

1/2
統計学+εといいつつ、統計ネタを全然書いていないのでこのへんで少し統計解析に触れてみよう。

海外から見ている日本の様子は、1に原発、2に原発、3、4がなくて、5にAKB48総選挙という感じなのでこの総選挙の結果を予測してみる。

アイドルの人気は刻一刻と変化する時間の関数だ。これはCDの売り上げや握手に並んだ人数といったもので測ることもできるがインターネットのトラフィック・データを用いると簡単に時系列にすることができる。Google はこうしたデータを「Google トレンド」としてデータ化している。例えば、今回の選挙の速報で上位5人に入ったアイドル達の検索件数は以下のグラフのようになっている。

リンク先を見る

なお縦軸は、インターネットでの総検索件数に対する該当キーワードの比率を数値化している。グラフは前田敦子の平均が1となるように標準化されているが標準化前のデータもダウンロードすることができる(ただし単位は不明)。

今回の総選挙を予測するために、まずは昨年(2010年)の選挙結果(上位13人)とインターネットでの検索件数を見てみよう(下図)。

リンク先を見る

速報での得票数と速報後の得票数の相関係数(*1)は 0.923 と非常に高くなっているが、投票締め切り直前の一週間(*2)の検索件数と合計得票数の相関係数も0.919 と非常に高くなっている(*3)。そこで、「速報での得票数」と「直前の検索件数」を二つのデータから、重回帰分析を用いて合計得票を説明する式を作る。得られた式は、以下の通りだ。

合計得票数 = 2.919×「速報での得票数」 + 601.4×「直前の検索件数」「直前の検索件数」は有意な変数とならなかったものの、予測力に関してはこのファクターを考慮した方がやや高いとの結果が得られた。

この式の右辺を今年のデータに当てはめて合計得票数を予測してみると、
結果は以下のようになる。


リンク先を見る

なお、直近のデータとしては5/27-6/2の一週間のデータを用いている。

トピックス

ランキング

  1. 1

    小室騒動招いた宮内庁の調査不足

    毒蝮三太夫

  2. 2

    不摂生後悔…堀ちえみガンと闘う

    渡邉裕二

  3. 3

    日本の信頼落とす中国パクリ企業

    メディアゴン

  4. 4

    大川長男 脱会原因は清水富美加

    文春オンライン

  5. 5

    24時間営業に固執 コンビニの闇

    猪野 亨

  6. 6

    よしのり氏 安倍首相は平和ボケ

    小林よしのり

  7. 7

    両陛下と秋篠宮さま 緊迫の90分

    女性自身

  8. 8

    全荷物を機内持ち込みにする利点

    内藤忍

  9. 9

    日本企業の英国撤退 次は韓国か

    早川忠孝

  10. 10

    ホンダ イギリス工場撤退の衝撃

    ヒロ

ランキング一覧

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。