記事
- 2011年10月06日 08:00
乱立するネット視聴率、それぞれの長所と短所
世論調査のように調査集団を構成して調査する方法と
国勢調査のように全員を調べる方法。
ネット視聴率でも使われるこれらの方法には
それぞれ一長一短がある。
前回、ネット視聴率の調査方法には、少なくとも3通りの方法があって、それぞれ結果が違い、混乱していると書いた。ネット経済のもとになる「通貨」としてきちんと機能していないというわけだった。
3通りというのは、
①調査対象者を選んで調査対象集団(パネル)を構成して調査する方法
②サイトのサーバーに残るアクセス・ログを調べる方法
③大手ネット接続業者の持っているデータを使う方法
の3つだった。
②のサーバーを調べる方法は、国勢調査のように対象すべてを調査するわけだから正確そうに思える。しかし、調査の詳しさでは、①の調査パネルを構成する方法がまさっている。
①の場合は、調査者の詳しい属性までそなわったデータも得られる。性別や年齢、年収などを登録してもらっておけば、属性ごとの利用行動がわかる。
サイトの広告主向けページを見ると、われわれのサイトの利用者は年収がこれこれで高所得層が多い(つまり消費者として有望)などといったデータが載っていることがある。こうしたデータは①のパネル方式の調査から得ている。どの記事のどこまで読んだということまで把握している場合もあるらしい。
②のサーバーのアクセス・ログでも、どのサイトから来てどの記事を何分見ていたかといった行動や、OSは何でどのブラウザを使っているか、あるいはどのあたりに住んでいるといったことはわかるが、①ほど詳しくはわからない。
①の調査パネル方式にはこのような長所があるが、もちろん欠点もある。
こうした調査では、対象者のコンピューターに、クリックが記録されるソフトをインストールしてもらう。家庭と仕事場の両方のコンピューターからのアクセスを調べていることになっているが、仕事先のコンピューターにインストールするのはいやがられ、仕事場からの利用者数が少なくなっているのではないかと、調査パネル方式を疑っているサイトは見ている。
たとえばウォールストリートジャーナルなどは、日中、会社で読んでいる人が多いと考えられる。だから、パネル方式では正しい結果が得られていないのではないかと疑っていると、前回も少し紹介した米コロンビア大学ジャーナリズム・スクールのネット視聴率調査に関するレポートは伝えている。
また、承諾した人だけを調査するのでは、ランダムに選んでいるとは言えず、適切に調査対象者を抽出していないという批判があることもこのレポートは指摘している。
一口に「利用者数」といってもその定義はさまざまだ。
利用者数はふつう「ユニーク・ユーザー」を指している。ユニークというのは「唯一の」といった意味だ。同じ人がアクセスするたびに数えていたのでは正確な利用者数はわからない。だから同じ人がサイトに複数回アクセスしても1人として数えている。
「同じ人が」と書いたが、少なくとも②のサーバー方式では、じつは人の数ではなくて、アクセスしてくるコンピューターの台数を数えている。
アクセスしてきたコンピューターには「クッキー」という小さなソフトが送りこまれる。次にアクセスしてきたときにこの「クッキー」を調べて以前(しばしばその月に)アクセスしてきていれば数に入れない。このようにして「ユニーク・ユーザー」を数えている。
正確な数が得られそうだが、ここに弱点がある。
一台のコンピューターを家族で共有していてそれぞれがアクセスしてきても1人としか数えないし、また逆に、1人で何台ものコンピューターを持っていたり、クッキーを削除してしまった場合も、新規のユーザーとして数えてしまう。
さらにサイトにアクセスしてくるのは人間だけではない。
「ボット」と呼ばれるソフトを使ったアクセスもある。その目的はさまざまで、サーバーへの攻撃といった穏やかでない場合もあるし、検索エンジンもデータ集めにボットを送っている。「利用者数」というならボットのアクセス数は除く必要がある。
このレポートによれば、アメリカでは広告やウェブ解析の団体が「それではおかしい。『人の数』を調べるべきだ」と言い出したという。一見、正論だが、コンピューターの台数を数えているサイトと人の数を数えているサイトが混在すれば、比較はできない。
また、了解を得て調査している①のパネル方式はともかく、②のサーバー方式で人を特定し始めれば、プライバシーの問題も生じてくる。
前回、いろいろなところがネット視聴率のデータを取得し、データの種類も豊富なことが価値尺度の形成をむずかしくしていると書いたが、より正確な調査をしようという「善意」が激しい議論を呼び起こし、多様な解釈が生まれて混沌とした状況を形作っているわけだ。
さて、このようにそれぞれの調査方法には一長一短があるわけだが、①のパネル方式を採用していたニールセンもコムスコアも、「ハイブリッド方式」を採用し始めたという。
これは①と②をあわせて用いる方法で、従来のパネル方式に加え、ウェブサイトのコンテンツにタグを付けておき、そのタグが表示されたかどうかを把握することで「包括的な統計ベースの測定指標」を得て「デジタル領域の全体像の把握に努め」る(ニールセン・ネットレイティングス)と説明している。
コムスコアもこれによって「cookieの削除やcookieのブロック/拒否などの変数に影響を受けないオーディエンスへのリーチを計算できるようになっています」などと、同様の方式を採用したことを明らかにしている。
しかしどういうわけかニールセンは、日本ではまだ開始していないとサイトで明かしている。
がんがん文句を言った国が優先されるということなのかもしれないが、ハイブリッド方式を採用した結果、利用者数は増大し、サイト側の主張する数字に近くなったというから、日本のサイト運営者も黙っているべきではないだろう。前回書いたように、視聴率はネット上の一種の「通貨」で、利用者数が増えれば広告収入に反映されるのだから。
ハイブリッド方式が採用されればサイト運営者はめでたしめでたしのようだが、ネット・アクセスの実態を知りたい人間にはかならずしもそうではないようだ。
ハイブリッド方式が適用されるためには、サイトの側にタグを埋めこんでもらう必要がある。先に書いたように、そうしてもらったサイトとそうでないサイトに大きなハンディが生まれるということならば比較はできない。ネット視聴率の混乱状況は少なくともまだしばらくは続くのだろう。
米コロンビア大学ジャーナリズム・スクールが昨年9月に出したレポート「ネット上の混乱――不完全な測定基準とデジタル・ジャーナリズムの未来(Confusion Online:Faulty Metrics and the Future of Digital Journalism)」(http://www.journalism.columbia.edu/page/633-confusion-online-faulty-metrics-the-future-of-digital-journalism/437)。
afterword
上のレポートは、パネルを維持するのは経費がかかるのでニールセンとコムスコアがひとつになる可能性もあるのではないかと予想している。その一方、パネル方式は古いやり方だということになって、サーバー方式を採用しているグーグル・アナリティクスが勝ち残ることもありうると指摘している。いずれにしても統合されていくのではないかと見ているわけだ。
(週刊アスキー「仮想報道」Vol.696)
国勢調査のように全員を調べる方法。
ネット視聴率でも使われるこれらの方法には
それぞれ一長一短がある。
世論調査方式の問題点
前回、ネット視聴率の調査方法には、少なくとも3通りの方法があって、それぞれ結果が違い、混乱していると書いた。ネット経済のもとになる「通貨」としてきちんと機能していないというわけだった。
3通りというのは、
①調査対象者を選んで調査対象集団(パネル)を構成して調査する方法
②サイトのサーバーに残るアクセス・ログを調べる方法
③大手ネット接続業者の持っているデータを使う方法
の3つだった。
②のサーバーを調べる方法は、国勢調査のように対象すべてを調査するわけだから正確そうに思える。しかし、調査の詳しさでは、①の調査パネルを構成する方法がまさっている。
①の場合は、調査者の詳しい属性までそなわったデータも得られる。性別や年齢、年収などを登録してもらっておけば、属性ごとの利用行動がわかる。
サイトの広告主向けページを見ると、われわれのサイトの利用者は年収がこれこれで高所得層が多い(つまり消費者として有望)などといったデータが載っていることがある。こうしたデータは①のパネル方式の調査から得ている。どの記事のどこまで読んだということまで把握している場合もあるらしい。
②のサーバーのアクセス・ログでも、どのサイトから来てどの記事を何分見ていたかといった行動や、OSは何でどのブラウザを使っているか、あるいはどのあたりに住んでいるといったことはわかるが、①ほど詳しくはわからない。
①の調査パネル方式にはこのような長所があるが、もちろん欠点もある。
こうした調査では、対象者のコンピューターに、クリックが記録されるソフトをインストールしてもらう。家庭と仕事場の両方のコンピューターからのアクセスを調べていることになっているが、仕事先のコンピューターにインストールするのはいやがられ、仕事場からの利用者数が少なくなっているのではないかと、調査パネル方式を疑っているサイトは見ている。
たとえばウォールストリートジャーナルなどは、日中、会社で読んでいる人が多いと考えられる。だから、パネル方式では正しい結果が得られていないのではないかと疑っていると、前回も少し紹介した米コロンビア大学ジャーナリズム・スクールのネット視聴率調査に関するレポートは伝えている。
また、承諾した人だけを調査するのでは、ランダムに選んでいるとは言えず、適切に調査対象者を抽出していないという批判があることもこのレポートは指摘している。
国勢調査方式の問題点
一口に「利用者数」といってもその定義はさまざまだ。
利用者数はふつう「ユニーク・ユーザー」を指している。ユニークというのは「唯一の」といった意味だ。同じ人がアクセスするたびに数えていたのでは正確な利用者数はわからない。だから同じ人がサイトに複数回アクセスしても1人として数えている。
「同じ人が」と書いたが、少なくとも②のサーバー方式では、じつは人の数ではなくて、アクセスしてくるコンピューターの台数を数えている。
アクセスしてきたコンピューターには「クッキー」という小さなソフトが送りこまれる。次にアクセスしてきたときにこの「クッキー」を調べて以前(しばしばその月に)アクセスしてきていれば数に入れない。このようにして「ユニーク・ユーザー」を数えている。
正確な数が得られそうだが、ここに弱点がある。
一台のコンピューターを家族で共有していてそれぞれがアクセスしてきても1人としか数えないし、また逆に、1人で何台ものコンピューターを持っていたり、クッキーを削除してしまった場合も、新規のユーザーとして数えてしまう。
さらにサイトにアクセスしてくるのは人間だけではない。
「ボット」と呼ばれるソフトを使ったアクセスもある。その目的はさまざまで、サーバーへの攻撃といった穏やかでない場合もあるし、検索エンジンもデータ集めにボットを送っている。「利用者数」というならボットのアクセス数は除く必要がある。
このレポートによれば、アメリカでは広告やウェブ解析の団体が「それではおかしい。『人の数』を調べるべきだ」と言い出したという。一見、正論だが、コンピューターの台数を数えているサイトと人の数を数えているサイトが混在すれば、比較はできない。
また、了解を得て調査している①のパネル方式はともかく、②のサーバー方式で人を特定し始めれば、プライバシーの問題も生じてくる。
前回、いろいろなところがネット視聴率のデータを取得し、データの種類も豊富なことが価値尺度の形成をむずかしくしていると書いたが、より正確な調査をしようという「善意」が激しい議論を呼び起こし、多様な解釈が生まれて混沌とした状況を形作っているわけだ。
解決策への模索
さて、このようにそれぞれの調査方法には一長一短があるわけだが、①のパネル方式を採用していたニールセンもコムスコアも、「ハイブリッド方式」を採用し始めたという。
これは①と②をあわせて用いる方法で、従来のパネル方式に加え、ウェブサイトのコンテンツにタグを付けておき、そのタグが表示されたかどうかを把握することで「包括的な統計ベースの測定指標」を得て「デジタル領域の全体像の把握に努め」る(ニールセン・ネットレイティングス)と説明している。
コムスコアもこれによって「cookieの削除やcookieのブロック/拒否などの変数に影響を受けないオーディエンスへのリーチを計算できるようになっています」などと、同様の方式を採用したことを明らかにしている。
しかしどういうわけかニールセンは、日本ではまだ開始していないとサイトで明かしている。
がんがん文句を言った国が優先されるということなのかもしれないが、ハイブリッド方式を採用した結果、利用者数は増大し、サイト側の主張する数字に近くなったというから、日本のサイト運営者も黙っているべきではないだろう。前回書いたように、視聴率はネット上の一種の「通貨」で、利用者数が増えれば広告収入に反映されるのだから。
ハイブリッド方式が採用されればサイト運営者はめでたしめでたしのようだが、ネット・アクセスの実態を知りたい人間にはかならずしもそうではないようだ。
ハイブリッド方式が適用されるためには、サイトの側にタグを埋めこんでもらう必要がある。先に書いたように、そうしてもらったサイトとそうでないサイトに大きなハンディが生まれるということならば比較はできない。ネット視聴率の混乱状況は少なくともまだしばらくは続くのだろう。
関連サイト
米コロンビア大学ジャーナリズム・スクールが昨年9月に出したレポート「ネット上の混乱――不完全な測定基準とデジタル・ジャーナリズムの未来(Confusion Online:Faulty Metrics and the Future of Digital Journalism)」(http://www.journalism.columbia.edu/page/633-confusion-online-faulty-metrics-the-future-of-digital-journalism/437)。
afterword
上のレポートは、パネルを維持するのは経費がかかるのでニールセンとコムスコアがひとつになる可能性もあるのではないかと予想している。その一方、パネル方式は古いやり方だということになって、サーバー方式を採用しているグーグル・アナリティクスが勝ち残ることもありうると指摘している。いずれにしても統合されていくのではないかと見ているわけだ。
(週刊アスキー「仮想報道」Vol.696)