記事

「景気は堅調」"店やタクシー"の声を解析

1/2

(三井住友アセットマネジメント シニアエコノミスト 渡邊 誠)

景気動向を把握するツールの一つとして、エコノミストや投資家に重宝されているのが、内閣府が毎月発表する「景気ウォッチャー調査」(街角景気指標)だ。

小売店や飲食店、タクシーなど、景気に敏感な現場で働く全国2050人の人々の景況感を集計し指数化したものだが、三井住友アセットマネジメントの渡邊誠シニアエコノミストは、指数とともに公表される回答者のコメントに着目。多量の文書をコンピューターで分析するテキストマイニングの手法を用い、どんなキーワードがよく登場するかという切り口から、より客観的な景気動向分析の可能性を探った。その結果は――。

■国が集めた地域・業種ごとの「リアルな声」

経済指標を見る限り、足元の景気は堅調である。一方で、回復感がないと感じる人も少なくないようだ。実際、人々は現在の景気をどう捉えているのか。

それを捉える試みの一つとして、景気ウォッチャー調査、いわゆる街角景気指標がある。全国11の地域を対象に、家計動向、企業動向、雇用等、代表的な経済活動の動向を敏感に観察できる業種の、適当な職種の中から選定した2050人の景況実感を調査し、それらを指数化したものだが、非常に面白いのが、同時にそれら調査対象者の景気判断の理由も取りまとめている点である。1~2行程度の簡単なコメントだが、毎月、景気の現状・先行きについてそれぞれ1000を超えるコメントが公表されている。

6月の調査では、「梅雨入り後も晴天が続き、衣料品や身の回り品に加え、お中元ギフトの受注も順調に推移しており、月末からのクリアランスセールにも期待がかかる。また、インバウンド売り上げも相変わらず好調である(近畿=百貨店)」などといったコメントが寄せられている。地域、業種ごとの特徴的かつリアルな声を拾うことができ、エコノミストの間では非常に重宝されている。

■2700コメント×3年6カ月分をコンピューターで分析

その一方で、現状・先行き合わせて2000を超えるコメントを毎月読み込み、街角の声を客観的に分析することは簡単な作業ではない。今回、街角の声をより客観的に分析する試みとして、「テキストマイニング」の手法を用い、景気判断についてのコメントを解析してみた。

「テキストマイニング」とは、テキスト(文書)をコンピューターで探索する技術の総称であり、その典型的な手法の一つが、テキストにおける単語の使用頻度を測定し、その特徴を統計的に分析・可視化することで、テキストの背後にある有益な情報を探るというものである。

テキストから単語の使用頻度を測定するには、文章を単語に区切る技術である形態素解析が必要だ。今回は、代表的な日本語形態素解析器である「MeCab」をベースにテキストを解析するパッケージ、「RMeCab」を用い、景気ウォッチャーのコメントから頻出キーワードとその使用頻度を抽出し、分析した。

※RMeCabの使用方法については、『Rによるテキストマイニング入門』(石田基広著、森北出版)、『Rによるやさしいテキストマイニング』(小林雄一郎著、オーム社)などが詳しい。

具体例を挙げよう。「梅雨入り後も晴天が続いたため、レジャー等が堅調だった」という例文をMeCabにかけると、図表1のような結果が出力される。「梅雨入り/後/も/晴天/が/続い/た/ため/、/レジャー/等/が/堅調/だっ/た」という形で文が区切られるが、これをRMeCabにかけると、スラッシュで区切られた後の各単語の使用頻度を測定することができる(品詞などの情報も付加される)。例文では、「た」(助動詞)という語が重複しているが、「た」の使用頻度は2という形で出力される。

例文では1文にとどめたが、複数の文から成る文書をまとめてRMeCabにかければ、その文書内で使われている単語全ての使用頻度が出力される。月ごとにコメントを集約してテキストファイルを作成すれば、時系列での比較も可能になるし、CSV形式で出力できるため、エクセルによる集計作業も容易だ。



■「不安」だけでなく「不透明」「不確実」なども確認

さて、本題に移ろう。今回、RMeCabを用い、景気ウォッチャーによる景気判断理由集の現状/先行きのコメント(それぞれ毎月約1300コメント/約1400コメント)について、時系列(期間は2014年1月~2017年6月、、以下の図表も同期間)に沿って、使用されている単語、及びその使用頻度のデータを抽出した。

ただし、MeCabは、全ての専門用語や固有名詞に完全に対応しているわけではなく、筆者に好ましくない形に単語を区切ってしまうケースもある。例えば、「マイナス金利」をMeCabにかければ、「マイナス」「金利」の二語として抽出されるし、「有機EL」は「有機」「E」「L」という形に分割されてしまう。このため、景気ウォッチャーに登場するこうした語についてはRMeCabで別途辞書登録し、筆者の意図する形で抽出されるようカスタマイズした。

その上で、抽出されたキーワードが文字通りの意図として使われているかを確認するため、複数の類義語・関連語の使用頻度との比較なども行った。例えば、将来への不安感を示す言葉としては、「不安」のほかにも、「不透明」「不確実」などの言葉が考えられる。「不安」だけでなく「不透明」「不確実」などの使用頻度もあわせて確認すれば、不安感の変化を捕捉する上で情報は補強されるだろう。

また、RMeCabで抽出されるのはあくまで単語とその使用頻度で、その単語が必ずしも肯定的に使われているかを示すわけではない。つまり、「不安」という言葉が、「不安である」という文脈で使われているか、「不安でない」という文脈で使われているかは識別できない。

そのため、上述のような類義語・関連語の使用頻度などとのクロスチェックに加え、その単語がどのような文脈で使われているかを観測するために、形態素の連なりであるNグラムの使用頻度もあわせて抽出した。Nグラムとは、ある単語がどのような単語との連なりの中で使われているかを観測するもので、例えば「期待」の後に「できない」が続いた場合には、「期待―できるーない」という3語から成るNグラムが作成される(Nは形態素の数で、N=3の場合、三つの語から成る連なりが抽出される)。

「期待」という語の使用頻度が増加しているときに、「期待―できるーない」というNグラムの使用頻度が同じような動きをしているのであれば、「期待」は必ずしもポジティブには使われていないことを意味する。

■強気の言葉と弱気の言葉、どっちが多い?

前置きが長くなったが、それでは実際に景気ウォッチャーのコメントをテキストマイニングすると、どのような結果が得られるのか。1カ月あたりのコメント数は、現状が1300コメント前後、先行きが1400コメント前後、そこで用いられる単語の数はおおむね45000語前後である。

その中には「が」「て」「に」「は」などの助詞、「。」「、」などの記号も多く含まれ、単純に使用頻度順にスクリーニングをかけると、こうした助詞や記号ばかりになってしまうが、RMeCabでは品詞情報も抽出されるため、品詞でスクリーニングすれば、こうした助詞や記号は簡単に排除できる。

しかし、名詞、動詞、形容詞などに絞っても20000語近くあるため、最終的にはエコノミストとして景気ウォッチャーのコメントを読み込んできた経験知を生かし、キーワードをいくつかのカテゴリーに分け、絞り込んだ上で、それぞれの使用頻度を時系列で観測した。
(RMeCabでは、テキストの量の影響を調整し、使用頻度を標準化することもできるが、わかりやすさを求める観点からも、以下では使用単語数をベースとして分析を進める)

まず重要なのが、景気の方向性を占うキーワードであろう。例えば、景気にポジティブなキーワードとしては、「好調」「好況」「回復」「改善」「拡大」「堅調」「順調」「持ち直す」「上向く」など、景気にネガティブなキーワードとしては「悪化」「苦戦」「減少」「縮小」「低迷」「低調」「停滞」「不振」「不調」など、景気に中立的なキーワードとしては「横ばい」「変わらない」「維持」「安定」などがある
(※「変わらない」はMeCabでは「変わら」「ない」の二語に分かれるが、使用頻度が多いため、筆者が別途辞書登録した)。

これらの景気の方向性を示すキーワードの使用頻度を合計し、合計に占めるポジティブな単語の比率、ネガティブな単語の比率、中立的な単語の比率を時系列で見たのが図表2である。

現状のコメントにおけるポジティブ・ネガティブ比率の動きを見ると、昨年4月以降、ネガティブ比率がポジティブ比率を上回っていたが、11月以降はポジティブ比率がネガティブ比率を上回っている。熊本地震の影響や英国の欧州連合(EU)離脱で低迷した後、昨年秋ごろから持ち直した実体経済の動きと整合的であり、景気ウォッチャーのコメントを分析することの有用性・意義は担保されたと言えるだろう。



トピックス

ランキング

  1. 1

    ダム決壊 韓国紙が東電に難癖

    tenten99

  2. 2

    本物?「三億円犯人」に直接取材

    BLOGOS編集部

  3. 3

    「考え方が甘い」時差Bizに指摘

    NEXT MEDIA "Japan In-depth"

  4. 4

    石田純一の改憲反対に感じた覚悟

    篠田博之

  5. 5

    秋篠宮さま 小室親子はもう他人

    女性自身

  6. 6

    那覇市長選 与党が敗北した要因

    田中龍作

  7. 7

    有休義務化 日本はやせ我慢社会

    自由人

  8. 8

    AI無人店舗は万引きの概念変える

    赤木智弘

  9. 9

    百田氏が憶測で沢田研二叩き謝罪

    女性自身

  10. 10

    誰もが美人? ハーフが苦しむ偏見

    ビデオニュース・ドットコム

ランキング一覧

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。