要約
人々の生の声をSNS等から収集するソーシャルリスニングとして、Google検索履歴やTwitter、YAHOO!知恵袋を用いて「リスク」のトレンドを定点調査しています。2020年3月の調査結果からは、このコロナウイルス蔓延のご時世に〇〇しても大丈夫か?という行動の可否の判断にとても高い情報ニーズがあることが浮かび上がってきました。
本文
グーグルの元データサイエンティストであるこの本の著者は、Googleの検索窓をデジタル自白剤と呼び、検索履歴のようなビッグデータを解析することで、いつどこでどんな悩みが増えているのかを明らかにできると主張しています。
リスクに関する人々の生の声を収集するには、アンケート調査がこれまで主に活用されてきました。こういう調査は「リスクコミュニケーション」という分野に位置づけられます。一方で、ツイッターなどのソーシャルメディアの会話等を分析するソーシャルリスニングという方法がマーケティングの分野で活用されるようになってきました。これをつかうと簡易に大量にデータを収集することが可能となり、今人々がどんなリスクに注目していたり不安を持っているか知ることができます。
ここではGoogle検索履歴やTwitter、YAHOO!知恵袋を調査対象として、定点調査として3月にどんな「リスク」に焦点があてられたかを分析してみました。
Google Trends
Google Trendsは、Google検索における特定のキーワードの検索数の推移や、一緒にどんなキーワードで検索されているか、などの検索履歴情報を調べることができるツールです。2020年3月の期間内で「リスク」と共にどんなキーワードが検索されているかを調べ、関連キーワードの注目度(検索数が増えたもの)トップ10を抜き出しました。トピックとはどんな分野かがわかるように私が手作業でタグ付けしたものです。
順序 | キーワード | トピック |
1 | コロナ 外食 リスク | コロナ |
2 | コロナ 外食 | コロナ |
3 | リスク オフ とは | 金融 |
4 | 温泉 コロナ | コロナ |
5 | リスク オフ | 金融 |
6 | リスクマネジメント とは | ビジネス |
7 | 全身 麻酔 リスク | 健康 |
8 | クレジット リスク | 金融 |
9 | リスクヘッジ とは | ビジネス |
10 | リスクヘッジ | ビジネス |
トップ1と2はコロナ関連で、外食することはコロナウイルスの感染リスクがあるのかどうかということ調べたかったと思われます。「温泉 コロナ」も同様で、温泉に行っても大丈夫かどうかを知るための検索だと思われます。〇〇しても大丈夫か、という判断基準は情報ニーズがとても高いということが浮かび上がってきました。また、コロナ以外にも金融やビジネス関連のリスクの検索も多くなっています。
YAHOO!知恵袋
YAHOO!知恵袋は、オンライン上で相談したり回答したりすることができるサービスです。質問するということは何かに悩んでいるわけですから、「リスク」を含む質問を抽出することで、人々がどのようなリスクに悩んでいるかを分析できます。2020年3月の期間内で「リスク」を含む質問のうち、閲覧数が多かったトップ10を抽出し、トピックと要約もやはり手作業で付けました。
順序 | カテゴリ | トピック | 要約 |
1 | 政治、社会問題 | コロナ | パチンコに行ってよいか |
2 | トレーニング | コロナ | スポーツジムに行ってよいか |
3 | 家族関係の悩み | コロナ | 孫を祖父母に会わせてよいか |
4 | カラオケ | コロナ | カラオケに行ってよいか |
5 | ニュース、事件 | コロナ | ライブに行ってよいか |
6 | 家族関係の悩み | コロナ | 孫を祖父母に会わせてよいか |
7 | 福祉、介護 | コロナ | デイサービスは大丈夫か |
8 | 政治、社会問題 | コロナ | パチンコに行ってよいか |
9 | 健康、病気、病院 | コロナ | 温泉に行ってよいか |
10 | 飛行機、空港 | コロナ | 新幹線か飛行機どちらに乗ればよいか |
トップ10はすべてコロナウイルス関係の質問でした。まあそりゃあそうなりますよね。さらに内容をみると、としてはこういう行動をとってよいか(感染するリスクは高いかどうか)?という質問になっていました。市民の欲しい情報は様々な行動の可否の判断にあることがここでもわかります。トップ10以外にも眺めていくと、ゴルフに行ってよいか?沖縄旅行に行ってよいか?スキーに行ってよいか?結婚式をやってよいか?キャンプに行ってよいか?市内から出てはいけないか?など、不安というよりは「周りは反対するんだがやってもいいよね?」という雰囲気の質問が多いです。リスク情報に対する感受性(不安に思うか大丈夫と思うか)の個人差が非常に大きいということもここから推測できますね。
Twitterはツイート(鳥のつぶやきの意)と呼ばれる全角140文字以内のメッセージなどを投稿できるサービスです。Facebookのようななれ合いの世界とは違い、クソリプ・パクツイ・不謹慎厨・なりすましはあたり前、バズったり炎上しやすく殺伐とした世界です(偏見持ちすぎ?)
統計ソフトR上からrtweetパッケージを用いてTwitterのAPIを利用し、2020年3月の間につぶやかれた「リスク」を含む1万ツイートを毎週収集しました。「リスク」を含むツイートは数が多いので定点観測をするのみで全ツイートを収集はしていません。形態素解析ソフトMeCaBを統計ソフトR上で使用するRMeCabパッケージを用いて、収集したテキストデータからテキストマイニングを行い、リスク関連単語の使用頻度ランキングを作成しました。このやり方はネット上にたくさん転がっています。例えば:
「リスク」を含むツイートもほぼほぼコロナウイルス関連で埋め尽くされていました。頻出単語トップ50を抜き出してみてもほぼコロナ関連と思われる単語でした。下の図はワードクラウドといって、出てくる頻度が高い単語ほど大きく表示されます
次に、属性に注目してみます。「リスク」を含むツイートの自己紹介の欄に、主婦、学生、サラリーマンと書いてあるツイートをそれぞれ抽出してみました。主婦のツイートはほぼほぼコロナ関連なのですが、頻出単語では全体の解析では出てこない「不安、子供、学校、休校」などの単語が特徴的でした。学生のツイートには半分程度がコロナ関連でしたが、あとは「投資、旅行」などリスクを取りに行く単語が結構出てくるようになりました。サラリーマンになるとコロナ関連よりも「投資、リターン、株、会社、資産、副業、FX」などお金儲けに関する単語が多くを占めるようになります。サラリーマンの頭の中では「リスク=金儲けのこと」であって、コロナに対する危機感があまりないことがよくわかります。このような人たちが感染を広げないように知恵袋のところで書いたような行動の可否の判断基準が必要になると思われます。
まとめ
3月のリスクの解析ではリスク=コロナウイルスという結果となりました(これ自体は解析しなくてもわかっていたことですが)。特に、各種の行動をとってもよいかどうかの判断基準についてとても高い情報ニーズがあることがわかりました。
ここで気になるのは、リスク=コロナウイルスになっているということは他のリスクに目が全然いっていない状態である、ということです。コロナにリソースが全振りされている状態はある意味結構危険かもしれません。これはまた別の機会に書いてみたいです。
コメント