2020年3月の「リスク」を分析しました~SNS定点観測結果1~

risk202003 SNS定点観測

要約

人々の生の声をSNS等から収集するソーシャルリスニングとして、Google検索履歴やTwitter、YAHOO!知恵袋を用いて「リスク」のトレンドを定点調査しています。2020年3月の調査結果からは、このコロナウイルス蔓延のご時世に〇〇しても大丈夫か?という行動の可否の判断にとても高い情報ニーズがあることが浮かび上がってきました。

本文

ご迷惑をおかけしています!

グーグルの元データサイエンティストであるこの本の著者は、Googleの検索窓をデジタル自白剤と呼び、検索履歴のようなビッグデータを解析することで、いつどこでどんな悩みが増えているのかを明らかにできると主張しています。

リスクに関する人々の生の声を収集するには、アンケート調査がこれまで主に活用されてきました。こういう調査は「リスクコミュニケーション」という分野に位置づけられます。一方で、ツイッターなどのソーシャルメディアの会話等を分析するソーシャルリスニングという方法がマーケティングの分野で活用されるようになってきました。これをつかうと簡易に大量にデータを収集することが可能となり、今人々がどんなリスクに注目していたり不安を持っているか知ることができます。

ここではGoogle検索履歴やTwitter、YAHOO!知恵袋を調査対象として、定点調査として3月にどんな「リスク」に焦点があてられたかを分析してみました。

Google Trends

Google トレンド

Google Trendsは、Google検索における特定のキーワードの検索数の推移や、一緒にどんなキーワードで検索されているか、などの検索履歴情報を調べることができるツールです。2020年3月の期間内で「リスク」と共にどんなキーワードが検索されているかを調べ、関連キーワードの注目度(検索数が増えたもの)トップ10を抜き出しました。トピックとはどんな分野かがわかるように私が手作業でタグ付けしたものです。

順序キーワードトピック
1コロナ 外食 リスクコロナ
2コロナ 外食コロナ
3リスク オフ とは金融
4温泉 コロナコロナ
5リスク オフ金融
6リスクマネジメント とはビジネス
7全身 麻酔 リスク健康
8クレジット リスク金融
9リスクヘッジ とはビジネス
10リスクヘッジビジネス

トップ1と2はコロナ関連で、外食することはコロナウイルスの感染リスクがあるのかどうかということ調べたかったと思われます。「温泉 コロナ」も同様で、温泉に行っても大丈夫かどうかを知るための検索だと思われます。〇〇しても大丈夫か、という判断基準は情報ニーズがとても高いということが浮かび上がってきました。また、コロナ以外にも金融やビジネス関連のリスクの検索も多くなっています。

YAHOO!知恵袋

Yahoo!知恵袋 - みんなの知恵共有サービス
Yahoo!知恵袋はみんなでつくる便利でうれしい知恵の共有サービス。参加している方がお互いに知恵や知識をQ&Aで共有できるサイトです。

YAHOO!知恵袋は、オンライン上で相談したり回答したりすることができるサービスです。質問するということは何かに悩んでいるわけですから、「リスク」を含む質問を抽出することで、人々がどのようなリスクに悩んでいるかを分析できます。2020年3月の期間内で「リスク」を含む質問のうち、閲覧数が多かったトップ10を抽出し、トピックと要約もやはり手作業で付けました。

順序カテゴリトピック要約
1政治、社会問題コロナパチンコに行ってよいか
2トレーニングコロナスポーツジムに行ってよいか
3家族関係の悩みコロナ孫を祖父母に会わせてよいか
4カラオケコロナカラオケに行ってよいか
5ニュース、事件コロナライブに行ってよいか
6家族関係の悩みコロナ孫を祖父母に会わせてよいか
7福祉、介護コロナデイサービスは大丈夫か
8政治、社会問題コロナパチンコに行ってよいか
9健康、病気、病院コロナ温泉に行ってよいか
10飛行機、空港コロナ新幹線か飛行機どちらに乗ればよいか

トップ10はすべてコロナウイルス関係の質問でした。まあそりゃあそうなりますよね。さらに内容をみると、としてはこういう行動をとってよいか(感染するリスクは高いかどうか)?という質問になっていました。市民の欲しい情報は様々な行動の可否の判断にあることがここでもわかります。トップ10以外にも眺めていくと、ゴルフに行ってよいか?沖縄旅行に行ってよいか?スキーに行ってよいか?結婚式をやってよいか?キャンプに行ってよいか?市内から出てはいけないか?など、不安というよりは「周りは反対するんだがやってもいいよね?」という雰囲気の質問が多いです。リスク情報に対する感受性(不安に思うか大丈夫と思うか)の個人差が非常に大きいということもここから推測できますね。

Twitter

https://twitter.com/

Twitterはツイート(鳥のつぶやきの意)と呼ばれる全角140文字以内のメッセージなどを投稿できるサービスです。Facebookのようななれ合いの世界とは違い、クソリプ・パクツイ・不謹慎厨・なりすましはあたり前、バズったり炎上しやすく殺伐とした世界です(偏見持ちすぎ?)

統計ソフトR上からrtweetパッケージを用いてTwitterのAPIを利用し、2020年3月の間につぶやかれた「リスク」を含む1万ツイートを毎週収集しました。「リスク」を含むツイートは数が多いので定点観測をするのみで全ツイートを収集はしていません。形態素解析ソフトMeCaBを統計ソフトR上で使用するRMeCabパッケージを用いて、収集したテキストデータからテキストマイニングを行い、リスク関連単語の使用頻度ランキングを作成しました。このやり方はネット上にたくさん転がっています。例えば:

【R言語】Tweetデータをワードクラウドで可視化してみた - Qiita
##概要R言語でtwitterからデータを取得してテキストマイニングにより可視化を行ってみましたので、手法を共有します。タイトルにもあるワードクラウドとはテキストマイニング手法の一つです。読み…

「リスク」を含むツイートもほぼほぼコロナウイルス関連で埋め尽くされていました。頻出単語トップ50を抜き出してみてもほぼコロナ関連と思われる単語でした。下の図はワードクラウドといって、出てくる頻度が高い単語ほど大きく表示されます

risk202003

次に、属性に注目してみます。「リスク」を含むツイートの自己紹介の欄に、主婦、学生、サラリーマンと書いてあるツイートをそれぞれ抽出してみました。主婦のツイートはほぼほぼコロナ関連なのですが、頻出単語では全体の解析では出てこない「不安、子供、学校、休校」などの単語が特徴的でした。学生のツイートには半分程度がコロナ関連でしたが、あとは「投資、旅行」などリスクを取りに行く単語が結構出てくるようになりました。サラリーマンになるとコロナ関連よりも「投資、リターン、株、会社、資産、副業、FX」などお金儲けに関する単語が多くを占めるようになります。サラリーマンの頭の中では「リスク=金儲けのこと」であって、コロナに対する危機感があまりないことがよくわかります。このような人たちが感染を広げないように知恵袋のところで書いたような行動の可否の判断基準が必要になると思われます。

まとめ

3月のリスクの解析ではリスク=コロナウイルスという結果となりました(これ自体は解析しなくてもわかっていたことですが)。特に、各種の行動をとってもよいかどうかの判断基準についてとても高い情報ニーズがあることがわかりました。

ここで気になるのは、リスク=コロナウイルスになっているということは他のリスクに目が全然いっていない状態である、ということです。コロナにリソースが全振りされている状態はある意味結構危険かもしれません。これはまた別の機会に書いてみたいです。

参考

テキストマイニングの手法については以下の本を参考にしています

ご迷惑をおかけしています!

記事の評価
この記事がわかりやすい、役に立つ、信頼できるなどの感想を持ちましたらぜひ下のいいね!ボタンを押してください。

いいね!をつける (まだ評価がありません)

ブログランキング参加中です。よろしければ応援クリックお願いします。

にほんブログ村 科学ブログへ

にほんブログ村 科学ブログ サイエンスコミュニケーションへ

SNS定点観測
シェアする

コメント

タイトルとURLをコピーしました