リスコミでは中学生でもわかるように説明しろと言われたけど、どうしたらいいかわからない人のためのツールを紹介1:文章の難易度レベル判定

pc_paper リスクコミュニケーション

要約

リスクコミュニケーションにおいてはわかりやすい説明が重要です。そこで、文章の難易度を判定するWEBツール「チュウ太」と「帯3」を紹介します。このツールを使うと文字通り「中学生にもわかるかどうか」を判定できます。

本文:リスクコミュニケーションにおける文章レベルの評価ツール

リスクコミュニケーション(リスコミ)においては「わかりやすい説明」をしなさいとよく言われます。さらに、わかりやすい説明のたとえとして「中学生にもわかるように」と言われることもあります。ただこれは「だれにでもわかるように」ということをちょっと極端に表すたとえなので、本当に中学生でもわかるかどうかを大まじめに評価しようとする人はなかなかいないでしょう。

わかりやすい文章を書くにはそもそもわかりやすさを調べるためのツールが必要です。中学生でもわかるような説明の仕方について、ネットでいろいろ探してみました。ところが、何をもって中学生でもわかるのか、ということを具体的に根拠をもって書いてあるものは全くありませんでした。本記事にて紹介するツールはまさに、本当に中学生でもわかる文章かどうかを客観的に評価しようとするものです。

もちろん「リスクコミュニケーション=わかりやすく説明すること」だけではありません。事業者や専門家が一方的に情報を伝えてそれを住民・市民に理解させる・説得することがゴールではないからです。リスコミもコミュニケーションの一種なので、お互いに意見を交換して、事業者や専門家が市民の声を聴いたり、お互いに理解しあったり信頼関係を築くことがゴールになります。

そのための第1歩として、まずはリスクを説明する側がわかりやすい説明を心がけることはやはり大事なことだと言えるでしょう。

「チュウ太」による文章難易度判定

東京国際大学の川村よし子氏によって開発された「チュウ太の道具箱」というサイトがあり、ここで日本語文書の語彙レベル判定ができます。
(2021年7月10日リンクを更新。東京国際大学から筑波大学のサーバーに移ったようです。)

https://chuta.cegloc.tsukuba.ac.jp/

これは外国人向けの日本語学習者を対象とした難度判定となっており、学年ではなく日本語検定試験のレベル(N1~N5)に対応しています。N1(1級)が高校生程度、N2(2級)が小学校卒業程度で、N5(5級)が最も初歩的なレベルです。日本で働くにはN2以上を求められることが多いようです。

日本語教育-Best Seminar » 日本語能力検定試験でお子様の日本語能力をキャリアに

チュウ太のボックスの中に文章を貼りつけて、「語彙レベル」のボタンを押してみましょう。下の方に判定として、とてもやさしい(★)、やさしい(★★)、普通(★★★)、少し難しい(★★★★)、難しい(★★★★★)の5段階の表示が出てきます。

また、一つ一つの単語のレベルとしてN1~N5、級外の割合も出てきます。N2(小学校卒業程度=中学生)以下の単語の割合を高めれば中学生でも理解できる文章になるでしょう。★の数は各レベルの単語の割合からの総合判定になっているようですね。

試しに、子供向けのコロナウイルスについてのQ&Aの文章を解析してみましょう。以下のサイトで見つけたソーシャルディスタンスについての説明文です。

新型コロナウイルスについて学ぶ子どもにも分かりやすい教材を、知識流動システム研究所らと共同で開発 - 国立大学法人 岡山大学
岡山大学の公式サイト。

なぜ1~2メートルくらい離れているとうつりにくいの?

せきや くしゃみで できた 水てきは、だいたい1~2メートルとぶ と いわれているから です。もちろん、せきや くしゃみで できる 水てきの 大きさは いろいろ できます。大きさが 小さくなる ほど、もっと遠くまで とんでいくことが できるし、空気の中に長い時間のこれて しまいます。ただ、水てきが 小さいほど(ひとつぶの 体積が小さいので)中に 入っている ウイルスのつぶの数も 少なくなる でしょうし、また、せきや くしゃみで できる多くの水てきは 1~2メートルとぶものの ようです。それなので、1~2メートル、はなれることが 大切と言われています。

https://docs.google.com/document/u/0/d/1xgU3-wSVbxwpYuyeljoC6ih0R5o4Pztwxo7zkJu0RUw/mobilebasic

この文章で「とてもやさしい(★)」の判定でした。ただし、大人にとってはひらがなが多すぎて逆に読みにくいです。次に大人向けQ&Aの同じ説明を解析してみます。

なぜ1~2メートルくらい離れているとうつりにくいのですか?

咳やくしゃみでできた水滴は、だいたい1~2メートル飛ぶと言われているからです(もっと飛ぶこともあります:確率的なもので、絶対2メートル以上飛ばないということではありません)。もちろん、咳やくしゃみでできる水滴の大きさはいろいろできます。大きさが小さくなるほど、もっと遠くまで飛んでいく、あるいはそのまま空気中で漂うことはできてしまいます。ただ、水滴が小さいほど(水滴一粒の体積は小さくなるので)中に入っているウイルスの粒の数も少なくなるでしょうし、また、咳やくしゃみでできる多くの水滴は1~2メートル飛ぶもののようです。それなので、1~2メートル、離れることが感染(飛沫感染)を防ぐためには大切と言われています。そして、空気中に長時間漂っている水滴のウイルスからも感染(空気感染)しないようにするには、部屋の換気をよくしたり、部屋の湿度を高くしすぎたりしないことが必要となります。(なお、気道粘膜の感染予防には、気道は保湿が有効です。この意味ではマスクが役立つと考えられます。)

https://docs.google.com/document/d/1-ee7SovEf-ADChz0m1GzwaiyGX0slvB6paiCzLSChac/mobilebasic

これでふつう(★★★)と判定されます。また、N2以下の単語が90%以上を占めていますので、中学生でもわかる文章になっていると言えるでしょう。さらに、本ブログの以前の記事にて書いたソーシャルディスタンスの根拠に関する文章を解析してみます。

このメタアナリシスによると、1m以上のソーシャルディスタンスは平均的に80%程度の感染リスク低減効果があるようです。距離を2mに伸ばすとさらに感染リスクが減るという効果も示されています。マスク着用や眼の保護も効果があるようです。(疫学でよく使うこのrelative riskという表現方法はあまり好きではないが。。)

https://nagaitakashi.net/blog/criteria/social-distancing-2/

これで少し難しい(★★★★)の判定でした。この文章だと一般の人にはやはり難しいと思われますので、やさしい(★★)~ふつう(★★★)くらいを目指していくとよいのではないでしょうか。

ところでこのツールでは一体何を解析しているのか、という疑問が出てくるかと思いますが、以下の順で判定する仕組みになっています:
①与えられたテキストの形態素解析を行う
②各形態素をレベル別語彙リストに照合する
③テキスト内の語彙にレベル表示を行う
④テキスト内語彙のレベル別分類表を作成する
⑤語彙のレベル別含有率を算出する
このように、チュウ太の判定は日本語の文章を単語ごとに分割する「形態素解析」がベースになっています(もう少し詳しい説明は下の補足に記載)。ただ、総合判定(★の数)のアルゴリズムは以下の文献を読んでもよくわかりませんでした。

川村よし子 (1999) 語彙チェッカーを用いた読解テキストの分析. 講座日本語教育, 34, 1-22
https://chuta.cegloc.tsukuba.ac.jp/goi.pdf

「帯3」による文章難易度判定

名古屋大学の佐藤理史氏によって開発された「帯3」というサイトでも日本語文章の難易度を測定できます。

日本語テキストの難易度を測る

これも非常に簡単に使えるツールとなっており、文章を貼りつけて「難易度を測定」のボタンを押すと、9段階評価(とてもやさしい~とてもむずかしい)と13段階評価(小学1年~大学・一般)が表示されます。この結果が中学3年以下であれば「中学生でもわかる」文章となります。文章の長さは、100文字程度以上あると安定して判定できるようです。

チュウ太でも解析したソーシャルディスタンスについての説明文3つを帯3でも解析してみました:
・子供向け説明文:とてもやさしい・小学6年レベル
・大人向け説明文:ふつう・中学2年レベル
・本ブログの説明文:かなりむずかしめ・大学・一般レベル
感覚としても3つの文章の難易度は子供向け<大人向け<本ブログとなっていますし、その通りに判定できていますね。

学年ごとの難易度判定のためには難易度の基準となるものが必要になりますが、このツールの場合は小学校・中学校・高校の学年ごと教科書をコーパス(言葉のデータベース)として使っています。国数社理の主要教科だけでなく、美術・音楽・技術・家庭科・保健体育などの教科書も使われています。解析対象の文章が、どの学年のコーパスと最も類似しているかを比較することで学年ごとの難易度判定ができるんですね。

佐藤理史 (2008) 日本語テキストの 難易度判定ツール『帯』. Japio YEAR BOOK 2008, 52-57
https://www.japio.or.jp/00yearbook/files/2008book/08_1_03.pdf

まとめ:リスクコミュニケーションにおける文章レベルの評価ツール

文章の難易度を判定するWEBツールを二つ紹介しました。いずれも簡単に解析ができるので非常に便利です。特に帯3は文字通り「中学生にもわかるかどうか」を判定できます。リスクコミュニケーションにおいても、このようなツールを活用してまずはわかりやすい説明とはどんなものかを考えてみるとよいでしょう。

本記事の冒頭に書いた文章(リスクコミュニケーション(リスコミ)においては「わかりやすい説明」をしなさいと~~~大事なことだと言えるでしょう。)を解析してみると、チュウ太でふつう(★★★)、帯3ではふつう・中学3年レベルと判定されました。実はこの文章はいつもよりもやさしめに書くことを意識しました。意識すればちゃんと中学生でもわかるように文章を書けるものです。

次回は文章レベルだけではなく、数字や図表、全体の構成、リスクの表現方法など、全体的な資料の評価方法について説明していく予定です。

リスコミでは中学生でもわかるように説明しろと言われたけど、どうしたらいいかわからない人のためのツールを紹介2:情報全体の評価方法
リスクコミュニケーションにおいてはわかりやすい説明が重要です。資料等の情報全体のわかりやすさの評価方法3つ:マーカー法、Clear Communication Index(CCI)、Suitability Assessment of Materials(SAM)と、数値・図表・リスクなどの表現方法の注意点を紹介します。

補足

チュウ太の判定は「形態素解析」がベースになっています。形態素解析とは、日本語の解析においては最も重要な基礎となるものです。英語と違い日本語は単語をつなげて文章にしますので、単語ごとに区分しないと解析が難しいのです。例えば「すもももももももものうち」という文章を形態素解析すると「すもも|も|もも|も|もも|の|うち」と7つの単語に分解されます。「も」がたくさん続くので区切る位置の候補もたくさんありますが、助詞の後に助詞が続くことはあまりないなどの連結可能性を判断していきます。

形態素解析を行うことで、文章中にどんな単語がどれくらい出てくるのかという解析ができるようになります。代表的な形態素解析ツールとして「KH-Coder」や「MeCab」、「Sudachi」、「茶釜」などがあります。チュウ太では茶釜が使われているようです。本ブログで連載しているツイッター等の解析もこの形態素解析がベースになっており、私はMeCabをR上で使って解析しています。

SNS定点観測
「SNS定点観測」の記事一覧です。

一方で、帯3の場合は形態素解析を使わずに、文字ベースで難易度を判定しているようなのです。もともとwebページの難易度判定を想定して作られたようなので、見出しや箇条書き、図表やURLなどが多く通常の句点で終わる文章以外のものが多い場合でも判定可能なようにしてあるとのことです。

流行りの機械学習や人工知能などでもこれら自然言語処理は画像の分類などと同じくらい花形な部分ですね。

コメント

タイトルとURLをコピーしました