雷の恐怖を克服する ~研究㉒~ 雷日記の解析
雷日記を解析する
独自の暴露療法を始めた去年の6月から、雷予報があった日や、雷が鳴った日に雷日記を書いてきました。雷日記も毎日記録しているVR記録簿と同じGoogleスプレッドシートに記録しています。
本物の雷に見舞われた時の恐怖度を記録していますので、VR記録簿のように月報へグラフを載せたいのですが、予報通り鳴らなかったり、音は聞いたけれど光を見ない時もあり、グラフ化するにはデータが乏しいです。
どちらかというと、雷の日の状況を文章で記録するのがメインになっていました。
そのため1年に数回は読み返しますが、定期的に読むのは面倒です。
しかし、せっかく記録しているのですから、もったいないので文章を解析してみようと思い立ちました。
そこで、Pythonというプログラム言語を使ってGoogleスプレッドシートの雷日記をテキストマイニングしてみました。
去年(2020年6月~)と今年(2021年)で出現頻度の高い単語の上位20位までをランキング形式でグラフ化したものが以下です。
去年(2021年6月~)
今年(2021年)
ランキングによる考察
去年(2020年6月~)は「パチンコ」「避難」がランクインしています。たぶん去年はパチンコ屋に避難していた日が多かったのでしょう。それに対して今年(2021年)はランク外です。振り返ってみると今年はパチンコ屋に避難してなかったと思います。そのかわり今年に「イオン」がランクインしているので、ショッピングセンターで暴露療法しようとした日が多かったのでしょう。
「鳴る」が去年も今年もランキング上位にあります。ただし、Pythonによる文章解析(正式には形態素解析と呼ぶ)では「鳴った」は「鳴る/た」に分割され、「鳴らなかった」は「鳴る/ない/た」に分割します。そのためどちらも「鳴る」でカウントしてしまいます。解析方法としては賢いのですが、実際に「鳴った」のか「鳴らなかった」かどうかはランキングだけではわかりません。
「見る」は少し違っていて、「見た」や「見ない」は「見る/た」もしくは「見る/ない」に分割しますが、「見えた」や「見えない」は「見え/た」もしくは「見え/ない」になって、「見る」と「見え」が別々にカウントされます。でも、どちらにしろ「鳴る」と同じで実際に「見る」したのかはこれだけで判別できません。
去年(2020年6月~)には「耳」「栓」がランクインしていますが、今年(2021年)はランク外で、その代わり「イヤ」「フォン」「聞く」「動画」がランクインしています。たぶん、去年は「耳栓」で雷に対応した時が多くて、今年は「イヤフォンで動画を聞いてた」時の方が多かったのでしょう。
「落雷」と「情報」も上位にランキングしています。たぶん「落雷情報」が「落雷/情報」の2つの名詞に分割されてカウントされたのだと思います。そう考えると、今年(2021年)は「落雷」と「情報」が1位と2位なので、それだけ今年は「落雷情報」を見てしまったのかもしれません。あまり雷の情報はネットで見ないようにしていたのに、ちょっと残念な気持ちです…。
去年(2020年6月~)には「怖い」がランクインしていていますが、今年(2021年)はランク外です。「怖かった」も「怖い/た」に分割されてカウントされるはずなので、今年の雷日記には「怖い」や「怖かった」とあまり書かなかったようです。
本当は怖かった時もあったはずなのですが、書きたくなかったのかな?
それとも、やせ我慢してた?
おわりに
今回は、ただ記録していただけだった雷日記をプログラムで解析する事に挑戦してみました。
もちろん原文を読まなければ詳しい所までは判別できませんが、何となくでも雷の日の傾向が見えてきて面白かったです。
これからも雷日記を続けていくかぎり、折を見て分析してみようと思っています。
最後まで読んでくださいましてありがとうございます。
また別のnoteでお会いしましょう。
よろしければサポートをお願いいたします。