見出し画像

一日一首、半年で二百の短歌を詠んだのでテキストマイニングしてみた。

こんにちは、武勢みさきです。2019年の夏から、日記をつけるように短歌を詠みはじめました。以来、だいたい毎日つぶやいています。

note連続更新バッジのために「毎日31文字なら何かしら書けるだろう」という大雑把な理由で短歌を選んだのですが、実はその後二回更新に失敗し、ただ今、仏の顔も三度目の正直言って修行、みたいなリトライ中です。
現在のゴール地点は348日後の2021年3月2日(火)です。
(そう、つい先日リスタートしたばかり……!)

連続更新は途切れても短歌はそれなりに詠み続けていて、先日、二百首になりました。切りのいい数字は、記事にまとめるいいキッカケです。
去年12月にも百首に届いた記念で記事を書きました。

まず直近の百首から、またお気に入りを選んでみます。


//////////////////////////////////////////////////////////////////////////

1. 崖っぷち生活

何一つ調味料すらないキッチン 白飯に白湯だけで乗り切る

寝て起きてまた寝て起きて日は暮れて よくぞ一日生き延びました

目をつむりコートのファーを撫でつけるこの子は猫だ、そうかわいい子

//////////////////////////////////////////////////////////////////////////

2. つい自問自答

認めよう、自分が蒔いた種だ。けど水と肥料を撒いたの誰だ?

「悔しい」と愚痴ってそれで気が済むの?悔しいだけで今日も終わるの?

あどけなく日持ちのしない幸せを今食べますか凍らせますか

//////////////////////////////////////////////////////////////////////////

3.もう開き直る

仕方ない何はなくとも息はある まだ生きてるし生き延びるらしい

本当にやりたいことをやるんだよ 積極的に後ろを向いて

見てもない聞いてもいない知りもしない未来はいつも新しいもの

//////////////////////////////////////////////////////////////////////////

4.結局好きなんだ?

今もまだ会いたい気持ちはあるけれどほんとに会うのは来世でいいや

永遠に交わりのない平行線 故に果てまで傍に居られる

平凡な言葉を全部切り詰めて結局口に出せたのは「好き」

//////////////////////////////////////////////////////////////////////////


(並べてみて分かった。我ながらひどい。日記のようにというか、生活実録になっている。固有名詞さえ省いておけばシチュエーションはいい感じにぼやけてくれるので、それでどうにか掲載できるレベル。)


************

さて、ここで記事を終えると前回と変わり映えしないので、何か新しい方向へ進むべく今回は二百の短歌をテキストマイニングしてみました。

テキストマイニングには、ユーザーローカルのAIテキストマイニングを使いました。使い方が簡単で、とっつきやすかったです。無料利用でしたので、せめて宣伝のお手伝いにもなろうかとリンクを貼っておきます。

せっかくだから何か他の資料と見比べてみても面白いかと「切りのいい数」つながりで百人一首も一緒に解析にかけてみました。

ではまず、ワードクラウドをご覧ください。
ここでは、各テキストで頻出度の高い単語ほど大きな文字で表示されます。フォントカラーは、青:名詞、赤:動詞、緑:形容詞、灰:感動詞に対応しています(百人一首は結果が読みやすくなることを優先して、歴史的仮名遣いのいくつかを現代仮名遣いに変え、解析の条件をカスタムしました)。

百人一首_wordcloud

半年で詠んだ二百首_wordcloud

私、さびしん坊ですか!?
しかし平安貴族達も何かとあれこれ思ってて、憂えてて、忍んでる。眺めていると、百人一首のワードクラウドにも切ない言葉が盛りだくさん。これが「もののあはれ」の世界観……!
やはり人間は皆、寂しさを好いているのに違いない。

ところで図表に何故「be」が、しかもちょっと大きめに登場したのか、とっさに原因を思いつかなかったのですが、そういえば一度ハムレットを詠んだことがあったのでした。12月の歌です。

ハムレットその名をみると思い出す
“to be, to be, ten made to be” の謎かけ


昔流行った(?)言葉遊びです。
「to be, to be, ten made to be」は「とべ、とべ、天までとべ」。生きるも死ぬも関係なく、そも英文ですらないという。ここに3回並んでいた「be」が特有の単語だと認識された訳です。なるほど。


************

続きまして、単語同士の出現パターンを確認できる共起キーワードをご覧ください。出現数の多い単語は大きくなり、単語同士のつながり強いほど線が太く表示されます。なんとなく連想ゲームを思い出しました。

百人一首_cooccurrence_network

半年で詠んだ二百首_cooccurrence_network

百人一首のほうは、一首ごとの光景が浮かんできますね。そしてそこからの、歌と歌のつながりも見えてきます。私が詠んだ二百首はというと、一首ずつぽつりぽつりと並んでいるばかりで、歌同士のつながりはあまり感じられません。この違いはなんなんだろう。歌の抽象度の高さかしら。

余談ですが、歌同士のつながりといえば推理小説「Q.E.D 百人一首の呪」が大層面白いです。タタル&奈々ペアの大ファンです。


************

最後に、両方の歌に共通する単語をチェックします。

単語分類

山、風、花、秋……百人一首の側からあふれでる季節感に胸がときめきました。読み手の心に風景を思い起こさせるパワーワードがそろい踏みです。そして、両方によく出る単語をみていて一つ分かったこと。人間は長い夜が更けるまでの間、何かしら考え込まずにはいられないのだ!

************

以上です。
学術研究やビジネスのために日々データ分析に取り組んでいる方々には「すいません!」と思いつつ、巷の心理テストを試してみるのと同じくらい軽いノリで短歌をテキストマイニングしてみました。

どうも思っていた以上に私は淋しさが好きみたいです。
もちろん嬉しい・楽しいも好きなんだけど、それを自分の人生のメインディッシュとして味わったことがまだまだ少ないような気がします。明日からもまた毎日短歌を詠むわけですが、たぶん何が変わるでもなく三十一文字の日記をつけていることでしょう。

「スキ」ありがとうございます!2022/2/23リアクション更新しました。私のオールウェイズ「スキ」な卵料理10選。