見出し画像

だった様の詩をテキストマイニング

依頼に基づき
だった様の詩40作品のテキストマイニングを実施しました。

●方法

KH Coderを使用しました。

対象とした詩は以下の通りです。

ああなんと素晴らしきかな
れもん
乃東枯
車輪
マザー
うんうんあはは
見上げれば空っぽ
ちまめ
7月11日(木)晴れ w.28 l.30
ビックイーター
走馬灯で満ちる部屋
確かなありかた
てざわり
春眠に誓って
朝日と添い寝
不可視浸食型教典
彗星交差点
ばち
白い背中
漂流
ボトル
アクアリウム
春のパン祭り
グットバイ、グットナイト
ほそく
春便
キングータイム
繋いだ手
本日を境目とする
行進
日曜日の死神
砂粒
自販機
にらめっこ
床屋の魔法
誘導灯
プール
売人
つぎはぎ
月と距離


●結果

・語数

総抽出語数(使用):10,823(4,159)
異なり語数(使用):1,817(1,555)

・抽出語高頻度順リスト

datta抽出語リスト

出現頻度の多い語を順に並べたものです。
どういった言葉を多く使っているか、題材としているかが分かります。

・ワードクラウド図

画像5

Rのwordcloud2パッケージを用いてワードクラウド図を描写しました。
出現頻度上位150位の語を高頻度であれば大きく、低頻度であれば小さく並べてあります。どんな言葉によって自分の詩が形作られているのか、視覚的に分かりやすいです。

・多次元尺度法

datta多次元尺度法

クラスターで色分けされたバブルプロットです。〇の大きさは「語」が出現する回数に比例して大きくなります。
〇の位置は語と語の距離を示し、近い位置にある語は同じ文中で使われることが多い、近しい位置関係を持った語です。
注意すべきなのは "軸にあらかじめ与えられた意味がない” ということです。
このため、考察者自身が「縦軸」と「横軸」の意味を考えなければなりません。これがこの分析の難しいところであり、面白いところでもあります。
内面と外面、精神と物質、身近にあるもの遠くにあるもの、様々な意味を見出すことができるかと思います。


・共起ネットワーク

datta共起ネットワーク

一つ一つの文書で出現する語のうち、距離が近いか遠いかを計算し、図示したものです。線で繋がった〇同士は共通に出現している語句と言え、距離が近い語同士は濃い線で結ばれます。
よく使う大きな〇の語や、自分の好きな語に注目し、どんな語と連なっているか、どのようなグループに所属しているかを確認することで面白い考察が得られると思います。

・文章クラスター

datta文章デンドログラム

使用されている語から文章ごとに近いもの同士グルーピングした図です。同じテーマで書いた詩は近いグループに所属していることもありますし、意外な近縁関係があるかもしれません。


以上です。

何故近いのか、何故遠いのか。図を元に考察を行い、詩作創作に活かしていただければ幸いです!

万が一サポート、感想、コメント、分析等のご相談などございましたらお気軽に。