見出し画像

【7.ストーリー】現代短歌のテキストマイニング――𠮷田恭大『光と私語』(いぬのせなか座)を題材に

承前

7-1.極性分析による作品の変遷

手法
 連作を公表するとき、第1首から最終首までの並び順を意識することは、新人賞からベテランの単著に至るまで、ごく当たり前に行われるという。緩急をつけ、時には意表を突くことで、読み手を飽きさせない試みがなされる。
 けれどもそうした工夫は、1首ごとの精細な読解に比べて、あまり論評されないとも聞いた。流れや顛末、起伏の説明は字数を使う。読書体験も言語化しづらい。おまけに短歌は――連歌形式の採用や、詞書による硬軟の指定がなければ――1首1首がわりあい独立している。だから散文のように、接続詞や代名詞に頼れば、通りいっぺんの論理展開が追えるでもない。その他いくつかの事情から、連作の構成は、暗に評価対象になっていても、表向きは語られにくいようだ。
 そこで私たちは、極性分析を行うことで、個々の連作がもたらす肯定/否定感情の変遷を可視化することを試みた。極性とは、正負や陰陽、賛否、好悪の偏りのことだ。Googleが提供する自然言語処理用APIのsentiment analyzingを用いて、『光と私語』に収録された1首( もしくは1行)ごとに、肯定値、否定値を求めた。次の3つの方法で値を算出し、その結果を棒グラフで描画した。

- A.連作ごとの推移。15の連作ごとの数値を求め、全体の推移を示した。
- B.1首ごとの推移。1首ごとの数値を求め、全体の推移と、連作ごとの推移を示した。
- C.1首ごとの絶対値。1首ごとの絶対値を求め、肯定/否定に依らず、値の高低を示した。

 こうすれば、連作ごとの極性値の高低を、「波の揺れ」のように観察できる。
 なお、一般に、肯定/否定値の計算法は、元になる大量の言語コーパスから導き出される。そのため、使用する言語コーパスの特徴によって、数値の大小が変わることもある。このAPIは、句読点で区切った文ごとに極性スコア(肯定/否定度合いを1.0~-1.0の範囲)を算出する。そこで、1行に複数の文が含まれるときは、すべての文のスコアを平均した数値を用いた。たとえば、「紙に文字。君のインクのキラキラのきらきらしたところが指につく」という1文は、「紙に文字」のスコアが0.1で、「君のインクのキラキラのきらきらしたところが指につく」のスコアは0.7だった。ゆえに、1行のスコアは0.4となる。このように、1首ごとの数値を連作ごとに合計し、連作全体の極性値とした。
 加えて、このAPIは、単語の有無ではなく、対象テキスト全体を評価する。ある1文に前向きな/後ろ向きな言葉があるからといって、そのまま肯定/否定値が高くなるわけではない。また、感情表現が混合的な文は、合算値が0に近づくことにも注意してほしい。すなわち、合算値が低いときは、ニュートラルな(極性のふれ幅が小さい)文章が多い場合も、文章ごとの大きなふれ幅が相殺された場合もありうる(詳しくはこちらを参照のこと)。


結果

A.連作ごとの極性推移(連作単位でスコア算出)

結果
 縦軸は、極性値の大小を示す。合算値がプラス(正)なら肯定(赤色)、マイナス(負)なら否定(青)感情を表すように色分けした。横軸には連作名を出現順に並べた。「わたしと~」から「部屋から~」までが第1章で、第2章は「大きい魚〜」から「象亀〜」。「ともすると~」から「明日の~」が第3章に当たる。

画像1

考察
図より、次のことがいえる。

- 全体として、肯定値が高い連作が多く、著しく否定値の高い連作は少ない。
- 各章の初め(「わたしと」「大きい魚」「ともすると」)で盛り上がりが起こる。
- 1章(「わたしと〜」から「部屋から〜」)と2章(「大きい魚〜」から「象亀〜」)は高い肯定値で始まり、段々盛り下がる。
- 3章(「ともすると〜」から「明日の〜」)は、どれも肯定値が高く、また、徐々に盛り上がる。

B-1.1首ごとの極性推移(1首単位でスコア算出)

結果
縦軸は、極性値の大小を示す。横軸は1文の出現順に番号(index)を付した。

画像2

連作ごとの句切れは、次のとおり。

第1章:
No.01-24:「わたしと~」
No.25-33:「光と私語」
No.34-42:「Napoli~」
No.43-51:「Not in~」
No.52-64:「三月の~」
No.65-77:「部屋から~」
第2章:
No.79-107:「大きい魚~」
No.109-133:「ト」
No.134-148:「されど~」
No.149-166:「末恒、宝木~」
No.167-176:「象亀の~」
第3章:
No.177-186:「ともすると~」
No.187-208:「私信は~」
No.209-240:「明日の各地の~」

考察
連作ごとに集計した場合と比べると、1首ごとに正負のふれ幅が大きくある。ニュートラルな歌(もしくは、双極的な歌)はむしろ少ない。否定的なセンチメントの歌が集中的に出現するわけではなく、肯定/否定の起伏が、より細かい単位で生じていると分かる。

B-2.1首ごとの極性推移(連作単位でスコア算出)

結果

第1章

No.01-24:「わたしと~」

光と私語_感情分析_11わたしと

No.25-33:「光と私語」

光と私語_感情分析_12光と

No.34-42:「Napoli~」

光と私語_感情分析_13Napoli

No.43-51:「Not in~」

光と私語_感情分析_14Not in

No.52-64:「三月の~」

光と私語_感情分析_15三月の

No.65-77:「部屋から~」

光と私語_感情分析_16部屋から

第2章

No.79-107:「大きい魚~」

光と私語_感情分析_21大きい魚

No.109-133:「ト」

光と私語_感情分析_22ト

No.134-148:「されど~」

光と私語_感情分析_23されど雑

No.149-166:「末恒、宝木~」

光と私語_感情分析_24末恒、宝木

No.167-176:「象亀の~」

光と私語_感情分析_25象亀

第3章

No.177-186:「ともすると~」

光と私語_感情分析_31ともすると

No.187-208:「私信は~」

光と私語_感情分析_32私信は

No.209-240:「明日の各地の~」

光と私語_感情分析_33明日の各地の

考察
第1章の後半から第2章にかけて、徐々に否定値の高い1文が増えてくる。「ト」の序盤は、否定値の高い1文が連続する。その他の連作では、数文に1回の間合いで否定値の高い1文が挿入される。その間合いが、一定のリズムを作っている可能性がある。

C.絶対値での極性推移(連作単位でスコア算出)

結果
縦軸は極性値の絶対値である。大まかな動きを捉えやすくするために、移動平均をとって、描線をよりなめらかにしてある。横軸は、これまでと同じく、1文ごとの出現順に番号(index)を振った。

光と私語_感情分析_絶対値_全作_移動平均

考察
1冊のなかで、極性値の起伏が数多く生じていると分かる。数え方次第だが、十数個の「やま」が作られている。大まかにみて、1文目から150文目にかけてゆるやかに下降し、そこから230文あたりにかけて、大きな盛り上がりが続く。230文あたりで急落があって、240文目に向けて、もうひと盛り上がりがある。値が小さい区間がニュートラルな歌か、双極的な歌かはさておき、細かい波のような起伏が観察できる。

展望
『光と私語』の著者によると、連作の構成にはいくつか定番があって、終盤で盛り上げるパターンもよく採用されるらしい。他の歌集でも分析してみたい。極性値の増減から短歌のストーリー構成がもたらす効果を観察できれば、歌集の編集とその評価システムに、新しい観点を付け加えられるからだ。
 極性分析を行えば、1冊の歌集のなかで――論理やイメージの展開ではなく、感情の起伏としての――ドラマ性の大小が評価できそうだ。どのような波形が、ある尺度からみて優れた歌集なのかは、この結果だけでは言えない。けれども、いくつかの歌集を分析することで、作者の個性に還元されない傾向が見つけ出せたり、ある歌集の読み心地を、他の歌集と比べて見極められるようになる可能性はある。
「連作」や「歌集」単位の分析は少ないようだ。分析単位が大きくなり、共通理解が作りにくいからだろう。この分析結果は、いぬのせなか座の連続講座でも発表した。映像や文章、図像は、「作品」として鑑賞され、批評の語彙で語られるのに、図表・グラフには同じ語りが発動しなかった。言うまでもなく、それが芸術の暗黙の慣習だからだ。その慣習が少しずつ変わっていけば、芸術表現と情報処理の根深く、しかし根拠のない断絶を埋められるようになる。



この記事が気に入ったらサポートをしてみませんか?