見出し画像

「数値からみる『サラダ記念日』」を読みました&計量的な文芸批評のすすめ

同人誌「Tri」第6号を読みました。
特集は第4号でもやった「サラダ記念日」の2回目となります。半年前に出た本ですが、先日の文学フリマで初めて買って読んだので反応が遅れました。


そのなかに収録された浅野大輝さんの「数値からみる『サラダ記念日』」を読んで得た雑感を書いていきたいと思います。

取り上げる理由は、私が前に発表した「『手紙魔まみ』における穂村弘の文体の変容」について少し触れてもらって嬉しいからです。

あとは、浅野さんも書いていますが、形態素解析を短歌でやる取り組みは普及しているとはいえないので、もうすこし広まってほしいなという思いからです。

浅野さんの評論について触れつつ、計量的な分析への関心を喚起できたらよいなと思います。

〇前置き—計量的な分析について
形態素解析とか耳慣れない言葉が出てきたとお思いの方のために少し説明しておきます。知ってる方は飛ばして可です。


短歌に対する計量的な分析、すなわち何らかの形で数値化し分析するアプローチは実は新しいものではなく、以前からしばしば行われています。
例えば永田和宏は「解析短歌論ー喩と読者」(1986年、而立書房)にて近代歌人の直喩出現率を調査しています。
「ような」「ごとし」といった直喩を示す単語があるかを、調査者が逐一チェックしたと思われます。大変な労力です。

形態素解析とは文章を「形態素」と呼ばれる、語のまとまりに分解し、さらに分析を加えることを言います。
形態素解析の語の分類は、国語で習うような品詞とは必ずしも一致していないのですが、ざっくりと「単語」に分解すると覚えておいて構いません。
(ソースを忘れたので間違っていたらすみませんが)形態素解析は、コンピュータを使って自動で文章を分解する必要性から生じたという背景があります。つまり、永田先生がやったようなことをコンピューターに自動でやらせて、労力を削減することができます。

分解してデータ化することで、より複雑な解析をかけることも容易になります。
正直、直喩の出現率を調べるだけならコンピューターを起動せずに歌集をめくった方が早いです。
しかし「形容詞の数」とか、「語Aが使われているときの語Bの出現率」のように、調べる労力が二倍三倍になるような項目ならば別です。一度データ化してしまえば、何項目でも短時間で調べられるようになります。

形態素解析を使って得られたデータは、更に処理を加えて数値化することができます。
もちろん形態素解析を使わなくとも、何らかの方法で数値化することは可能です(字数を数えるとか)
これら、文章を数値化したデータを使って行う分析を総称して計量的な分析と言えると思います。

以上、形態素解析と計量的な分析の説明です。
もともとこの手法はアカデミックな場で発展してきたようで、探せばたくさんの資料がでてきます。詳しく知りたい方は独学には困らないと思います。
私は「社会調査のための計量テキスト分析」(樋口耗一、ナカニシヤ出版)などをお勧めしておきます。

〇筆者(久真八志)のこれまでの仕事
一応、筆者について今までどんなことをやってきたか紹介しておきます。これも本題ではないので飛ばして構いません。
色々やっていますが、筆者は別にこの分野の専門家ではありません。ただ趣味でやっている人です。
よって今後書くことには間違いがあるかもしれませんので、その点はご了承ください。

・なぜ、妻は『なる』ものなのか?
https://www.slideshare.net/YatsushiKuma/ss-51974792
形態素解析は使っていませんが、「夫」の出てくる歌と「妻」の出てくる歌で「なる」が出る頻度を数値化して、その差の生じる背景を分析しました。

・『手紙魔まみ』における穂村弘の文体の変容
https://www.slideshare.net/YatsushiKuma/ss-67407164
「手紙魔まみ、夏の引越し(ウサギ連れ)」とそれ以前の穂村弘の短歌について、品詞ごとの出現頻度に着目して差異を分析しました。

・数値でみるビットとデシベル~フラワーしげるの短歌は長いのか?
https://www.slideshare.net/YatsushiKuma/ss-53831330
「ビットとデシベル」(フラワーしげる)に収録された短歌について、語数・文節数・字数・音数を数えてみました。語数の算出に形態素解析を用いています。

・「わかる」から探る詩観
https://blog.goo.ne.jp/sikyakuesse5/e/acfd0a68329a1fa278bb3e17d12c5a1d
Webサイト「詩客」の短歌時評・自由詩時評・俳句時評について、形態素解析を用いて評のなかで中心的に使われるキーワードとその差異を分析しました。一番時間がかかったやつ。

・俳句を嗜む人を嗜む
https://blog.goo.ne.jp/sikyakuhaiku/e/78ef3f47b71e3b3538ed31c848805907
Twitter上の「俳句」を含むツイートのなかで人名に言及しているものを拾い出し、言及されている回数順にランキングを作成しました。人名の拾い出しに形態素解析を用いています。


〇「数値からみる『サラダ記念日』」について

ここから本題です。

浅野さんの評論は主に二つのパートにわけられます。
(A)俵万智の文語利用率を、他の新人賞作品と比較する(二章)
(B)「サラダ記念日」を形態素解析する(三章)

●(A)について

・「文語」の定義
何をもって口語/文語とするかを決めるのは非常に難しい問題ですが、浅野さんは短歌において「文語」と言われるのはどんなケースが多いかという実感を頼りに、「現代の話し言葉に一般的に登場するか」を基準とし、4項目の条件を立て、該当する歌を「文語の使用が見られる」と判断すると定義しています。

(1)「ず」「ぬ」「き」「けり」「なり」「ごとし」など、古典語の特徴があり現代の話し言葉で一般に使用されない助動詞がある場合
(2)「ぞ」「や」など、古典語の特徴があり現代の話し言葉で一般に使用されない助詞がある場合
(3)「をり」「あり」など、古典語に特徴的な補助動詞の使用が見られる場合
(4)「行きて」「好みて」「働きて」など、現代では一般に音便化する動詞などの活用が音便化せずに残存している場合

この一連のアプローチがとても良いと思いました。

計量的分析に関してのありそうな誤解(私の脳内だけかもしれませんが)として、数値化すると様々な物事が客観的な、すなわち揺るぎない強固な事実として扱えるというものがあります。
文芸批評は批評者の物の見方を示すものであり、それを妥当性をもって論証できているかが重要です。
その点は数値化しようとしまいと変わりません。そして一人の人間の物の見方である以上、そう簡単に揺るぎない結論は出ません。
ですので、文芸批評で計量的な分析をしたものを読むときは、何かの価値判断が客観的な事実として示されようとしていると構えるのではなく(そのような書き方をしているものは良くない批評です)、批評者の主観的な価値判断が示されているといつも通り構えて読めばいいのです。

計量的な分析で重要なポイントは、批評者の物の見方に数値化のプロセスが適合しているかどうかです。

浅野さんは現代において短歌を読むときに感じる「文語」を、個別の助動詞などとして数えられる要素に関連付けようとしています。
浅野さんの「文語」定義は、私にも妥当と感じられました。後にある「つっこみ座談会」でもこの定義は肯定的に捉えられています。
ここでの合意があることで、そのあとの数値化されたデータの比較も受け入れ可能になります。

この「文語」の定義は、計量的な分析に使用できるとともに、恣意的な判断の入り込む余地があまりない点で他の評者も使えそうな点、それでいて短歌における「文語っぽさ」に概ね一致していそうな点で、非常に優れていると思います。

余談ですが、数値化プロセスを踏むメリットとして、恣意的な判断の入り込む余地が少なくなる点は大きいです。それによって印象だけに基づいた批評をあらかじめ抑制することが期待できます。今回の話で言えば、浅野さんの「文語」定義に異論がある人は、どのような定義ならばより多くの人に受け入れ可能になるか検討しなくてはならないでしょう。「文語」を感じさせる要素を厳密に説明することも求められます。

・「文語」使用率の比較
浅野さんは俵万智作品の「文語」使用率が同時代の他の新人賞作品に比べて低いことから、『「口語」の多さ/「文語」の少なさは目を引いたのではないか』としています。
ここでは「文語」と「口語」が排他的な関係として捉えられており、「文語」が少ないということは「口語」が多いという印象につながるのではと示唆されています。この点、浅野さんも「ひとまず」と前置きして注意深く書いていますが、短歌での「文語っぽさ」と「口語っぽさ」は完全に排他的な関係とは言えません。最近ではミックス文体も当たり前にあり、両者の「ぽさ」を一首の中で巧みに操作する作品もあります。
ただし、「文語」と「口語」の使用率に強い負の相関は成り立つといえますので、当時の俵万智が目立ったであろうとの結論はその通りだと思います。
ここで、一つ面白い課題が見えたと思います。口語を数値化できる形でどのように定義可能か?というものです。
もしかすると文語より難しいのではないでしょうか? 私は今のところ全然思いつきません。 

浅野さんの評論で重要なのは、むしろ、俵万智は確かに「文語」は少なかったけれど、それでもやはり「文語」を結構使っていたという点にあると思います。
ド忘れしてしまいましたが、似たようなことを書いている評をどこかで読んだ記憶があります。
ただ今回の評論はその印象を数値化して示した点で、価値があります。
第二歌集「かぜのてのひら」でも「文語」の使用率はまだ4割以上あるとのこと。
俵万智は口語短歌の代名詞的存在ですが、このように「文語」の使用率を参照してみると、違った面が見えてきそうです。
またこの結論を読むと、では俵万智の「文語」使用率はその後どの時点で減るのか? あるいは実はいまだにそこまで減っていないのかも?という疑問も湧いてきます。
そういった気付きを与えてくれる点でも有用だと思いました。

本筋から外れますが、P30にある各歌人の「文語」使用率の表は実に面白いです。
俵万智だけでなく、加藤治郎や穂村弘なども、同時代の中で「文語」使用率が低いことがわかります。
いわゆる「ライト・ヴァース」の歌人に合致する結果ですが、よく見ると、同じく「ライト・ヴァース」の話で名前が上がる荻原裕幸はむしろ「文語」の使用率が高いことがわかります。この時期の荻原さんはまだ「口語」ではなく、加藤さんや穂村さんとは違う動きをしていることが示唆されます。

・形態素解析における文語と口語
ところで文語と口語を形態素解析で扱う場合、一つ難しい問題があります。
それは「文語」が時代によって変わることです。

形態素解析を用いての分析は現代だけではなく、近代かそれ以前の文章も対象になります。
国立国語研究所では現代語版の形態素解析辞書の他に、「近代文語」と「中古和文」の辞書を公開しています。
http://current.ndl.go.jp/node/22479

短歌を形態素解析の対象にする場合、古典和歌は「中古和文」辞書を用いればよさそうです。
しかし近代短歌以降はちょっと判断が難しい。
作者にもよりますが、近代の短歌は、当時の文語と和歌の文体が混ざっている印象があります。一首の中で混ざっていたり、同じ作者の別々の歌で雰囲気が違っていたり。
もともと近代短歌は和歌を参照してその文体を作り上げていったところがあるので、過渡期はどうしても混ざってしまう。それこそ俵万智の歌に口語と文語が混ざっているように。
現代短歌となると更に複雑で、作者によってはあえて古典和歌に寄せている人もいます。

もし比較計量したい場合は、形態素への分解の単位は揃えないと意味のあるデータにはなりません。
しかし適切な辞書が作者によって、歌によって異なる可能性があると、どの辞書を使うべきか簡単には判断できません。

色々と試した経験から言いますと、現代語の辞書はそこそこ古典的な言葉も守備範囲に含んでいるようです。
よって、現代短歌だけを対象にするならば、現代語版の辞書を使えば、実用的な精度で形態素解析ができると考えています。ある程度は。
辞書を自らカスタマイズするという手もあるようですが、一気に難易度があがるので私はやっていません。

●(B)について
こちらは「サラダ記念日」を対象に形態素解析をしています。
言い忘れましたが(A)は特に書いていないので、自動ではなく一首ごとにチェックしたのだろうと思います。本当にお疲れ様です。

・形態素解析のツール
浅野さんはPythonを使っています。
今回の評論以前、文フリでお会いした時に形態素解析の話をした記憶があるのですが、そのときにPythonでもできるという情報を共有させてもらいました(記憶違いだったらすみません)
そのあと、実際にされた。実行力にまず感動してしまいます。

ちなみに私はPythonが使えないので、KHcoderという形態素解析と統計を合わせてできるフリーソフトを使用しています。
パソコンが不得手の方はこのフリーソフトをおすすめします。
試しに自分の作った短歌とかをエクセルに並べて放り込んでみると、色々と楽しいと思います。

・Bパートについて
Bパートは形態素解析によって得られる各指標を羅列したという印象です。
Aパートが浅野さんなりの物の見方をはっきりと前面に出して、それをどう数値化するかのプロセスの提示も含めて新鮮だったのと比べると、Bパートは一人称や二人称についての考察などはありますが、少し物足りない印象でした。

私も経験があるのですが、形態素解析をして、例えば『助詞「の」の使用率が〇%』だとわかっただけでは、それ以上のことを示すのは難しいです。
とはいえ、俵万智作品に関する基本的なデータ自体は有用だと思います。
せっかくなので私の書いた「『手紙魔まみ』における穂村弘の文体の変容」を参照して、比較してみましょう。

浅野さんによれば、「サラダ記念日」434首中、終助詞「ね」の登場回数は12回。すなわち2.8%となります。
一方で私が調べたところによれば穂村弘の『手紙魔まみ』以前の作品の終助詞「ね」の登場率は1%前後です。
こうしてみると(A)で同じぐらい「文語」使用率が低かった俵と穂村ですが、終助詞「ね」の使用率一つとってもそれなりに差があります。
つまり同じように「文語」が少ない≒「口語」が多い当時の二人とはいえ、その「口語」使用へのアプローチは異なっている可能性が示唆されます。

ちなみに、『手紙魔まみ』での「ね」使用率は6%以上となっています。
「ね」だけに関してみれば、穂村さんの「口語」の『手紙魔まみ』での変化は、俵万智の使い方に近づいた上に追い抜いたと言えるかもしれません。
穂村弘の「口語」を俵万智からの影響という視点で語る文章は読んだ記憶がありませんので、誰か考察してみても面白いかもしれません。
もしやる気のある方がいれば、私のやった穂村さんの作品の形態素解析データをお渡ししますのでご相談ください。

〇まとめ
以上、この文章を読んで計量的な分析に興味を持ってもらえるといいなと思います。

誰でもこの手法を好きになってくれるとは思わないのですが、数字で示すこと自体に楽しみを感じる人で、短歌に限らず文芸批評に興味がある人ならば、色々とやりがいのある手法だと思います。
もしまだやったことのない方で興味のある方は、私の知っている範囲の情報は提供しますのでご連絡ください。

2018.5.12 久真八志


この記事が気に入ったらサポートをしてみませんか?