見出し画像

【校閲ダヨリ】 vol.65 僕の夏休みの自由研究④(計量言語学の手法Ⅲ)※難




みなさまおつかれさまです。

最終回に来て予想外の確認事項が発生し元の文献を取り寄せることになり、作成に時間がかかってしまいました。
計量言語学ではじめたときには、まさかこんなに長いものになるとは想像だにしていなかったのですが、ようやく今回で終幕です。
前回は、3つある計量語彙論の本質に迫る法則のうちひとつを紹介しました(Zipf(ジップ)の法則)。
ここでは、残りふたつを取り扱いたいと思います。



2.【樺島の法則】

I=a×(eの-bN乗)

M=c-dN

V=100-I-M

   

N:名詞  V:動詞  M:形容詞・形容動詞・副詞・連体詞  I:接続詞・感動詞

画像1

(樺島忠夫(1979)『日本語のスタイルブック』(大修館書店)より引用)   
   
延べ語数で見た場合の、品詞(類)の割合がテキストのジャンルによって異なる」ということを明らかにした経験則を指し、樺島の法則と呼んでいます。
   
   
   

なんのこっちゃ。

   
   
   
勉強してからしばらく時間が経っているため、私も同じような感覚に陥っております。(学習は反復が大切です)
これはどういうことかと言いますと……

基準はまず「延べ語数」です。
ここを出発点として集めたデータを分析していくのですが、文章(テキスト)のジャンルによって名詞が多いのか、動詞が多いのか、形容詞が多いのかということを数式で導き出したもの、という感じになります。
   
たとえば、新聞記事では名詞の割合が70%、動詞が28%、残り数パーセントが形容詞や形容動詞、感動詞・接続詞という品詞構成であったり、日常会話では名詞が41%、動詞25%、形容詞や形容動詞が20%など、テキストのジャンルによってその品詞的特性が明らかになるような法則なんです。
   
   

いちいち数式で示さなくても、新聞に名詞が多いのはなんとなくわかるような気がするんだけど

   
   
たしかにそうですね。
ただ、そこはやはり学問ですので「なんとなく多い気がする」ではお話にならないわけです。
また、「統計としてアタリをつけられる」ことも、研究の大きな助けになるので、「なんとなくそうっぽいこと」を裏付けしてくれる論は研究者にとってとてもありがたいものということになります。
   
   

スクリーンショット 2021-10-18 9.41.52

さて、見出し下でもご紹介している数式ですが、これは「名詞の比率に従って、ほかの品詞の割合がどのように変化するか」導き出した式です。
x軸を「名詞の比率」とし、y軸を「対象品詞の出現割合」とすると、品詞の種類ごとに一定の法則性が見出せるグラフが現れます。(樺島(1979)第14図)

画像3

Mのグラフは、y=ax+bの形をしていますが、式もその通りになっています。
M=c-dN は、項を並び替えると M=-dN+c となり、見慣れた形になりますね。

Iのグラフは、指数関数(y=aのx乗)のグラフに形が似ていますが、式I=a×(eの-bN乗)を見ても、それがわかるかと思われます。

Vの式は、グラフに対するものではありません。すべての品詞の割合から名詞の割合を引いたものを100%とし、そこから I と M の割合を引いて求めています。グラフの形は、Iを反転させたような形に見えます。


   
   
   
3.【大野の法則】
   
こちらは、樺島の法則の「異なり語数」版です。

   
何度も言っていますが、延べ語数と異なり語数は同じものではありません
たとえば、洋服をデザインする人にとっての素材の違いといえば少しわかりやすいでしょうか……?
シルクの素材感を出したい部分に、コットンや麻は使えないでしょう。
言語学でも同様に、「異なり語数」を使って論を展開している場合には、延べ語数を対象にした樺島の法則はあまり役に立たないわけです。
そんな点で、「大野の法則」はとても意味のあるものと言えると思います。
   
   
ただし、樺島の法則・大野の法則ともに重要な点として「語の認定方法が揃わないと、結果がおかしなものになる」ということがあります。
語の認定方法については vol.63でお話ししていますが、データを集める際には十分な注意を払いましょう。
   
   
   
さて、ここまで長々と計量語彙論の手法についてまとめてきましたが、最後にその目的について、もう一度みなさまと共有しておきたいと思います。
   
計量語彙論は、いわば「定量的手法」に終始するわけですが、帰結するところは普遍性を見出す「定性的研究結果」になることが多いです。
定量的手法定性的研究には密接な関係があり、これは計量語彙論のみならず、広くさまざまな学問にいえる「本質」のひとつであるのでしょう。
   
   
国語学者の宮島達夫は「意味の記述は、現象における量的なちがいを説明できなければ、不完全である」と述べていますが、これは茨木のり子の「自分の感受性くらい」と同じくらい、私にとっては「父からのカミナリ」的な言葉です。
自分の論が「不完全だ」と言われることほど痛烈なものはないし、またそれは自分の力不足や詰めの甘さを意味しますからね。
   
   
……論文を書くときは、量的な研究もしっかりやりますね、先生。(いつも読んでくださっている恩師に向けて)
   
   
それでは、また次回。
   

   
   
追伸:「自分の感受性くらい」とはこんな詩です。

茨木のり子
「自分の感受性くらい」

ぱさぱさに乾いてゆく心を
ひとのせいにはするな
みずから水やりを怠っておいて

気難しくなってきたのを
友人のせいにはするな
しなやかさを失ったのはどちらなのか

苛立つのを
近親のせいにはするな
なにもかも下手だったのはわたくし

初心消えかかるのを
暮らしのせいにはするな
そもそもが ひよわな志しにすぎなかった

駄目なことの一切を
時代のせいにはするな
わずかに光る尊厳の放棄

自分の感受性くらい
自分で守れ
ばかものよ



参考文献
日本国語大辞典』(小学館)
日本語学大辞典』(東京堂出版)
日本語文法事典』(大修館書店)
講義「ことばを数える―計量語彙論の世界―」』(山崎誠、国立国語研究所)
樺島忠夫(1979)『日本語のスタイルブック』(大修館書店)



#校閲ダヨリ #校閲 #校正 #出版 #雑誌 #本 #書籍 #エディトリアル #日本語 #言語 #言葉 #国語学 #文法 #proofreading #magazine #book #publishing #create #editorial #language #peacs


この記事が気に入ったらサポートをしてみませんか?