見出し画像

新聞の1面記事で最も使われているひらがなを探る

  標題の通り、ただ新聞の1面で最も使われたひらがなをカウントしているだけである。結果だけ見るのも面白いかもしれないが、時間が許せば他の部分もご覧いただきたい。(文:きゅえすた)

画像1

1.はじめに

 日本語の文はひらがな、カタカナ、漢字、数字等の記号を組み合わせる。その中でもひらがなは文章で大きな役割を果たしている。もちろん、単語1つ1つは漢字で成り立つものがある。しかし、助詞や助動詞は漢字で表記しない。専らひらがなが用いられる。動詞の多くには送り仮名があり、そこにもひらがなは用いられる。現代の日本語で文を作成するには、どうしてもひらがなの力が必要になる。

 ある日、新聞を読んでいた筆者は、ふと思い立った。文章で使われているひらがなの中でも、よく使われるひらがなとそうでないものがあるのではないか、と。もし使用頻度の高いひらがなが存在するのであれば、我々日本人はそのひらがなにペコペコお辞儀しながら生きていく必要があるかもしれない(必要ない)。

 そこで試しに新聞の1面に書かれた記事を読み、ひらがなをカウントしていくことにした。今回はその結果を発表する。

2.まさかの先行研究

 新聞でひらがなの使用頻度を確かめている研究など存在しないだろうと、軽い気持ちで論文検索サイト「CiNii」にアクセスした。ドンピシャなものが1件存在し、笑うしかなかった。

 その論文は1996年の『日本教育工学雑誌』に掲載された「文字使用に関する計量的研究 : 日本語教育支援の観点から」(野崎他、1996)である。野崎らは1993年の朝日新聞の記事全文を、この研究のために開発したシステムで分析し、ひらがな・カタカナ・漢字の使用頻度を分析している。27年前であれば日本語がさほど現在と変わりはない上、新聞記事1年分をコンピュータで分析しているのだから、もはや答えは出たようなものである。つまらなくなるので、この研究の分析結果はこの段階ではあえて触れず、後ほど今回の結果と比較することにする。このやり方は普通であれば誰かに怒られているが気にしない。

 仮説:ひらがな使用頻度の順位において、野崎他の論文で示された結果と今回のカウント結果がほぼ同じである。

3.分析方法

 残念ながら、筆者(一般人代表)にはコンピュータを用いて分析できるほどの知識や経験を持ち合わせていない。下記の要領で地道にひらがなをカウントすることにした。多少の誤差が生じている可能性はあるが、仕方なく目を瞑っていただきたい。気を付けてカウントしてはいる。

 使用データ:2020年3月6日京都新聞朝刊1面 集計方法:読みながら正の字でカウントするアナログな方法 規則:記事本文(見出し、解説の図表含む)をカウントし、広告・天気予報・目次部分は省略する。 

 この日の1面にはコロナウイルスに関する記事2件と、サンガスタジアム京セラの整備に府債を用いなければならなくなったことを伝える記事が掲載された。今回の分析にはこれらに加え、「凡語」(1面の連載)、「星を見つめて」(星座に関する連載)を対象に含めている。

画像2

4.分析

 誰も待っていないカウントの結果が表1である。

ひらがな

 「の」が他のひらがなを大きく上回り使用されている。この「の」の他にも、「に」・「を」・「は」などは助詞として用いられるひらがなだ。

 助詞としての「の」は、名詞と名詞をつなぐ言葉として用いられる(連体修飾語)。また、「この」のように連体詞として組み込まれているものもある。分析に使用した京都新聞から一例(習近平国家主席の来日延期について)を引用する。

 菅義偉官房長官は記者会見で延期理由について、「両国が双方の最大の課題である感染症の拡大防止を最優先とする必要があると一致した」と説明。

 この一文だけで3回「の」が使われている。「双方の最大の」のように、連続して使用されるケースは珍しくないようだ。

 3番目に多く使用されている「た」は動詞の一部として多く用いられている。今回分析に使用した新聞の記事は、いずれも過去(発行日前日やそれ以前)の出来事を報じている。「星をみつめて」でも、星座に関連したエピソードを説明する際に過去形の文を用いている。

 「の」が150回使用された一方で、「ぬ」、「ね」、「ひ」、「ふ」、「ぎ」、「ぢ」、ぱ行全て、「ぼ」、「ざ」、「ぞ」は1回も使用されることがなかった。普段の会話でも使用することが少ないかもしれない。

 最後に、野崎らの論文と今回の結果を比較する。

平仮名研究

  順番こそ異なるが、使用頻度の上位10位に入っているひらがなはほとんど一致した。野崎らの論文で9位に入っている「が」は、今回のカウントでは11位タイに入っている。今回のカウントで10位の「で」は、野崎らの論文では11位で、こちらもほとんど変わりない。野崎らの論文で1位となった「の」だが、1年間の新聞記事で約191万回使用されており、2位の「に」に80万回以上の大差をつけている。

5.まとめ

 仮説についてはどうでも良い(暴論)。新聞記事では「の」が最も多く使用されていることが、さらに強く主張できそうな結果が示せた。今回は1日分、それも1面の記事のみでカウントしているので、気力のある方は、電子データを用いて1年間カウントしてみるのも良いかもしれない。アナログな方法だと間違いなく挫折する。

 文章では多用されている「の」だが、話し言葉だとどこまで使われるのだろうか。興味は尽きないが、今回はここまでにしておく。


<参考文献>

野崎浩成・横山詔一・磯本征雄・米田純子(1996)、「文字使用に関する計量的研究 : 日本語教育支援の観点から」、『日本教育工学雑誌』第20巻3号、141-149頁。

京都新聞「習主席の国賓来日延期」、2020年3月6日朝刊、17版1面。

なお、記事内イラストは「白黒ヤギさん」という優秀なサイトからお借りしている。

この記事が気に入ったらサポートをしてみませんか?