見出し画像

How many words do we have to know?

▼大学入試問題の英文を読むためには,いったいどれぐらいの語彙力が必要なのでしょうか。もちろん,語彙の知識は多ければ多いに越したことはありません。とはいえ,たとえば「わからない単語は前後から推測しなさい」と言われた時に,どの程度の単語を知っていれば推測ができるのかわからなければ,そのアドバイスも意味をなしません(「前後から推測しろ」と言われても,前後の単語を知らなければお手上げですから)。

98%=a 8,000-9,000 word-family vocabulary

▼入試問題ではなく,英文全般に関して言えば,Paul Nation, "How Large a Vocabulary is Needed For Reading and Listening?", 1979 などで示された,"98%" という数値が定説となっているようです。つまり,英文全体の98%の語彙を知っている必要がある,ということで,これは8,000-9,000のワードファミリー(*)に相当する,とされています。

"If 98% coverage of a text is needed for unassisted comprehension, then a 8,000 to 9,000 word-family vocabulary is needed for comprehension of written text and a vocabulary of 6,000 to 7,000 for spoken text."
https://www.utpjournals.press/doi/pdf/10.3138/cmlr.63.1.59

※ word family:たとえば analyze という動詞の場合,analyzed / analyzing と活用しますが,それだけでなく analysis という名詞形や analytical という形容詞系などの派生語も含むグループのことです。

▼しかし,大学入試問題の場合,文部科学省の学習指導要領の範囲内から出題する必要があるため,語彙に関してはかなり使用が限られており,原文をリライトしたり,注釈をつけて対応しているので,8,000-9,000という数は必要ないはずです。

センター試験に最低限必要な語数

▼センター試験で出題された英文の語彙レベルを研究した論文として,Ewen MacDonald, "An Analysis of Vocabulary Level in Reading Passages of the National Center Test", 2019 があります。

▼この冒頭部分では,英文を読んだり推測したりするために必要な語彙レベルについて,これまでの研究内容がコンパクトにまとめられています。

A strong knowledge of high frequency vocabulary is foundational to second language (L2) learning and obtaining general language proficiency, as words that occur with a high level of frequency provide a disproportionately high percentage of text coverage (Stoeckel & Bennett, 2015).  An analysis by Nation (2006) of the British National Corpus showed that knowledge of 3,000 to 4,000 word families is necessary to understand 95% of a general English text.  This is an important minimum vocabulary threshold, with Laufer (1989) estimating that knowing 95% of the words in a text allows reasonable comprehension and guessing the meaning of unknown words in context. Later studies concluded that while 95% coverage allows minimally acceptable comprehension, text coverage of at least 98% based on knowledge of 8,000 word families is ideal, and should be an eventual goal for learners as it allows accurate guessing of unknown words in context and unassisted reading for pleasure (Hu & Nation, 2000; Laufer & RavenhorstKalovski, 2010; Schmitt, Jiang & Grabe, 2011).  It can therefore be said that a sound knowledge of core vocabulary is essential for L2 learners of English, and the acquisition of high frequency vocabulary should be focused on in teaching and learning English as a second language.
( http://teval.jalt.org/sites/teval.jalt.org/files/23_02_19_MacDonald_Vocabulary_Level-2_0.pdf )

▼これによれば,〈一般的な英文テクストの95%を理解するには3,000-4,000語が必要である。ただし,95%では最低限の理解は可能であるが,少なくとも8,000のワードファミリーの知識に基づく98%のカバーが望ましい。これは文脈から未知語の推測をしたり,娯楽のために辞書などを使わずに読めるようになるレベルだからだ〉ということになります。

▼この研究では,以下の2つの問いを立て,それについて考察しています。

1. What percentage of vocabulary coverage does the NGSL provide for long reading comprehension passages of the 2014-2019 NCTs?
(NGSLは2014年から2019年のセンター試験の長文読解の文章のうち,何パーセントの語彙をカバーしているか?)
2. Does this vocabulary coverage achieve the ideal 98% text coverage to allow comfortable reading comprehension and guessing of words in context?
(この語彙のカバー率は,快適な読解や文脈における語彙の推測を可能にする理想的な98%というカバー率を達成しているか?)

▼この NGSL とは,New General Service List のことで,英文の中で用いられる,最も核となる語彙をリスト化したものです。

▼以下の画像は http://www.newgeneralservicelist.org/ から引用したものですが,これによれば,コアとなる単語(NGSL: New General Service List)が2,800語で,その上に目的に応じた語彙(700-1,700語)を積み重ねるイメージです。

画像1

▼この調査の結果,2014年度から2019年度のセンター試験第4問~第6問の英文では,NGSLの最高頻度単語2,801語内でカバーされているものが94.62%(2014年)~96.93%(2015年)の範囲内に収まっていることがわかりました。つまり,NGSL の2,801語をマスターすれば,95%という閾値はほぼカバーできることになります。しかし,NGSLだけでは,98%という「より快適に辞書なしで読めて,正確に未知語を推測できる」というレベルは厳しそうです(※なお,この論文によれば,たとえば2018年度の第4問は NGSL で98%以上をカバーしていたものの,第6問は95%を下回った,というように,大問ごとにカバー率は異なるとされています)。

共通テストで用いられている語彙がセンター試験とほぼ同じだとすれば,まずはこの NGSL の語彙リストに掲載されている2,801語を覚えることで,最低限必要な95%の語彙をカバーできることになるでしょう。では,国公立二次・私大はどうでしょうか。

東京大学の入試英文読解問題を解くために必要な語数

▼以下の Masaya Kaneko, "Estimating the reading vocabulary-size goal required for the Tokyo University entrance examination", 2013という論文では,東京大学の入試英文読解問題を解くためには,4,000-5,000のワードファミリーが必要であるとされています。

▼この研究は,2003年から2011年の東大の入試英文読解問題を分析したもので,NGSLの前身にあたるGSL(General Service List)と,学術用語のリストであるAWL(Academic Word List),およびBNC(British National Corpus)を用いて分析しています。

▼その結果,98%のカバー率を超えるためには,BNCの語彙リストで 4,000-5,000 のワードファミリーを習得している必要があると判明しました。

大学入試に必要な語彙数

▼一概に単純化はできませんが,一つの目安としては次のようになるでしょう。

▼98%の壁を超えるために必要な語彙力
① 共通テスト/センター試験レベル 2,800-3,000のワードファミリー
② 難関国公立二次・私大 4,000-5,000のワードファミリー

▼なお,先に述べたように,この数値は派生語を含む「ワードファミリー」を表すものなので,派生語も1語と数えた場合,これよりも数字は大きくなります。

▼まずは,NGSLのリストにある単語とその派生語をマスターすることから始めるのが効率的な語彙の習得法だと言えそうですね。

※NGSLのリスト(エクセルファイル)は以下のリンクからダウンロードできます。

①頻度順リスト

②アルファベット順リスト


この記事が気に入ったらサポートをしてみませんか?