見出し画像

【コーパスメモ】COCA でレマ(ed, ing, s, 過去分詞など全ての形態素の単語をまとめて)で検索する方法

Lemma で検索する際は、[]で対象の単語を囲めばOK。

例: [bear] fruit で検索すると、以下のように、レマ単位で検索が可能である。

参照元:COCA(https://www.english-corpora.org/coca/

ちなみに、[bear][fruit] と検索すると、両方ともレマ単位での検索となる。

画像1


ただし、これは固定されたカタチでの検索になるので、コロケーションの間に形容詞などが入る場合の頻度は、検索できない。


そのため、各コロケーション構成語の、前後のスパンを4語ずつにして、collocates の機能で頻度を検索するのが適切らしい(以下の文献の、457ページをご参照)。


Durrant, P. (2014). Corpus frequency and second language learners’ knowledge of collocations: A meta-analysis. International Journal of Corpus Linguistics, 19(4), 443–477.


クリックすると、こんな感じに。

画像2


この下の数字を選ぶことによって、スパンを決めることができる。

ちなみに、このcollocates でも、[]の使用や大文字化によって、レマ単位で検索することが可能。

ただ、文献を読んでみても、コロケーションの構成語のどちらをlemmatize して検索するべきかは、わからないので、これから調べないといけない、、、

ぼつぼつ、頑張りましょうか。

この記事が気に入ったらサポートをしてみませんか?