日本酒コーパス(最新情報)

日本酒の雑誌・書籍から味わい表現をピックアップした,
日本酒コーパスがレベルアップしました.(2020年2月4日現在)

総語数 (Tokens) 120,789 → 158,639
異なり語数 (Types)  6,018 → 8,197
総文数 (Sentences)  5,582 → 7,485
段落数 (銘柄数 brands of Sake) 2,388 → 2,964

複合語リストは下のものです.
(KH Coder付属のtermextractを使用)

コーパスを使いたい方はご連絡ください
fukushima[at]kwuc.ac.jp

以前のバージョンを含めた,感性表現データベースの論文は以下のものです.


この記事が気に入ったらサポートをしてみませんか?