日本酒コーパス(最新情報)
日本酒の雑誌・書籍から味わい表現をピックアップした,
日本酒コーパスがレベルアップしました.(2020年2月4日現在)
総語数 (Tokens) 120,789 → 158,639
異なり語数 (Types) 6,018 → 8,197
総文数 (Sentences) 5,582 → 7,485
段落数 (銘柄数 brands of Sake) 2,388 → 2,964
複合語リストは下のものです.
(KH Coder付属のtermextractを使用)
コーパスを使いたい方はご連絡ください
fukushima[at]kwuc.ac.jp
以前のバージョンを含めた,感性表現データベースの論文は以下のものです.
この記事が気に入ったらサポートをしてみませんか?