つい文書のトークナイズしたあとに表層形のまま、学習データを作ってしまうというミスをした。場合によるけども、データが少ない時は基本形に変換して、語彙数を抑えた方が精度が上がることを確認した。

私にカフェオレを飲ませるためにサポートしてみませんか?