見出し画像

Fasttext ライブラリで文書分類が出来る

Fasttext ライブラリで文書分類が出来るのまとめ

Facebook research がFasttextを使った文書分類ライブラリを公開している

Fasttext のpython 環境でのinstall 方法は簡単

実行時間が早い

前振り

文書分類のタスクに取り組むことになり、当初は、NeuralClassifier: An Open-source Neural Hierarchical Multi-label Text Classification Toolkit を使っていたのですが、あまり精度が出ませんでした。

上司に教えてもらったのが、

[2] A. Joulin, E. Grave, P. Bojanowski, T. Mikolov, Bag of Tricks for Efficient Text Classification 

でした。

Fasttext ライブラリの特徴

これはFasttextを用いて文書分類問題をend-to-endで解いてくれるライブラリになります。そのため、文書ベクトルを分類タスクに最適化できる仕様になっています。

学習にかかる時間も数秒以内と非常に速く、たたき台としては十分に有効です。

Fasttext ライブラリの使い方

ここから先は

1,576字

¥ 500

私にカフェオレを飲ませるためにサポートしてみませんか?