ネット上の怖い話をトピックモデルで自動分類してみた(2)
こちらの記事のつづきです。
(1) ではネット上の怖い話14,000件から30個のトピックを生成してみました。では、その14,000件の怖い話はそれぞれどのトピックに分類されるのでしょうか?LDAは一つの文書が複数のトピックを持っていることを仮定していますが、ここではそれぞれの文書について最も重み(尤度)が大きいトピックをその文書の主要なトピックとして分類します。すると、各トピックに分類される文書の数は下図のような分布になります。
一番多くの文書が分類されたのは Topi