Pythonでワードクラウド
ちょっとテキストマイニングのまねごとをしてみます。
サンプルデータはこのようなものです。
病名がリスト化されたシンプルなテキストファイルです。
まずはこれをデータフレーム化します。このテキストにはHeaderがないのでヘッダーも指定してデータフレームを作成します。
import pandas as pdheaders = ['AE_Name']df = pd.read_table('Adverse events.txt',names=headers)df
header