備忘録:Python書いたことない人がcolaboratory使ってみてコケた話
colaboratory使ってテキストマイニングしようとして、⇩をやろうとしたらハマったアホほど初歩的なところ。
120%自分用のメモだよ
データの読み込みはちょっと面倒くさい
データよみこむのに、いきなりpd.read_csvつかったらこけた。
いっかいファイルをアップしないといけないらしい。
from google.colab import files
uploaded = files.upload()
janomeがインストールできない問題
$pip installだとダメ。!pip installでcolaboratory上でインストールできる。
Tokenオブジェクトで何がとれるのか
こればただのPythonの話。いきなりコードいっぱい書いてあって、なにが何のデータか分からないレベルのド素人だったので整理。
surface (表層形)
part_of_speech (品詞)
infl_type (活用型)
infl_form (活用形)
base_form (基本形)
reading (読み)
phonetic (発音)
node_type
そもそもPythonちゃんと勉強してない件
pythonはインデントを綺麗にしとかないとうごかない…これ一番ひっかかった…
ネットからコピペとかしてきて、こねこねいじくってるとインデントよく分からなくなるんだもん…returnのインデントちょっとずれただけじゃんかちくしょう……