MacにMeCabを入れて品詞分解してみた

めかぶともずくだったら、めかぶを採るように指導されたことがあります(もずくは冷性で、からだを冷やすのだそうです)。

というのも、口の中の粘膜に綿棒をグリグリ採取して体質をみてもらえるサービスを以前受けまして。毎日もずくを食べる生活(10年以上)を否定されたようでそれはショックでした。

MeCabや利用する辞書のインストール

こちらを参考にしました。

またしても冒頭から初見の単語が出てきたので、辿ります。。
Homebrewをインストール。

Python3からMeCabを使うの記事の順番どおりにコマンドを入力すると2箇所躓きます。

# 1箇所め

$ git clone --depth 1 git@github.com:neologd/mecab-ipadic-neologd.git

はPermission Error(publickey)となったので、GitHubを見に行きます。初回は

$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git

とありましたのでこちらを入力。

スクリーンショット 2020-08-14 14.43.08

フィニッシュ!(見切れてますがFinish.. *2で完了です)

# 2箇所め
$ pip install mecab-python3
​

は、

$ python3 -m pip install mecab-python3

初心者は「python -m pip形式でコマンド利用してください」&& pythonのバージョンが3以降なのでコマンドはpython3にすること、を組み合わせたらうまく行きました(^^)

品詞分解してみる

MeCabで定番の分解結果はこちら↓

$ mecab
すもももももももものうち
すもも	名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も	助詞,係助詞,*,*,*,*,も,モ,モ
もも	名詞,一般,*,*,*,*,もも,モモ,モモ
も	助詞,係助詞,*,*,*,*,も,モ,モ
もも	名詞,一般,*,*,*,*,もも,モモ,モモ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
うち	名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

で、わたしが今回品詞分解してみたかったのはこちらです。

想定した結果は出るでしょうか。

$ mecab
バナナのナナチはバナナナチ
バナナ	名詞,一般,*,*,*,*,バナナ,バナナ,バナナ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
ナナチ	名詞,一般,*,*,*,*,*
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
バナナ	名詞,一般,*,*,*,*,バナナ,バナナ,バナナ
ナチ	名詞,固有名詞,組織,*,*,*,ナチ,ナチ,ナチ
EOS

惜しい。そうきたか。。てかナナチ名詞判定されとる!
インストールした辞書を指定してもう一度だ。

$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
バナナのナナチはバナナナチ
バナナのナナ	名詞,固有名詞,一般,*,*,*,バナナのナナ,バナナノナナ,バナナノナナ
チ	名詞,一般,*,*,*,*,*
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
バナナ	名詞,一般,*,*,*,*,バナナ,バナナ,バナナ
ナチ	名詞,固有名詞,組織,*,*,*,ナチ,ナチ,ナチ
EOS

最後そこは固定なのね、という結果。でもこれすごいわ、楽しい✌︎

※実は新卒入社時はテキストマイニングやりたかったのよ。。

この記事が気に入ったらサポートをしてみませんか?