見出し画像

MouMa x 自然言語処理

みなさまこんにちは。MouMaチームです。

今回はMouMaラジオで登場した頻出名詞や動詞を調べるために用いる自然言語処理についての記事となります。できるだけ分かりやすく説明することを心掛けて書きました。

みなさんが投稿していただいた妄想商品も、ドライに眺めると19文字以内の文字の列ということになります。これを自然言語処理のライブラリ(処理を行ってくれるツール)に渡すと、

例えば「MouMaは、19文字以内で好きなアイデアを書いて出品することができるWebアプリケーションです。」

という文章は、次のように分解されて出力されてきます。

画像1

こうした分解処理の後、左から2列目に品詞の区分がありますので、それぞれの名詞や動詞の出現回数をカウントします。ただ動詞の場合は活用がありますよね。

例えば「好きなアイデアを書いて出品」の「書くが、五段・カ行イ音便 連用タ接続されて、書いて」になっている…なんてことを気にしなくても、

(※「五段・カ行イ音便」「連用タ接続」は国語文法の専門用語です。気になる方は調べてみて下さいね。)

画像2

上の表の中で「書い(て)」は「書く」だよ、と教えてくれています。文法アレルギーの私でも心配することなく、すばらしいライブラリたちが助けてくれます。

しかし、「出品する」では「する」が動詞になっていますが、ヒトの感覚では「出品する」です。また日本語では「象は鼻が長い」のようにどれが主語?みたいな問題や、「何食べたい?―――カツ丼」での「カツ丼(を食べたい)」のように文脈を介して初めて意味をなす問題があって、自然言語処理はとても奥が深いです。

下の画像は、MouMa商品の中で「眼鏡」(MouMa頻出名詞の一つ)が含まれるアイテムを処理したものです。※タイトル絵は「MouMa」のもの。

画像3

この条件を出品者さんの出品リストに変えれると、出品者さんの頭に浮かぶことの多い言葉リストが出来上がります。自分でも意識していなかった言葉の世界があるのかも。。

以上、MouMa x 自然言語処理の話でした。
最後まで読んでいただき、ありがとうございました!

↓ ↓ ↓ よければこちらもご視聴ください! ↓ ↓ ↓

【MouMaRadio】
#56 MouMa出品における頻出「動詞」ランキング ~妄想商品にはどんな行動が入りがちなのか


◆妄想商品マーケット MouMa(モウマ)
19文字以内で実現可能性を考えない自由な妄想商品を、好きな値段をつけて出品することができるWEBサービス♪ 「こんなのあったらいいのにな~」と一度でも考えたことがある人は、ぜひ使ってみてほしいです!

◆MouMaのホームページはこちら

◆MouMaRadioも配信中!
- Spotify
- ApplePodcast
- YouTube

◆MouMa公式Facebookはこちら

◆MouMa公式Twitter

MouMaに関するお問い合わせは、下記連絡先までお願いいたします。
株式会社要 MouMa事業部
連絡先:mouma_support@kanamekey.com
https://kanamekey.com/

#MouMa #妄想 #妄想商品 #フィクション #自然言語処理