見出し画像

日本語を「足し引き」する?

おはようございます。
折り畳み傘を持ち運ぶためだけのカバンが欲しいきゃたです。
#リュックはデカすぎる
#でも傘を直接持ちたくはない


昨日から自然言語処理という分野の勉強を始めました。
簡単にいうと「Google翻訳」のように言語をパソコンで扱っちゃおうぜという感じです。
#多分あんまり正しくない説明

昔から使われている手法の一つに「word2vec」というものがあります。
簡単にいうと「単語を数字で表しちゃおうぜ」というもの。
#多分あんまり正しくない説明(2回目)

例えば「日本」は

こんな感じの数百個の数字で表されます。
#こわいよー
#数字こわいよー


これの面白いところが「足し引き」できるんです。
#は?


意味わかりませんよね?

例えば以下のような式が与えられたらなんと答えるでしょう?

王様 + 女性 ー 男性 = ?

王様に女性の要素を加えて男性の要素をなくす、、、
皆さんならなんと答えますか?

なんとこの計算がプログラム上でできちゃうんです。

positiveが「+」、negativeが「ー」を表すので、このプログラムは先ほどの式と同じものを表しています。

これを実行すると

プログラム上は「お姫様」が答えである可能性が最も高いと言っています。


面白くないですか?

この技術では文脈を読むことはできないので現在は注目度は少し落ちているようなのですが、言葉を数字にして計算するという発想は面白いなーと思いました。


引き続き勉強頑張っていきまーす。

それでは皆さん良い1日を。

きゃた

こちらもお願いします!

この記事が参加している募集

アプリのAndroid版開発のためによろしければカンパをお願いします!!