E資格【ラビット・チャレンジ】110日目/Word embeddingとは??
ちょっと、テスト対策でざっくりまとめたいと思います。
すっごく範囲が広いので、きっとこの問題もいきなり問題がぽつーんとあって、僕がいまから書く内容なんて全くかすりもしない可能性はかなり高いのですが。
もし、掠りでもして、1点増えたら嬉しいかなと思って、箇条書きにて簡単に記載してみる
・単語埋め込みを使うと、似たような単語が似たようにエンコード(変形)される。効率的で欲しい表現が得られる。重要なのは、このエンコーディングを手動で行う必要がないということ。
・埋め込みベクトルの値は指定するものではなく、学習されるパラメータ
・Embedding レイヤーは、(特定の単語を示す)整数のインデックスに(その埋め込みである)密なベクトルを対応させる参照テーブル。
・Embedding(埋め込み)とは、「文や単語、文字など自然言語の構成要素に対して、何らかの空間におけるベクトルを与えること」
あ、なるほど、wordEmbeddingは、言葉にベクトルを与えるような埋め込み関係をいう考え方であって、アルゴリズムの名称ではないのですね。
Word embeddingを行う沢山のアルゴリズム
One-hot表現
共起関係の利用
LSI(Latent Semantic Indexing)
Glove
fastText
Character-based Embedding
Meta Embedding
AutoExtend
日本語は少ないが MeCabが有名だが、近年はneologd がある。
シラバスの中でWord embeddingと記載されているが、Word2vecと言う有名なアルゴリズムが出そうと、山をかけて勉強する感じですね
E資格黒本にもWord2vecが記載されていました。
この記事が気に入ったらサポートをしてみませんか?