GPTは、どのようにして答えを出してくるのか?
あなたの質問をGPTは、マルコフ連鎖で文字を出してきます。
GPTの内部の動きはどのような動き?
GPTはTransformerアーキテクチャを使用しています。このアーキテクチャは、複数のエンコーダーとデコーダーを持ち、エンコーダーは入力文章を符号化し、デコーダーは符号化された文章をデコードして出力を生成します。このプロセスは、入力文章と出力文章のペアをトレーニングデータとして使用して、損失関数を最小化するようにモデルのパラメータを調整することで答えを出します。
[入力文] -> [エンコード] -> [デコード] -> [出力単語の確率分布]
[トレーニングデータ] -> [学習] -> [モデルパラメータの調整]
上のマークダウンで図解したものの[エンコード] と[エンコード] 、 [モデルパラメータの調整]がよく理解できません。例を出して、さらに小学生でもわかるように説明して下さい。
[「りんご」のトークン] [「が」のトークン] [「赤い」のトークン]
[0.123] [0.456] [0.789]
「エンコード」「デコード」「モデルパラメータの調整」の説明です。。
「エンコード」とは、入力された文章を数値データに変換することを指します。トークンと呼ばれる小さな単位に分割し、それぞれに対して一意な数値を割り当てます。
「デコード」とは、数値データを元の文章に変換することを指します。
「モデルパラメータの調整」とは、モデルが正しい出力を生成するようにパラメータを調整することを指します。トレーニングデータから学習した情報を、モデルのパラメータに反映することで、より正確な予測が可能になります。
ざっくり結論
GPTは、あなたが入力した文字の流れを見て次の文字を予測して文字を出してくる。ということです。
ざっくりしすぎたかもしれませんね笑
■最先端のプロンプトデザイナー
独学でプロンプト、天才的なプロンプトを発信しているので、かなり勉強になります。ネットで一所懸命にプロンプトの情報をかき集めるよりも、圧倒的に勉強になると僕は思います。