以下のXのポストとnoteの記事にインスパイアされて、Claude-3-Opusと対話して、LLMとはというのを簡潔にまとめてみました。
とか
では、「LLMとは、文字列を入れたら文字列が帰ってくる関数である」とかシンプルな説明等があったのですが、自分としては違和感があったので、Opusと対話してみました。
以下、Opusとの対話の転載です。
「LLMとは、文字列を入れたら文字列が返ってくる関数である」「LLMとは、「自然言語命令を受け取って自然言語を出力するプロセッサである」というこれら二つの説明について、LLM研究者のシニアアドバイザーとして、これらの説明方法のアドバンテージと、ディスアドバンテージ、それから、正しい点と誤解がある点について、包括的に、自然な日本語で、エッセイとして書き出してください。
より包括的でかつ簡潔な説明文をLLMについて書いてみてください。1行です。
生成するためのトリガーについての説明も含めてください。
トリガーという言葉は使わないで。また、文脈を理解するという意味をしっかり説明して。長くなったいいですが、一文にしてね
この生成された一文の適切さを、自己批判して、改善できるかを考えてみて
入力の文脈や背景を理解って正しい? 推測のほうが適切では?
今までの議論を踏まえてどう思う?
統計的予測 が適切かな
動作原理がまだ解明されていないって、どういうことか説明して
じゃあ、未解明の部分があるということも含めて、一文にしてみて
ニューラルネットワークモデルという専門用語がはいっていますが、とりあえず、こんなところで私は納得しました〜
#AI #AIとやってみた #やってみた #LLM #大規模言語モデル #Claude