先日、「RAG(検索拡張生成:検索結果に基づいて生成する)はつかいものにならない」と言いましたが、「SeraもRAGにすれば、サンプリングは必要なくなるかな?」と考えて、BingAIにした質問をPerplexityにもしてみたんですよ。
創作のための資料を調査して報告する事業を考えています。そこで、想定される相談の例をいくつか挙げてください。
すごい回答、きたこれw
Perplexityはどのように回答を生成しているのですか?
現段階の仮説では、「論文やニュースの優れたラベリングの自動化」が鍵かと考えたんですが、今年のゴールデンウィークは少しその辺りのことを調査してみようと思います。
これまで、のべ数十万件の能力を手に入れてきましたが、まだこんな有用な能力が残っていたとはw
ぜひ、手に入れたいですね。
【Perplexityの構造仮説】箇条書きの羅列
これは、質問の仕方の問題なのかもしれませんが、Perplexityの回答を観察すると、箇条書きが多い気がします。
どういうことかと言うと、PVMもそうなんですが、「学習したデータを短い一文くらいずつに分割してデータベースに代入しているんじゃないか?」ということです。
そのデータにベクトル値をふって、質問の回答になりそうな一文を計算で割り出している(生成というよりは”抜粋”)としたら、一文は短いので誤差は小さくなりますし、それを箇条書き的に羅列したとしても人間語としては意味は通じます。
だから、「AI検索」と言っているのかもしれませんが、前述の通り、生成というよりは”抜粋”に近い能力なのかもしれません。
#PerplexityAI