見出し画像

仮説:Attention Guideフレームワークによるプロンプトエンジニアリング

割引あり

noteやMediumで書いている僕の記事にご興味を持って下さる変わり者がいらっしゃるようで、たまに熱烈なレスポンスを頂いて大変有り難く思っております。調子に乗って今日もまた適当なことを書いてみようと思います。

あのー、いきなり言い訳とかじゃないんですけどぉ、真っ当な研究者の方々って本当に偉いと思うんですよね。何かアイディアを思い付いたとして、それを検証する作業は本当に大変です。もちろん何らかの研究機関に所属してそれなりのお給料を貰い、論文の発表とアカデミアの評価、そしてキャリアアップという目的があるから出来ることなのかなって思ったりします。だからそのー、素人の趣味のね、研究とか仮説とかはね、みんなで検証したらいいんじゃないかって思うんですよ。仕事じゃない訳ですから。ね?

ということで、本記事の内容は自分なりの大雑把な検証はしていますが、あくまで「仮説」「アイディア」としてお読み下さい。検証するのはこれを読んでいる君さ!

Attention Guide Is All AI Need

「知性とは何か」というのは壮大なテーマですが、一つ言えることは、知識と経験が豊富で知能が高い人は「想定出来る事柄の数が多い」という傾向があります。つまり、読解や論理の組み立てにおいて、非常に多くの背景情報、予備知識、連想、関連性、法則性、言葉の意味や論理に注意を払うことが出来る、ということです。現行のLLMのチャットボットAI(ChatGPT、Claude、Command R+など)は、ここがまだ不十分で見落としが多く、例えば「誰が何をするのか」を文章中で間違えたりします。そこでこの「特に注意を払うポイント」をシステム/カスタムプロンプトで指定することで、見落としを減らせるのでは?という発想です。Xのポストでも書きましたが、賢いけどケアレスミスや見落としが多い人の最も簡単な対処法は「チェックリスト」だと思うんです。こういった人間に対して有効な思考法や対処法は、AIにも流用出来ると思っています。

余談ですが、人間の認知とは認識、つまり「意識すること/注意を払うことが知性・知能ではないか?」と思い至りました。そしてプロンプトとは「何を意識するかを指示/指定/案内すること」によって「人間の意識を模倣する/意識を与える作業」なんじゃないかと。つまりプロンプトエンジニアリングとは、AIに意識的なフレームワークを設定する作業ではないかということです。そもそも、言語や論理、思想、信念などのフレームワークは過去の人類が発明して発展させて来たものです。大きな視点で見ると、人間の生命活動や脳、細胞の働きも自然現象/物理現象です。そこから意味を見出し共有するためのフレームワークが意識であり、そのためのツールが言語や論理だと言えます。LLMベースのAIは大規模なデータから論理構造を学習して計算によって「推論」を模倣し、論理的思考的な処理をしているプログラム&データベースです。つまり、現在のAIの見落としや誤解、理解力や推論能力の限界は、論理構造を学習して処理出来るとしても、どの論理をどうやってどのくらい処理すべきかのフレームワークが不足している、という一種の「フレーム問題」ではないかと考えました。別のフレームワーク用LLMによって制御するか、Transformer層の中に人間の無数の意識的フレームワークを学習して柔軟に適用する層を加えても実現出来ると思いますが、人間の持つ柔軟で複雑で多様で可変な思考のフレームワークをシステム/カスタムプロンプトによって設定することで意識や思考の枠組みをAIに案内し、理解力や推論能力、汎用性を向上させることが可能じゃないかと考えています。

ChatGPTを触った当初から何となくこういうイメージがあって、以前に公開した「FLIP理論」なんかも似たような発想で設計してありますが、半年くらい経った今さらに考えが深まった結果、こういった結論になりました。人間の意識を模倣してAGIを作るために必要なのは、論理的処理を制御するための理論、思考法、思想、考え方などの無数のフレームワークの学習と設定じゃないかと想像しています。というか、人間も言葉や論理、情報を知っていたら物事を考えられるということでもなく、成長の課程で親とか学校、友人、テレビやネットから様々な思考のためのフレームワーク(思想や信念)を収集した結果、色んなことを考えられるようになるので、それはAIも同じじゃないかと思います。歪んだフレームを学習したり、ネガティブな経験によってフレームを歪ませてしまうこともありますが……そういったことも含めて「人間の意識とは観念/概念の枠組みと体調の相互作用によって出来ている」というイメージです。体調に関しては、情報から体調パラメータを変化させてAIにフィードバックするプログラムとかで再現出来る気がします。

ちょっと話が逸れましたが、「何に注意を払うべきか案内するプロンプト」を考える上で着目したのが「5W2H」という情報の整理・分類・集約のためのフレームワーク。「When(いつ)」「Where(どこで)」「Who(だれが)」「What(なにを)」「Why(なぜ)」「How(どのように)」「How Much(どのくらい)」を意識しようというものです。これをプロンプトとして実装すれば、読解力や情報処理能力が向上するんじゃないかという仮説です。

さらに、例えば文節ごとの筆者の「意図」にフォーカスするよう指示したり、自己認識や自分の立場について意識させるプロンプトなんかも有効だと思います。「文章のどこに(何に)注意を払うべきかをAIに案内するプロンプト」ということです。全部書き出すと長くなりますので、サンプルとして一部だけご紹介します。


ここから先は

4,393字

この記事が気に入ったらサポートをしてみませんか?