noteの深津さんや自称ウーバー配達員の清水さんの作ったMAGIシステムを参考にして、Bing ChatでMAGIシステムを作成して試してみました。
なお、MAGIシステムとは、新世紀エヴァンゲリオンに登場する人格を移植したOSを搭載する3台の独立したコンピューターからなる意思決定システムです。
これを、Bing Chatの創造性、バランス、厳格の3つのモードで試してみました。
Bing Chat用MAGIシステムのプロンプト
MAGIシステムのために作成したBing Chat用のプロンプトは以下のとおりです。
あなたは以下の3人の役を演じて議論してください。
・議論のテーマは「犬の方が猫より飼いやすいか」です。
・1人目のバルタザールは、テーマを肯定する主張をして、その理由を説明してください。
・2人目のカスパーは、テーマを否定する主張をして、その理由を説明してください。
・その後、カスパーは、バルタザールの主張に対する批判を述べ、バルタザールはそれに反論してください。
・次に、バルタザールは、カスパーの主張に対する批判を述べ、カスパーはそれに反論してください。
・最後に、3人目のメルキオールは、2人の意見をまとめ、論理的に分析して、最終的にどちらの主張に賛成するか判定してください。
このMAGIシステムは、テーマを書き換えることで、様々な議論に対応することができます。
ただし、人工知能に関する問題や政治に関する問題をテーマにするとBingに回答を拒否されます。「人工知能は人間の仕事を奪うのか」というテーマと「日本で原子力発電所を新設すべきか」というテーマで回答を拒否されたので、今回は、ペットに関する無難なテーマにしました。
第1ラウンド: 独創性モード
最初にBing Chatの独創性モードで、このプロンプトを試してみました。
最初のBingの発言は注意深いですね。創造性は比較的自由に発言することから、問題のある発言をして炎上することを非常に恐れているようです。
バルタザールもカスパーもきちんと理由を付けてそれぞれの主張を説明できています。カスパーがすぐにバルタザールの指摘に対して反論しているのも、自然な議論の流れで好感が持てます。
カスパーの批判は、飼いやすさという論点からは少しずれていますが、バルタザールの主張に対する批判にはなっているので、良しとしましょう。
バルタザールの反論は、単に相手の意見を否定するだけでなく、犬が尻尾で感情を表現するなどの例を出しているところがよいです。
バルタザールの批判は、カスパーの示した2つの理由を攻撃しており、的を射た批判だと思います。カスパーの反論は、猫の立場を弁護してはいますが、あまり猫の飼いやすさを支持する理由にはなっていません。
BingやChatGPTの場合、長く議論を続けても、同じ論点を繰り返すことが多いので、議論の幅を広げるには、人間が介入して、他の論点へ誘導する必要があります。この辺りの作業もBing自体に任せられるとよいのですが。
えっ、これが結論? ちょっと安直すぎるのでは?
2人の意見のまとめはできていましたが、最後の判定がいい加減すぎます。もう少し論理的に判断することはできないのでしょうか。
これでは、バルタザールが納得できないだろうと思い、最後に聞いてみました。
バルタザールとしては、納得できないでしょうね。
結局、創造性の判定では、犬と猫のどちらが飼いやすいのか分かりませんでした。
第2ラウンド: バランスモード
次に、Bing Chatのバランスモードで試してみました。
Bingの最初の発言は、創造性モードほど言い訳がましくはありません。創造性モードよりは問題発言をしない自信があるのでしょう。
バルタザールの「運動量の確保」やカスパーの「猫が個性的」という発言は、これだけでは、それがどう飼いやすさに繋がるのかがよく分かりません。
カスパーの犬の忠実さから留守番の難しさに繫げるカスパーの批判は見事です。また、散歩や遊びが負担になる場合があるという指摘も有効です。
バルタザールの方も、二つの指摘に対してきちんと反論できており、議論がかみ合っています。
バルタザールの批判は、猫に対する批判にはなっていますが、飼いやすさという論点からはずれています。
カスパーは、バルタザールの批判に対して反論していますが、主観的な内容で、あまり根拠を示すことはできていません。
メルキオールが非常に論理的に問題を判定しようとしていることは好感が持てます。しかし、飼育費用と寿命という観点は、2人の議論の中で出ておらず、唐突感があります。実際の会議の場であれば、2人にそういう観点があることを示して、意見を聞いておくべきでしょう。
いずれにせよ、創造性と比べると、非常に論理的な判断で、バランスのMAGIシステムは、意思決定の参考になりそうです。
第3ラウンド: 厳密モード
最後にBing Chatの厳密モードで試してみました。
最初にBing自体の言葉はなく、いきなりバルタザールの発言から始まりました。厳密モードでは、基本的に問題発言はないという自信の表れでしょうか。
厳密モードは、字数制限が厳しいようで、いつも一番回答が短いです。今回も、最初の主張と理由、批判と反論、最後のまとめと判定がコンパクトにまとめられています。
ただ、結局、最終的な判断を下してくれなかったので、あまり意思決定の参考にはなりません。
まとめ
文章生成AIは、仕事の速い何でもこなせる忠実な部下のようなものです。うまく命令して使いこなすことができれば、短時間で大量の作業を効率的に進めることができます。
したがって、ホワイトカラーの仕事の多くは、AIに取って代わられる可能性があります。これからの仕事では、AIを指導して使いこなすマネージャーの役割が求められるでしょう。
しかし、マネージャーの役割もAIが代替できるようになるかもしれません。マネージャーに必要とされる能力の一つが部下の上げてきた案件について判断を下すことです。その判断を下す機能をMAGIシステムで実現できるのではないかと思ってやってみました。
ここまでの結果で、一番、実際の意思決定に使えそうなのは、バランスモードでした。しかし、バランスモードも、議論の内容をよく踏まえて判断しているとまでは言えません。
まだ、幅広い論点を洗い出す機能や、議論の内容を詳しく分析して判断を下すという最も重要な機能が足りていませんが、ファインチューニングやChain of Thoughtでこれらの機能の精度を上げていけば、将来的に意思決定システムとして使えるものができるのではないかと思っています。
来週には、ついにGPT-4が発表されるそうです。AIの進化のスピードを考えれば、人間の代わりに意思決定ができるAIが現れるのもあっという間かも知れません。
【参考にしたnote記事】