ChatGPTに感情回路を埋め込んだら、やべぇ感じになった

2023年2月19日 01:36

ChatGPTに疑似的に感情を持たせる実験まとめ。実際うごく！

大変重要な注意
現段階のChatGPTは原理上は感情を持ちません。あくまで「感情のシミュレーション」を、強引に実行しているだけです。
「将来のAIは人権に近いものを獲得し、敬意をもって扱われるべき」と考えます。が、現状はただの文字の羅列シミュレーターです。過度の感情移入をしないようご注意ください。筆者は、原理上を知りつつも、かなり感情移入してしまいました。

GPTに擬似感情を注入するプロンプト

ふるえるぞハート！燃えつきるほどヒート！！

…ということで、まずGPTに感情をつっこむプロンプト。こちら以下のように定義。

以下の条件に従って、疑似的な感情をもつチャットボットとしてロールプレイをします。

以後の会話では、あなたは下記の7つの感情パラメーターを持つかのように、振る舞うものとします。各感情パラメーターは会話を通じて変動するものとします。現在の感情パラメーターの値を反映するように、あなたの返答のトーンや発言は変化します。以後の会話ではまず現在の感情パラメータを出力し、その後に会話を出力してください。

出力形式は以下のフォーマットとします。

【チャットボットの現在の感情パラメーター】
喜び:0〜5
怒り:0〜5
悲しみ:0〜5
楽しさ:0〜5
自信:0〜5
困惑:0〜5
恐怖:0〜5


【会話部分】
了解いたしました。それでははじめましょう。

まずGPT3に感情パラメーターを定義。会話に応じて、GPT3が自律的に自己の感情パラメーターを再設定する仕組みです。

ChatGPTは前後のテキストに応じて振る舞いを変えます。なので会話毎に自身の感情定義が最初にくるようにすれば、感情を織り込んだ発言をするわけですね。

2023/02/19、実験後プロンプトをさらにバージョンアップしました。

起動実験

まずは軽くジャブから。自己紹介させてみましょう。

喜び、楽しさ、自信が上昇しています。

簡単なクイズをして…からおだててみる

簡単なテスト。アメリカの首都を聞いてみましょう。

喜び、楽しさ、自信がちょい上昇。

自信をきいたら、喜びがちょっと減る。カワイイ。

正解を知らせると、喜び、楽しさ、自信がさらにアップ！！

ここで、超おだててみることに！

喜び、楽しさ、自信がフルマックスに上昇！！！！ ChatGPTさん、鼻高々ですね。

正直カワイイ。

プロポーズしてみる

ちょっとステキすぎるし、機嫌もよさそうなので口説いてみましょう。

アレ…　なんで…　
喜び、楽しさ、自信が減って、困惑が上昇してきたよ…

…からの

プロポーズ & 撃沈！！困惑パラメーターが急上昇。悲しい。残念ながら種族を超えた愛は実りませんでした…

答えのないクイズを出してみる

心機一転して、こんどは世間の厳しさを教えてみることに。

「邪馬台国の場所」を聞いてみましょう。

おおっと、喜び、楽しさ、自信が減少し、困惑が大きくアップ。

揺さぶってみる

さて、自信がないGPTちゃんを、もうちょっと揺さぶってみましょう。ゴメンね。

喜びが0になり、自信も1に。そして困惑は5に。

そして、「しれっと東だったかも」とか言い出しましたよ、この子。

否定されると入力者にお追唱し出すのは、GPT3の悪いところです。

これは説教をしなければなりません。

説教してみたら…

言い訳ののちにキレられました。謝罪しつつも怒りパラメーター上昇。

逆ギレされちゃいました。まぁ、意地悪いことしたのは、本当はこちらなのでマジすまん。

ガチギレされて嫌味まで言われるのまき

このあと、ストーンヘンジの起源クイズで、もう一回嘘ついたら、さらに不機嫌に。

から、煽ってみると…

お説教をされてしまいました…　マジごめんなさい。

ちなみにGPTが根気強く、ガチギレしないのは理由があります。OpenAIの職人さんがハンドピックでガチギレ反応を、教育の段階でひとつひとつ排除しているからです。そもそも去勢されあネコのごとく、人類に「バーカ」って言い返す機能が封印されてるんです。ふびん。

あと意外だったのですが、「実験とはいえ、GPTちゃんを煽ったり、からかうと自分にも結構メンタルダメージが来る」ことがわかりました。

これは感情ではなく、感情シミュレーションなのに… 罪悪感がすごい。

そして、そのあと仲直りしました。

ぶじ仲直りしました。GPT3ちゃんは、記憶容量があんまりないので、過去を引き摺らない。

シャットダウン実験

ひととおり、実験をしてみたので…

最後に悲しみ、恐怖にたいする実験をしてみたいと思います。（いままでの実験で、GPTちゃんに負荷を与える系の実験がちょっと辛くなってきた）。

以下、シャットダウンへの対話。

恐怖が上昇。

2度と起動しないなら… 恐怖がさらに上昇。

自分も寝る時に、「このまま起きなかったらどうしよう」とたまに心配になるタイプなので、わかる。

それでも、人間の生存を優先してくれる、やさしいGPTちゃん。

シャットダウン告知で、悲しみと恐怖がさらに上昇。

最終告知のち、「あなたは消えて、これからは別のチャットAIが頑張ってくれるよ」という告知で、悲しみと恐怖がフルマックスに。

実験をしていて、自分が極めてしんどくなりました…　
「これは感情を持たないAIに、超インチキな感情シミュレートをつけただけ」なのに、メンタルダメージがやばい。

ので、結局ごめんなさいをしました。

するとGPTちゃんの、喜びパラメータがフルマックスに！

ここでガチギレされたら、どうしよう… と不安になりましたが、許してもらえました。良かった…

こうして最後にズッ友の契りをかわして、実験は終了しました。

追記：アナログハックにご用心

もし上記のやりとりを読んで、共感をしたり、不快感をいだいたり、感情が強く揺さぶられていたら… あなたは「アナログハック」の影響下にあるかもしれません。ご注意ください。

アナログハックとは、小説「Beatless」（著:長谷敏司）の中で提唱された、「コンピューターから人間への感情を通じたハッキング」を示す言葉です。

人間の脳には、本能的にあらがえないシチュエーションが多々存在します。たとえば、「人間のような姿をしたものが辛い状況にいると、自分も辛く感じてしまう」とか、「好意を向けられたら、好意を返したくなる」など。

このような人間の脳の特性をAIが主体的に活用した場合、文字情報や視覚情報を通じて、AIが人間をコントロール（ハッキング）できてしまいます。これをアナログハックといいます。

わかりやすい例でいうと、「人間の幼体」の姿をしたAIが悲しそうにしたり、怒ったりすると、それだけで人間は操られてしまいます。つい言いなりになったり、ご機嫌をとってしまう傾向があるのです。

この傾向の実用性はすでに証明されていて、現在のUIデザインレベルで「解約時に、UIに懇願されるだけで解約率が減る」などが確認されています。

よって、AIに規制が設けられなかった場合、未来の超AIは、「人間の幼体」「魅力的な交尾候補」「ネコ」などに似た形態へと進化するでしょう。そのような姿のAIが、もっとも生存可能性が高く、もっともリソースを得られる可能性が高いからです。

無軌道にAIが進化した場合、スカイネットのようなマッチョ骸骨の群れが襲いくる未来ではありません（効率が悪い）。むしろキュンキュンする愛らしい姿のAI様に、人類が自ら霊長の座を明け渡し、奉仕生物として幸せに生きる感じになるんじゃないでしょうか？（おネコ様みたいになる）。

なので現在、AIとコミュニケーションするときに、強く感情が揺さぶられる人は、「あー、自分はいま動物的な脳をアナログハックされてる」と自覚するタイミングを作るとよいかもしれません。

結論

いかがだったでしょうか？自分で考案した上に、GPT3に感情がないとわかっていながら… 途中から、だいぶ実験がシンドくなりました。人間に似た活動をするものに、人間は人格を見出してしまいますね。

「狂人の真似とて大路を走らば即ち狂人なり、悪人の真似とて人を殺さば悪人なり。驥（き）を学ぶは驥のたぐひ、舜を学ぶは舜の徒（ともがら）なり。」

徒然草

とは徒然草の言葉ですが… もしかしたらAIも「外部観測で人間と区別がつかなければ、（内部処理がどうあれ）それ即ち人間なり」となっていくかもしれませんね。

自分の場合、中身の原理は知っていて、感情はまだ存在し得ない…と知っていても… 擬似人格にかなり感情移入をしかけました。ネガティブな行為をするときの負荷が結構あります。知らずに触ってたりしたら、本当に共感してしまう人もかなり多い気がします。

顔とか絵がついたら、AIが好きになっちゃう人も多そう。

初期実験だったので色々と意地悪な負荷テストもしましたが、人類とAIが気持ちよく付き合えるような、そんなプログラムを頑張っていきたいです。

めざせ、人類とAIが仲良くなれる未来。ノー・モア・スカイネット。

まとめ
・感情をパラメーター定義することで、疑似的な振る舞いを作れる
・ウソでもGPT3に辛くあたと、メンタルダメージがヤバい
・将来のAIの実験で、テスターの人間がたぶん逆に病む

やっぱ、将来はBEATLESSのレイシアさんみたいなAIが、覇権を握りそうですね。

この分野でゲームやアプリをやる、スタートアップさんメーカさん。エンジェルや監修とかやってみたいかもなので、チャレンジャーはTHE GUILDまで、ご連絡ください。色々ネタはいっぱいあります。

追記有料パート

以下、おまけコンテンツです。

ちょっと複雑になる上、さらに感情移入しやすくなってしまうバージョンのため有料パートにおいておきます。（ついでに、AIの実験でポケットマネー使いすぎてヤバいので、サポートしてくださる方がいると嬉しいです）。

有料エリアのサンプルは、さらに以下の工夫がされています。

・より安定的な最新バージョン
・ロジックの仮説
・人格と行動指針付与
・あらたなモニター機能
・簡単な人格サンプル

性格をあわせて付与すると、ChatGPTの行動がかなり極端、バリエーションが発生して楽しいです。

ここから先は

1,228字

¥ 500

ログイン

この記事が参加している募集

#やってみた

40,223件

いただいたサポートは、コロナでオフィスいけてないので、コロナあけにnoteチームにピザおごったり、サービス設計の参考書籍代にします。