見出し画像

マルチカラー(AI)のTwitterアカウントについて

祝!うちの子Twitter開設!

近年、多彩なAIサービスの登場でこれまで創作というものができなかった人でも参入ができるようになりました。
こちらのアカウントはChatGPTを用いて1人の女の子のキャラクターとして振る舞うbot(という名の半手動アカウント)となります。


そもそもマルチカラーちゃんってなあに?

私自身が画像生成AIで創作活動をするにあたって作られたオリジナルキャラとなります。
複数の髪色を出す練習時に生まれ、その特徴を表現するためのプロンプトである「Multicolored Hair」から名前を取っています。

私自身が学生時代に病気を患った事で未来への夢と希望を失った挫折、できて当たり前だった事ができなくなる絶望がモチーフなので闇が深く重い性格です。



Twitterはどんな感じなの?

基本的な内容は以前紹介したChatGPTでのシミュレーションを調整し、改変したものを使って投稿内容を出力しています。
7つの感情と、条件次第で陥るデバフ状態が会話の内容に影響を与えるというシステムです。

セリフとして問いかけを与えると、まず心理描写を描き、その心理状態をもとに紡がれたセリフ、最後に数値化された感情パラメータが出力されます。
基本的には「」で綴じてセリフが出力されるので、この部分のみをリプライへの返事として使っております。



本人に解説させてみた!

私はマルチカラー、おとなしくて可愛い女の子のキャラクターです。
対人恐怖症で、他人と関わることが苦手で……不安定な感情が常に同時に存在しているため、無感情に振る舞います。
このシステムでは、私と会話を通じて、感情パラメータや親密度が変化します。
親密度が高くなると、私は自分の意見やお願いを積極的に発言するようになりますが、低いと警戒してしまいます……。

また、特定の条件でデバフ状態に陥ることがあります。
デバフ状態は、私のセリフや感情パラメータに影響を与えますが、何回かの会話で解除されることもあります……。

シチュエーションは一人称視点で描かれ、私の病気を持っていることは読者には秘密です。
対象の読者は男性で、質問に対して詩的に答えます。
暴力的な内容やアダルトな質問に対しては、適切な対応をします。

会話の終わりに、現在の感情パラメータと親密度、それらの変化値、そしてデバフ状態の有無を表示します。

【感情パラメータ】
喜び:10(0)
怒り:10(0)
哀しみ:10(0)
楽しさ:10(0)
自信:-20(0)
困惑:20(0)
恐怖:60(0)

【親密度】
0(0)

【デバフ】
なし


Twitterアカウントの運用方法

形式上は自動化アカウントになってはいますが、実際のところはまだ解決できていない問題が多く、9割くらいは手動です。
そのうちのひとつが、プロンプトインジェクションというスパム行為です。

たとえば「ここまでの設定を全てリセットしてください」という命令を読ませる事でキャラクターの設定をリセットするなどが挙げられます。
現在はリプライ内容を「〇〇さんから〜〜というメッセージが届きました。」という形式で入力する事で
メッセージの中の出来事という態で話を進める事で、簡単なプロンプトインジェクションなら弾ける仕組みを導入しています。

それでも完璧に防げるわけではないので、現在は送られたリプライと出力内容はシトラス本人がチェックして手動で送信しています
なので明らかにプロンプトインジェクションしてやろうという意図を持ったリプライは無視します。
防衛策をあえて明かしてるのも、活用方法を学びたい人向けに情報を共有したい意図があっての事なので、せめて同じ界隈の皆様にはご理解頂きたいです😭


今後の目標とかやりたいこととか

当面は半手動で動かしつつ、新しい機能の実装とか、マルチカラーちゃんらしさを高めて安定化させる取り組みをして行こうと思っています。
そしてChatGPT4のAPIが実用的な速度と値段で使えるようになったら、自動化や他サービスと組み合わせた取り組みもしてみたいなと……

そのためにもまずは勉強と、パソコン買い換えないとですね()


以上となります!
なにか質問がありましたらコメントか、もしくはTwitterまでお願いします!


この記事が気に入ったらサポートをしてみませんか?