見出し画像

[AI中山]をオンライン会議に参加させた話③対話型[AI中山 3号]の大失敗

 自分の分身=「AI中山」を作って会議に参加させる実験をふまえ、これからの「AIとの共存社会における働き方とは」に関して語る話の3回目です。

前回までの話
・仕事があまりにも忙しいある日、「もう一人の自分がいたら」という考えがふと浮かび、自分の分身=「AI中山」を作ろうと思い立った。
・僕は学生時代コンピュータ工学を専攻。ある程度生成系AIの技術的な仕組みは理解できていたが、その能力のすごさが、どうも腑に落ちなかった。
・肚落ちし、理解するためには、体感するしかない。
・Chat-GPTなどの生成系AIツールをフル活用し、夜や休日にプログラミングに勤しんで「AI中山 1号」完成。
・僕がプレゼンする必要のあるオンライン会議で「AI中山 1号」に喋らせたところ、種明かしするまで誰も気づかなかった。
・「AI中山 1号」の改良版=2号も実験成功。
・次は双方向の会話めざして3号の開発へ。


リリース直後のChat-GPT4を活用

 「AI中山 3号」は会話をしなければなりません。ここで再び登場するのが、Chat-GPT。ちょうどChat-GPT4がリリースされ、対話してみると、3.5よりも会話能力が格段に向上しています。

 これは実戦で使えるな、と思いました。Chat-GPTで会話をさせる機能を「AI中山 2号」に組み込めば、会話に応答することもできるようになる、待望の「AI中山 3号」ができる、そう確信しました。

[AI中山 3号]の仕組み

 軽く整理すると、ここまでの1号、2号にできるのは「プレゼン原稿を読み込ませて『AI中山』が話す」だけです。

 「AI中山 3号」はというと、①原稿なしで相手の質問に対して、相手の質問音声を文字に変換して、Chat-GPTに入力する。②その入力に対して返ってくるChat-GPTの返答文を僕の声に音声変換する。③「AI中山 3号」の画像が口パクで、Chat-GTPの返答を僕の声で喋っている…。そんな感じです。

「中山っぽさ」のためのプロンプトの工夫

 さらに重要なのは、『僕っぽい』答えをすることです。その『僕っぽい』というのが重要で、いかにも僕が言いそうなことを言わないと、僕でないことがばれてしまいます。

 そのために必要なことは? まず、会議前に、Chat-GPTに対して、「中山とはこういう発言をする人です。中山になりかわって、中山のように会話をしてください」と命令(プロンプティングといいます)します。

 その上で、僕の過去のオンライン会議で録音した発言、メール文書、作成した仕事の文章などをいくつかChat-GPTに投げた上で会議を始める。そうすれば、「僕っぽい」がうまくいくかもしれない、と思いつきました。

[AI中山 2号]+2機能=[AI中山 3号]

 そこで、2つの機能を新たに「AI中山 2号」に加えました。

 ①Chat-GPTに過去の僕の発言を読ませてから「僕のように答えて下さい」とお願いをしてから必ず会議を開始する機能、②相手の対話音声を文字に変換してChat-GPTに渡して戻ってきた返答を中山風に話す。

 これによって、対話型AIである「AI中山 3号」が完成するはずです。

まさに自分の分身のような受け答え

 ちなみにですが、僕の過去の文章等を読み込ませて「AI中山」を教育してから、僕自身が「AI中山」と対話すると、本当に『僕っぽい」話し方で、『僕っぽい』答えを返してくるのです。

 僕と「AI中山3号」との間での会話実験しているとき、僕はまるで自分自身と話している感じがして、思わず吹き出すことが何度もありました。

 いかにも自分っぽく話している「もう一人の自分」を見るのは、案外気持ちの悪いものです(笑)。

[AI中山 3号]の大失敗

 こうした対話実験とチューニングを数日間経て、ついに「AI中山 3号」は完成。早速、オンライン会議にデビューさせました。ところが、これが大失敗に終わります…本当に笑うぐらいの大失敗。

 何が失敗したかいうと、大きく3つあります。

失敗その1: 会話のタイムラグ

 まず決定的な失敗は、会話における不自然すぎる「タイムラグ」です。まず、聞かれたことに答えるまでの時間がかかりすぎました。

 受けた質問に対して、音声から自文字に変換→ChatGPTに渡す→Chat-GPTで返答を出力→その回答文を中山風の声で音声変換→「AI中山 3号」が口パクして発話する…の一連のプロセスがあるわけです。

 ただでさえ長くなったこの会話の流れに加えて、現在Chat-GPTは全世界で使われており、そもそも返答に時間がかかります。そのため「AI中山」3号は、話しかけても、なかなか答えてくれないのです。

 黙ったまま、じ~~っと相手を見つめる時間が10秒ほど続いたかと思うと、突然、話し出す。本当、突然です。

しかもその答えが、これは僕の過去のデータの学習が十分でなかったのか、予想外の会話をされたのか、支離滅裂なことを言い出すなど、とにかく会話が相手と全然かみ合わない。

 「AI中山 3号」の恐ろしい?その答え方に、相手の顔がだんだん、青ざめゆがんでいくのが、画面を通しても伝わってきました。

 僕も、さすがにこれは洒落にならないと思い、ついには「AI中山 3号」をシャットダウンして、「実はこういう理由で…」と経緯を説明してお詫びしました。

 すると「中山さん、頭がおかしくなったのかと思いました」とか、「何を聞いても、しばらく黙っているから体調が相当悪いのかと心配しました。そじゃなくてよかった」と、逆に安心されてしまいました。

失敗その2: 過去に僕が言ったことを覚えていない

 また、会話がぎくしゃくした理由の1つに、「中山さんがこの間おっしゃっていたXXはどうなりましたか?」と聞かれても、今のChat-GPTには、有名人でない限り、個人の過去データを記憶する機能はありません。

 答えはなんと、「私にはこの間おっしゃったことがデータにありませんので、適切なお答えはできません」です。

 これには相手も、「え?…そ、そうですか…」と返す以外ありませんでした。なんと気まずいのでしょうか。

失敗その3: 口パク同期ができない-腹話術師に変身-

 「AI中山 3号」は、異なる会社のシステムのAPI連携という、システム間をインターネットでつないで連動させて動かす仕組みで動いています。

 Chat-GPTからの返答を、口パクで音声変換して答える設計でしたが、Chat-GPTのレスポンスが遅いのが原因なのか、口パクソフトが音声とうまく連動して動かないのです。

 その結果、先に声が流れて数秒後に口が動く、という、どこかでみた腹話術師のような話し方をしていました。

 これも相手を恐怖に陥れた原因の1つです。「声が…遅れて…出てくるよ…」っていう、まさにあれです。

課題は解決、あるいは克服されつつある

 次回は、この実験から学んだ「生成系AIの限界」の整理と、3つの課題の考察、そして、それらをどう解決したかをまとめていきます。

[AI中山]をオンライン会議に参加させた話
① 
自分の分身=[AI中山]誕生
② 
[AI中山]ついにデビュー
③ 対話型[AI中山 3号]の大失敗
④ 
失敗から学んだ,現時点での生成系AIの限界
⑤ 
[最終話]AIを使うか,使わないか


この記事が参加している募集

最近の学び

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?