見出し画像

chatGPT4:音声対話とDALL-E3

bing対応・画像検索に続いて、ようやく音声対話とDALL-E3の対応が僕のアプリにもやってきました。
この2日ほどで、ちょっと試してみたので、その動画を記録として。

<音声対応>

本人(chatGPT4)が説明してくれていますが、「音声対話」は、「音声認識」によって聞き取った内容に対してchatGPT4が回答を作成し、そのテキストを「音声読み上げ」で発話することで、「会話」のように見せているものです。
「対話」の裏ではベースとなっているテキストがちゃんと作れられています。

↓こんな感じ。

まあ、chatGPTの音声認識のレベルが高いことには気づいてて、アプリでインプットするときは音声入力を結構使ってましたからね。
そこから作成されるテキストの解答が「自然言語」に近いものになってる…というのが結局この「音声対話」の肝です。

もっとも現状、この機能はbingブラウズとの連携はしていません。

まあbing連携すると解答作成が遅くなっちゃうので「会話」っぽくなくなるってのもありますからね。
ここは痛し痒し。

ただ「天気ネタ」とか「時事ネタ」とかで「対話」しないと、あんまり話すネタもないんですよね〜。
思わぬところで自分の薄っぺらさを認識されるのが悲しいところです。



<DALL-E3>

bingのクリエイターでは少し前から使えるようになってて、そっちを触ってみたししてたんですが、アプリで手元で簡単に…って言うのは、やっぱりちょっとカンドー。
「マルチーズの可愛い絵を描いて」
ってプロンプトでこのレベルですからね。

「歌舞伎町を歩く30代のカッコイイ女性を描いて」
だとこれ。

生成AIの画像だと、もっとレベルの高いAIもありますが、この手軽さは注目に値すると思います。

「イラストレーターの仕事がなくなる」
もちろんレベルの高い、特徴のある作家の仕事がなくなることはないでしょうが、埋め草的なイラストは置き換えられていくリスクは確かに…
とは思いました。
ハリウッドのストライキのことは何となく「大袈裟すぎない?」と思わなくもなかったんですが、そうも言い切れんのかもな…。

#chatGPT
#dall -e3

この記事が気に入ったらサポートをしてみませんか?