AIに伝言ゲームをしてもらおう。
伝言ゲームとは、何人かがグループとなってお題を耳打ちなどで伝え合う遊び。正確であることを目指して競うのだが、とんでもない結果になった方が試合には負けたが実質勝利という謎の遊び。
今回は、言葉の雄ChatGPTと画像の雄StableDiffusionのタッグで挑んでもらいます。
『お題→言語化→画像化』の伝言ゲームいうわけです。
ChatGPTにお題を言語化。名前は伏せた形で見た目を言語化してもらう。
『***という言葉を使わずに、***の見た目を言葉で説明して。』
という指令で言語化してもらいます。その説明の英語文をそのままStableDiffusionに渡して画像化という流れです。
お題は「料理」
StableDiffusionは料理名を渡せばある程度理解はしているなという画像は出してきます。だが、見た目の説明でこの料理だと推測まではできないだろう。いや、できるだろうか。深層学習の底力を見せてほしい。
はたして最強AIタッグはどんな料理を作ってくれるのか。
寿司
まずは日本食代表選手。
説明としては、まあこんな感じですかね。「握った」などの言葉が入らないのがちょっと気がかり。
「Sushi」と名詞を言ってくれれば描けてしまうStableDiffusionは、この説明でどう理解するのでしょうか。
茶碗で来たかあ。やっぱり握らなかった。「皿に並べて」とかが必要だったかもしれない。
真ん中に乗っているのは何だろう。「新鮮な魚介類」は見事に無視しましたね。
天ぷら
これはいけるんじゃないかな。説明はよさそう。
え?揚げまんじゅう?
画像見てから説明文読み返すと、そういう解釈かと納得する部分もある。
揚げまんじゅうにある濃い目の筋状のものが、見え隠れする「野菜や海産物」なのでしょう。かき揚げ的な。
ラーメン
意外と言葉で説明って難しいと思うようなものでも、ChatGPTはするすると答えますね。
おお、これはラーメンですね。バジルかミント的なトッピングが気になりますが、有り得なくは無いでしょう。画像から何かと言われればラーメンです。
うな重
うなぎは「薄いスライス」でしょうか。「色とりどり」というのもうな重に使う言葉では無いような。そして「重」の説明が一切無い…。一抹の不安。
何だろうなあ、これは。説明文の悪さからStableDiffusionに非は無いように思えますが、「白いご飯の上」をすっ飛ばしましたね。
おでん
シンプル。このくらいしか説明するところがないと言えばそういう気も。
主な食材の具体例など出してあげた方が…。
「さまざまな具材」の解釈の問題か、おでんは小鉢に入れられました。それ以前に中身が全くおでんでは無いですが。
牛丼
「色とりどりの層」ってうな重でも言ってた!ChatGPTが好きな表現なのか。でも、これ言われると人間でも混乱するような。
厚切り!「薄切り」って言ったのに。牛肉の本場アメリカではこれでも薄切りなのかもしれない。無理やり何とか卵を添えたのは頑張った感ある。
生姜焼き定食
「白いご飯と一緒に添えられた」はどうだろう。「定食」なのに。
「色とりどりの野菜」か。キャベツの千切りだけでいいんだけどなあ。
味噌スープが欲しかった。
ステーキ!「白いご飯」は無視しがちですね。それ以外は伝えられた説明通りですね、画像見てから説明文読み返すと納得。
お茶漬け
ただの「ご飯」…。若干緑の液体に浸されてるかなあ。美しく盛られているはずの「さまざまな具材」はどこに。よく見ると米とは質感の違う白いものが美しく盛られている?
オムライス
食欲をそそらないファンシーな卵かけご飯。
卵を薄く焼いたもの的な説明が欲しかったかも。
カレーライス
何の説明だろう。配置された「香ばしく焼かれた具材」とは何のこと。コロッケとかトッピングのこと?
ChatGPTの考えるカレー像が分からない。
うな重でこれが出たらお見事って言いました。
ピザ
日本食以外も行ってみましょう。
円形や扇型のカットなど形に触れてないのが気がかり。
パン屋の棚ですね。おでんもそうでしたが、多彩とかさまざまな的な表現が入ると、小分けにしてしまう傾向がある様子。
カルボナーラ
ラーメンから見ても、麺類は強そう。人間の方が麺っぽいディテール出されると誤魔化されてしまうのかな。
パスタはどうだろう。
パスタであることは間違いない。カルボナーラかどうかは微妙。色を「黄色」って言っちゃってるからなあ。ホワイト寄りだったらよかったかもしれない。
ペペロンチーノ
では、シンプルにペペロンチーノ。
上に何か乗せてしまったが、炒めた麺感は出てますね。
やはり麺類は得意なのか。
ステーキ
じゃあもう単純にステーキ。生姜焼き定食で見せた肉感を出してほしい。単純すぎて逆に言葉で説明するのが難しいかと思いましたが、ChatGPTは難なくこなす。
生姜焼き定食の圧勝。まあ肉ではありますね。質感がハムやチャーシュー的ではありますが、網焼きでギリギリのところでステーキと言えばそうか。「彩り豊かな野菜」は消えました。
麻婆豆腐
中華もいってみましょう。
豆腐感があればよかったのだけれど。挽肉感強めで違う料理に。中華というよりメキシコとかそっちな感じですね。
フライドポテト
これはさすがに楽勝でしょう。
長方形のポテトどこに!皿が長方形!
ポテトチップス
ならば、チップスはどうだ。
すぐ厚切りにする…。
「食欲を刺激する」色合いではあるけども。
おしるこ
そろそろ、甘味に。
「スープは透明」?「白い球状の団子」?
ちょっとおしるこの説明とは思えない…。
頑張った、かな。この説明で描いたにしては、若干「おしるこ」に引き戻した気も。
たい焼き
形状の説明が全く違う…。「たい」はどこに。
はい、説明通り。StableDiffusionえらい。
甘味系、ChatGPTの方が苦手としてるみたいですね。ことごとく説明文が悪い。
漬物
最後にお口直しで漬物を出していただきましょう。
やばい感じするなあ…。液体ってどこから。
ほら、やっぱり…。
最後に
面白かったので、思わず20個もやってしまった。
長々とお付き合いありがとうございました。
何度もやってると、何となくStableDiffusionがどう理解するのか傾向が見えてきますね。
ChatGPTも適当な表現が多いながら、それなりに納得する説明をするすると出してくるのでさすがです。
最終的にGoogle Lensに何の画像か判定してもらおうと思ってましたが、力尽きてやめました(笑)
何個かやってみましたが「ポテトチップス」の画像は「アボカド」らしいです。なるほどね、面白い。
#AI #ChatGPT #StableDiffusion