生成AIでエッセイテーマに沿った画像を作ってみた【失敗続出例】
前回は、各エッセイの境界線を明確にするため、その章の最後に、各テーマを元に生成AIで作った画像を置くアイデアと、その成功例を紹介した。
しかし、すべてが順調に進んだわけではない。
今号では、生成AIを用いた画像作成での失敗が続いた例について紹介する。
上手くいかなかった例の一つ目は、下記のローカーボの画像だ。
日付や時間は、出力画像を撮影した日なので、生成した日時ではない。
最初の二枚は、食生活というよりは、学校の先生がローカーボの授業をしている雰囲気で気に入らなかった。
そして次の二枚は、糖質を含めるなという指示にもかかわらず、パンやオートミールっぽいものがある。
文字も結構入ってきていて指示通りとは言えない。
食事内容を指定しても、訳の分からない食べ物が並ぶ。
上記の左下は絵柄は良かったが、丼状のスープが気になる。
あからさまにパンや丼でないのと、目が大きくて表情に愛嬌があるのが気に入ったので、右側を採用した。
生成AIは、プロンプトでの細かい記述が良しとされるが、細部にこだわり過ぎると反映されなくなる。
たぶん、何か一つに絞れば、かなり良い画像が得られるだろう生成AIだが、細部にこだわるのはどうも得意では無いようだ。
続いてポーカーの画像。
テーマに闘争心が含まれていたせいか、かなり強面な吊り目おじさん画像ばかりだった。
それと上の二枚が海外風のだったので、日本人と指定したけれど、まだ怖い感じだ。
逆に言えば、こういう画像にしたいなら、闘争心は使えるワードなのかもしれない。
嬉しそう、というワードで表情は明るくなってきた。
そこで、テキサスホールデムの手札は2枚なので、それを指示した。
表情は明るいままの日本人で、ちゃんと過去の指示が残っている。
ただ、手札の枚数と、表向き、という指示が反映されない。
全く指示通りに作成してくれない。
「チップを持たせて」と書いたら、チップの絵を描いた札を持たせるようになった。
チップコイン、は理解できなかったようで、全く採用されない。
そこで、一度、全ての指示を入れ直すことにした。
右手は2枚札を持っているが「内容が自分にしか見えない様に」というのは通じ無いようで、さらにコインチップも手に持っていない。
もう一度、少し表現を変えて試してみた。
表向き、という表現が違っているかと思い、トランプは裏向きと指示した。
後から気づいたのだが、トランプを持つ手を指定していなかった。
裏向き、でも通じず、ここでちょっとキレてしまった。
指示ではなく、批判だ。
人ならパワハラと言われるくらいの嫌味のある表現だが、GPTは素直に指示に従おうとする。
でも、言ってることと、出力画像が一致していない。
ただ、トランプの登場枚数は減ってきたので、誉め殺し作戦に転じた。
全部絵柄が見えていて、スペードのAが2枚とか、めちゃくちゃだ。
キレる心を抑えて、事実を指摘した。
絵柄が見えないように、トランプの表面の模様を絵柄の方に転写したようだ。
こういう時は、初心に戻って、詳しく記述し直してみる。
何も言わないとスペードのAを登場させるのに、指定すると表に出さなくなるのは、なぜだろうか。
ちょっとヤケ気味にしたところ、スペードのAだけを右手に持ち、表情も笑顔なものが出来たので、これを採用した。
端にある記号が一つマークが多いけれど、まあそれくらいは我慢だ。
GPTは「トランプ」を描く指示を出すと、何かしらの絵柄を出そうとする傾向にある。
「トランプ二枚の絵柄を下にして伏せた状態でテーブルに置く」という具体的な指示でも、絵柄を上に出してきたので、GPTとしては譲れないポイントなのかもしれない。
以上、失敗続出でキレた時もあった。
また短時間の間に多数の画像を生成すると、下記のような警告と共にストップがかかるので、注意して欲しい。
以上が、失敗続出例だ。
GPTによる、指が6本になるとか、頭の角度がホラーになるようなエラー画像の生成は減ったが、数や状態の指定をきちんと守れるようになるには、まだ少し時間が必要なようだ。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?