生成AIでエッセイテーマに沿った画像を作ってみた【失敗続出例】

maimai

2024年8月2日 17:00

前回は、各エッセイの境界線を明確にするため、その章の最後に、各テーマを元に生成AIで作った画像を置くアイデアと、その成功例を紹介した。

しかし、すべてが順調に進んだわけではない。

今号では、生成AIを用いた画像作成での失敗が続いた例について紹介する。

上手くいかなかった例の一つ目は、下記のローカーボの画像だ。

日付や時間は、出力画像を撮影した日なので、生成した日時ではない。

最初の二枚は、食生活というよりは、学校の先生がローカーボの授業をしている雰囲気で気に入らなかった。

そして次の二枚は、糖質を含めるなという指示にもかかわらず、パンやオートミールっぽいものがある。
文字も結構入ってきていて指示通りとは言えない。

食事内容を指定しても、訳の分からない食べ物が並ぶ。

上記の左下は絵柄は良かったが、丼状のスープが気になる。

あからさまにパンや丼でないのと、目が大きくて表情に愛嬌があるのが気に入ったので、右側を採用した。

生成AIは、プロンプトでの細かい記述が良しとされるが、細部にこだわり過ぎると反映されなくなる。

たぶん、何か一つに絞れば、かなり良い画像が得られるだろう生成AIだが、細部にこだわるのはどうも得意では無いようだ。

続いてポーカーの画像。

テーマに闘争心が含まれていたせいか、かなり強面な吊り目おじさん画像ばかりだった。

それと上の二枚が海外風のだったので、日本人と指定したけれど、まだ怖い感じだ。

逆に言えば、こういう画像にしたいなら、闘争心は使えるワードなのかもしれない。

嬉しそう、というワードで表情は明るくなってきた。

そこで、テキサスホールデムの手札は２枚なので、それを指示した。

表情は明るいままの日本人で、ちゃんと過去の指示が残っている。

ただ、手札の枚数と、表向き、という指示が反映されない。

全く指示通りに作成してくれない。

「チップを持たせて」と書いたら、チップの絵を描いた札を持たせるようになった。

チップコイン、は理解できなかったようで、全く採用されない。

そこで、一度、全ての指示を入れ直すことにした。

右手は２枚札を持っているが「内容が自分にしか見えない様に」というのは通じ無いようで、さらにコインチップも手に持っていない。

もう一度、少し表現を変えて試してみた。

表向き、という表現が違っているかと思い、トランプは裏向きと指示した。

後から気づいたのだが、トランプを持つ手を指定していなかった。

裏向き、でも通じず、ここでちょっとキレてしまった。

指示ではなく、批判だ。

人ならパワハラと言われるくらいの嫌味のある表現だが、GPTは素直に指示に従おうとする。

でも、言ってることと、出力画像が一致していない。

ただ、トランプの登場枚数は減ってきたので、誉め殺し作戦に転じた。

全部絵柄が見えていて、スペードのAが２枚とか、めちゃくちゃだ。

キレる心を抑えて、事実を指摘した。

絵柄が見えないように、トランプの表面の模様を絵柄の方に転写したようだ。

こういう時は、初心に戻って、詳しく記述し直してみる。

何も言わないとスペードのAを登場させるのに、指定すると表に出さなくなるのは、なぜだろうか。

ちょっとヤケ気味にしたところ、スペードのAだけを右手に持ち、表情も笑顔なものが出来たので、これを採用した。

端にある記号が一つマークが多いけれど、まあそれくらいは我慢だ。

GPTは「トランプ」を描く指示を出すと、何かしらの絵柄を出そうとする傾向にある。

「トランプ二枚の絵柄を下にして伏せた状態でテーブルに置く」という具体的な指示でも、絵柄を上に出してきたので、GPTとしては譲れないポイントなのかもしれない。

以上、失敗続出でキレた時もあった。

また短時間の間に多数の画像を生成すると、下記のような警告と共にストップがかかるので、注意して欲しい。

以上が、失敗続出例だ。

GPTによる、指が6本になるとか、頭の角度がホラーになるようなエラー画像の生成は減ったが、数や状態の指定をきちんと守れるようになるには、まだ少し時間が必要なようだ。

生成AIでエッセイテーマに沿った画像を作ってみた【簡単成功例】

この記事が参加している募集

#この経験に学べ

60,701件

この記事が気に入ったらサポートをしてみませんか？