やはりツーショットはむつかしいですね、画像生成AIの最新バージョン( --v 5.2)のミッドジャーニーでも。
僕は、画像生成AIが学習している大量の画像データを想像し、人気の高そうな人物、動物、風景をせっていして投稿画像のテーマを決めています。そうしなければ、いくら本物の写真っぽくしてください(Photo-realistic)という指示をしても、AIが学習していないシーンでは、当然へんてこな画像になってしまうからです。僕がすごいと感じるのは、この子への「指示」が丁寧であればあるほど、それ相応の画像を生成しようとがんばる(っているように見える)ことです。
今回は、チーターとヒトが競争しているシーンを作りたかったのですが、僕が思っている顔の小さいスレンダーなチーターが出にくかったんです。よくよく調べてみると、どうやらチーターは「ネコ科チーター属」に分類され、「ネコ科ヒョウ属」のジャガーやヒョウと間違えられることが多いことがわかりました。
チーターは英語でCheetahやAcinonyx jubatusと表されますが、足が速すぎるため、実際にその姿を写真に収めることは難しいはずで、結果的にジャガー・ヒョウが疾走する写真の数が多くなって、画像生成AIの学習データになる確率として高くなるのかなあと思いました。毛皮のがら(はん点)も素敵だがら♪
画像生成AIは、指定された指示に従って最適な結果を返そうとするツールですが、その生成結果はAIが学習した大量のデータに基づくため、特定の細かい要求に対して、完全に理想通りの結果を返してもらうことはやっぱり難しいんです。だからこそと言いますか、AIの制限と僕の「こんな画像を作りたいという思い」がぶつかり合う中で、新しいアイデアや発見が生まれることがあります。AIが完全に僕の思い通りにならないことは、新しい発想のきっかけとなり、さらにおもしろい作品が作れるのではなかろうかと夢見ていた、のでした。
「もう3DCGはつくんないの?」いえいえ、taiinいわく今はお仕事に集中したいから、ということになっているようです。
ここまで読んでいただき、ありがとうございました。
つづきま‥
おまけ: /shorten コマンドについて
ミッドジャーニーで画像を生成するとき「/imagine」のあとに生成コマンド(prompt)を入力しますが、今回のミッドジャーニー,バージョン5.2から「/shorten」のあとに、おなじようにコマンドを入力することで、そのコマンドを分析して、どの指示が画像生成結果に影響しているかを定量的に知ることができます。これをどのくらい信用するかは”あなたしだい”といえます♪