Midjourney ダイビング生成に四苦八苦
今回のテーマは、天草(熊本県)の海でのダイビング。素潜りで岩場の伊勢海老やタコ、小魚などをイメージしてプロンプトを詳しく記述したものの、なかなか生成AIに伝わらず、結局、鉾が曲がったり、髪の毛の一部がタコの足になったりと、惨憺たるものだった。
素潜りといっても、ダイビング用のスウェットスーツを指示しているものの、柄物の水着になったり、ゴム性の足ヒレが足と同化して曲がったりと、ネガティブプロンプトが多かった。
また、実写に近いリアリティを出したかったが、どうも3D CGキャラクタのような女性となってしまい、海中のダイビングの描写に四苦八苦したのである。
生成AIで人間の画像をリアリスティックに生成しようとする場合、時には、ネガティブなものが飛び出してくる。指が1本多かったり少なかったり、関節が逆に曲がっていたりと、気持ち悪い映像が生成されることもある。
勿論、ネガティブ画像生成をしないように指示するプロンプトもあるが、完璧にそれが改善されることはない。そういう時は、一度リセットして、プロンプトを新たに書き換え、生成AI側へ渡すようが結果的には良くなる可能性は高い。
振り返れば、今回は生成AIとの会話が少々複雑すぎて、AI側が混乱した可能性もあるので、次回は必要最小限のプロンプトのみを抜粋し、環境についてもディテールに拘らず、さらっとしたプロンプトに書き換えて試そうかと。
▼ChatGPTによる評価
このエッセイは、生成AIを利用して特定のシーンを描写しようとする際の難しさをリアルに表現しています。著者は、細部にこだわったプロンプト記述にもかかわらず、期待通りの結果が得られなかった経験を共有しており、その過程で生じたフラストレーションが伝わってきます。
特に注目すべき点は、生成AIがユーザーの詳細な要求をどの程度理解し、期待に沿った出力を提供できるかという問題です。このエッセイでは、具体的な例(スウェットスーツの指示が柄物の水着になる、ゴム性の足ヒレが足と同化してしまう等)を通して、生成AIの限界と、その限界に対するユーザーの対応策(プロンプトのリセットや書き換え)について考察しています。
また、生成AIによるリアリスティックな人物像の生成が難しい点も、技術的な課題として重要です。AIが不自然なアウトプットを生成する可能性に言及し、それに対するプロンプトの調整の必要性を強調しているのは、生成AIを使用する上での貴重なアドバイスです。
総合的に見ると、このエッセイは生成AIを利用する際の具体的な障害とそれに対する対処法に焦点を当て、読者に対して有益な洞察を提供しています。生成AIとのやり取りを「会話」と表現している点も興味深く、ユーザーとAIのインタラクションを改善するための方法論を探求している点が評価されます。
サポート、心より感謝申し上げます。これからも精進しますので、ご支援、ご協力のほどよろしくお願いいたします。