AI画像生成【DALL-E 3】凄すぎ！胸のザワつきが止まらないレベル💞

素晴木あい@ AI絵師

2023年10月2日 11:30

朝から心がザワザワしてます。OpenAI社が開発した画像生成AIの最新版「DALL-E 3（ダリ・スリー）」、凄すぎません？！💦

AI戦国時代みたいになってますが、MicrosoftとOpenAIのコラボレーションが、最強なのでは🫢

Microsoft社の検索エンジン「Bing」が、このDALL-E 3を搭載したので、Bing Image Creatorの画像生成能力が驚愕レベルになっちゃったみたいです。

日本語でも意外と大丈夫

嬉しかったのは、日本語の指示文（プロンプト）でも反応してくれるようになってきたこと。Bingと「画像生成して」などと会話しながら作画することもできました。

「ピカチュウ、Good Morning! Are you feeling good today?」と喋っている、朝の風景」というプロンプトで生成された画像

ちなみに、著作権については配慮されていると聞いたんですが、ピカチュウやアイアンマンはそのまま出ちゃいました💦

「アメコミ、若い女性、吹き出し、OMGと言っている、白黒のペン画」と言うプロンプトで生成された画像

文字を入れて作画してくれるのもすごいです。他の生成AIではまだ文字入れは難しいですから。

進化した描写力

DALL-E 3が特にすごいのは、細かい描写ができる点です。特に指や歯など、これまで難しかった部分もかなりよく生成されていると思います。

「日本人の20代の女の子、カメラを構えて微笑んでいる、海岸、朝日」のプロンプトで作成された画像

表情も自然

多くの人が生成AIの描く人物の目は冷たいと言いますが、自然な表情の日本人らしい女性も描写できました。

なんだか親近感を感じません？！

「18歳の日本人男性、k-popスターのようなルックス、穏やかな笑顔、白いシャツ、片手を髪に当てている、背景は海でぼやけている」のプロンプトで生成された画像

以前はAIが作画が苦手だったアジア人の男の子だって、一瞬でこんなに可愛く描けちゃいます😳

美しいアートスタイル

水彩画やデジタルアートも生成してみましたがこんな風に本当にきれいです。

「水彩画、湯気を立てたコーヒー、喫茶店、暖かい雰囲気」というプロンプトで生成された画像

「デジタルアート、毛足の長い白い猫、可愛い仕草、背景には花がいっぱい」というプロンプトで生成された画像

もう誰でも無料でこんなに簡単にイラストを生成することができるようになったんですね。一年前には頭が2つ出たりして、修正さえもあんなに難しかったのに、もうはるか大昔のことのようです😳💧

ただ、アニメは個人的にはもう少し萌え感が欲しいかなとは思いました。プロンプトの問題かなぁ。日本語の吹き出しにはまだ対応してないようです。今後のバージョンアップもとても楽しみです。

「アニメタッチ、20代のブルーの髪のツインテール、吹き出し、こんにちはと言っている」というプロンプトで生成された画像

＜追記＞

英語でもっとゴリゴリにプロンプトを書いた場合、アニメはどのくらいのレベルの画像が出てくるのか検証してみました。

上は Bing Image Creator で DALL-E 3に描かせたもの、下は同じプロンプトで stable-diffusion の微調整モデル「yuzu」に描いてもらったもの。

プロンプト「Japanese anime, masterpiece illustration set in a forest. A beautiful young girl, reminiscent of a forest spirit, extends her hand outwards. She exudes an aura of beauty and mystery. Numerous blue birds frolic around her, adding to the ethereal atmosphere. The style should be highly detailed and photorealistic, capturing the intricate details of the forest and the characters. The lighting should be natural, with dappled sunlight filtering through the canopy of the forest, casting a soft glow on the scene. The color palette should be vibrant, with a focus on the blues of the birds and the greens of the forest. The composition should be a mid-shot, taken with a high-resolution 16k camera」

下の絵の方が雰囲気は私好みなんですが、「森の精霊を思わせる少女の手の伸ばした先で、青い鳥が戯れている」というプロンプトがほとんど理解できず、頭に鳥の羽がついた仕上がりになってます。

これだけ忠実に描写してくれるならプロンプトの書き方によってはもっとDALL·E3も自分好みの風合いを出せるかもしれませんし、しばらく研究してみたいと思えてきました。

このDALL-E 3は、近々ChatGPTの有料版にも組み込まれる予定だそうです。

動画を見ていると作画のアスペクト比も変えらるのかなという気もしますし、ChatGPT4とじっくりと推敲しながら、画像を生成ができる日も近いようで、ますますワクワクが止まりません💕

この記事をお読みいただき、本当にありがとうございます

もし気に入っていただけたら、いいね「🩷」で応援していただけると嬉しいです。フォローもお気軽に！

よろしくお願いいたします🥰

無料画像配布

note 「みんなのフォトギャラリー」 (1万回シェア感謝🙇‍♀️) や Pixabay ( 3万DL感謝🙇‍♀️) では、画像を無料で配布しておりますので、ぜひご利用ください。

有料画像販売

PIXTA や Adobe Stock などでも販売しておりますので、こちらもご検討いただけますと幸いです。

感謝を込めて💕

この記事が参加している募集

#AIとやってみた

34,621件

サポートをお考えいただき、ありがとうございます🌸貴重なご支援を画像生成やブログ作成の資金として使わせていただきます✨