見出し画像

国産AI、SAKANAにも画像生成機能が搭載された!

本日、国産AIのSAKANAが画像生成機能を実装したことをXで告知しました。

こちらで、画像生成機能が確認できます。しかも生成スピードはとても早く、画質はDALL-E3と遜色ありません。

早速実力を試してみた!

Harpy Eagleというちょっと特殊なワシがいるのですが、実際はこんな顔をしています。

生成AIがこれまでの学習データから生成するのでEagleというワードに紐づけられた学習データから結構典型的なワシを生成してしまいます。例えば、DaLL-E3であればこんなワシを生成しました。

多少、Harpy Eagleの特徴である頭に生えている大きな羽を小ぶりにした様な変化は見られますが、典型的なワシに近い形です。

SAKANA AIの画像生成でHarpy Eagleを生成してみたところ、下記の様な全く普通のワシになってしまいました。ですが、画質はとてもいいです。

DALL-E3にHarpy Eagleの特徴を伝えてプロンプトを作らせて生成した画像はすこし実物に似てきました。

この画像を生成したプロンプトがこちらです。

Create an image of a large majestic bird with a stern expression, with its face and head covered in dense, soft feathers. The feathers around the face should be especially pronounced, giving it a unique, fluffy appearance, reminiscent of a Harpy Eagle without directly referencing an eagle.

そして、このGPT-4が生成したプロンプトをSAKANAにぶっ込んでみたところ、ほんの少しHarpy Eagleに似た感じにはなってきました。

顔の周りのふさふさ感はでていますね。

画質はDALL-E3に全く遜色ないです。むしろ画質はいいかもしれません。ではクリエイティビティはいかがでしょうか?

Harpy Eagleにヅラを被せた!

DALL-E3では部分修正ができるので、「この辺りに王冠みたいに羽をたたせてみて」みたいな依頼をしたら、なんかヅラっぽいものを被せやがりました。

「なんじゃ、ヅラじゃねーか」と腹筋クラッシュしてしまったので、じゃあいっそのことさまざまなヅラをかぶせてみようとおもい、モーツアルトを依頼してみました。

侍をいらいしたのですが、黒柳徹子風になってしまったのがこちらです。

「それだと、黒柳徹子じゃないかよ」って指摘したら自主的に描き直したのがこちらです。

茶髪だしアメリカン侍なワシですが、このプロンプトを使ってSAKANAに侍ヅラを被ったワシを書かせてみました。GPT-4の生成したプロンプトはこちらです。

Create an image of a harpy eagle with human-like features and a topknot hairstyle that is more accurate to the character 'Baka Tono', a comical feudal lord from Japanese comedy shows. The eagle should have an exaggerated and playful samurai topknot, making it look both majestic and amusing, perched in a forest.

そして、上記のプロンプトで生成したSAKANAの生成画像がこちら。SAKANA AIの精一杯のクリエイティビティです。

まあ、顔が侍っぽいといえば侍っぽいかもしれません。

お決まりですがMidjourneyに描かせてみた

やはり大トリはMidjourneyさんの登場という事でHarpy Eagleをかかせてみたら、典型的なワシからは少し離れ、Harpy Eagleそのものの特徴は捉えていました。

そして、部分修正で、「頭に王冠上の羽が何本か立っている」と修正をいれるとなんとこの様な独創的なHarpy Eagleを描きやがりました。Midjourneyのクリエイティビティは他の生成AIの追従をゆるしません。

ってあれ?SAKANAの画層生成機能を紹介するNoteなんだけど、いつの間にかMidjourneyを褒めちぎるNoteになってしまいました。

ちなみにアドビのphotoshopに、「参考画像をアップして参考画像を真似て部分修正」という機能が実装されたのでSAKANA AIの書いたHarpy Eagleの頭を参考にして修正させてみましたが下手すぎて驚きました。やはり、Midjourneyには勝てるものはいません。

一番左が真似をさせた本物のHarpy Eagleです。

フォトショの参考画像を使った修正方法はこのXのポストに添付された動画がわかりやすいので合わせてご覧ください。

下記のNoteでは、クロハゲワシをMidjourneyが非常に芸術性の高い生成をしてくれていますので合わせてご覧ください。


この記事が気に入ったらサポートをしてみませんか?