見出し画像

生成AIのここ1年の進化を振り返る(画像編)

室長の岡田です。

タイトルの通り、2023年は非常にAIが進歩した年だと言われています。
2022年11月に初めてChatGPTが公開され、他にも色々な生成AIサービスの提供が開始されてきたわけです。

私は割と早い時期から有料で使い始めていたわけですが、文章、画像共にものすごい速度で進歩をしていたなあと感じております。

というわけで、一番最初に画像を生成した時と、今との比較をしてみようと思います。


①midjourney(22'8)

一番最初に生成AIで画像を作ったのは22年の8月でした。
Twitter(現X)で話題になっていたので、早速作ってみたのです。
その時は、なんとなく日本の表現力を試したいと思い、

「A Japanese samurai draws his sword into the sea.」

と入力してみたのです。
それがこちら…

なんというか、刀が曲がっててはいけないですよね

確かに、侍要素、海要素は入っていますが、コレジャナイ感は否めません。
(当時はこれでもすげー!ってなっていましたが…)

それでは、今のGPT4で同じプロンプトにしてみたらどうなるのでしょうか?




かなり思っていた通りです。ただ、刀は素手で触ると危ないです。


PS2からPS5になったくらいの変化量ですね。
1年半でPS2からPS5になるなんて、とんでもない速さです。


(midjourneyとChatGPTは、似て異なるものなので、単純比較はできませんが…生成AIが進歩しているのは間違いありません)




もいっこいきます。長文のプロンプトを書いていました。

「A Japanese samurai is swinging his katana to the sea. In the background, you can see waves and the clowd that look like an ukiyo-e print.」
まあつまりは、上の絵を、浮世絵風にしてもらいたかったんです。

伝わります。伝わりますけれども…

GPT4で同じプロンプトにしてみたらどうなるのでしょうか?




多分サーフボードとかがないと危ないし、鎧着ていてこの波の高さはやばいです

侍、波の表現等、かなり繊細になりましたよね。




②midjourney(23'7)


1年くらいたち、ようやく使えるかな?と思い使い始め再開をしてみました。
この頃には、日本語でもある程度対応できるとのことだったので、日本語でプロンプトを出し始めました。

「カメレオンが波乗りをしています。カメレオンは赤、青、黄色、緑の4色で構成されており、サーフボードの色は黒色です。」

ううむ…なかなか伝わりませんなあ。てかありえないシチュエーションですなあ。


日本語ではまだまだスーパーファミコンレベルでした。。

やはり開発においては、英語が主導されておりますね…


GPT4で同じプロンプトにしてみたらどうなるのでしょうか?




若干サーフボードが斜めっていないか?というツッコミ

求めていたものがここにありました。
これが半年での進化なんだからとっても驚きですよね!



②midjourney(23'8)


当時、すげー!ってなっていた絵で比較を終わりたいと思います。
この頃には、英語で指示を出せばかなりクオリティの高いものが出来上がっていました。

「A girl with black hair, wearing a kimono, walks on a bridge. She is smiling. It is sunny. The composition is seen from the front.」

ディテールにツッコミどころはありますが、美しいなあと思いました。


GPT4で同じプロンプトにしてみたらどうなるのでしょうか?





橋の質感が上がりましたね。


たくさん勉強されて、進化されたんですね。。。


というわけで、ここ1年半での生成AIの画像生成の進化についてまとめてみました!


そういえば、岡田印刷の今週号のメルマガのタイトル画像をご覧になりましたか?



なんと、英語の文字を綺麗に入れることができるようになりました!
これまでかなり苦戦をしていたところだったのですが、少しずつできるようになってきました!


このペースで進化していくと、今年中には日本語も対応をしてしまいそうな気がしますね…

今年もAIの進化に注目していきましょう。
本年もよろしくお願いいたします。

この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?