見出し画像

現実感の高い人物画像を無料で作るための画像生成AI比較

画像生成のための準備

現実感の高い人物の画像を生成するためにはどのGAIを使うべきか、基本的に無料でも使えるシステムを中心に比較検討してみましょう。

1.画像生成のためのプロンプト(命令文)を作る

利用するテキスト系システムにはいくつかありますが、今回は Cloude 3 にて、作りそれを使って画像を作ります。その他のシステムに関しては下記リンクを参考にして下さい。

2.Cloude3でのプロンプト生成

以下が Cloude3 です。

写真を撮影するものとしては、リアリティーの高い写真画像を生成する事を目的としてのプロンプトを作って比較したいと思います。

プロンプトの生成のための命令は以下の通り

下の内容を元に Midjourney の生成用プロンプトを作って下さい。
「詳細な写真画質の日本人の女性のスナップ写真。」

その答え

以下のようなプロンプトを提案します。

"A highly detailed, photorealistic snap portrait photograph of a beautiful Japanese woman with a natural, candid expression, shot with an 85mm lens and shallow depth of field to blur the background, golden hour lighting, Sony A7R IV"

このプロンプトでは、以下の点を意識しています。
"highly detailed, photorealistic"と指定して、詳細で写実的な画質を要求
"snap portrait photograph"でスナップ写真の雰囲気を出す
"natural, candid expression"で自然な表情を指定
レンズとボケ味の指定で、一眼レフの写真らしさを演出
照明の"golden hour"で柔らかな雰囲気を出す
高解像度の"Sony A7R IV"カメラを想定

こうしたさまざまな要素を詳細に指定することで、実在の女性のスナップ写真のようなリアルな画像が生成されることを意図しています。必要に応じてさらにブラッシュアップが可能です。

日本語に翻訳すると「自然で率直な表情の美しい日本人女性、85mmレンズと浅い被写界深度で背景をぼかし、ゴールデンアワーの時間帯の光、ソニーA7R IVで撮影した、非常に詳細で写実的なスナップポートレート写真」といった感じです。

1.Adobe Firefly

Adobe Fireflyは、Adobeが開発した汎用AI技術です。自然言語によるテキストプロンプトから、高品質な画像、ドキュメント、ビデオ、3Dモデルなどのコンテンツをリアルタイムで生成できます。

Creative Cloudに統合されており、Photoshop、Illustrator、Premire Proなどの各アプリケーションでも利用可能です。AIが持つ柔軟性と創造性を活用しながら、人間のクリエイティビティと技術力を補完するのがFireflyの目的です。デザイン、映像制作、マーケティングなど、さまざまな分野での製作プロセスを加速・簡素化できると期待されています。

1.操作画面

2.サンプル画像

Adobe Firefly によるサンプル画像
Adobe Firefly によるサンプル画像2

いいんだけどね・・なんだろうこの残念感。

2.Dream Studio

Dream Studioは、Anthropicが開発した画像生成AIサービスです。複数の先進的なAIモデルを搭載しており、リアルからアブストラクトまで幅広いスタイルの画像作成が可能です。生成した画像に対して、アップスケーリングや補正、変形などの編集機能も備わっています。ウェブブラウザ上で利用でき、アカウント作成するだけで誰でも手軽に体験できます。ただし無料ユーザーには一定の制限があり、有料プランに加入すれば制限が解除されます。

1.操作画面

2.無料ユーザの限界

Dream Studioは無料で利用できますが、いくつかの制限があります。

  • 生成枚数: 1日あたり50クレジット分までしか生成できません。

  • 待ち時間: 生成に時間がかかる場合があります。

  • 画質: 無料プランでは、生成される画像の画質が低くなります。

  • 商用利用: 無料プランでは、生成した画像を商用利用できません。

3.サンプル画像

眉毛・・太いなぁ・・日本人の認識がちょっと弱いかも
やっぱ、まだ太いというか濃いよねぇ眉毛

写真的画質という評価基準では評価が低くなってしまいますが、インターフェースがわかりやすく工夫次第によっては使いやすいと思います。

3.Leonald AI

レオナルドAIは非常に高機能な有料の画像生成AIですが、150ポイントまで無料で利用する事が可能で、一日経てば自動的に150ポイントに戻る形で利用することができます。このため、一日に生成出来る画像の数には制限があるのですが、初心者でも気軽に利用出来ると思います。

ただ、高度な機能は一定期間を過ぎると利用できなくなり、リアルな写真画質などの画像をつくるのは難しくなりますが、それでも普段使うのには十分すぎる能力をもっています。

今回は新規ユーザーを作って最大限の機能が利用できるように設定して人物写真を作ってみました。以下がそのセッティング画面です。

1.操作画面

写真画質で書き出しに設定

操作画面の Photo Real のボタンが使えると写真的質感が上がりますが、無料の場合一定期間経つと使えなくなります。(利用回数かな)

2.サンプル画像

写真的質感が最大限再現されていると思います
肌の質感もいいですね

ただ上記のプロンプトでは、日本という概念を画像化する場合、その解釈として衣服が着物になる確立高いのですが、画質的には非常に良好だと思います。光の具合や肌の質感など、実際の写真と比べてもその差がわかりにくいですね。

また、ある程度利用した後、高度な機能が無効化された時点での画像も比較の為にアップします。上記の2つに比べると表現力が低下するように見えますが、プロンプトを工夫する事で更に使える画像になるのではないかと思います。

機能制限された状況での生成

無料でも十分に楽しめるものと思われますが、有料で使えば様々なエンジンが使えて楽しめるでしょう。

4.Image Creator from Microsoft Designer(Bing Image Creator)

Microsoftが提供するAI画像生成サービスです。テキストを入力するだけで、AIが自動的に画像を生成します。システム的には Open AI の画像生成システム DALL-E3 をそのエンジンとして利用しています。

一日の生成枚数などの上限がありますが、進化も早く質的向上が見られます。

1.操作画面

2.サンプル画像

まだ少しCGっぽさが残っていますね。

元のプロンプトの頭に「photo-realistic」という単語を付け加えてみました。これにより多少現実感が増したと思えます。

photo-realistic の単語を追加

やはり、プロンプトの書き方次第でその能力は引き出せそうです。

4.Midjourney

最後は有料サービスですが Midjourney での生成の例をアップしておきます。さすが有料のシステムだけあって、その質感はほぼ完璧と言えるでしょう。

うつくしい・・
光の表現がすごいぁ
クソかわいいじゃねーか。
逆光のフレアの感じもいいですね。

まとめ

無料で使いたいのであれば、後々、制限が発生するとしても まずは、LEONALD.AI がオススメです。その上で予備的に Bing Image Creator を使えば色々な画像を作ることが可能です。

もちろん、有料システムであれば、その質は格段に向上しますが、遊びの範疇であれば無料システムで十分でしょう。

また、今回は、比較の為に同一のプロンプトを利用しましたが、各生成AIのシステムあわせたプロンプトを作ることでより良い結果となるのは間違いありません。あくまでも今回は固定されたプロンプトでの生成実験ですので、その点をご理解下さい。

追記

さて他にも色々画像生成サービスをしているサイトがあるのでちょっと実験。

Artbreeder

以下AIにまとめてもらいましたが、テキストから画像を作るだけでなく様々なサービスが利用できます。

Artbreederは、人工知能を使って画像を作成・リミックスできるコラボレーション型AIアートプラットフォームです。画像とテキストを組み合わせたり、細かいコントロールで画像を作成したり、パターンと説明を組み合わせて画像を作成したりできるさまざまなツールを提供しています。また、他のユーザーが作成した数百万の画像を閲覧してリミックスすることもできます。
Artbreederは、アーティストやデザイナー、写真家、クリエイターなど、さまざまな人が利用できます。自分の想像力を形にしたり、新しいアートスタイルを探求したり、新しいアイデアを思いついたりするのに役立ちます。
Artbreederは、まだ開発中ですが、すでに多くの人々に愛用されています。今後の進化が楽しみです。

サイトトップ

下記の Prompter を使います。

ぎゃあああああああああ、まずい!まずい!!まずい!!!(笑い)

不適切にもほどがある!コンテンツフィルタリングができてないじゃーん!

こういったトラブルは技術の発展段階には必ず発生する問題であり、そのカオスさが面白かったりするのも事実ね・・とはいえ、生徒には教えられないな・・。


この記事が気に入ったらサポートをしてみませんか?