CHATGPTによる画像生成の検証とその多様性

2024年1月10日 23:18

こんにちはー！
今日はChatGPTで挿絵が作れないかと四苦八苦した経過をお伝えします。

これができれば、自分の本に好きな挿絵を差し込めるぞー！
と、試行錯誤してます。
ChatGPTは、写真みたいなイラストは得意なのですが、ざっくりした絵は苦手なんですよね。

今回は風景を挿絵っぽくすることに挑戦です。

画像生成プロセスの説明

ChatGPTを使っての画像生成は次の通りになります。
これもChatGPTちゃんに聞いた結果です。AIでの画像生成はこの順序で行われるようです。

1. プロンプトの入力
ユーザーがテキスト形式で具体的な指示や説明を入力します。
このプロンプトは、生成される画像の内容やスタイルを定義するためのものです。

2.AIの解釈
AIはこのプロンプトを解釈し、学習データベース内の情報を用いて、要求された内容を視覚的に表現する方法を決定します。

3.画像の生成
AIはプロンプトを基に画像を生成します。
このプロセスでは、複雑なアルゴリズムが使われ、ピクセルレベルで画像が構築されます。

4. 結果の表示
生成された画像はユーザーに表示されます。
ユーザーはこれを評価し、必要に応じてフィードバックをAIに提供することができます。

5. 調整と改善
ユーザーのフィードバックに基づき、AIは画像を調整し、プロンプトに対する解釈を改善することができます。

6. 最終画像の確定
ユーザーが満足する画像が得られたら、そのプロセスは完了です。

ま、難しく感じるかもしれませんが、実際に人がやることはひとつだけです！
それが「プロンプトの入力」です。

生成画像の比較と検証

今回、例題としてこちらを使います
ハレアカラ山（ハワイ、アメリカ） - 火山頂から見る壮大な日の出。

これに以下の線画を指定します。

1. シンプルスケッチ
2. 詳細スケッチ
3. リアリスティック
4. 抽象的
5. 幾何学的
6. 漫画スタイル

なぜ線画にしたかというと、挿絵に使うには線画が馴染むかなと思ったからです。
これがイラスト集なら、また違うスタイルを指定して、個性を出すといいと思います。

さて気になる結果ですが……

1. シンプルスケッチ

2. 詳細スケッチ

3. リアリスティック

4. 抽象的

5. 幾何学的

6. 漫画スタイル

いかかでしょうか？
結構、雰囲気が違いますよね。
挿絵として使うなら、スケッチか、漫画風スケッチが使いやすそうだなと思いました。
単純な好き嫌いで言えば、抽象的と幾何学的が面白かったですね。
それだけのテーマでイラスト集とか作れそうな気がしてきます（笑）

まとめ

プロンプト、難しいイメージがありますが、どうだったでしょうか？
思ったより簡単だった！
と思ってもらえたら嬉しいです。

たった二文でこれだけの画像が作れるって感激です。
これは誰もが自分の言葉を画像にする力を得たと言っても過言ではありません！
（細かい指定はできないけどね）

これがただのスタートで、これからもっと凄い技術が出てくるんだろうなって予感がします。
誰もがAIと組んで、何かを生み出せる時代になってきました。
次に何を生み出すか、ワクワクしませんか？

この記事が少しでも役に立った、気に入った方はスキとフォローをお願いします。

この記事が参加している募集

#仕事について話そう

109,984件

この記事が気に入ったらサポートをしてみませんか？