【Imagen3】Geminiで画像を生成する

2024年7月10日 14:23

[読了目安: 2分]
AI系ポッドキャスト(耳で学ぶAI)を運営している矢野哲平(@robothink_jp)です。Googleが提供する生成AIのGeminiでは画像生成もできます。最近ではImagen3という新しい画像モデルも登場しました。この記事ではGeminiを使って画像生成する方法を解説します。

👨‍💻対象読者

Geminiで画像生成したい
Geminiの画像生成の現状を知りたい

🎉記事を読むとできること

Geminiで画像生成ができるようになる

注意点

いずれも、「現状」という前置きが付きますが、Geminiで画像生成をするには下記の制限に注意しましょう。

人物画像の生成は無料版ではできない
日本語プロンプトの注意点
アスペクト比の指定はできない

注意点1️⃣: 人物画像の生成はできない

これですね、以前は生成出来ていたんですよ？リリース当初はこんな感じで人物の画像生成が出来ていました。

しかし、現状は無料版での人物画像生成はストップされています。背景として人物の画像生成で起こるハルシネーションに批判が集中したためです。
その後、Gemini有料版では人物画像の生成ができるようになっています。

ちなみに人物以外の生成は無料版、有料版でも可能です。

注意点2️⃣: 日本語プロンプトの注意点

Geminiで画像生成する場合は英語プロンプト推奨。
なぜなら日本語プロンプトでは人物画像の生成ができないからです。
「まもなく Gemini Advanced で人物の画像生成を利用できるようになります。」👈こんなエラーが出ます

有料版に加入したのに人物画像生成できない！という人はプロンプトを確認してください。もし日本語プロンプトで指示していればそれが原因です。

Gemini上で日本語→英語に翻訳できるので、翻訳してから指示に使う方法も有用です。

注意点3️⃣: アスペクト比の指定はできない

(現状)アスペクト比の指定ができない点にも注意しましょう。アスペクト比、つまり縦横の比率が指定できません。生成される画像は正方形のみです。

Geminiで画像を生成する方法

さっそくGeminiで画像を生成してみましょう。

やり方はいたってシンプルです。プロンプトで画像を生成してと英語で指示するだけです。プロンプトを入力する場所はチャットを入力する所と同じです。

例として、レストランのテーブルの上に置かれているパスタとワインを描くように指示します。

Drawing photorealistic images. 
Background is a restaurant. 
Pasta and wine on a white tablecloth.

生成した画像をダウンロードする

生成した画像にカーソルを合わせればダウンロード可能です。

生成後に会話を重ねる

画像生成後に会話を重ねて画像を修正できます。

先ほどの画像では赤ワインが生成されていました。これをシャンパンに変えてみましょう。

Change the wine at the table to champagne.

うまく機能していますね！ちなみに会話を重ねる時も英語となります。

興味のある方はぜひ試してみてください✌️

目と耳で学べるAI情報を発信しています

通勤時間に効率良く目と耳でAI情報をインプットできます。

AI系ポッドキャスト：https://bit.ly/3TadgCX
X：矢野哲平(@robothink_jp)
動画で学べるAI講座：https://bit.ly/3YI8ktd

noteでも月に30本ほどAI関連の記事を投稿しています。フォローよろしくお願いします😼

この記事が気に入ったらサポートをしてみませんか？