見出し画像

【インターンレポートvol.2】 生成画像の画風を統一する方法

こんにちは!
バスキュールでインターンをしている、多摩美術大学の松尾です。
私はインターンで、生成AIを使用した作品を作ることを目標に学習をしています。

この記事では、前回の続きで「画風がバラバラになるのを防ぐ方法」について私が試行錯誤した過程をレポートします。
私と同じような状況の人や、生成AIを調べ始めたばかりの人にぜひ読んでほしいレポートです。


ChatGPT+Runwayで映像を生成する

生成AIの学習を初めて5日間程の間、私は「ChatGPTでストーリーと画像を生成→Runwayで映像へ変換」を繰り返して練習をしてきました。
成果はこんな感じです。

日を追うごとに、画風が統一され始めているのがわかると思います。
画風を統一するために、私が試したこととその結果を共有します。

画風を統一するために試したこと

1. シード値を固定する

画像を作るAIには「シード値」というものがあります。これは、AIが画像を作る時のスタートの数字です。同じ数字(シード値)を使えば、AIは同じ画像をまた作ることができます。だから、好きな画像をもう一度作りたい時や、違う画像をたくさん作りたい時に、この数字を変えたり同じにしたりして使います。
(ChatGPTに聞いてみました)

生成した画像のシード値をChatGPTに教えてもらい、生成時のプロンプトに書き加えて別の画像を生成してみました。

全然違うテイストの画像が出てきてしまいました…
この後も色々試してみましたが、結局シード値を固定することによって画風を統一することはできませんでした。

調べてみると、どうやらシード値というのは全く同じ画像を生成するのに適しているらしく、特徴を保ったまま別の画像を生成したい時には不向きであるということがわかりました。


2. gen_idを統一する

次に私が試したのは、「gen_idを統一する」という方法です。
画像生成AIが作成した各画像には一意の「gen_id」という識別子が割り当てられます。このIDを使用して、特定の画像を簡単に特定し、操作や参照が可能になります。「gen_id」により、画像を効率的に管理・追跡できます。

シード値との違いは、シード値は全く同じ画像を生成するのに適しているのに対して、gen_idは画風を統一することに適しています。

生成にあたって、以下を参考にさせていただきました。

このgen_idを使用して、統一を図った画像がこちらです。

シード値の時よりは揃っていますが、それでもまだ統一できたとは言い切れない精度になりました。

何枚も生成していくうちにだんだん画風も離れていってしまいました。
(新しいチャットでやり直すとリセットされやすいです)


3.ChatGPTに画風のプロンプトを考えてもらう

私が試した中で一番効果があったのが、この方法です。
参考にしたい画像をChatGPTに見せ、「この画像を再現するためのプロンプトを教えてください」と要求し、ChatGPTにプロンプトを書いてもらいます。
そのプロンプトの中から、画風について言及している箇所を抜き出して他のプロンプトに流用すると、高確率で想像通りの雰囲気の画像が生成できるようになりました。

このブログを参考にさせていただきました↓

画像からプロンプトを作る流れ↓

このプロンプトから、以下の記述を引用しました。
「lighting is a natural gold color, reminiscent of late afternoon sunlight filtering through the trees. The background is a soft-focus green bokeh, suggesting a peaceful natural environment.」

生成した画像↓

この方法で、かなり近い雰囲気の画像を生成できるようになりました!🎉


私は最終的に3番目の方法に落ち着き、最終的にこのくらいの映像を作れるようになりました↓

今回の実験を経て、生成AIに連続して同じ画風の絵を生成してもらうのは想像以上に難易度の高いことなのだと実感しました…
今後も試行錯誤を続けていきます。

次の記事では、「ChatGPTにプロンプトを書いてもらう」方法について、私が試したことをレポートします。


▼ 前回のレポートはこちら ▼


この記事が気に入ったらサポートをしてみませんか?