見出し画像

【AI は面白い】画像生成を色々やってみた、まとめメモ

まず、画像を生成する技術として、SDXL1.0ベースのモデルを使って、プロンプトで指定した画像を生成することをしました。
ポーズを指定するのに、プロンプトも利用できますが、基となる写真があって、そのポーズどおりに生成したい場合は、
OpenPose , Canny , Depth , という各々の技術がありました。
OpenPoseは棒の骨格だけを抽出した画像を生成に使うので、現実的でない身体の画像も生成されましたが、それなりに近いポーズとなりました。
Cannyは線画画像を生成に使うので、基となる写真にほぼ正確なポーズが生成されますが、線画は顔や服にも影響しますので、同じようなパターンが生成されます。

私のおすすめはDepthです。深度をとった画像を生成に使いますが、ポーズは思ったように出力されましたし、線画と違い、プロンプトによるカスタム性もありました。
プロンプトだけで、思ったように生成できない場合はDepthを使ってみてはいかがでしょうか。

AIで生成した画像をベースとしました

複数パターンの画像を生成するときに、顔は同じ人の感じで生成したい場合に、InstantIDという技術が使えました。

今までのお話はControlNet関連のものになりますが、LoRAを適用すると、
画像の装飾的な要素が適用できるのも面白いです。

プロンプト、ControlNet、LoRAを使って、画像生成していると、面白くて1日があっという間に過ぎます。
しかし、これで画像生成の調査はいったん終えようかと思います。


深度画像

人物画像の深度をとった画像です。人物の輪郭がわかり、顔や背景などプロンプトによる変更がしやすいので、Depthはおすすめです。


サマークラウド株式会社の情報はこちらまで。
https://summercloud.jp


この記事が気に入ったらサポートをしてみませんか?