【AI は面白い】画像生成を色々やってみた、まとめメモ
まず、画像を生成する技術として、SDXL1.0ベースのモデルを使って、プロンプトで指定した画像を生成することをしました。
ポーズを指定するのに、プロンプトも利用できますが、基となる写真があって、そのポーズどおりに生成したい場合は、
OpenPose , Canny , Depth , という各々の技術がありました。
OpenPoseは棒の骨格だけを抽出した画像を生成に使うので、現実的でない身体の画像も生成されましたが、それなりに近いポーズとなりました。
Cannyは線画画像を生成に使うので、基となる写真にほぼ正確なポーズが生成されますが、線画は顔や服にも影響しますので、同じようなパターンが生成されます。
私のおすすめはDepthです。深度をとった画像を生成に使いますが、ポーズは思ったように出力されましたし、線画と違い、プロンプトによるカスタム性もありました。
プロンプトだけで、思ったように生成できない場合はDepthを使ってみてはいかがでしょうか。
複数パターンの画像を生成するときに、顔は同じ人の感じで生成したい場合に、InstantIDという技術が使えました。
今までのお話はControlNet関連のものになりますが、LoRAを適用すると、
画像の装飾的な要素が適用できるのも面白いです。
プロンプト、ControlNet、LoRAを使って、画像生成していると、面白くて1日があっという間に過ぎます。
しかし、これで画像生成の調査はいったん終えようかと思います。
人物画像の深度をとった画像です。人物の輪郭がわかり、顔や背景などプロンプトによる変更がしやすいので、Depthはおすすめです。
サマークラウド株式会社の情報はこちらまで。
https://summercloud.jp
この記事が気に入ったらサポートをしてみませんか?