見出し画像

コラム: 画像生成AIに関する自由研究

閑話: 画像生成AIと私の目標

画像生成AIに関する研究を進める中で、私が特に重視しているのは「多様性」と「人物の一貫性」です。これらのキーワードは、私が最終的に目指している映画の1シーンのような画像生成と、人物の一貫性を保持するために非常に重要です。

多様性: 4つの視点

Bing imagecreatorは一つのプロンプトに対して4つの画像を生成してくれます。この4つの画像がそれぞれ異なる視点や構図を提供してくれると、表現の幅が広がります。例えば、前回の記事で紹介した2つの画像に対して、Bing imagecreatorが生成した残りの2つの画像は以下のような視点と構図を用いました。

人物の一貫性: 小説と挿絵の調和

小説を書く際には、その挿絵となる画像の人物像が一致していることが望ましいです。例えば、「太郎」はいつでも「太郎」として描かれるべきです。この一貫性が保たれていると、読者はより深く物語に没頭することができます。

日中と夜間: 照明の影響

照明はシーンの雰囲気を大きく左右します。日中と夜間での違いは特に顕著で、これが人物の一貫性にも影響を与える可能性があります。例えば、日中の明るい照明下で「太郎」がどのように描かれるかと、夜間の暗い照明下での「太郎」は、一貫性を保つために注意が必要です。

結論: 研究の進行と期待

現状では、多様性と人物の一貫性のバランスがまだ取れていないと感じています。しかし、これからの研究でこの問題を解決し、よりリッチな画像生成ができるように努力していきたいと考えています。

このような研究は、画像生成AIが持つ無限の可能性を探るための一歩です。私の望みは、この研究を通じて、より多くの人々が画像生成AIの魅力に気づき、その可能性を広げていくことです。