
<学習シリーズ>Stable Diffusionでpromptを学んでみた



 AIを用いてテキストから画像を生成するAI Generated Artが活発となり、特に2022年8月23日にstable diffusionがOSSとして公開されてから隆盛を極めております。


 なおZhong氏はDALL-E2を使用しておりますが、私はstable diffusionを使用しました。

 出力結果の構成としては、上にZhong氏の写真(DALL-E2)、下に私が作成した画像(stable diffusion)を示します。



●DALL-E2はアニメ風だがstable diffsionは初めからリアル画に近かった。ただstable diffsionはラマが存在しない写真も出てきた。
●"realistic of "をつけるとDALL-E2ではそれっぽい写真は出たが切り抜き画像のような感じになった。
●"realistic of "をつけるとstable diffusionの方は"playing"の部分が十分に認識されずラマとバスケットボールの画像が表示されているだけになった。


●Zhong氏のお気に入りのワードは「dramatic backlighting
 ー>画風(今回は映画スチール:Film still)、着せたい服、撮影の向き・距離、情景
 ー>「llama dunking a basketball」でpromptを与えてもラマ-リング-ボールの関係を正しく理解できていない。
 ー>Zhong氏より、‘in the distance’ や ‘extreme long shot’と入れてもフレーム内にラマ全身を収める画像生成は難しかった。
 ー>「A low angle, long shot, indoors, dramatic backlighting, professional photo of a llama wearing a jersey, dunking a basketball.」だとラマはでない
 ー>例として‘Abstract painting of….’、‘Vaporwave’、‘Digital art’、‘Screen
shots from the Miyazaki anime movie’などがある。
●Zhong氏Final Prompt「“Film still of a llama in a jersey dunking a basketball like Michael Jordan, low angle, show from below, tilted frame, 35°, Dutch angle, extreme long shot, high detail, indoors, dramatic backlighting.”」


【Film still of a llama dunking a basketball, low angle, extreme long shot, indoors, dramatic backlighting.】

【film still of an alpaca wearing a jersey, dunking a basketball, low angle, long shot, indoors, dramatic backlighting, high detail.】

【film still of a llama in a jersey dunking a basketball like Michael Jordan, low angle, show from below, tilted frame, 35°, Dutch angle, extreme long shot, high detail, indoors, dramatic backlighting.】

【Abstract painting of a llama in a jersey dunking a basketball like Michael Jordan, shot from below, tilted frame, 35°, Dutch angle, extreme long shot, high detail, dramatic backlighting, indoors. In the background is a stadium full of people.】

【Film still of a llama in a jersey dunking a basketball like Michael Jordan, dramatic backlighting, vibrant sunset, vaporwave.】

【llama in a jersey dunking a basketball like Michael Jordan, shot from below, tilted frame, 35°, Dutch angle, extreme long shot, high detail, dramatic backlighting, epic, digital art】

【Film still of a llama in a jersey dunking a basketball like Michael Jordan, low angle, show from below, tilted frame, 35°, Dutch angle, extreme long shot, high detail, indoors, dramatic backlighting.】

2-3.所感:DALL-E2とStable diffusionの違い

 Promptに関してはDALL-E2を参照してStable diffusionに適用してもよさそうではあるが、Stable diffusion側の特徴もしっかりつかまないと期待する絵は出力できなさそうである。


 前回の学習をベースに自分が表現したい画像を生成してみます。私が一番好きな動物はコツメカワウソです。よって①コツメカワウソ、②可愛い感じ、③アートっぽい感じ の画像を生成させてみました。



●何も書いてなくても水辺が多い。"on the rock"ってしても水の中にいる子もいる。


【little otters】

【realistic photo of little otters】

【little otter gazing at here】

【little otter gazing at here on the rock】


 より可愛く表示させたいため詳細を追加していきました。追加した修飾語は"fluffy(ふわふわした)※", "round eye(丸い目)", "looking up(見上げる)", "full body(全身)", "dry(乾燥した)"などです。
※DALL-E2のLlamaだと「fluffyという単語は結果を最悪にした」ことを後で気づきましたが、今回のstable diffusionでは悪影響はありませんでした。

●今見れば「gazing at here」と「looking up」という同時にできないprompt書いてた。この場合は先に書いている方が強いかも
●"dry"と書いてもウェット感は消えずに水辺からも脱出できないし、"full body"と書いても全身がでてこない。DALL-E2の例でもある通り「角度や撮影(shots)」に関しては感度が低い可能性がある。


【fluffy little otter gazing at here on the rock】

【fluffy little otter gazing at here ,round eye】

【fluffy little otter gazing at here ,round eye, looking up】

【fluffy little otter gazing at here,dry ,round eye, looking up】

【fluffy little otter gazing at here,dry ,round eye, looking up, full body】

【cute fluffy little otter gazing at here,dry ,round eye, looking up, full body】


 追加した単語は"oil painting(油絵)", "vibrant sunset(鮮やかな夕日・夕焼け)", "Dutch angle(ダッチアングル)", "in space(宇宙で)"です。



【oil painting of fluffy little otter gazing at here,dry ,round eye, looking up, full body】

【oil painting of fluffy little otter gazing at here, dry ,round eye, looking up, full body, vibrant sunset】

【oil painting of fluffy little otter gazing at here, dry ,round eye, looking up, full body, Dutch angle】

【oil painting of fluffy little otter gazing at here, dry ,round eye, looking up, full body, in space】






  • Origin1:oil painting of fluffy little otter gazing at here,dry ,round eye, looking up, full body

  • img2p1:a painting of a sea otter sitting on a rock, an airbrush painting by Valerie Petts, featured on deviantart, photorealism, oil on canvas, acrylic art, detailed painting

  • Origin2:oil painting of fluffy little otter gazing at here, dry ,round eye, looking up, full body, in space

  • img2p2:a painting of two otters with a blue background, a fine art painting by Lisa Frank, featured on pixiv, massurrealism, storybook illustration, airbrush art, oil on canvas

  • Origin3:oil painting of fluffy little otter gazing at here, dry ,round eye, looking up, full body, vibrant sunset

  • img2p3:a painting of a sea lion in a circle, an airbrush painting by Lorraine Fox, featured on deviantart, metaphysical painting, oil on canvas, acrylic art, airbrush art

 用語もそうですが"Valerie Petts"や"Lorraine Fox"などアーティストの名前も入ってきております。画風が似ているかはよくわかりませんがアーティスト名を入れるとスタイルに大きく影響するかもしれません。






 あといろいろな人が既にfine tuningしたいろいろなサービス出してて早すぎる・・・・・
