日本酒が好きになった、でも飲みに誘わないでください、AI力向上のため
年齢を重ねて、最近、日本酒が好きになりました。刺身を食べながら、日本酒を飲むと、めちゃくちゃ美味しく感じます。世界には、なんと素晴らしい飲み物があるのかと、感動している今日この頃です。
それでも、若い頃は、全く日本酒が美味しいと感じませんでした。そもそも、ビールもワインも、お酒全般が全く美味しいと思いませんでした。加えて、お酒に酔って羽目を外している大人を小さい頃からよく見ていたので、「あんな大人になりたくない!」とずっと思ってきたのも理由かもしれません。しかし、どんなに酔っ払いが嫌いでも、やはり、美味しいものは美味しいのです。
今日の目標
それで、何が言いたいのかという言うと…日本酒を飲みながら、「AIで日本酒の絵を描いてみたい」のです。
MS Image Creatorに日本語でプロンプトを与える
MicrosoftのImage Createに以下のプロンプトを入れました。日本語でそのままいけるのが良いところ。
浮世絵風ではないですが、なかなか良い雰囲気になりました。そこで、ちょっと雰囲気を変えて、アニメ風にしてみます。以下のようなプロンプトを考えて描かせてみました。
アニメ風にすると、日本っぽい雰囲気になり良いですね。日本酒を描くなら、アニメ風にすべきだと感じた一枚が出ました。
これに味を占めて、アニメ風、浴衣、日本酒のキーワードで行くことにしました。
ChatGPT + Stable Diffusion
次に、ChatGPTの力も借りてプロンプトを作ってみます。Stable Diffusion(以下SDと略す)は英語にしないといけないので、その点もChatGPTに助けてもらいます。
次の手順で、指定の情景を描く、Stable Diffusion用のプロンプトを作ってください。
## 手順
- Step1. 日本語で200文字程度でプロンプトを作成してください
- Step2. それを英語に訳してください
## 情景
夏の夜空、月を見ながら日本酒を飲むと、めちゃくちゃ美味しい。小さなおちょこと寿司。浴衣。アニメ風。
すると、次のような応答が得られました。
結果から言うと、Stable Diffusionを使う場合、上記のプロンプトでは良い絵が出力されませんでした。残念。
同じプロンプトでもImage Creatorだとまともな絵が出る
ただし、MSのImage Creatorに上記、Step1の日本語を入れると以下の良い感じの絵が出ました。Image Creator良い絵をたくさん描いてくれます。
また、上記、Step2の英語を入力してみると、次のような画像を描いてくれました。英語が悪いというわけではなさそうです。
best quality や masterpiece を付与してみた
そもそも、Stable Diffusionを使う時は、良い絵が描けるプロンプトを差し込む必要がありそうです。なんでも、`best quality` とか `masterpiece` とか `4K`とか、特に意味のないキーワードを挟む必要があるようです。
そこで、次のようにChatGPTに与えるプロンプトを修正してみました。
次の手順で、指定の情景を描く、Stable Diffusion用のプロンプトを作ってください。
## 手順
- Step1. 日本語で200文字程度でプロンプトを作成してください
- Step2. それを英語に訳してください
- Step3. プロンプトの直前にbest quality, masterpieceのキーワードを差し込んでください。
## 情景
アニメ風のイラスト。夏の夜空、月を見ながら日本酒を飲む。イラストの中心には小さなおちょこと寿司。
そして、できたのが以下の画像。ぜんぜん駄目じゃん!
ネガティブプロンプトを指定してみる
何でも、ネガティブプロンプトを指定すると良いというので、以下のネガティブプロンプトを指定してみました。
sketches logo,watermark, txt,(worst quality:2),(low quality:2),
(normal quality:2),lowers, normal quality,((monochrome),((grayscale),
skin spots acnes,skin blemishes, age spot,(outdoor:1.6),nsfw.ugly face,
breasts out, ippl, too much muscle, bad hands, bad arms, missing fingers,
4 people, 5 people, 6 people
上記のネガティブプロンプトを入れたら、多少まともなイラストが出ました。
アニメ風の指定を削除
もしかすると、SDではアニメ風という指定が良くないのかも。。。アニメ指定を削りました。
次の手順で、指定の情景を描く、Stable Diffusion用のプロンプトを作ってください。
## 手順
- Step1. 日本語で200文字程度でプロンプトを作成してください
- Step2. それを英語に訳してください
- Step3. プロンプトの直前にbest quality, masterpieceのキーワードを差し込んでください。
## 情景
夏の夜空、月を見ながら日本酒を飲む、小さなおちょこと寿司。
すると、次のような画像が出力されました。やはりうまく行きません。
時間切れ、ここまで
残念、納得はいきませんが、今日の画像生成AIの練習はここまでです。日本酒を飲みながら、適当にやっていたのがいけないのか、あまり手を掛けずにImage Creatorで出力した画像が一番良かったという結果になりました。
一番気に入ったのは最初に適当に生成した画像です。
今回は、自宅PCのMacbook ProにインストールしたDraw Thingsというアプリで試しましたが、次回は、ColabとGPUをガンガン使って、いろいろなモデルを試してみようと思っています。
また、ChatGPTを使う場合、ゼロからプロンプトを作るよりは、既に美しい絵を描くプロンプトを与えて、その内容をChatGPTに改良してもらうと良いそうです。この点も、次回チャレンジしてみます。
この記事が気に入ったらサポートをしてみませんか?