見出し画像

日本酒が好きになった、でも飲みに誘わないでください、AI力向上のため

年齢を重ねて、最近、日本酒が好きになりました。刺身を食べながら、日本酒を飲むと、めちゃくちゃ美味しく感じます。世界には、なんと素晴らしい飲み物があるのかと、感動している今日この頃です。

それでも、若い頃は、全く日本酒が美味しいと感じませんでした。そもそも、ビールもワインも、お酒全般が全く美味しいと思いませんでした。加えて、お酒に酔って羽目を外している大人を小さい頃からよく見ていたので、「あんな大人になりたくない!」とずっと思ってきたのも理由かもしれません。しかし、どんなに酔っ払いが嫌いでも、やはり、美味しいものは美味しいのです。

今日の目標

それで、何が言いたいのかという言うと…日本酒を飲みながら、「AIで日本酒の絵を描いてみたい」のです。

MS Image Creatorに日本語でプロンプトを与える

MicrosoftのImage Createに以下のプロンプトを入れました。日本語でそのままいけるのが良いところ。

透明色の日本酒が静かに注がれているとっくり。背景には、伝統的な日本の風景、特に静寂な石灯籠、雪に覆われた竹林が描かれています。日本の浮世絵風で。

MicrosoftのImage Createに入れたプロンプト
MS Image Creatorで描いた日本酒のある風景

浮世絵風ではないですが、なかなか良い雰囲気になりました。そこで、ちょっと雰囲気を変えて、アニメ風にしてみます。以下のようなプロンプトを考えて描かせてみました。

刺身を食べながら、日本酒を飲むと、めちゃくちゃ美味しい。小さなおちょこと刺身。アニメ風。夏の夜空。浴衣。

プロンプト

アニメ風にすると、日本っぽい雰囲気になり良いですね。日本酒を描くなら、アニメ風にすべきだと感じた一枚が出ました。

やっぱり、画像生成AIで日本風にするなら「アニメ」のキーワードは強い!

これに味を占めて、アニメ風、浴衣、日本酒のキーワードで行くことにしました。

ChatGPT + Stable Diffusion

次に、ChatGPTの力も借りてプロンプトを作ってみます。Stable Diffusion(以下SDと略す)は英語にしないといけないので、その点もChatGPTに助けてもらいます。

次の手順で、指定の情景を描く、Stable Diffusion用のプロンプトを作ってください。 

## 手順 
- Step1. 日本語で200文字程度でプロンプトを作成してください 
- Step2. それを英語に訳してください 

## 情景
夏の夜空、月を見ながら日本酒を飲むと、めちゃくちゃ美味しい。小さなおちょこと寿司。浴衣。アニメ風。

すると、次のような応答が得られました。

Step 1
夏の夜、月明かりの下で一人または友達と静かに過ごす。月の映る蒼白い光が飲み物に反射し、さらに美味しく感じる日本酒。手元には、工芸的な美しさを持つ小さなおちょこと、一口大の寿司が並んでいる。身にまとったのは、涼しげな浴衣。周りの風景は現実の風景ではなく、アニメ風の美しい背景。この一瞬一瞬を大切に感じて。
Step 2
On a summer night, spend quiet moments alone or with friends under the moonlight. The pale light of the moon reflecting off your drink makes the sake taste even more delightful. At your side are a small sake cup with artistic beauty and bite-sized sushi. You're dressed in a cool yukata. The surroundings aren't a real scenery but a beautifully drawn anime-style background. Savor each and every moment.

上記のプロンプトから生成した応答

結果から言うと、Stable Diffusionを使う場合、上記のプロンプトでは良い絵が出力されませんでした。残念。

上記のプロンプト+Stable Diffusionでは良い絵が出せなかった😿

同じプロンプトでもImage Creatorだとまともな絵が出る

ただし、MSのImage Creatorに上記、Step1の日本語を入れると以下の良い感じの絵が出ました。Image Creator良い絵をたくさん描いてくれます。

MS Image Creatorで試すと、実に美味しそうな酒と肴の絵が出た!

また、上記、Step2の英語を入力してみると、次のような画像を描いてくれました。英語が悪いというわけではなさそうです。

英語にして試してみたところ。当たり、イケメンが出た!

best quality や masterpiece を付与してみた

そもそも、Stable Diffusionを使う時は、良い絵が描けるプロンプトを差し込む必要がありそうです。なんでも、`best quality` とか `masterpiece` とか `4K`とか、特に意味のないキーワードを挟む必要があるようです。

そこで、次のようにChatGPTに与えるプロンプトを修正してみました。

次の手順で、指定の情景を描く、Stable Diffusion用のプロンプトを作ってください。

 ## 手順 
- Step1. 日本語で200文字程度でプロンプトを作成してください 
- Step2. それを英語に訳してください 
- Step3. プロンプトの直前にbest quality, masterpieceのキーワードを差し込んでください。

## 情景
アニメ風のイラスト。夏の夜空、月を見ながら日本酒を飲む。イラストの中心には小さなおちょこと寿司。

そして、できたのが以下の画像。ぜんぜん駄目じゃん!

SDよ、何がbest qualityなのか説明して欲しい!

ネガティブプロンプトを指定してみる

何でも、ネガティブプロンプトを指定すると良いというので、以下のネガティブプロンプトを指定してみました。

sketches logo,watermark, txt,(worst quality:2),(low quality:2),
(normal quality:2),lowers, normal quality,((monochrome),((grayscale),
skin spots acnes,skin blemishes, age spot,(outdoor:1.6),nsfw.ugly face,
breasts out, ippl, too much muscle, bad hands, bad arms, missing fingers,
4 people, 5 people, 6 people

上記のネガティブプロンプトを入れたら、多少まともなイラストが出ました。

でも、なんか違う。。。

アニメ風の指定を削除

もしかすると、SDではアニメ風という指定が良くないのかも。。。アニメ指定を削りました。

次の手順で、指定の情景を描く、Stable Diffusion用のプロンプトを作ってください。

 ## 手順 
- Step1. 日本語で200文字程度でプロンプトを作成してください 
- Step2. それを英語に訳してください 
- Step3. プロンプトの直前にbest quality, masterpieceのキーワードを差し込んでください。

## 情景
夏の夜空、月を見ながら日本酒を飲む、小さなおちょこと寿司。

すると、次のような画像が出力されました。やはりうまく行きません。

アニメの指定を削ったところ

時間切れ、ここまで

残念、納得はいきませんが、今日の画像生成AIの練習はここまでです。日本酒を飲みながら、適当にやっていたのがいけないのか、あまり手を掛けずにImage Creatorで出力した画像が一番良かったという結果になりました。

一番気に入ったのは最初に適当に生成した画像です。

あまり手を掛けずに生成した画像が一番良かったというオチ

今回は、自宅PCのMacbook ProにインストールしたDraw Thingsというアプリで試しましたが、次回は、ColabとGPUをガンガン使って、いろいろなモデルを試してみようと思っています。

また、ChatGPTを使う場合、ゼロからプロンプトを作るよりは、既に美しい絵を描くプロンプトを与えて、その内容をChatGPTに改良してもらうと良いそうです。この点も、次回チャレンジしてみます。



この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?