見出し画像

#67【日本特化のAIモデル】Sakana AIで高速画像生成してみた

おはようございます。



34営業日後に『生成AI活用法』セミナーを開催するアヒルです。隣の席で上司がnoteをはじめたようです。


昨日からSakana AIについて調べ始めました。
デモが公開されている①画像→テキスト、②テキスト→画像のモデルのうち、今日は②テキスト→画像を試します。

①画像→テキストのモデルや、Sakana AIについてはこちらでご紹介しています。



Sakana AIの画像生成モデル


Sakana AIは、画像生成モデルとしてEvoSDXL-JPを構築しました。

こちらもHaggingFace上でデモを使用することができます。


プロンプトを日本語で入力して、"Run"を押すだけですぐに画像が生成されます。

デモ画面はこんな感じ。

ちなみに詳細設定では、シード値を指定することができます。

AIの画像生成におけるシード値とは、
画像生成のランダム性を制御して、再現性を確保するための初期値といったようなもので

簡単に言うと、
AIが同じ画像を何度も作れるようにするための番号です。

シード値に関しては
興味深い記事を見つけたので、それを参考に来週DALL-Eを使って実験してみようと思います。



生成してみた



せっかく日本特化の画像生成モデルなので、日本にまつわるお題を与えてみます。

やば、いま目が合った?とかなりそう

高画質でリアルな画像を生成してくれました。


詳細設定でシード値をいじる


詳細設定でシード値を少しいじってみます。


例えば、シード値「1300000000」で
"パソコン教室に通い始めた白髪のじいさんのモノクロイラスト"
というプロンプトを与えると、

説明が下手だとこの顔で無言で見つめてきそうなじいさん。


目ヂカラのあるじいさんが生成されました。
ここから、シード値のみを変えて様々なじいさんを生成していきます。(じいさんがたくさん出てきます🙇‍♂️)

シード値1400000000のじいさん。
ランダムシードの683072683じいさん。


シード値が1違うだけで、全然違うじいさんが出てきます。

1300000001じいさん。


そして、同じプロンプトで、シード値を最初の「1300000000」にして生成すると、かつてのじいさんがまた生成されました。

やぁ久しぶり。

これはPCで生成しましたが、自分のスマホでもプロンプト・シード値を同じにしたら、

同じじいさんが生成(再現)されました。


次回予告


途中からSakana AIというよりシード値で遊ぶことがメインになってしまいましたが、画像のクオリティは高かったですね。

こんなタッチもいける。

ChatGPTの画像生成なんかは、日本語で指示を入力しても、英語に変換されてから伝わるので、もしかしたら細かいニュアンスが伝わりきれていない可能性もあります。

日本語にしっかり対応しているモデルであれば、より指示内容にあった画像が生成されるかもしれませんね。


今回は意図せずじいさんだらけの記事になってしまいましたが、来週はChatGPTの画像生成を使って、シード値についてもう少し実験してみます。


今週もお読みいただきありがとうございました!

この記事が参加している募集

#AIとやってみた

27,502件

この記事が気に入ったらサポートをしてみませんか?