『らいらのAI美女ブランド展開』レビュー その2

初めましての方は初めまして。
前回の記事を読まれた方は改めまして。
天城といいます。

前回の「『らいらのAI美女ブランド展開』レビュー」はかなり感情にまかせて書いてしまったので、
数日開けて改めてのレビューを
私の過去談を交えながら書いていきたいと思います。




天城が画像生成をはじめたキッカケ


改めまして、天城といいます。
私が副業を初めたのは…は次回以降に回すとしまして、
AI画像生成をはじめた頃から語ってみたいと思います。

私が画像生成を知ったのは2023年11月10日前後、とある方が𝕏で
「QRコードアート(デザインQR)って知ってる?」
というポストをされているのを見たのがキッカケです。

ここがすでに他の方と違いますよね。
「AIで自分好みの美女作ってみたいぜ!」
とか、
「AI画像生成って儲かるらしいぜー」
じゃないんです🥰

そこでそのQRコードアートなるものを作ってみたい、
あわよくば作った作品をみんなに見せびらかして自慢したい!
と思っちゃったんです。

それで発信者の方に直接DMできればよかったんですが
あいにくと私は極度の陰キャ・コミュ障ですので、
「DMして直接やりとりなんて絶対ムリ!」
ということで色々Googleで調べたところ、
いくつかのブログが見つかりまして、そこには
「Stable Diffusion(SD)って画像生成ツール使えば作れるよ👍️」
と書かれていました。

たまたまですが、
この少し前に動画編集で必要だからという理由でグラフィックボードを新調していたためスペック的には大丈夫でしたし、
コマンドプロンプトにも抵抗がなくYoutubeの初心者用動画を見ながら
ポチポチとインストールが完了。

ブログに戻ってさあやってみよう!
「img 2 imgとcontrolnetという拡張機能を使って…」
…え?なにこれ?どうやってやるの?
でした😭

SDを使ったことがある方なら分かると思いますが、
これって思いっきり派生技術なんですよね。
インストールしたてで基礎もわからない超初心者にできるわけがない🌝

どのパラメータをどういじったらいいのかわからない。
そもそもの話、
「プロンプト?呪文?なにそれ指示文じゃないの?なんでそんな表現してるの?」
というその程度もわからない状態です。
できるわけがない(二度目)

画像生成を止めてしまいました…


案の定できませんでした。
ブログにかかれている通りやっているのに、一度も成功しない。
他のブログを見てみたり、わからないなりにパラメータやプロンプトをいじってみたりしましたが、やっぱりムリ。
2週間くらいやってみましたが、結局できませんでした。

ここで、一度画像生成自体を止めてしまいました。
だって、面白くないんですもの…🤔

どれだけ生成しても満足できるものが出力されない。
それどころかキメラ(破綻絵)ばかり量産していました。
「もうこんな絵見たくない!」
ということで一度離れて、別のことをやっていました。

ChatGPTを勉強


この頃、ちょうど「GPTストアが解禁される」ということで、
今度はChatGPTを勉強し始めました(ミーハー)。
こちらは独学ではなくきちんとオンラインスクールに申し込んだんです。

ChatGPTをきちんと勉強してプロンプトがようやく理解できてきた頃、
「じゃあどうやってマネタイズする?」って考えたんです。
ChatGPT活用してマネタイズ!でよく見かけるのは、
ココナラやランサーズでYoutube台本やブログの執筆代行です。
…え?クライアントワーク?営業…するの?自分で?

できるわけねーじゃん!?陰キャなめんな!😡

ということでこちらも挫折。
ただプロンプトが理解できたこと、
ChatGPTが(ある程度)使えるようになったのは不幸中の幸いでした。
特にプロンプトの理解はいまだに助けられています。

画像生成に戻ってきた


めでたく(?)ChatGPTも挫折したところで、
「そういえば画像生成やったことあったっけ」
ということでもう一度画像生成をがんばってみることに。
このときはまだ趣味程度でした。

スキマ時間にちまちま生成していた時、
えちぃ画像がたまたま出力されました。
このときに思ったんです。
「これ売ったら稼げるんじゃね?」
単純ですよね🥰

じゃあ画像作って売ってみようとなった時、どこに出版する?ですが、
FANZAかKindleだろうと考えました。
ここでFANZAに出版できるだけの画像が作れていないと思ったため、
まずはKindleでどうやったら出版できるのか調べました。

色々情報が出てきましたが、あったのは
1.Kindle ダイレクト・パブリッシング(KDP)に登録する方法
2.Kindle Comic Creatorの使い方
3.KDPで出版申請するやり方
…ちゃうねん、そこが知りたいんじゃないんだわ😭

Googleやnoteで色々調べましたが、無料情報はほぼこれだけでした。
いえ、これだけの情報しか書かれていない有料記事もありました。
1,000円~2,000円くらいのnoteを何個か購入、
↑の情報しかなかったときは思わず壁を殴ってしまいました。

強いて言えば、アカウント閉鎖のリスクが非常に高いこと、
その基準が非常に曖昧で質問しても答えてもらえないこと、
未成年、女子高生系は絶対にダメ!
という情報はありがたかったです。

他に、特に私が知りたかった情報は、
①どんな画像を作ったらいいのか
②画像サイズ
③出版枚数
です。

正直な話、この情報どこにもありません…orz
仕方がないのでKindleのAI美女写真集を何冊か購入、
いわゆるリサーチってやつをやってみました。

かわいい系の顔や、制服・体操服姿の写真集もありました。
でもこれってやばいよね、垢BANされたくないよね。
ロイヤリティ没収ってやりすぎだよね😂

そこから長い旅が始まりました…

Kindleで出版…の前に


日本人の顔って、外国人からするとものすごく幼く見えるんですよね。
これを前提に考えると、かわいい系のモデルでKindle出版って
ものすごくリスクが高いと思いました。
じゃあどうするか。

かわいい系じゃなくてきれい系の顔が出力できるモデルで、
あまり他の人が使ってないモデルを使ったらいいじゃん。

ということでCIVITAIを徘徊、モデルを探しました。
SD初心者系のサイトで紹介されてるモデルってたいてい一緒で、
・Chilld_remix
・Beautiful Realistic Asians(BRA)
の2種類です。

私的には両方とも好みに合わず、他にも
・yayoi_mix
・majicMIX realistic
・Kawaii Realistic Asian Mix
をはじめ色々ダウンロード→生成してみましたが、どれもしっくりこない。
リアル系イラスト系あわせて150個くらい試しました。
結局、Meichidark_Mixが一番好みだったので、
このモデルを使うことに決めました。

ただこのモデルかなり特殊でした。
CIVITAIの参考絵を元にしていますが、
・サンプリング:DPM++ 3M SDE Karras
・ステップ数:75
・CFGスケール:7.5
・VAE:ClearVAE_V2.3_fp16
これがどれだけ変かというのは、分かる人には分かると思います。
ちなみに、他のモデルは
・サンプリング:DPM++ 2M SDE Karras か Euler a
・ステップ数:20~30
・CFGスケール:7
・VAE:なし、もしくはvae-ft-mse-840000-ema-pruned
が指定されている場合が多いです。
ステップ数…おかしいですよね💦
ClearVAE_V2.3_fp16も本来はイラスト系に使うVAEです…
やっぱりおかしい🤔

プロンプトの構築にも苦労しました。
まずはCIVITAIの参考絵のプロンプトを借りてきて、
これに色々付け加え~削除し~また追加~を繰り返し、
2週間くらいかけてようやく、
ある程度満足できる画像が出力できるプロンプトが組み上がりました。

ただこれかなり絶妙なバランスの上で成り立っている奇跡的な一品で、
おそらく他の方が真似してもまともに出力できないと思います。
なにしろトークン数が400超えてますから…

ここで、ずっと独学できちんと基礎を学んでこなかった弊害が出ました。
とにかく細かくAIに指示したほうがいいと思って組んだ結果、
大量のトークン数になってしまったわけです。
一般的に、トークン数は少ない方がいいと言われています(論争あり)。
大体150トークンくらいが目安…ですかね?
他にも、よくテンプレートとして挙げられる
・品質向上プロンプト
・髪型
・表情
・服装(小物)
・ポーズ/アングル
・背景
の順番もガン無視です😂

ですがこのプロンプトが一番好みの画像を出力してくれたので、
このまま改良しながら使い続けています。

他にも副産物として、
実際に生成するときはAfter Detailerで顔と手の補正をかけていますが、
指がおかしい程度の破綻絵は全体の約30~50%程度に抑えられています。

副業で作業時間がとれない、
修正に時間を使うくらいなら勉強に時間を使いたい。
特にローカル環境なので寝ている間に大量生成してしまえばいいので、
After Detailerで余計に時間がかかっても特に問題がない。
(強いて言えば電気代がかかるのとPCに優しくない…)

それなら最初からできるだけ破綻していない画像を作って、
ダメな画像だけ弾いてしまえばそれほど時間をかけずにすみます。
大体300枚生成して、指の破綻がないのがだいたい150~200枚、
そこからさらに良さげな画像だけ選別して100枚にして出版。
これの繰り返しです。修正の手間がない分楽ですよね✋️
(修正する技術がないだけともいう)

Kindle出版をはじめて1ヶ月間は睡眠時間を削って、
1日の作業時間を4~5時間くらいは確保していました。
休日は週1日、約12時間は作業していたと思います。

ちなみにですが、私は通常のStable Diffusion Web UI AUTOMATIC1111と、
Stability Matrix版のStable Diffusion Web UI Forgeをインストールしています。
帰宅、夕食後片方でその日のプロンプトを組んで生成開始、
もう片方でプロンプト組んだり拡張機能を試してみたり、していました。

Kindle1冊目出版、その後


Kindleで1冊目を出版申請したのが2024年3月6日、SDをインストールしてから約4ヶ月経っています。
これが早いか遅いかで言えば、かなり遅いと思います。
Kindleで使う画像のレベルって、私の感覚でいえば40~60点程度で十分。
かなりハードルが低い方です。
おそらくですが、AIで作った画像を売り物にするマネタイズの中では
一番レベルが低いと思っています。
それでも4ヶ月もかけるって、相当ですよね。
早い人なら1ヶ月程度で行けると思います。

1冊目を出版してから毎日1~3冊出版申請してーを1ヶ月続けて、
約1万円のロイヤリティを獲得。
タイパで言えば最悪なのですが、
まぁこんなもんだと思ったのでそこはいいんです。

ただここで、私の作る画像がなんか微妙だな~って思っていました。
それが何なのかいまいちわからず、色々プロンプトをいじってみたけど変わらない。

そこで、ちょうどとある方と無料zoom面談をする機会があったので聞いてみました。
実はAI物販のローンチの一環だったのにKindleの相談をするって…💦
それなのに親身に相談してくださいました。
その節はありがとうございました🙇

その方がおっしゃったのが、
「画像が暗いよね」
でした。

はい、確かに暗いんです。
多分なのですが、これってモデルの特性なんですよね。
プロンプトじゃない、VAEも使ってる、でもなんとかしたい。

そこでまたGoogle先生にお願いして探しました。
約2週間かかりました。
結果、
「オリジナルモデル作ればいいじゃん👌」
単純ですよね🥰

ただこれで私の中で、私の作る画像の点数が一段上がりました。
今まで60点程度だったのが、70点くらいには上がったと思っています。
(完全に私目線です)

このモデルでやっていこうと思ってプロンプトの精度をもう少し上げ、
顔固定LoRAを作ってInstagramをやってみよう。
これがゴールデンウィーク終わりの5月6日。
これも準備不足の見切り発車です。
まぁ失敗してもいいや、やらないよりやったほうがいいだろ、の感覚です。
フォロワーが2週間で約200人、多くないですよね…😭

らいらさんのTipsが発売されたのが、この頃です。

『らいらのAI美女ブランド展開』を読んで


前回も書きましたが、らいらさんのTipsを読んで一番に思ったのが、
「理解できて良かった。ホッとした。」
です。

私のレベルが低すぎて書かれていることが理解できない。
これってかなり悔しいですし、
なにより必死になって作られたらいらさんに申し訳ない。

ただそのあたりは杞憂でした。
1章にかかれているのは
①自分だけのオリジナルモデルを作ろう
②顔LoRA作って差別化しよう
です。

両方とも、やろうと思ったキッカケがらいらさんとは全く違います。
目指していたものも違います。
でも得られた結果は一緒でした。

自分でも経験済みだから理解できる?
らいらさんが考えていることって、
そんな浅いものじゃないと思います。
私なら理解できる?
そんなの傲慢でしかありません。

でも、らいらさんがなぜこの2つを
「最強の武器」
と表現したのかはわかります。
だって、自分しか使えないんですから

マージの配合比率って、それこそ無限にあります。
モデル自体もかなりの数あります。
その中で、全く同じモデル・配合比率になる確率ってどれくらいですか?

私は、別に自分だけの顔が欲しかったわけじゃありません。
むしろ、Meichidark_Mixというモデルに惚れて、
でもどストライクからは微妙に外れていて。
これをなんとかして自分好みの画像にしたい。
そこが出発点で、目的地でした。

でも結果として、自分だけの
誰にも真似できない唯一無二の武器が手に入ったんです。
らいらさんがおっしゃるとおりに。

らいらさんがおっしゃっていた「最強の武器の作り方」。
前回のレビューではその表現にかなり引っ張られていました。
ですので、今回は別の例えをしてみたいと思います。

目の前に大きな山がいくつもあります。
道はいくつか用意されています。

コンサルやスクールで学ばれている方は、
比較的安全かつ近道で、整備された道を通ることができます。
途中で道順が書かれていたり、
向こう側まで案内してもらえたりします。
ただこれには条件があって、
①信頼できる方を探し出せる。
②コンサル・スクールを申し込めるだけの財力がある。
③それなりの金額を支払うだけの勇気がある
を満たせる人だけが通れます。

独学の人は、近道を通ることはできません。
麓から伸びている険しい山道を歩いて行かなければいけません。
川や崖、道なき道を通らされることもあります。
脱落者も出ます。
でも道は続いています。
たどり着けさえすれば先に進むことができます。

私の場合は、
きちんと整備された道があるにも関わらずその道に気が付かず、
途中でそれて林の中に入り込み、迷子になりながらも先に進み、
ようやく開けたところにだどりついたと思ったらそこに道があった。
皆さんはすでにかなり先に進んでしまっていた。
そんな感じです。

らいらさんのTipsは、
山道を通らないといけないけれど、
途中でショートカットが用意されています。
あるいは、
「この道は危険だから通らない方がいいよ🐇」
と立て札を立ててくれています。
道を通っている時には気が付かないけれど、
たどり着いた先で後ろを振り向いたときに
「実は近道を通ったんだ」
「あの道って危険だったんだ」
と気がつける、そんな感じのものだと思います。

山の麓に立っている人、
つまり画像生成をこれから始めようという人に必要なのは、
基礎がきちんと学べる「技術参考書」です。
基礎をきちんと身につければ、
それだけ早く、確実に目的地にたどり着けます。
でもそれは、残念ながららいらさんのTipsではありません。

らいらさんのTipsは近道をするためのものです。
初心者・はじめたての人が読んで、
すぐに理解できるものではないと私は思います。
その場では理解したつもりでいても、本当に自分のものにできる人はそういないと思います。
けれどある一定以上の場所まで進んで、後ろを振り返った時。
自分が通った道がらいらさんの手で整備された、
安全に通れる道だった。

初心者にこそ読んでほしい。でも初心者にはおそらく理解できない。
ただある一定のレベルに到達できた人はそのありがたさが理解できる。
そういう類のものです。
私はそう思っています。

最後に



私は、画像生成の中級者ではありません。
基礎が全くできていないからです。
独学の自己流で、矯正もできそうにありません。
どこまで行っても中級者にはなれない、
中途半端なレベルでしかありません。

でもらいらさんのTipsの内容は理解できます。

色々遠回りをしました。
しなくてもいい、バカみたいなことばかりやってきました。
そんなことしても意味はない、無駄なことばかりしてきました。

その経験は、その場では必要ありません。
これから先も必要ないでしょう。
完全に無駄な時間・無駄な努力です。
私自身がそう思っています。

でも、「経験をした」という経験は、どこで役に立つかわかりません。
今ではないかもしれません。
もしかしたら、一生ないかもしれません。
でも私は運がいいことに、今回その場に恵まれました。

前回の記事で「経験値の厚み」と表現したのは、
どう言語化したらいいのかわからなかったためです。
ですがこちらの記事を読んで、少しでも理解していただけたら幸いです。

らいらさんのTipsを購入された方は、せっかく購入したんです。
使い倒しましょう。
らいらさんに
「こんなに役に立ちました!」
って、皆さんで報告しましょう。

らいらさんのTipsを購入しようか迷っている方は…
この記事が、少しでも参考になればいいなぁ、と思います。

参考


①Meichidark_Mix

②Tips購入前に作成のオリジナルモデル

③Tips購入後、記事を参考に作ったオリジナルモデル改良型


ここまでお付き合いいただき、ありがとうございました。

今回紹介したTipsはこちら⏬️(#PR)


この記事が気に入ったらサポートをしてみませんか?