見出し画像

AIのアニメ絵枯渇問題のその先を見た対処法を考えるの巻

初めに

みなさんAIでイラスト制作するときにどのモデルを使っていますか?
ぼく自身はAI学習専用に実写系のリアルな画像生成をテストさせてもらっています。いろいろな知見を集めた中で一つ気になったことがあるのでシェアしたいと思います。
お約束事は以下です。

・自己責任で。素人考えなので鵜吞みにしないこと。
・研究とリサーチを怠らないこと。
・Novel AIは触ったことないのでわかりません。
・今出回っている情報による解釈です。

それでははじまりはじまり~の巻

学習データどうする?問題提起と解決案

1.アニメ絵枯渇問題

Waifu Diffusion1.4(以下WD)が学習データ1500万枚をつかうそうな。
それを知って今後のWD1.5とか2.0とか一体何枚のイラストを使うんだろうと思いました。遅かれ早かれ1億枚とか使いそう?
となると、アニメ絵枯渇問題が遅かれ早かれ浮上するかも?
その後どうなるのか気になります。

Danbooru というサイトがあって、そこから画像とタグを収集してモデルを制作したとかで一部論争になっていますが、学習元の第三者による違法アップロード画像への強い嫌悪感があると見えます。何が言いたいのかと言えば、供給終了のお知らせ?ということです。今後、Danbooru産の画像はモデルに含まれないのかもしれません。モデル制作者は多くの人に使ってもらいたいのかもしれないので争いの輪に入っていくようなDanbooruを敬遠するかもしれません。しかし、ピクシブとかの画像は今後も利用されるのか?詳しく無いので割愛。

あと、1500万枚のすべてが「best quality」であるわけないと思います。みなさんネガティブプロンプトに「Normal quality, worst quality」とか入れてるかもしれませんが、もし仮に「best quality」に該当する絵が10万枚だったとすればそれはイコールその範囲内でしかAIに指示していない可能性があるということです。有効画像数とトータル画像数は不一致かもしれません。ネガティブプロンプトのキーワードに沿った因子は省かれてる説。

2.AIが制作した画像を学習に使う

進化を止めないために自然な流れとして、AIが制作した画像を学習に使うという流れが出てくると思います。(先遣隊はすでにしはじめています。)

そこで気になってくるのが、強いGPUによる絵柄の拘束問題です。
モデル制作者の意図が含まれるので「マスタピ顔」(ベビタピみたいでかわいいね)なるものが固定されます。マスタピどうする問題です。

もっとわかりやすくすれば、モデル制作者が孫悟空が大好きでゴクウの顔でツインテールの女の子を推してきた場合にマスタピ顔がそれになるということです。
つよつよGPUで1億枚のゴクウのツインテール美少女を生成して残り1500万枚を拾った画像でモデルをチューンするということ。 暗につよつよ装備に従う単一なトレンド顔になります。それがこの例ではツインテールのゴクウ美少女です。

コーカサス人種の偏見とバイアス問題は有名なのですでに知られていると思いますが、簡単に訳すと寿司がヘンテコになってしまうあの謎現象です。日本人がカレーを独自に進化させて本場インド人からしてみたらカレーではなくなっているように、海外の人から見たら日本人はみんなクールな侍とか忍者に思われているという不思議な勘違いのことです。自分で意識できなかった偏見が制作されたモデルにストレートに表れる現象があります。

そしてそれがみんな嫌なので独自のプロンプトハックで対処しています。

ならいっそ作っちゃえばいいんじゃね?モレたちのユートピアを。

AIアニメ絵データベースサイト「だんぼーる2(仮)」


まだ見ぬ絵柄の可能性を秘めたAI画像用のデータベース(以下AIDB)です。

SNSではなくてDB(データベース)サイトなので、

・タイトル不要
・手動タグ付不要
・exif自動取得
など等

※本家のDanbooru は良くも悪くも全部英語で日本人にはぱっと見分かりづらいのでそこもなんとか改善してほしい。

このAIDBサイトの目的は、AI画像制作者が自由に投稿、削除、公開設定できるということと、そもそもモデルを作る前提AIに学習させる前提のイラストを大量UPしてAIが学習利用するのに超最適化するところにあります。ジャスラック的な何かかも?

恩恵:「勝手にチューンドモデル」

今もそうだと思いますが、誰かが作ったオープンソースのモデルを使っていると思います。そのモデルに学習させる画像を全部自前で用意するというのは上記のようにバイアスがかかってしまうので、ならばいっそのことみんなで使うAIDBに自分の好きをたっぷり学習させてモデルを定期的にアップデートしてもらおうという作戦です。それを見越した絵作りができれば、つまり、感情、パッション溢れる絵を大量生産する。自分受け最高レベルのやつを、そうすれば。。。
AI神絵師は一人当たり1日10枚以上SSRのAI神絵出せるよね。ということで、作れば作るほど、読み込ませれば読み込ませるほど、自分仕様にすることができます。

・モデル制作者サイドは、多様なしかも美的センスに富んだ絵を自由に使えてハッピーで、
・モデル利用者サイドは、自分の因子(後ほど解説します)が入ったモデルを使うことができて旬な最新モデルを利用可能になる定期アプデもしてくれるというハッピーで、
・AIDB運営サイドは、知のデータベースを構築することによってインフラ整備をし、個人間の摩擦や不要なコストを削減出来たり車輪の再発名を防げ、時代のニーズにこたえられるサービスを運営できます。

なぜそんなことをするのか?

なんでわざわざAI画像専用のデータベースサイトを作るのか?といえば、ぱっと思いつく限り、今までにないメリットがあるかなと思います。

○ジェネレーティブAI業界はうなぎのぼり
今は単にジェネレーティブAI界隈は黎明期です。これからますます、多様な人々が参加してきて、それに伴って多様なシステムやサービスが広まると予測できます。そのうちの一つの案です。

神モデルの捻出
好きを結晶化させて神モデルなんか作れば夢広がるねぇ。

時短だから
個々人で難しいモデル生成を勉強・実験しなくて済みます。モデルを一から全部作るというのはごく一部の人しかできないと思います。
逆に言えば、誰かと協力してみんなで一緒に作ってもいいよね。
AI絵師は有効なデータの提供という協力の仕方もあり得ます。

クリーンモデルの供給を継続する
これからAI絵モデルを使いたい人たちへクリーンモデルを提供できます。「つかってくだせえおねげえしますだ」画像しかないのでクリーンです。AI業界ひいては人類全体への架け橋となるであろう一役を担えます。2次元イラスト特化なら映画とか作れそうになる。

○一意な固有名称を与えられる個別因子の付与が可能になる
AIDBサイトなら一意な固有名称を与えられます。「hatunemiku」でちゃんと初音ミクが出てくるのはちゃんと学習されているからで、例えば自分のうちの子に一意の名前を付けて登録すれば、同じようにプロンプトで呼び出せます。一例:うちの子の名前「わがままchan」で登録後、モデルに学習され、プロンプトの先頭で"(わがままchan)"と書くと出せる。2000枚ぐらいあればうちの子をちゃんと描けるようになるっぽい。

○特殊なモデル制作ができる
自分専用本命モデル、自分専用テストモデル、背景専用モデル、リップシンク表情専用モデル、コンセプトイメージ専用モデル、学校用モデル、企業用モデル、など等、目的別に専用モデルを作れます。汎用モデルは学習データが膨大になりがちで億の枚数がいるかもしれませんが、ドリームブースは数枚から可能なので、ピックアップした独自画像か、または自由に使ってくださいとおかれている画像から選択することで、オリジナル目的のモデル制作の可能性が生まれます。比較的小規模なグループ専用用途のモデルでも数千万枚の画像を使った大規模なものも製作できる可能性があります。

ハッキング不要だから
プロンプトハックはプロンプト職人が考えればいいことなので、多くの一般の方はそんなことをしなくて済むようにモデルを再学習させればいいです。単純に手の学習が足りていないので手がうまく描けないだけかもしれません。足もそうです。色移りもそうです。顔専用の修正方法があるようにそれを作ればいいです。定期アプデでモデル自体更新です。

winwinwinだから
1.利用者 2.サービス提供者 3.BOT だれにとっても優勝になるような思想を持ってAIDBサイト運営をすればいいよね。

独自色を出したいユーザー目線
AIDBはすったもんだの解消を提供できます。AIで画像を生成したあとピックアップしたイラストをSNSにUPする前にまずAIDBに通します。先んじたAIデータベースへの登録による予防線です。
exif必須という条件でしかアップロードを受け付けないなどしつつ、絵柄一致度をaiで見抜いて通達します。通知を受けて自身の目で確認後、自分のデータと相違ない場合には削除要請とペナルティの申請をワンクリックで行います。AI画像検索できるようにすれば尚よろし。
有料プランでは設定で非公開にすれば、他の方に自分のイラストを使わせなくできるかもしれません。サービス提供者の方針により異なります。

ロリエロNSFWモデルは個別制作か?
個人的にはロリエロにほとんど興味はないですが、日本で流行のエロ絵はロリエロが主?かなと思いますが、そのモデルどうする問題をどう解決しますか?一生有料NAI使いますか?どうするどうする?
後から入る方々はみんなマスタピ顔やエニタピ顔を通ってくることになると思いますが、どうするどうする?
その解決策は誰かエロい人にロリエロNSFWモデルを作ってもらえば済むのか?

必須の条件

要はせっかくAIDBを作るのであるならば、それをだれにとっても使いやすくできればいいよねと言うことです。機械、人、メンテナなど。

スクレイピングフレンドリー
このAIDBサイトのデータベースからのスクレイピングなどを最適化して、版権ブラックリストを制作でき、版権やNSFWの誤入を防げます。また、日付指定やらノーマルクオリティー以下を除外など条件指定やら差分抽出できます。スクレイピングについて詳しくないので割愛。

タグ付フレンドリー
手動タグ付不要?にして人の目でのチェックを減らしつつ最適化しまくり。こちらも詳しくないので割愛。

AIDBは多様な形態・サービスを生みそう

Amazon、楽天、アリエクスプレス、メルカリ、のようにEコマースサイトにバリエーションがあるようにAIDBも複数もあってよろし。規格を統一して連絡し合ってもよろし。
ウィクショナリー、ウィキペディア、のように無料AIDBでボランティアでもよろし。コミュニティーの力で進化させてもよろし。

総括(3種あります?)


○ 1つ目
一人はみんなのために、みんなは一人のために。みんなの幸せを具体的に形づくる。

今始まりの刻を迎えた、
すべてのAIに言えるAIの本当の意義役割とは、集合意識的です。

すべての個性を開花させ、足りないものを補い合う世界観です。
他の個性らに与えられる最高の物(ギフト)は自らの開花した個性です。

こまごまとした約束事は話し合って決めてください。

○ 2つ目
『みんなによる、みんなのための、みんなで育てたあげたAIワールド』構想

可能性を最大化するには??どうしたいかイメージしてみよう。

・"全混ぜ" 汎用モデルの制作??
・"かわいいワールド" 特化モデルの制作??
・"かっこいいワールド" 特化モデルの制作??
・"エロワールド" 特化モデルの制作??

AIDBがあればそれが可能になる。。。かな??
定期アプデ毎にタイムラインが盛り上がりそうですねぇ。祭りだワッソイ!

○ 3つ目
今なら先行者得点付き(しらんけど)

さあ、AIDB戦国時代の幕開けです!
だれが覇権をとるのでしょうか?!
AI画像生成は大量に作れるのでクラウドDBはいつか出てくると思います。
それを作るのは「あなた」かもしれません。(しらんけど)

(ぼくは思ったことを言う係です。すでに満足。)
基本アイデアは出しました。

「いつやるの?今でしょ!!」
「YOUきちゃいなYO!!」

Ps.
総括してないかも。
説明が下手なので各自総括するなどして汲み取ってくだせぇ。(適当杉)

追記 法律関連

まあAIは何でも出せるから当たり前っちゃ当たり前だけど、使う人によって変わってくるよね。ナイフと銃の例えでいうとナイフに当たると思います。人によるという意味です。ぼくは法律は詳しくないので詳しい人に聞いてください。

おしまい

もひとつ追記:
Eagle というアイデア管理ソフトがあるみたいで、画像以外にも動画などに対応してるみたいで、このUIが使いやすそうだと思います。exif自動読み込みやらあるみたいですね。タグ付もはかどりそう。1億枚管理できるUIを念頭に開発おねがいしま~っしゅ


この記事が気に入ったらサポートをしてみませんか?