一人の絵描きとしてイラストAIについての見解

一人の絵描きとしてイラストAIをどう見ているのか それを書いておこうと思います
イラストAIについて何が問題なのかを知りたい人に読んでほしい内容になっています絵描き以外にも関わってくる話なので
今なぜここまで問題になっているのか気になる方は是非ご一読ください

なるべくわかりやすくなるようにかみ砕いて書いていこうと思います
どうしても長くなるので気合を入れてお読みください
まず私自体がどう思っているのかということについて 

現段階では私はイラストAI反対です

色々な観点から見て好きになれる技術ではありません
学習段階で著作権など権利関係を無視している フェイクポルノ ディープフェイク 版権物の海賊版商品など様々な問題を抱えています

物凄く簡単に言ってしまえばいくらでも犯罪行為にだれでも気軽に使えてしまうツールなのに 人権を侵害できてしまう機能が搭載されているのに

制限機構がなくなおかつ法規制もないのでそれを咎めることすらできない状態なんです

全文を読むのは難しいのでこの↑事を覚えていてくれればいいです

要はめちゃくちゃ悪用できる状態なのに半年の間ずっと放置されていてどんどん問題が広がっていってるのが今の状態です

まず最初にイラストAIの何が問題なのか?これについてまだ理解が追い付いてない人が多いと思います
ですのでそれを要点を踏まえ説明していこうと思います

まずイラストAIとはおおもとのソフトウェアがありそこに学習モデルをセットすることでイラストを生成します

学習モデルとはイラスト 写真など要は画像というコンテンツを指しますがそちらからディープラーニングと言われるものによって学習をすることでイラストを生成します
詳しく書くとこれだけですさまじく長い説明をしないといけないので簡単に説明しておきます

イラストAIが人間と同じように学習してイラストを生成しているという情報を流す方がいましてそれをそのまま信じている方がいますが全くの間違いです

AIが行っているのは学習データに用いられたイラストから学習されたデータを元に作られた模倣による合成です考えてはいません
AIと名前がついていますがこれは絵を描く技術を学習して理解しているわけでもなければ 物質の構造を理解しているわけでもありません

感覚としてはAIによる新しい新手法のコラージュ トレースです                     一枚のイラストからトレースをするのではなく膨大なイラストからプロンプト(指示)を元に疑似的にコラージュやトレースに近い事をしてイラストを生成しています


厳密に言えばトレースやコラージュとは似て非なるものですが
それに近い事をすることで一枚のイラストを作っています

決してAIが自分で考えてイラストを作っているわけではないんですよ

そもそも人間と同じように学習してイラストを描いているとするならば手が増えたり足が増えたりしないでしょう?
人間が人を描こうとしてうっかり足を3本描きますか?
二人の人間を融合して描きますか?
描きませんよね

あくまでも学習データに使われたイラストや写真の模倣からなっている集合体ですよ
新しいものを生み出しているのではなく 学習素材からプロンプトによって特徴であったり傾向を合成してなんとなく一枚のイラストに復元しているだけです

そこをよく理解していただきたいです

学習データが多ければ多くが混ざり合うため元になったものが特定できなくなっています なので今まではAIによって新しいものが作られていると主張されていましたが

集中学習したモデル LoRAが出てくることにより学習データが少ない物 偏らせたものが出てきたことでその実態が見えてきた というのが最近の流れです

学習データがたとえ多かったとしても学習素材に使われたイラストのプロンプトを正確に入力すれば その画像に近いものを生成します

混ざり切らないので元がわかってしまうんですね
結局のとこ少しのデータだとパクリだとばれて問題になってしまうから学習データを増やせば混ざり合って元がわからないからセーフになるという暴論なんですよこれ

これを理解した上でイラストAIを見たときこれを使おうと思いますか?
私はこんなキメラ生成器を使う気には微塵もなれないですね

話を変えましてまず学習モデルについて

この最初の学習という段階から問題が生じていまして
よく聞くと思いますが 「学習は合法だ!」と目にするでしょう
こちらに関しては著作権法 30条の4というものに基づいて行われています一部を抜粋しますね(後の説明を聞きながら見返してください 詳しく読まなくていいです)

著作物に表現された思想又は感情の享受を目的としない利用(第30条の4関係)
著作物は,技術の開発等のための試験の用に供する場合,情報解析の用に供する場合,人の知覚による認識を伴うことなく電子計算機による情報処理の過程における利用等に供する場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には,その必要と認められる限度において,利用することができることを規定しています。これにより,例えば人工知能(AI)の開発のための学習用データとして著作物をデータベースに記録する行為等,広く著作物に表現された思想又は感情の享受を目的としない行為等を権利者の許諾なく行えることとなるものと考えられます。

何がなんやらって思われると思いますが すごい簡単に言ってしまえばですね
研究目的であれば権利者に許可を取らずに学習素材にしていいよ!っていう法ですね
なかなかこれが問題になっていまして例えばなんですがサブスクリプションなど
(FANBOXなどの有料コンテンツとか)
そこでしか公開されていないものだとしてもそれが無断転載で代表的なものでDanbooru というサイトにアップロードされてしまったものだとしても

それを学習することが合法になってしまっているんですよ
なかなかめちゃくちゃな法律だとお分かりいただけるでしょうか?

有料で販売しているものだとしてもそれが無断転載されたら無断学習おkの素材になってしまうんですね
これでは学習に使われたくない絵描きさんが有料コンテンツとして販売して自衛をしたとしても無断転載された時点で防御策を失ってしまうんです

今Stability AI社が学習モデルからオプトアウトという学習素材から権利者から申し立てがあれば素材を訓練用データから外すという申請が出来るんですが
まず学習素材に使ってほしくないのであれば第一段階として絵描きの防衛策は有料で販売しますよね
ただ無断転載されてしまうと本人が気づかないうちに無断転載先から学習されるため本人が気づかないとこで学習素材にされるため実質機能しないんです
そして気付かないうちに学習素材にされるためオプトアウトをしなくては という段階にすら行きつかず
そもそも自分の作品をそのデータセットから探す事は現実的ではなく
自分の作品ページから学習されたものではないので検索をかけようがないんですね
なのでオプトアウトは意味がない!!と絵描きは言っているわけです

そもそもこれ絵描きだけの問題ではなく         ネット上の写真などありとあらゆる画像を学習していますのであなたの家族の写真も含まれているかもしれませんよ


今は日本の法で30条の4というものを例題に上げましたが
海外ではフェアユースというものによってこれが行われています
一定の条件を満たしていれば、著作権者から許可を得なくても、著作物を再利用できる というものですね
こちらに関しては国によって法が異なるので全部を上げるときりがないんですが
大体の場合 なんらかの理由で無断学習が許可されていると思ってもらえればいいです

では次にじゃあ学習されたら何が問題になるのかについて

こちらについて掘り下げていきます

まず一つ目 ディープフェイク フェイクポルノ 児童ポルノなど実在の人物を害する写真だと思えるような写実的なイラストのようなものを作ることが出来ます
普通の考えであれば写真と見間違うほどの出来でどう考えても問題なんですが

これは写真から学習して生成された イラストであって実在する人物ではない非実在性のイラストだ!

という言い訳をしてこれを生成する人たちがいるんです
困ってしまいますね

それとここで集中学習というものを問題として提示しなくてはいけません

今主に問題に上げられているのはLoRAというものを使って大元となる学習モデルに追加データをマージ(混ぜる)する事で
写真から特定の人物を学習
それによりフェイクポルノ 児童ポルノを作れるようになってしまいます

これをそのまま聞いても実際どういうことが行われているのかぱっと思いつかないと思われますので例題を上げますと
服を着た女性の写真から学習し 顔の過学習をする
ポルノ画像から作られた実写系の学習モデルと合わせる(マージ)ことで顔がその人そっくりの様々なフェイクポルノ画像を作り放題になってしまいます
ポルノ画像からポルノ画像を作るのではなく 元画像は服着ててもいいんですよ別に
ありとあらゆる写真から この工程を踏めばその人の精巧なポルノ画像が作れてしまうんです

児童ポルノの場合だと少々また話が変わってきまして このAIイラストと言われるものは現在それがAIによってつくられたものかどうかを宣言する義務はないんです(日本では 海外ではもう義務化されてるところもあります)ですので学習データというものに児童ポルノを学習させ変換することで今日本国では単独所持であっても違法ですが
学習データと言う形にしてそこから出力されたものに関しては法整備が追いついておらず現状それを明確に違法だとは言えない状態になってしまっています

そもそも言い訳として非実在性だから問題ないとか彼らは言っていますからね

これがどれだけ問題なのかお分かりいただけるでしょうか?
今回はフェイクポルノというものに焦点を当てましたがこれは例えば万引き画像 暴力画像 グロテスクな画像等様々なものに応用が効きます

これを個人がそこまでスペックの高くない一台のPCで行うことが誰でも出来 

なおかつそれを明確に違法だと咎められないのが今の日本の状態です

いかに今日本がやばい状態かお分かりいただけたでしょうか?
本当にやばいんです
半年も放置されてるんです
このLoRAというもの データとしても軽いため気軽に裏で取引されていると思います

表に出てこないだけで特定個人を学習したもの 児童ポルノを学習したものおそらく相当数がすでに出回っていると思います
そもそもポルノでなくても結果それをポルノに加工できてしまいますから
実際の被害者がどれだけいるのか考えたくもないような状態です

そもそもですね これを違法にしたとしても個人が一台のパソコンで行えてしまいますからもうこれをすべて回収することは不可能でこのプログラムがばら撒かれた時点で今後このディープフェイク フェイクポルノの製造を完全に止めることはできない状態になっています

これに拍車をかけるように音声も今本人の声そのままにAIによって喋らすことが出来るようになってきてしまっていますから
合わせ技で虚偽の動画 なりすまし行為などが出来る状態です
そしてそれを行う前に止める法律がなく実害が出てからしか止めることが出来ません

今の状態に絵描き以外も参加して問題を把握してほしいと思っています

先に人権侵害について問題を出したのは私は今のイラストAIをなんとしてでも早く止めたいので より多くの人に関係のある深刻な問題として先に書いています
絵描き以外も無関係じゃないんだよ?今どんどん巻き込まれているんだよ?って事を自覚してほしいからですね

絵描きとして見たときの問題も触れていきます

集中学習によって絵師さんの絵柄 個性というものをトレースし
似たようなものを生成できるようになってしまっています
これにより本人が積み上げてきた技術にフリーライド ただ乗りをすることで高品質なイラストを生成することが出来てしまいます

今まではこの絵柄の絵を描いてほしいからこのイラストレーターさんに仕事を頼んでお金を払っていた というものに対し
集中学習したデータを用いて まがい物 海賊版のようなものを生成しそれで代用してしまったりするんですね
こちらも現状では許可を取る必要すらなく勝手に学習データを作られ なおかつ拡散されインターネット上にアップロードされてしまっていて
もはや本人が取り下げを要求しても回収しきる事は出来なくなってしまっています

何年 何十年と積み上げてきた技術を無許可でトレースされ なおかつそれを拡散
もし今後法規制が来たとしてもすでにばら撒かれた学習データは回収しきれません
裏で使われ続けるでしょう
悲しいですよね そしてこれを行う事を咎める法がありません

なので絵描きは一刻も早くこれを止めるための法規制を求めているわけです時間がかかればかかるほど被害は広がっていきます
日に日に被害にあってしまった方が増えている いや被害にあっていることに気づいた方が増えてきました

このままでは日本を支えてきた絵師さんたちの知的財産を吸い尽くされてしまうかもしれません
それによってできるものはまがい物ではありますが 大事に大事に作った作品がミキサーにかけられ無残な姿でイラストとして反映されるようなものです
この行為は大変腹立たしく イラストに真摯に向き合ってきた人には耐えられないほど屈辱的なことです 許されることではありません
この行為を容認してしまっている今の状態を早く何とかしたいと思っています


とりあえず問題だと思っている本題はこれぐらいと言ったところでしょうか
あまりにもこの生成AIというものは問題を抱えていましてすべて上げていくと本当にきりがなくてですね
とても読み切れる量ではなくなってしまうのでこれぐらいにしておきます

このページをここまで読まれた方 お疲れ様でした
最初の方に説明した生成AIがどのようにしてイラストを出力しているか
こちらにつきましては拡散モデルと調べることでもっと深く知る事は出来ますが何分非常に難しいのでこれを素人が完全に理解するのは難しいと思います 私もまだ完全には理解しきれておりません
興味があれば調べてみるのもいいと思います
一度にすべてを書いても理解しきれる内容ではなくなってしまうため大分端折った説明となってます
集中学習により特定個人のディープフェイクを作られてしまうと本文には書いてありますが
拡散モデルという物は低確率で学習素材そっくりの贋作 複製のようなものを出力することがあるため
個人を学習したものでなくとも偶然気づかぬうちにディープフェイクを作ってしまう可能性があります
イラストであれば著作権を明確に侵害していると言えてしまうような複製物が出力されるということになりますね

と言ったように問題が山ほどあるんです 本当に何故ここまで問題を抱えたものをオープンソースでばら撒いてしまったのか
正直正気を疑ってしまうような行為なんですが すでにばら撒かれてしまった後なので後手になってしまいますが対策を考えなくてはいけない段階に入っています
絵描きだけの問題ではなく全員が当事者であるという自覚をもって取り組んでもらいたいと思っています


ここから先は問題提起ではなく雑談に近いものなので問題を知りたくて読んでくださった方には関係ないものになるかと思います

今後どうなっていくのか自分が考えている事を少し書いておこうかなと思います

今本当に絵描きにとっては地獄のような状態ですよね
非常につらい状態です 自分も強がってはいますがメンタルはすでにぼろぼろで泣きたいぐらいです
出来ることなら何も言わずに引っ込んでいたいんですが
今が踏ん張りどころです やっと やっとなんですが世間の認識が一段階あがり声を出しやすい環境になってきました
今どれだけ声を上げられるかで今後の規制を絵描きにとって有利に持っていけるかが変わってくると考えています

ただぶっちゃけた話を少し書いてしまいますがどれだけ今声を上げても法規制を早めることは難しいとも考えています
すぐ効果が出ることではなく後々有利に働かせるために必要なことで今すぐ何かが変わる事を期待しすぎると手ごたえがなく絶望してしまいがちですが
決して無駄にはならないと思いますので頑張っていきましょう

まず法規制についてどう考えているのかと言うと

ほぼ確実に法規制は入るとは思っています

こちらにつきましては今年二月ぐらいから確信を持っています
ただ同時に時間もかかると考えています
これはまあ単純な話で日本がこのAIを推進したいと考えているため法規制を嫌がっているからです では何故法規制が確実に入ると考えているのかと言えば海外からの圧力が確実に入ると思っているからですね

上の方で一度説明しているのですがこの拡散モデルという物
低確率で学習素材そっくりの贋作 複製のようなものを出力することがある
と先ほど書きました
これもっと厳密に言えば低確率というのは大規模な学習モデルを使った場合の話であって
学習素材が少ない物 意図的に偏らせたり集中学習したものであればその確率は決して低確率とは言えないものになっていきます

そもそもな話で言えば複製に近い物と言うのは全体が完全に似ている物という話であってパーツという事ではないんですよ
実写モデルというものがありますがあれおそらくですが 顔 というパーツだけで見れば決して低くない確率でディ―プフェイクと言えるもの出力していると思いますよ

要するに何が言いたいんだって言うとこの技術をオプトアウトという無断学習を前提で推し進めていくことがそもそも不可能で
偶発的に人権を侵害してしまうツールなんですよ
laion-5bというデータセットがたびたび例に挙げられていますが入っていてはまずいデータが当然のように入っていますので
この問題を無視して隠し通すことは不可能だと考えています

以上の事から国際社会から見て海外の方から問題がどんどん大きくなっていき日本もそれに準拠した法規制を引かざる得ない状態になると考えます
日本のみが法規制をしない事で勝ち筋を考えている可能性が今の日本政府にはありますが それは無理だと思っていますね

自分が今現在考えている最終的な落としどころは個人のローカル上での画像生成AIの使用は禁止になり
企業サーバーを通したもののみが生き残り 結果としてオプトイン以外の生成AIが使えなくなると予想しています
保証は出来ませんけどね ただオプトアウトでこのまま進めて行くことは現実的ではないと思っています問題を抱えすぎていますから

何もこのまま起きなければこの予想のようになだらかに時間をかけつつ事態は沈静化していくと思っていますが
この予想から大きく外れる可能性はありまして
例えばDeepfloyd IFという画像生成AIが出てきています
こちらまだデモ版となっており営利目的での使用が出来ませんが
オープンソースとして今後リリース予定となっております

Twitter上で一部話題になりましたが他の生成AIと違い出力された画像が
もはや文字すらくっきりと読め
プロンプトで正確に呼び出せば
学習に使われた画像そのままの複製といえるものを出力してしまう事があります
これでは人であれば非実在性という事は言えないでしょうし
イラストであれば著作権侵害になってしまいますよね

では出力された画像をネット上に公開しなければ問題ないのか?と考えた時それでも問題が起きますよね
例えばなんですが学習データを作る際 漫画を学習させるとしましょう
〇ne Piece p1と入力 p2 p3とページ名をタグ付けして出力させてしまえば
研究用と称して漫画を学習データとして保管 出力することで違法にならずに漫画を学習データ内に保管できてしまいますね?
それ以外にも児童ポルノなど単独所持が禁止されている明確な違法なものでも学習データとして 呼び出すための隠されたタグを入力することで作った人にしかわからないように隠して所持することも出来てしまいますし
隠して配布することも出来てしまいますね

これはまずいですよね このDeepfloyd IFというものStable Diffusionと原理上はほぼ同じものです 一部異なりますがどちらも拡散モデルですね
これの登場によりStable Diffusionが許されていたのは復元精度が低かったからでは?と言われたりしています
じゃあDeepfloyd IFを使う事は禁止してStable Diffusionを使えばいいんだ!とはさすがにできないんですよ原理上はほぼ同じものですので
内部で行っていることはほぼ同じですから構造上にそもそも問題があるんじゃないんですか?と突っ込まれますよね
こちらの問題が大きくなっていった時画像生成AIという物が時間をかけてのちのち完全な禁止まで行くかもしれないなと考えています
構造に欠陥があると認められた場合そもそも使えませんからね
こちらに関しては私はプログラマーではないためそこまでの予想は出来ません どう判断されていくかは今後次第と言った感じですね


もう一つの懸念事項は何分AIの進歩というか新技術が出てくるスピードが速いので
今のように大規模な学習データを使うことなく 高品質なイラストが生成できるとか 何か画期的なシステムが出来てしまうとまずいですよね
現実的に可能だとは思っていませんが今のスピードを鑑みるに絶対にないとは言えないのでこちらもまだ何とも言えない感じではあります
これを実現されてしまうと絵描きは結構本当にどうすることも出来なくなるかなと

これについて少しだけ説明したのは私は法規制が入る事で徐々にではあるが前の環境を取り戻せるとは思っていますし
今の環境に絶望しないでほしいので大丈夫だよ!って言いたいとこではあるんですが 保証は出来かねますという事ですね
ローカルにばら撒かれている以上規制が入ろうが手描きだと偽装する人
AIイラストをトレスしてアイデアのただ乗りをする人
こちらも問題としては排除できません

完全に前と同じ環境を取り戻すことはできないのである程度覚悟する必要はあるのかなと
自分は漫画を描く練習をしておこうかなとか 自分の絵柄を一つではなく複数用意して使い分けできるようにしようかなとか
絵描きとして今後生き残るために出来ることはしておこうかなと思っています
今声を上げることは重要でなるべくいいほうに向かうように精いっぱい頑張っていきましょう
それと同時に今後生き残っていくために色々考えておく必要もあると思いますので絵の方は絵の方で頑張りましょう

がんばるぞー!!

追記(5月12日)

AI生成作品の一時禁止の告知がFANBOX FANTIAから告知され
ci-enも後を追う形で一時停止となりました

事態は大きく動きつつありますがまだまだ問題は抱えており
まだ無断学習そのものは放置されています

原理として難しすぎるため詳しい説明を避けていたのですが

ここで拡散モデルというものに追加で説明をしておきたいと思います

まず私は上記文章にて 模倣による合成
AIによる新しい新手法のコラージュ トレースです
と比喩表現をしています

ただですねTwitter上でこの模倣という表現が正しくないと指摘する人を多くみられますので(私に対して言っているわけではない)
何故自分が模倣と比喩しているのか 拡散モデルの仕組みについて追加説明をしないとその理由が説明できないんですよ

なので追加の説明をしたいと思います
私はプログラマーではないため完全な理解は出来ておらず間違った解釈が一部含まれているかもしれません そこはご了承ください

まず拡散モデルとはディープラーニングによって画像を 学習 します
この学習という物は絵を描く技術を学習しているわけでも物質の構造を理解しているわけでもないです これは上で説明していることと同じです
完全な説明をすると長くなりすぎるので簡略化しますが
学習させる画像に対し時間経過ごとにノイズを増やしていき 最終的にそのデータから画像を分解 別のデータに変換するんです
この際タグ付けによりパーツとしてもばらばらのデータとして 学習 するんですね

非常に難しい話なんですが学習というのは画像をタグ付けされた言葉によってばらばらの構成物として 変換されたデータに置き換える という作業を指しています 傾向 特徴量と言ったものに
もちろんこの学習の際画像全体を指示するようなタグで学習させた場合ばらばらの構成物ではなく 全体を含む変換データとして呼び出せるようになりますね

もう頭が痛くなって来たんじゃないんでしょうか?頑張ってついてきてくださいね

この変換されたデータを呼び出す行為が プロンプトの入力です
タグ付けされた単語をプロンプトによって呼び出し
変換されたデータから元画像を復元しようとする事で画像を出力しています
この復元を行う際 元データそのものではなく変換されたもの 一つではなく複数の物を呼び出し合成することで復元を行うので
結果としてオリジナルに近い要素は残しつつ しかし違うものが復元されるわけですね(複数が混ざるので)

ここをもっと詳しく言えば存在しないノイズから画像を復元することで存在しない画像を復元生成することが出来るという説明になったりするんですが
これを説明してもあまり意味がないので気にしなくていいです

この説明を聞いた方は絵描きであればコラージュじゃん!!って思われると思います
はい 私はこれは原理的には限りなくコラージュに近いと思っています

ただ学習データはイラストそのもののデータを含んでいるわけではなく
傾向 特徴量 というイラストではない別の変換データにいうなれば圧縮されていまして 
そこから復元という工程を経た時オリジナルデータではない何かに復元されるため直接的にコラージュだ!!というのは難しいんですよ

弁護士の方たちで意見が変わってしまったりするのはこの性質が問題でオリジナルデータの切り貼りで生成されているのであればこの問題はこんなに複雑にはならなかったと思います

著作権のロンダリングとこの生成AIは揶揄されることがあります 自分もしますが
この性質のせいで問題が数段階ややこしくなっているんですよ

私が 複製(コピー) ではなく 模倣 と表現せざる得ないのは学習データが単一画像であれば 複製 ともしかしたら呼べるかもしれないが
複数が混ざった時点で 傾向 を元に作られた 模倣 と表現するのが一番ふさわしいと考えているからですね

ええ大変不服なんですが 複製とは少々異なりコピー機と揶揄するにはさすがに条件不足でして しぶしぶ模倣と表現しています

今文章を書いていてもっとふさわしい単語が浮かびました
キメラトレスと表現するのがもっとも正しいかもしれませんね
複数の画像から傾向を元に線を(色も)抽出して復元していくことで一枚の画像を生成していますので キメラ(複数画像)トレスですね
絵描きに伝わりやすい表現としてはここに落ち着くかと

何故模倣と表現していたかはこれで説明できましたが
まあついでなのでもう少し追加で拡散モデルの問題について

まずこの生成AIというもの30条の4であったりフェアユースによって著作物の権利を例外として処理し研究される事で表に出てきました
これが表向きとして運用出来ているのは 学習データという物が傾向や特徴量を学習することで結果 新しいもの を作っている存在しない画像を生成しているという主張から成り立っているものだと思います

もう少し補足するなら学習データにはオリジナルデータ画像が含まれていない 学習データ内にあるのは傾向や特徴量と言ったAIが学習したデータから生成されているのだから権利的にも問題がない という感じでしょうか


ここまで説明した上でもう一度問題を提起します
拡散モデルという物は低確率で学習素材そっくりの贋作 複製のようなものを出力することがある
と上に書いてあります
Deepfloyd IFは復元精度が高くこの問題がより起こりやすくなっています
この問題がある限りこの主張は難しくなると考えています
複製(コピー)というものが吐き出される以上 これは30条の4であったりフェアユースに違反していると私は考えています

前提として学習データ内にあるのは傾向や特徴量と言ったAIが学習したデータから生成されているのだから権利的にも問題がない
という主張は学習データだから問題ないのであって オリジナルデータを超圧縮したデータであってはいけないという事です
結果複製が作れてしまう以上 これはデータを学習しているだけであってオリジナルデータを使用していないとは言えなくなってしまいますよね?
ここがおそらく今後法規制を考える際問題になってくる点の一つだと考えています

AIを推進したい企業などはこのことをひた隠しにし続けるでしょうが到底隠せる問題ではないため今後大きな問題になると思っています

その他生成AIの問題点としてよく上げられるものとしては
i2i(img2img)画像+プロンプトから画像を出力
集中学習したモデル
ディープフェイク

などが上げられますが こちらは
img2imgは明確に依拠した画像があり 改変を行い生成するため現行法でも問題がある事

集中学習したモデルは 倫理やモラルとして問題点が上げられています その他 フリーライドの観点 個人の利益を害している
30条の4にそもそも違反しているのではないか?などが挙げられています

ディープフェイクについては人権侵害 個人を簡単に貶めてしまえること
犯罪の証拠など画像媒体が機能しなくなってしまう事など
情報社会の機能が麻痺してしまうことなどが懸念されています

話が少々逸れてしまいましたが拡散モデルが抱えている問題はあまりに多くこのまま法規制なしで進めることは不可能で

今これに気軽に触る事の危険性を理解していただきたいです

活用法を考えるだとか 適切な使用をするという事は現状できません
原理を正しく理解し問題点を把握していればこの技術をこの問題を抱えたまま進めることが出来ない事は明確で

今後おそらくかなり厳しい法規制が入ると予想しています

最初からある程度機能制限があり学習モデルがクリーンなものであればそこまで法規制は必要なかったと思われますが
現状機能制限がまったく施されてないものがローカルにばら撒かれ
すでに学習モデルも個人が出自の怪しい何を学習させたものなのかがわからないものが出回りすぎてしまったため
これを抑えるためには相当厳しい法規制を引かざる得ないでしょう

技術として期待していた人 最初の触れ込みでそれを信じてしまった人たちがこの問題を理解せず または理解していても耳を塞ぐことで推進しようとしています
後には引けない!という心理なんだとは思いますが
間違いを認め立ち止まること 意見を変えることは決して恥ずかしい事ではないと思います
これから生成AIについて意見する際 または見かけた時 このような問題を抱えている技術だという事をよく覚えておいてください

生成AIが抱えている問題点はこれだけ書いても全部ではありません
悪用される恐れがある行為を書くことは利用法を教えることにもつながってしまうため全てを書くことが出来ないんです ご了承ください