だから生成AIはパクリだと言われてしまうのさ
3月辺りからXが妙におかしくなり、気を揉んでいる木村です。
そんな先月のとある日、東京AI祭に行けなくて悲しいなぁ…なんて思っていたとき、このようなポストが目に入ってきました。
どうやら東京AI祭で展示されているAI作品の中に、Jizellさん(以降Jizell氏)という方の絵のLoraがある
ということらしいのですが、ハッキリ言って悪意ある盗用・盗作であれば言語道断、ダメなことです。
Lora(Low-Rank-Adaptation)とは、画像生成AIモデルの一つで、生成したい画像の特徴をベクトルとして表現します。
このベクトルは、潜在空間と呼ばれる多次元の空間に配置され、Loraは、この潜在空間を低次元空間に射影することで、少ない計算量で画像生成を実現します。
簡潔にいうと、Loraを使えば、ある程度真似することは可能ということです。(基本的には、完璧な真似はできない)
三か月前に、以下記事を書きましたが、正直この手の盗作・盗用問題は、AI推進派・規制派という構図を以前より対立構図にしてしまう事項です。
今件に関しては、いわゆるAI規制派の方々に分があります。
分があるどころではなく、件のLoraは悪質であり、ダメなことです。
今件のJizell氏は、以前、"絵師の裏方氏に成りすましつつ、漫画家の樋口氏のLoRAを作ったのと同一人物"に、LoRAを作成される被害を受けているとのこと。
他にも同様のケースが散見されますが、一応のAI情報・生成AIに関する内容を発信している身として、大変残念に感じています。
残念に感じますし、率直な思いとして言葉は悪いですが
「何をしとんねん大馬鹿野郎!」
と。
「もっと規制・ルールが厳しくなればいい」
と思っています。
今件に関して、
このような声が上がっていますが、まさしく反論にはならないでしょうし、生成AI側の学習データに問題あり、というのは普通に頷けてしまいます。
例えば私が、↑のポストを引用して、「その通りだと思います。許されないことです」と、率直な思いを吐露したところで、"あら、生成AI推進派が何か言ってる"と、何の介入の余地も意味もないでしょう。
尤も、画像生成AIで知名度のあるStable DiffusionやMidjourneyの学習データは、Danbooru等のサイトから学習していると言われています。
Danbooruとは、イラストをアップロード・閲覧等可能なサイトです。
アップロードされたイラストには、『ダンボールタグ』と呼ばれるタグ付けがされており、そういったタグはStable Diffusionなどの生成AIの学習データとして用いられているとされています。
また、MidjourneyにおいてはStable Diffusionよりも更に複数のサイト等から、学習データを得ていると言われています。
そのため、"そもそも論"ではあるため、ここから以下、そのテイでお読み頂ければと思います。
「画像生成AI自体が〇〇のパクリだ」と言われてしまうと、その通りだとしか言いようがないかと思います。
そういった中で、↑のような件があると、いわゆるAI推進派よりも、AI規制派の方達に確かに分があるのです。
個人的には、法的な観点やルール決めは、もっと厳しくなってほしいと思っています。
そのほうが、盗用・盗作の防止、抑止につながると思うからです。
ただ、ここが難しいところでもあるかなと思います。
例えば、学習データ対象のサイトにしても
「はい、じゃあ生成AIさんは、ウチのココからココまで、学習データとして反映OKですよ」
といったような明確な線引きがないと、そもそもな話でしょうから。
生成AIサービス・ツールにおいて、音楽生成AIがあまり世に出ていない(それなりの数はありますが)大きな理由として、楽曲における著作権がしっかりしているからだと言えます。
この辺は画像生成AIと比較しても、例えば音楽生成AIである曲を作りました、と。
それでその生成された曲のコード進行が(丸々でも一部でも)誰もが知るような著名な曲と同じだった場合、その指摘が入れば、現状の法的観点では争って負けてしまうのは音楽生成AIで生成した曲側でしょう。
先にリリースされている、その先にリリースされた楽曲は、多くの人に認知されている
という観点だけで考えても、音楽生成AIはシビアだと思っています。
画像生成AIにおいても、何かしらルールの制定がしっかり敷かれることを望みます。
いわゆるグレーゾーンではなく、明確に「これはダメ」という法的な縛り・ルールがあれば、生成AI推進派、ひいては生成AI利用ユーザーも当該サービスをクリーンに利用できることにつながるかと思いますし。
「ん?生成AI?パクリなんだから新しい技術も何もないでしょ」
と、後ろ指をさされることもなくなるでしょうし。
明確なルールが制定されれば、の話ではありますが。
個人的にですが、しっかりルールが制定されたとして、そのルールを破れば、その生成AIサービスを金輪際二度と利用できない(個体認識等で)、くらいの措置をとっても良いと考えています。
総じて、そもそも生成AI自体がその学習データを盗用してしまっている観点がある以上、後ろ指や非建設的に捉えられてしまうのが現実です。
何がクリエイティブか、何が素晴らしいか、何が評価されるに値するかは、それぞれ創作側ではなく、観る側の人たちの意見に委ねらるものだと思いますし、だからこそ私もAI・生成AIに関する情報を発信の際は、必要以上の持ち上げは絶対にしないように気を付けています。
生成AI推進派と言われればそうかもしれませんし、規制派でもありません。
ただ、面白いものと感じたAIについて発信しています。
ですが、おそらく『お笑い』のカテゴリーに対する世間の声と同じようなもので、「面白ければ何でもアリってことではない」という論争は起きるのかなと。
それが、画像生成AIにしても「パクリ・盗用・盗作」なのだろうと思います。
こと画像生成AIにおいて、「この生成AIの絵は○○さんの絵のパクリだ」といったことが今後も続いて、明確なルールも制定されず曖昧で、なあなあで過ぎてしまうと、日本において画像生成AIサービスの類は、やがて姿を消してしまうことになるかも知れません。
可能性は無きにしも非ずです。
ただ、そうなってしまったら、なってしまったで、画像生成AIというポジションがそれだけの、それまでのものだったという事なのでしょう。
AIに関する情報を発信しておきながら言うのもおかしなことかもしれませんが、個人的に画像生成AIに関しては「いやあ、面白い。すごい。」とは思っています。
ただ、「こんな面白いもの、奪おうとするな」とは思いませんし、明確なルール化は是非、制定されてほしいところなのです。
生成AIの学習データ習得方法がそもそもな点は排除できませんが、明確なルールが何もないからこそ、画像生成AI/生成AIはパクリだと言われてしまうのが現実です。
生成AI黎明期~生成期といった現状ですが、仮想通貨の出始めの頃を若干似たところはあるようにも感じています。(仮想通貨も最初はルール的なところが曖昧で法整備が敷かれていなかった点が似ているでしょうか)
問題点:AIモデルがクリエイターの著作権を侵害する可能性
1. 不適切な学習データの使用
AIモデルは、学習データから知識や表現方法を学びます。
学習データに、クリエイターの許可なく収集された著作物が含まれている可能性があります。
2. 作風の模倣
AIモデルは、学習した作風に似せた作品を生成することができます。
悪意のある開発者は、意図的に特定のクリエイターの作風を模倣し、作品を生成する可能性があります。
3. 報酬の喪失
模倣された作品が広く利用されると、本来クリエイターが得られるはずだった報酬が失われる可能性があります。
例:音楽AIが、特定のアーティストの作風に似せた楽曲を生成し、その楽曲がヒットした場合、本来そのアーティストが得られるはずだった収益が失われる可能性がある
現状、AI作品における盗用・盗作に関する法律は整備されていません。
私自身、法の専門家ではないので深く言及できませんが、著作権法が、AI作品のような新しい形態の作品には適用しづらい面があるようです。
AI技術の発展に伴い、AI作品における盗用・盗作問題はますます深刻化していくことが予想されます。そのため、法的な観点やルール作りを早急に検討していく必要があるでしょう。
▼ルール制定における課題
ルールを作るにあたっての課題は以下。
AI作品の定義
盗用・盗作の判断基準
著作権侵害に対する責任の所在
技術的な対策
▼解決策
学習データの著作権管理の徹底
AIモデルの開発における倫理ガイドラインの策定
著作権侵害作品の検出・削除体制の強化
~私見~
法的な観点やルール作りは、簡単には解決できない問題です。しかし、各生成AIサービスを日ごろ利用している身としては、無視できない問題だとも。関係者間で議論を深め、解決に向けて取り組んでいく、といった、精神論的なものではなく、何らか明確なルール制定の必要があると思います。