猫へ送る。AI画像生成の著作権とライセンスのキホン 【最近の騒動理解に向けて】
はじめに&注意点
猫に向けて書きます。あくまでも私の理解を、なるべくなるべく平易に。
(4/24公開時)
確定事項と推測はなるべく分けてわかる表現を心がけますが、誤った事実を含む可能性や将来的な考え方の変化によって推測をまちがえる可能性もたくさんあるので、そのあたりはもちろん自己責任でお願いします。(4/26追記)私は法律やライセンスの専門家ではまっったくございません。今回の騒動をきっかけに、素人が素人なりの情報収集力で、AI画像生成の活動を行う上で、最低限必要な情報と学習のスタートラインとなりそうな知識を集めて私なりに整理してみたらこんな感じだと思うというのを紹介させてもらっているに過ぎません。これをきっかけに皆様は皆様で必要に応じて調べたり学んで頂くようお願いいたします。
また、私は特定のライセンスを否定する意図はありません。この騒動ののち私も考えたのですが、ある時点でライセンスを規定した、もしくは変更したのには、未来のリスクなどを考慮した作者の気持ちの反映だと思います。それを未来の時点から、利用する側である、周囲の利害によって殊更に悪として取り扱うことは違うな、となりました。作者に感謝と敬意を。過去の先人の選択に思いやりを。(例えば、無事故・無病気で過ごせたからって「保険は入ってるんじゃなかった。金の無駄だった。」とか責め立てられたらいやでしょ?私は嫌。なんてこととかを考えました。)
商用利用と著作権
〈以下、4/26追記〉
あなたが「AIで生成された画像を販売する」には、まずは、生成に使ったソフトウェアの利用規約(ライセンス)を満たしていることが必要です。生成に使ったソフトや学習モデルの利用規約(ライセンス)において、生成画像の権利についてライセンスが関知しない、もしくは明確に商用利用がOK、と書いてあることが必要となります。
そこからさらに、あなたが作成した画像を「独占的に販売したい」、つまり「他人が無断で無制限に利用できないようにしたい」場合に必要となるのが著作権です。
ではその著作権を有するためには画像生成時に「創作的寄与」があることが必要となります。議論はありますが、プロンプトの工夫や修正や、画像の選定や編集など、やっていればまあこちらは満たされるという考え方はあります。ので基本的には著作権は付与されていると考えてOKだと思われます(まだここも議論ありますが)。
というわけで、もし仮に本当に「創作的寄与」ゼロでぼーっとGenerate押すだけの作品で、著作権の発生がなくても、実は、ライセンスの規定を満たしているならば、販売をすること自体は自由なのです。
ですが、著作権が発生していないなら、同じ画像を他の方に利用されたとしても文句は言えない、ということになります。
私も修正前の文章でまさに間違った解釈をしていたんですが、「著作権」という名前だけは有名な、でも実はよくその中身を知らない言葉が先行してしまい、ライセンスと著作権をごっちゃにしていたわけです。
〈2/24公開時版〉あなたが「AIで生成された画像」を売る(かつパクられた場合に文句を言えるためには)には「著作権」を自分が所有している必要があります。著作権が付与されるためには以下の二つの両方を満たしていればよいようです。
画像生成時に「創作的寄与」があること:議論はありますが、プロンプトの工夫や修正や、画像の選定や編集など、やっていればまあこちらは満たされる。議論はありますからね。生成に使ったソフトウェアの利用規約を満たしていること:生成に使ったソフトや学習モデルの利用規約(ライセンス)において、生成画像の商用利用がOKとか、著作権所有権を画像の生成者に与えソフトウェアやモデルの提供者はそれを放棄します、と書いてあることが必要。そもそもそれがないなら、いくら「創作的寄与してますからぁ!」とか言っても権利はない。こっちが最近モメてるところ。
生成画像の商用利用可否をライセンスで確認
ライセンスの実情についてライセンスやモデルの例を用いて喋ります。
商用利用OK: StableDiffusion
そもそもの本家本元のStableDiffusionから。CreativeML Open RAIL-M ライセンスというライセンスになっている。
こちらは、ライセンスを見に行くと結構大変なんだけど、ゆえにはせさんがめちゃくちゃわかりやすくまとめて頂いてくれているわけです。
ライセンス自体の説明はすんごく色々書いてあるんですが、でも多くの人は、原文を読まれても、「え?生成画像の商用利用って結局OKなの?」ってわからないんじゃないかと思う。私も最近まで一切読めなかった。
実は、生成画像を何かしらに利用するにあたっては、以下の部分が大事。まず「アウトプット」の定義、これが生成画像に該当する。
その上で、以下。
「商用利用してOK」なんてふうには書かない。え?ライセンス文読んでもどこにも書いてないじゃないですかぁ大丈夫なんですかぁ?って私も数週間前に思っていた。権利を主張しない(関知しない)っていうことが大事。
商用利用非推奨:CC0-1.0
<4/24公開時>クリエイティブコモンズなんとかってやつです。私が好きなモデルがこれでうーんとなりました。著作権を放棄してパブリックドメインとかいうところへ渡しちゃうということらしい。売ってもいいんだけど、自分のものではないものなので、パクられたりしても止める権利がないという状態になってしまうみたいです。<4/26追記>こちらに関してはそもそものライセンス、そんなもの存在すること自体がおかしいのでは?というのが現在の私の理解です。詳しくはこちらのはせさんの記事をご参照ください。
商用利用NG:ChilloutMix
アジア系実写系が爆発的に伸びる全ての始まりとなった神モデル。「残念ながら商用利用ダメぽ」ってやってる人は3日で知っている。それは「ライセンス」がだめだから。確認してみよう。Civitaiのページに行ってみる。
ライセンス種:CreativeML-openrail-m dreamlikeとなっている。CreativeML-openrail-mとは違うライセンスである。
ペンのマークを押すと「Shell images they generate」はダメってわかる。
さらにこんな注意書きも書いてある。
多分以下はDreamlikeとかよりもずっとずっときつい使用ルール(BRAのところで触れますがDreamlikeは商用利用を一切認めていないということはない)。
ちなみに、「当モデルを使用したことを明記せずに生成された画像を公開することは禁止です。」これ、Oh, Really?? よろしくお願いします。
商用利用NG:BasilMix
次これ。先週の騒動。こんどはHuggingfaceのページを見に行ってみます。
でちゃんとLicense.mdを開くと「modified」Creative Open RAIL-Mって書いてあります。このmodifiedってのが大切。もととは違ってるってこと。
で、ここで、つまづく。丁寧に書いてくださっている。
はせいぶつ・・???なにそれ?
はい、次はそちらです。
派生物とライセンスの継承
多くのモデルのベースのライセンスとなるCreativeML OpenRAIL-Mライセンスにおける「派生物」の定義と、ライセンス継承のルールについて見ていきます。
モデルの派生物
モデルの派生物の定義は具体例が不足していたり原文だと解釈が分かれそうなところがあるんですが、以下などはモデルの派生物となるのではないかと考えられます。
モデルAをモデルBとマージして生まれたモデルCはAの派生物。
モデルAに追加の学習データを与えることでトレーニングしたモデルA'はモデルAの派生物。
ある特定のモデルAの出力をつかって他のモデルBの挙動をAに近づけるためにBを学習させた場合、モデルBはモデルAの派生物。
ライセンスの継承 → (4/26追記) CreativeML OpenRAIL-Mにはそんなのない
〈修正前〉派生物の配布時には派生する前のオリジナルのラインセンス文書を配布する派生物に含める、という文言があり、結果、派生物はオリジナルの
※「ようです」というのはちょっと私が確たる論拠が掴みきれていない部分があるからです。例えば、配布してなくて手元でのマージとかならライセンス継承もないということがあり得るのか?とか気になるのです。すみません、わからないですが、多分常識の範囲では多分継承するんだろうと思います。
〈修正後〉
修正前の上記はめちゃくちゃ間違っています!!ライセンス中に記載されている内容では、「派生物にもライセンスの内容の全てを引き継がなければならない」なんてことは書いておりません!
CreativeML Open RAIL-Mが派生物に対して求めているのは、主に下記の2点です。他はそれほど重要ではありません。
1. 元のライセンスのコピーを提供すること(ファイルを配置するのみで、同一のライセンスであるというルールを課すものではない)
2. 利用者に「制限事項」(生成物の悪用などに関する内容)を守らせること
BasilMixとDreamlikeが持つ問題点を見る
<4/26追記部分>
BasilMixや、BRAに関連したDreamlikeの話は、私の当記事公開以降充実した、はせさんの記事や鎖城さんの記事をご覧になっていただくのが良いと思います。以下には私の理解の範囲での問題点を平易に書いてみています。
BasilMixやDreamLikeは何が「違う」か
改めて整理してみます。全ての先祖となるStableDiffusionのモデルとそれが持つCreativeML OpenRAIL-Mのライセンスはこう。
生成物の商用利用OK
派生物への制限はすごく限定的(ライセンスファイルの配置と「制限事項」のみ)
んじゃ、ChilloutMixが持つDreamlikeライセンスとBasilのライセンスはOpenRAIL-Mと何が違うのか。
BasilMixの例:
生成物の商用利用OK → 生成物の商用利用NG
派生物への制限はすごく限定的 → 派生物も、生成物による商用利用NG
にした。2個目は、手元でマージした派生物なら商用利用OKとかにされてはならないから追加されて当然ちゃ当然。
Dreamlikeの場合(ChilloutMixも含む):
生成物の商用利用OK → 商用利用は限定付きだけどOK
派生物への制限はすごく限定的 → 派生物とその利用者は未来永劫、全部元のモデル製作者の言うこと即座に聞けな(意訳)
ライセンスの文章を見ると、商用利用それ単体がOKかNGかってことに意識が行きがち、もちろん画像生成をする人はまずはそこが重要、だけど、もっと危険なことは実は二つ目。この派生モデルへの強い制限。モデルを手元でマージして作ったり、ちょっとマイナーなモデルを拾ってきて使う際には全員関係のある話。
派生物への強い制限の何が「問題」か
派生物はその定義から、派生物の派生物は派生物、となる。子孫の子孫も子孫。それに対して、例えば、dreamlikeライセンスの「派生物に言及した」部分は、簡単に言うと「今からオレの子孫代々に告ぐ。オレの命令は絶対な?」っていう意味。派生モデルは生まれた瞬間から始祖による爆破装置を遺伝子に埋め込まれて生まれてくるようなもん。こわい。Basilの例だと、「オレの子孫代々みんな商用利用ダメな?」って言ってる。
本来的には、dreamlikeやBasilMixにはそんな事情があるんだから、それらのモデルの子孫は「私ゃdreamlikeの子孫やねん」とかってみんながわかるように書かなきゃいけない。それは実用的なルールになるべき。
でもそれは必ずしも実施されない。世の中のモデル生成者は必ずしもライセンスについての理解が深いわけじゃない。仕方ない、ライセンスの理解の大変さに対して、モデルマージとかはすごく簡単に出来てすごく楽しい。どんどんやられるしどんどん出回る。それがすごく危ない。
結果、最悪にしてごく自然に発生する事態は、知らんうちにdreamlikeライセンスのモデルやBasilMixの派生物が出回ってしまって、しかもそれが魅力的で、みんなが使う有名モデルになった後にそこにdreamlike の血が流れていることが分かること。
そこの段になって、dreamlikeの始祖が、「オレの遺伝子はオレ一人でいいワ。子孫ら全員○ね〜!」とか言いだしたりしたらもうアカン。BasilMixの派生物だったので今から商用利用停止してください、という事態になり得る、という話。
ここまで聞くと、モデルを手元でマージして作ったり、ちょっとマイナーなモデルを拾ってきて使う、、なんてことが怖くて出来なくなる。少なくともライセンス表記がないモデルなんてのは論外だって気づくことができる。
〈4/24公開時 変更前〉
BasilMixによるChilled_re_genericの停止
この問題は、Basilが出力の商用利用停止したから派生物の出力画像も商用利用ダメ、になったよって話、と要約できそうです。
派生物の理解がここまできたら、Basilの作者の「Chilled-re-〜」もダメよ、っておっしゃっていたことがわかったでしょう。Basilをマージに含めている派生物なので、更新された時点以降のBasilMixをマージしてできたChilled-re-genericにはBasilMixのライセンス継承が発生するからね?っていうことです。
BRA(Beautiful Realistic Asians)とDreamLike Lisenceについて
ではもう一つ最近盛り上がったBRAの話。こちらの問題はちょっとややこしい。
要約すると、すごいBRAという次世代のAsia系の中心・デファクトになりうるモデルが出てきたんだが、ライセンスが追加適用されるリスクがあって、その場合でも、10人以下の商用利用はOKなんだけど、最悪オリジナルの作者の一声でBRAの利用が全世界で停止可能になりうるリスクがあったので、修正するように鎖城さんが動いてくれた、、、という感じでしょうか。はい、要約にしては長すぎますね。だって難しいんですもの。
とりあえず、ここまで追えてれば、鎖城さんの記事も途中で詰まらずに読めるはず。読んで欲しいです。普通にドラマです。
私の理解は以下です:
ChilloutMixに追加付与されているDreamLike Lisenceは少人数なら商用利用OK、だが、派生物の全てに対してまで強力な権限を持っていること。今から全部使用禁止な!と言ってその効力を発動できるということ。BRAは新規学習をした超新星のモデルだったが学習にChilloutを利用していてChilloutの派生物になっていた。BRAがそのように「派生した」タイミングでのChilloutは商用利用可能だった。しかしながら当時はそれ以外はライセンス表記が十分にされていなかったライセンスの遡及適用(過去のものまで遡って適用されること)はない「CreativeML Open RAIL-MとDreamlike Licenseは、適切なライセンス表記をしていない場合は、自動的に本来あるべきライセンスと同一と考えるという解釈になる表記があり」当時のChilloutMixとそれの派生モデルであるBRAは「Dreamlike License1.0の影響下に置かれる可能性が非常に高い」
ただのコメント
内容は以上になります。
急にコメント挟みますが、ライセンス整理はずっとはせさんのターン。モデル生成はずっと鎖城さんのターン。調べるとこの二人にしかまず当たらない。
このお二人、すごすぎます。そして、本当に未来のことを考えて動いてくださっていて、頭があがらない。
私たちにできること
やっておくのが推奨される行動例を書いておきます。
伝え合うこと<4/26追記>
まずはこうやってみんなで理解を高め、相互に教え合うことなのかもしれないです。
変なモデルに手を出さないこと<4/26追記>
ライセンス表記がないとか怪しいとかそういうものには近寄らないようにしましょう。周りの人に聞きましょう。
記録しておくこと
モデルもLoRAも、TIも、各画像や手元で作ったモデルやLoRAがが何を使って生成したものかは記録しておきましょう。特にバージョンやDL時の日付やWebサイトのスクショまであるとぬかりないです。
理解を深めておく
著作権やライセンスに関する知識と自分の状況についての理解を深めておきましょう。知識については最後にリンク集を置いているのでみていただくといいかもしれません。自分の生成画像などが著作権的にどれほどセーフなのか、使っているモデルについては最低限調べましょう。世の中で決めっていることまだ、決まってないこと、をしっかりと理解することで、不要に怯えることは避けられます。堂々とやりましょう。
次に読むべきもの
私が書いた内容は以下の内容をまとめているだけです。おすすめの読む順が以下です。特にライセンスの記載は、時間が許されるなら一度は原文にあたりましょう。
おわりに
週刊MiSiMOに書こうと思ったけど、どう平易に書こうと思っても、これは無理だなと思ったんで、一本記事にしました。
読んでくださった方ありがとうございます。間違いのご指摘&ブラッシュアップ、皆様と一緒にしていければと思います。
〈ここから記事最後まで、4/26 追記〉
4/24 AM1:00頃、公開後、はせさんから多大なフィードバックを頂きました。
私の理解がこんがらがって間違えまくっていたところを一つ一つ丁寧に紐解いていって下さいました。本当にありがとうございました。改めて感謝申し上げます。
私自身も最初の状態からここまでの理解に至るだけでも非常に苦労を要しました。が、最終的には、ライセンスの仕組みと内容から読み取れる、StableDiffusion開発者の方々の思いを僅かながらではありますが理解できるようになりました。そこに共感するとともに、彼らのAI技術に対しての理念と信念の美しさが知れたことが個人的には一番の喜びでした。
とはいえね、、、やっぱり難しいいんYOO!!。結局8000字でしょ?これ。
本当、なんなんだろうな、図とかで書いたほうがいいのかな。検討します笑。
まぁとにかく難しいので、皆様ももし分からないことあったら気楽に聞いて下さい。きっと私も分かんないですが笑、一人で不安でいるより良いですし、一緒に勉強しましょう!
では、、また!
この記事が気に入ったらサポートをしてみませんか?