【画像生成AI】Stable Diffusion派生モデルを利用・公開するときはライセンスに注意しましょう

※2023/4/24 に、Stable Diffusion の派生モデルのライセンス問題について記事を書きました。その記事が長くなりすぎたので、一般的な注意事項をこちらの記事に分けました。

Stable Diffusion には多数の派生モデルが公開されていますが、上記のようにライセンスに問題があるモデルもあります。この記事では、上記をふまえて、一般的な注意事項を書きます。
※注: 筆者は法律に関する資格を持ちません。この記事の見解が正しいとは限らないので、法的な問題については必ず専門家の意見を聞いてください。

1. そもそもライセンスって何?

ソフトなどを公開している人と、それを利用する人との約束のことです。
無料で公開されているものでも、無条件で使っていいわけではありません。その条件を定めたものです。難しいことは置いておいて、とりあえずそう理解しておけば間違いではないです。

2. どれを使えばいいの?

A. 基本

ライセンスに、「CreativeML Open RAIL-M」と表示されているものを使えば、だいたい心配ありません。Stable Diffusionと同じように自由に使えます。商用利用も可能です(と派生モデルの作者が言っています)。
SD2.0, 2.1は「CreativeML Open RAIL++-M」というライセンスですが、これも大丈夫です。違いは、ライセンサーが個人名でなくStability AIになったのと、アップデートの努力義務が削除されているだけです。

B. リアル系で、今のところ大丈夫そうなやつ(2023/4/24時点)

※ここをメンテしていく予定はないのでご注意ください。DL時点のライセンスを確認ください。

C. ライセンスの見方(Hugging Faceの場合)

まず、ライセンスタグ(下記)を見ましょう。ここが "creativeml-openrail-m" となっていれば大丈夫です(鎖城さん引用させていただきます)。

Licenseタグ

さらに、「Files」タブに、"LICENSE.md" や、 "LICENSE.txt" などのファイルがあるかどうかを確認しましょう。この中身がちゃんと 「CreativeML Open RAIL-M」ライセンスになっていれば安心です。

ライセンスファイルの確認

ここがちゃんとしていない作者さんは、ちょっと心配です。マージ元のモデルのライセンスもあまり気にしていない可能性があります。

D. ライセンスの見方(Civitaiの場合)

この部分を見ましょう。 "Licenses" が "creativeml-openrail-m" だけであれば大丈夫です。下記は "dreamlike" が併記されているので危険です。

Civitaiのライセンス表示

さらにCivitaiがややこしいのは、CreativeML Open RAIL-M には無い下記の制限を選択できる点です。しかもこれは変更履歴が残りません。

なんていい加減なんだ!

  • Use the model without crediting the creator
    作者のクレジットなしにこのモデルを使うこと。これに❌が入っている場合は、画像を公開するときに、作者名を載せなければなりません。

  • Sell images they generate
    生成した画像を売ること。これに❌が入っているモデルは、生成した画像を販売することができません。

  • Run on services that generate images for money
    画像を生成するサービスで動作させ、お金を得ること。これに❌が入っているモデルは、生成サービスに使用して利益を得ることはできません(無償で提供して広告収入を得るのもダメだと読めます)。

  • Share merges using this model
    このモデルをマージしたものを再配布すること。これに❌が入っているモデルは、派生物を再配布してはいけません。

  • Sell this model or merges using this model
    このモデルや、このモデルをマージしたものを売ること。これに❌が入っているモデルは、派生物を含めて、モデルそのものを販売してはいけません。

  • Have different permissions when sharing merges
    このモデルをマージしたものを、このモデルと違う制限で公開すること。これに❌が入っているモデルは、派生物に対しても、このモデルと同じ制限を全て引き継がなければなりません。足しても、引いてもダメです。

なんてややこしいんだ!
ていうかそれはもう CreativeML Open RAIL-M ではないだろ!同じライセンスを名乗るな!

下記のように、"creativeml-openrail-m" 以外何も表示がない場合は、本当にCreativeML Open RAIL-M だという意味になります。これなら細かいことは特に気にしなくてOKです。

本当にCreativeML Open RAIL-M である例

本来、このように追加の制限が一切ないときにしか、 CreativeML Open RAIL-M を名乗ってはいけません(違うライセンスなので当然です)。 ”Modified” を頭につけるなどして、変更したことをわかりやすく表示しなければなりません。

E. 万全を期す場合

  • その時そのライセンスで表示されていたという証拠を保全しましょう。
    Hugging Face なら、リポジトリごとCloneしておきましょう。Gitは変更履歴も残るし、かなり信頼できる証拠になるので安心できます。
    Civitaiには、残念ながらそのような機能がなく、しかも変更履歴もわからないので、魚拓やスクリーンショット、PDFを取っておくしかないです。

  • 派生元がわかっている場合は、派生元のライセンスも確認して、CreativeML Open RAIL-Mであることを確認しましょう。それ以外の場合はライセンスを読むしかありません。頑張ってください。

  • CreativeML Open RAIL-M ライセンスをよく理解している方の場合は、それがライセンスに沿った再配布になっているかをチェックしましょう。ライセンス違反の再配布をしている場合、その作者の公開しているライセンスは疑わしくなります。

3. 「CC0-1.0」(パブリックドメイン)で公開されているモデルは?(23/4/26追記)

それはライセンス違反の再配布なので、使わない方が良いです。CreativeML Open RAIL-M 第4条(リンクは意訳)の下記の条項に違反しています。

  • a. 「5. 使用時の制限」に書かれている制限と同等以上の制限をかけなければなりません(「5.」と「別紙A」の制限を緩めることはできません)

  • b. 本ライセンスのコピーを提供しなければなりません(これはしてるかもしれませんが)。

ライセンスに違反した再配布には自動的にCreativeML Open RAIL-Mが適用される(4. d.)ため、CC0で公開されていたとしても、そのモデルはCreative ML Open RAIL-Mとして取り扱わなければなりません。

そもそもCC0-1.0(パブリックドメイン 以下CC0)って何?

「誰にも著作権がないもの」のことを指します。それを誰が何に使おうが、誰も文句は言いません、そんな権利は全部放棄しますという意味です。

なんで元のライセンス表示を残さないとダメなの?

1つめは、Stability AIやその貢献者たちは、Stable Diffusionの著作権や特許権を放棄していないからです。それらの権利は派生物にも及びますから、著作権表示などを勝手に消してはダメです。
2つめは、元のライセンスは、あらゆる派生物が絶対に守らなければならないこと、つまり、利用者に対し絶対に悪用をしないよう約束させることを決めているからです。これを削除してはいけない理由は説明不要でしょう。

それを消してるってヤバくない?

ヤバいです。

まず、ライセンス違反の再配布行為について、差止請求されたり、著作権や特許権を理由とした訴訟を受けたりするおそれがあります。実際にはまず忠告を受けるだけでしょう。それに従わないと、その先に行く可能性があります。

さらにもし、その表示を見て、本当にCC0だと勘違いした利用者がいたとすると、その複製や派生物も無限にライセンス違反で作成され続ける可能性があります。そして、最初にライセンスに違反してCC0で配布した責任は、そのライセンス違反の再配布をしたモデルの作者だけが単独で負うことになります。
派生物がCC0で配布されているところだけを見た利用者は、それが元々どのようなライセンスであったかはわかりません。だから、それを見て「何にでも無条件に無制限で使える」と解釈して行動するのは普通のことです。
しかし、実際には制限事項を守らなければなりません。でも利用者はそんなことは知りませんから、使ってはいけない行為に使うかもしれません。そんなとき、Stable Diffusionの開発元は、その利用をやめさせる権利があります。さらに、利用をやめなかったときには、著作権や特許権をもとに訴訟を起こすことができます。著作権料や特許権料などを請求できます。

さて、仮にCC0で再配布されていたモデルの利用者が、制限事項のことを知らず、例えば医療に活用するなどして、大規模なビジネスに発展したとします。しかし、医療職の代わりをさせることなどはライセンスで禁止されていますから、SDの開発元はその使用をやめさせる権利があります。
それで使用をやめさせられたり、著作権料を取られたりすると、その利用者は損害を被ります。どこから入手した派生物かによらず、正当な権利者、たとえばStability AIは、末端の利用者へ直接権利を行使できます。つまり使用停止、著作権料・特許料の請求などができます。
さて、その損害を被った利用者は、次に何をするでしょうか?CC0で再配布されていたモデルの作者(再配布者)に、損害賠償請求ができます

このように、再配布自体の責任はもちろん、派生物のその先の責任すら負う可能性があるということです。
実際に、悪意のない個人の利用者や開発者がここまでの責任を追及される可能性は低いですが、理論上はありえます。

CC0で公開している人は、すぐに是正しましょう

以上から、Stable Diffusionの派生モデルをCC0で公開する行為はライセンス違反であり、リスクを伴うため、すぐに是正しましょう。具体的には、とりあえず「CreativeML Open RAIL-M」表示にして、元のライセンスのコピーを一緒に配布しましょう(マージ元のライセンスがそれを許していれば、ですが)。

4. ライセンスって怖いね!

怖いです。それで痛い目を見た人も過去にたくさんいます。
とりあえず、「CreativeML Open RAIL-M」表示にしておけば開発者は守られるようによく考えられたライセンスなので、派生モデルを公開する人で、よくわからない場合は大人しく同じライセンスにしておきましょう。
利用者も、悪用さえしなければ自由に使えるので、「CreativeML Open RAIL-M」のをものを使っておけばとりあえずは大丈夫です(その表示が信頼できれば、なのですが……)。

【補足】Novel AIのリークモデルについて

Novel AI からリークされたモデルが存在していることは周知の通りです。そして、それは一般的には営利企業の知的財産であり、営業秘密であるため、勝手に利用してはいけません。損害賠償を請求されるおそれもあります。
なので、可能な限り、Novel AI のリークモデルやその派生物は使うべきではありません。

ただ、現実問題として、利用者はもはやリークを含むモデルかどうかを判断できません。確実にわかっているのはAnything-V3.0くらい(ハッシュが一致するらしい)で、あとは自己申告や状況証拠しかなく、第三者が検証できません。
また、Novel AIを運営するAnlatan社が籍を置く米国デラウェア州では、営業秘密の漏洩や不正使用に対する差止請求権や損害賠償請求権の時効は、原則として違反が発覚した日から3年間だそうです(GPT-4による)。これは日本法と同じです。
何が言いたいかというと、営業秘密が漏洩した状態をあまりにも放置しすぎると、その権利すら主張できなくなるかもしれませんよ、ということです。実際、放置状態です。このまま3年経てば、営業秘密としては時効です。
モデルに特許が含まれていればまた話が変わってくるのですが、それは考えにくいのではと思っています。
個人的には、もうこのまま3年経つまで放置されるのではと予想しています。

しかし、だから使って良いということには決してなりません。また、将来技術が進歩したとき、モデルのマージ元を検証できるようになる可能性もなくはないです。そうなったら、子の派生物は追及を受ける可能性はあります。子の派生物がリークモデルの使用を隠していたら、孫の派生物はそれを知ることはできないので、現実問題として、どうしようもないです。

参考記事