見出し画像

著作権法30条の4の契約によるオーバーライド

AIと著作権に関する考え方について(素案)について、任意の意見募集がなされている。

このポストのツリーを、まとめなおしてみました。
https://twitter.com/info_kvaluation/status/1751075262786400693

 素案は、制限規定一般や、著作権法30条の4について、強行規定であるかどうか、言及していない。

 30条の4が強行規定であれば、当事者間の合意があっても、30条の4の規律が有効であり、当事者間の合意は法的に意味がない。
 一方、30条の4が強行規定でなければ、当事者間の合意によって、30条の4の規律は上書き(オーバーライド)され、当事者間は合意した内容に拘束される。例えば、生成AIの学習をしないことに同意をしてイラストを見せた場合などは、30条の4の規定にかかわらず、当事者間の合意が当事者を拘束し、生成AIへの学習はできない。

 改正民法により、定型約款による合意の拘束性は、通常の合意よりも薄いといった整理が深まっていった。一般的に、当事者の一方的な表示かどうか、定型約款か、書面による合意かなど、合意の濃さ・薄さや、合意形成のプロセスの適切性(デュー・プロセス)などによって、合意の拘束力が個別に判断される。

 髙部先生は、著作権法の制限規定は強行規定ではないと説示している。髙部先生は、元知的財産高等裁判所所長で、最高裁判所調査官として著作権に関する重要な事件の調査にあたられた、現弁護士である。

「著作権法の権利制限規定に定められた行為であるという理由のみをもって、これらの行為を制限する契約は一切無効であると主張することはできず、いわゆる強行規定ではないと解される」

髙部眞規子『実務詳説著作権訴訟第2版』第238頁

 髙部先生は、本書で、契約自由の原則に基づきつつ、実際には、ビジネス上の合理性やユーザーに与える不利益の程度などの観点を総合的にみて個別に判断することが必要とのべておられる。

 注目点は、「不正競争又は不当な競争制限を防止する観点」が、制限規定を契約で上書きできるかどうかについての考慮要素として掲げられていることである。市場の役割を重視する考え方で素晴らしい。

 30条の4がそのままでは不正競争又は競争制限を防止する観点から妥当でないケースで、当事者間の契約によって公正な競争が確保されるような場合、契約による30条の4のオーバーライドが認められやすくなると解される。

 30条の4が強行規定でなければ、 イラストなどの著作物の利用者に対して、生成AIの学習の禁止に合意してもらう契約があれば、30条の4の規定を上書き(オーバーライド)して、学習を著作権違反・契約不履行にできる。

 生成AIの学習を禁止するために、どのような手段をとることができ、裁判を想定した際、どの程度認められやすいかを、順序付けてみる。

 ☆の数が多いほど、学習禁止が認められやすい。

 ☆ 絵画・イラストに署名

 ☆☆ 学習禁止の意思表示(SNSやイラストサイトの作者プロフィールなど)

 ☆☆☆ 学習禁止の意思表示とパスワード等によるアクセス防止

 ☆☆☆ イラストに技術的保護をかける(Glaze, Nightshade等)

 ☆☆☆☆ 多くの著作権者が利用する定型約款があり、その定型約款に学習禁止条項があり、イラストのアクセスは定型約款への合意が必要とされている場合。イラスト管理サイトのユーザー規約でも良い。

 ☆☆☆☆☆ 特定の人と、学習禁止の合意を条件としてイラストへのアクセスを許諾する。例えば、見積段階のラフ提供など。

 ☆☆☆☆☆ robots.txtで学習禁止とし、アクセスを許諾しない。

鈴木健治による位置づけ

 素案は一方的な学習禁止の意思表示と、robots.txtの間を整理してくれなかった。

 著作権者は、強行規定でない前提で、学習禁止の合意を得るよう、工夫していけると良い。各業界が、学習禁止を導く定型約款や標準契約モデルなどを法学者や弁護士の支援をうけながら定め、利用していくとなお良い。

 robots.txtとの併用で、情報解析用データの提供をしていると、著作権者の利益を不当に害するに該当するという、パブコメ時の素案の整理があるが、30条の4が強行法規でなく、30条の4自体を契約により上書きするため、ただし書きだけの議論ではなく、30条の4の全体を上書きし、権利侵害とするのである。ただ、合意内容によっては、一部のみ制限され、他の部分のみ権利侵害という整理がなされる可能性もある。

 また、素案は、データベースなのかどうかで、30条の4ただし書き該当性を区分けする立場だが、技術的に、近い将来かまたは現在すでに、あらゆるデジタルデータはデータベースとなっている。つまり、データベースかどうかの区分けは技術的に意味がなくなっている可能性が高い。

 例えば、大規模言語モデルは、ニューラルネットワークでデジタルデータであるイラストのRGBのデータを「分解して」多数のシナプスに個別に入力し、不要なデータは切り捨てて、必要なデータだけ利用・学習している。この動作は、データベースからの検索であり、大規模言語モデルは、イラストをデータベースとして扱っているのである。

 つまり、ニューラルネットワークの入力層は多数あり、イラストのデジタルデータを分解して、伝統的なリレーショナル・データベース(RDB)でのレコードに該当する粒度のデータが、それぞれのシナプスに入力される。
 大規模言語モデルからするとイラストデータはシナプスに入力されるデータ長のデータセットであり、イラストはデータベースである。

 RDB構成だけがデータベースではなく、XMLでずらずら記述されているような構造であってもデータベースであり、すると、RGB三原色のデータセットであるイラストもデータベースである。

 それでは、イラストに、データベースとして著作物性があるだろうか。
 イラストのデジタルデータのセットは、単純にレイヤーごとの編集著作物性のみならず、描かれている物体や色のレイアウト・配置に特徴があり、描かれていないことが何かを含め、イラスト全体に個性があらわれている。特定の主題の事典と同様に、採用の編集方針が色濃く表れている。

 法的に、著作物や発明の数を数えるのはとても難しく、1 つだったり複数だったりする。データとデータベースの法的な境目は単純ではなく、情報処理の動作の観察によるだろう。 例えば、書籍は全体として著作物だが、そこにある詩も著作物で、詩の中の一行も著作物である。

 重層的であり、1冊の書籍はデータベースであるといえば、データベースでもあるだろう。以前は、データベースとして百科事典的なものが想定されていたが、機械学習後はあらゆるコンテンツから、もっと自由に情報を検索的に取り出せるから、逆向きに、データベースになった著作物が増えたし、さらに増えていく。

 従前のデータベースはインデックスやテーブルの質が重要だったが、現在、中規模であればインデックスがなくとも力業の検索で充分に実用的であり、さらに、大規模言語モデルは学習時にインデックス相当の関連性をつくるから、大規模言語モデル用のデータセットに事前のインデックスは不要で、イラストごとのタグがあれば良い。

 XMLやイラストのベタなデータで、インデックスがなくても、大規模言語モデルの機械学習のためのデータベースとして充分である。

 このように、すべてがデータベースになり、データベースかどうかの切り分けに意味がなくなっていく。

 そして、学習禁止と、データベースとしての販売とは、意思として矛盾する。多くの著作権者はデータベースとしても販売したくなく、学習を禁止したいのである。

 今後の展開によって、不幸にも、データベースの販売をしていなければ学習禁止にできない場合、同種の著作物を出力しない生成AIモデルへのデータセットの販売を有償許諾することが考えられる。

 つまり、イラストであれば、イラストを出力しない生成AIに対してのみ、データセットとしてのイラストの販売を認めるのである。イラストに何が描かれているかの判別のために、情報解析用途での学習することは認めるが、イラストを出力したい生成AIへの学習は認めないのである。

 このような、学習元と同じカテゴリーの出力をしない情報解析用途であれば、本来的な30条の4の範囲であり、変容的でもあるからアメリカのフェア・ユースも認められやすく、ベルヌ条約のスリー・ステップの想定内でもあろう。

 いずれにせよ、どのような場合に学習禁止にできるのかが具体化されれば、必ず、学習禁止のための実務が生み出され、おそらくは圧倒的多数の著作権者が、そのような選択をするだろう。

 大多数の著作権者が学習禁止を望んでいることを前提に、文化を萎縮させない制度設計が望まれる。

 

この記事が気に入ったらサポートをしてみませんか?