見出し画像

AIに生成させたデータが学習元の著作物に類似していたら著作権侵害になるのか?

…については、諸説ある模様。なお現行の著作権法では、AIの学習に用いるデータセットとして他者が著作権を有する著作物を利用することについては認められている(30条の4)が、それとは別の話である。

門外漢なので、参考資料を示すことにする。AI 生成物・機械学習と著作権法(日本弁理士会発行 月刊『パテント』別冊 第23号(2020))4章より

既存のディズニー映画という著作物を AI に機械学習させて作成された学習済みモデルから出力された映画が,その創作的表現においても,学習用データに含まれる既存のディズニー映画と共通する場合に,著作権侵害の成立を認めるべきなのか,侵害が成立するとして誰に責任を負わせるのか
(略)
侵害要件として大きな問題となり得るのは依拠,すなわち,他人の著作物に接し(アクセスし),これを基にして著作物を作成・利用していることを求める要件である。基本的には,AI 利用者が AI によるコンテンツ生成を行う過程で,AI が入力された他者の著作物にアクセスし,それを元にして AI 生成物が生成されたと認められる限り,依拠を肯定せざるを得ないと思われる。

AI 生成物・機械学習と著作権法(2020)

どうやら『依拠性』がキーワードとなるらしい。別の著者による記事や政府機関の報告書でも同様の説明がみられる。

(2) 処理の都度著作物を自動生成している場合
 たとえば、GPT-3のように一部の文章(非著作物)を入力すると、その後の文章を自動生成してくれるようなサービスがこれに該当します。
(略)
 自動生成された出力が、「偶然」既存の著作物に類似した場合に著作権侵害の問題が生じることになります。
 著作権侵害が成立するためには、元に著作物に「依拠」していることが必要です。先ほどの「出力対象となる著作物を事業者が予め蓄積し、入力に応じてそのまま出力している場合」は明らかに「依拠性」がありますが、「処理の都度、著作物を自動生成している場合」にもこの「依拠性」があるかどうかが問題となります。

STORIA法律事務所 自然言語系AIサービスと著作権侵害(2021/10/24)

課題④-3)AI生成物が問題となる(悪用される等)可能性
・学習済みモデルから学習用データ(著作物)類似物が出力される問題
(略) この場合、出力された生成物が著作権侵害と判断されるためには、依拠と類似性が必要とされると考えられるが、単に学習用データに元となった著作物が含まれているからといって依拠が肯定されるのか、仮に肯定されるとしても学習済みモデルの作成者とAI生成物を出力した者が異なる場合にまで依拠を認めて良いのか等の問題が指摘されている。

知的財産戦略本部 新たな情報財検討委員会 報告書(2017)

最初に示した資料では、

  • 著作権侵害にあたるとしたら、誰が責任を負うのか?

  • 著作権侵害にあたるとしたら、損害賠償を請求されうるのか?

といった付随する問題の他、AIと著作権に関わる全般的な話題について網羅的に解説されており、非常に勉強になる。京都大学大学院法学研究科教授による論文とのことで、信用できる資料だと思われる。

ちかごろ画像生成AIの話題が俄に盛り上がっており、それに伴って権利関係の疑問もよく見かけるようになったので、興味のある向きは読んでみると良いんじゃないでしょうか。(自分もStable Diffusionを試しているうちに気になったクチ)


この記事が気に入ったらサポートをしてみませんか?