【AI】生成AIを利用する場合に気を付けなければならない著作権の知識

2023年4月18日 20:05

はじめに

最近は、テクノロジー法を主に取り扱っています。その中でもAI、Web3、メタバースは、現時点では別系統の話題の感が強く、一緒くたにNOTEに書くのはためらわれ、それゆえにNOTEに何を書くか迷っていたのですが、タイトルに【AI】【Web3】【メタバース】と入れることで全部NOTEに書くことにしました。これで問題解決しました！
ということで、今回はChatGPTの登場で、最近盛り上がっているAIがテーマです。

生成AIの法的リスク

生成AIの利用にはどのような法的リスクがあるのでしょうか。
リスクとしては、①著作権侵害、②誤情報の利用、③秘密情報の漏えい、④個人情報の不適切な利用、⑤悪用などがあげられます。
たとえば、学習データやプロンプトに他人の著作物を利用する場合や、生成した物が他人の著作物に似ている場合には、著作権侵害の問題が生じます。
生成AIが誤った情報を生成し、人間がそれを鵜呑みにして誤った判断・行動をした場合にも問題が生じます。
秘密情報や個人情報を学習データやプロンプトに入れた場合には、秘密情報の漏えいや個人情報の不適切な利用が問題になります。
生成AIを悪用してフェイクニュースやウイルスを作成することも問題になります。
今回は、これらの問題のうち著作権を解説します。

生成AIの利用の４段階

生成AIに関する著作権の問題は、生成AIの利用段階を分けて考える必要があります。
生成AIを作成・利用する段階としては、
①大規模言語モデル（LLM）を作成する段階
②特定の分野のデータを学習させて作成する段階（ファインチューニング）③ユーザがプロンプトを入れる段階（ChatGPTだとチャットの入力）
④プロンプトに基づいてAIが出力したアウトプットを利用する段階
の4段階があります。

②の段階は、イメージが沸かないかもしれませんが、GTP‐3や4、PaLMといった大規模言語モデルに追加でデータを学習させることで、自社向けのAIモデルを作成することをいいます。セミオーダースーツのようなものです。

これらの４つの段階を区別せずに議論するのは混乱を招きますので、分けて議論したいところです。
大規模言語モデルを生成する①の段階は高度なAI技術力と多額の資金が必要なため、通常の企業や個人では、第2～4段階における問題を検討することになります。
生成AIには、ChatGPTのような文章生成系と、Midjourneyのような画像生成系がありますが、法律的には考え方は同じです。

著作権侵害となるかどうかの問題

①LLM作成段階、②ファインチューニング段階

LLM作成段階とファインチューニングの段階では、他人の著作物を学習用データとして利用することが問題となります。
著作権法30条の4は、著作物に表現された思想や感情を、自分や他人といった人間に「享受」させることを目的としない場合には、必要と認められる限度で、著作物を著作権者の許諾を得ないで利用することを認めています。そして、その典型例として「情報解析」を挙げています。そのため、AIの学習データとして他人の著作物を利用する場合であっても、情報解析にあたるか、あるいはAIは著作物を享受していないと考えられるのが通常なので、必要な範囲内であれば、著作権者の許諾を得ずに利用できることになります。

ただし、著作権法30条の4は、利用対象となる著作物の種類・用途・利用の態様から判断して「著作権者の利益を不当に害する場合」には、著作権者の許諾が必要であると規定しています。これは、著作権者と利用者の利益を調整する規定です。
「著作権者の利益を不当に害する場合」にあたるかについては、その著作物の種類・用途・利用の態様からケースバイケースで判断することになります。
この点、文化庁著作権課の「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方」では、「著作権者の利益を不当に害する場合」に当たるか否かは、①著作権者の著作物の利用市場と衝突するか、②将来における著作物の潜在市場を阻害するかという観点から判断されるとしています。たとえば、大量の情報を簡単に情報解析に活用できるように整理したデータベース著作物が販売されている場合に、これを学習用データとして無断で利用することは「著作権者の利益を不当に害する場合」とあたるとしています。
もっとも、「不当に害する場合」という抽象的な規定であることから、どのような場合がこれにあたるかは、現時点では不明確といわざるを得ません。
（注１：著作権オーバライド問題というのがあり、これについては末尾に記載しています。）

③プロンプト入力段階

プロンプトに入力する段階では、ユーザがプロンプトに他人の著作物を利用する場合が問題となります。プロンプトに入れる他人の著作物としては、イラストなどの画像、記事などの文章などのほかに、他人が作成したプロントも考えられます。
そして、プロンプトとして他人の著作物を利用することについても、著作権法30条の4の適用が考えられます。つまり、自由に使える場合があります。
もっとも、プロンプトによる著作物の利用は、学習データとして利用するのと違って、自分や他人といった人間に「享受」させるかが問題になりやすいでしょう。例えば、自分の好きなキャラクターの画像を生成することを狙って、そのキャラクターの画像や名前の文章をプロンプトに入れる場合には、人間に享受させる目的があると判断される可能性があります（注２）。
また、プロンプトの入力内容によっては、「著作権者の利益を不当に害する場合」にあたる場合もあるでしょう。

④アウトプット段階

アウトプット段階では、アウトプットが他人の著作物と似ている場合に著作権侵害が問題となります。
著作権侵害は、アウトプットが、①他人の著作物に依拠し、②他人の著作物と類似性がある場合に成立します。
生成AIの学習用データには膨大なデータが使われていることから、そのごく一部に著作物が使われているにすぎないような場合に「依拠」していたといえるかについては、議論があります。大きく分けると、断片になっておりアイディアにすぎないから依拠していないという説と、学習データに入っている以上、依拠しているという説があります。ただ、ユーザとしては、学習データにどのような著作物が利用されているのかは知ることができないのが通常でしょう。

他方で、ユーザがプロンプトとして他人の画像などの著作物を利用した場合には、依拠が認められることは明らかでしょう。
では、プロンプトとして、アーティストやキャラクターの名前を入力した場合には依拠が認められるでしょうか？　例えば、「村上春樹風の文章を作ってください」とか「ポケモン風のキャラクターを作ってください」などをプロンプトに入力する場合です。この場合、直接的にアーティストの作品やキャラクター画像という著作物を使ってはいません。もっとも、このプロンプトをきっかけに生成AIが学習した村上春樹の文章やポケモンの画像から村上春樹風の文章やポケモン風のキャラクターを作成することは考えられ、その場合には依拠が認められやすくなるように思います（作風・アイディアをマネることは著作権侵害ではないと考えられているので、この点は私も考え方は固まっていませんが、依拠という観点からは依拠を否定できないようには思います）。

なお、個人でプロンプトを入れて、そのアウトプットを見たりダウンロードするだけであれば、「私的使用」として著作権侵害になりません（著作権法30条）。もっとも、アウトプットをネットで公開すると、著作者の公衆送信権を侵害することになるので、この私的使用の例外は使えません。Midjourneyのように、アウトプットがネットで公開されるものは、そもそも私的使用の例外は使えないことになります（Midjourneyにはプライベートモードで非公開にする方法はあります）。

ちなみに、商標権についてですが、商品やサービスにつける画像をＡＩで生成するする場合、アウトプットが他人の商標権と同一・類似していることも考えられます。その場合、そのアウトプットが作成されたこと自体は、商標権侵害となる「商標的使用」とならないので商標権侵害にはあたりませんが（商標法26条1項6号）、他人の商標権と同一・類似のアウトプットを、その商標権の同一・類似の類のビジネスで利用することは商標権侵害になる可能性が高いので注意が必要です。同一・類似の商標権がないかチェックする必要があるでしょう。

AI生成物に著作権があるか？

著作権は、著作権法が創作を保護する法律であるため、人間の創作意図と創作的寄与がある場合に発生するとするのが通説です。
AIに簡単な指示出しただけでは、通常は、創作意図と創作的寄与は認められないため、指示を出した人間が著作権を持つことはありません。その場合には、AI生成物はそもそも著作物ではなく、誰もが自由に使ってよいことになります。
他方で、人間がAIを利用して作りたい画像・文章のイメージがあり、そのイメージを実現するために、プロンプトを工夫するなどして時間と手間をかけた場合には、創作意図と創作的寄与があるとして、著作権が認められる場合があると考えられます。
米国の著作権局も、「Copyright Registration Guidance」において、結論としては同じような見解を示しています（米国ではAI生成物には著作権が認められない方針が示されたという報道がされていましたが、この見解の一部を切り取ったものにすぎません）。
ですから、AIで生成した画像を誰かにパクられた場合に著作権を主張できるかは、どれだけ人間が創作に関与したか次第で、ケースバイケースといえます。
今後、AIを使ったクリエイティブが増えていくことが想定されますが、AIを利用して創作するクリエーターは、自らのクリエイティブの著作権を主張するには、創作意図と創作的寄与を証明できるように制作過程などを記録していくことが重要になると思われます。

終わりに

このように生成AIを利用するにあたっては、著作権や商標権に注意する必要があります。日本では、機械学習のための著作物の利用が比較的自由であるといえますが、全く自由というわけではなく、「著作権者を不当に害する場合」などは著作権侵害になることは注意が必要です。もっとも、「著作権者を不当に害する場合」が曖昧なので、今後はガイドラインなどが作成され、明確化されることが望ましいといえます。本来は裁判例の蓄積を待つべきですが、裁判例が蓄積するには10年単位の時間がかかるので、AIの技術進歩の速さを考えるとあまりにも長すぎるといえるでしょう。

生成AIには上記のようなリスクがありますが、企業においては、過度にリスクを恐れて不必要に利用を禁止すると生産性が落ち、ライバル企業の後塵を拝することになる恐れがあります。一定のルールを設けて、従業員が適切に利用できるような環境を整えることが重要でしょう。

なお、この文章も、いつかはAIに学習データとして私の許諾も得ないで取り込まれ、誰かの法律相談の答えの材料になるのでしょう。それは納得いかない気もします。有料化すればそれを防げるのでしょうが、私としては、多くの人に読んでもらいたいので無料にしています。そう考えるとネットで公開することは多くの人が無料で利用することを了解することを意味しているので、AIが無料で利用することに腹を立てるのは矛盾しているかもしれません。私としてはAIの発展（と仕事が効率化して楽になること）も願っていますのでAIが学習することには賛成です。いずれにせよ、著作権者としては複雑な気持ちです（笑）。

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
注１：著作権オーバライド問題について
ウェブサイトから集めたデータや有料で購入したデータを学習データとして使いたい場合に、ウェブサイトに「このサイトのデータは商用利用をしてはならない」「AI学習用に利用してはならない」という利用規約がある場合や、購入契約では目的外利用を禁止している場合があります。この場合に、利用規約・契約に反してデータを利用してよいのか、という「著作権オーバライド」という問題もあります。この点についての議論は複雑ですが、「令和３年度産業経済研究委託事業（海外におけるデザイン・ブランド保護等新たな知財制度上の課題に関する実態調査）調査報告書」では、「AI 学習等のための著作物の利用行為を制限するオーバーライド条項は、その範囲において、公序良俗に反し、無効とされる可能性が相当程度あると考えられる。」としています。つまり、利用規約・契約よりも著作権法30条の4が優先する場合が相当あることが示唆されています。
なお、ウェブサイトに利用規約が掲載されているものの、自由に閲覧できるものについては、利用規約は一方的な意思表示であり、サイト運営者とユーザ間の合意はないので、そもそも契約が成立していない（よって著作権法の規定にしたがう）と考える余地があります。

注２：プロンプトへの入力と情報解析
プロンプトへの入力は、著作権法30条の4第２号の「情報解析の用に供する場合」といえない可能性があります。なぜなら、「情報解析」については、条文(2号)に、「大量の情報から解析すること」と定義されているのですが、プロンプトに入力された著作物は「大量の情報」でないことが一般的だからです。その場合、著作権法30条の4の解釈に当たっては、本文に戻って、人間に「享受」させる目的があるか問われることになります。もっとも、Embeddingなどのテクニックで大量の情報を入力した場合には情報解析にあたる可能性は高まるでしょう。

　　　　☆　　　　　　　　　☆　　　　　　　　　☆　　　　　　

なお、下記のAI関連の拙著もご覧になっていただけると嬉しいです！

この記事が気に入ったらサポートをしてみませんか？