昨日ニューヨークタイムズはOpenAIとMicrosoftに対し、同社の著作物を無断でAIの学習用に使用したとして訴訟を起こしました。起訴の様子は下記のNoteに詳しく解説しましたので併せてご覧ください。
Jason Kint氏がXにて証拠資料を開示
起訴には22万ページにも及ぶ証拠資料が添付されており、それに目を通したJason Kint氏(注01)がXへのポストで一部を紹介しています。
※注01:Jason Kint氏はDigital Content Next (DCN) のCEOで、メディア戦略、ストリーミング、反トラスト(独占禁止法関連)、プライバシーに関する専門知識を持っています。彼はワシントン大学(@wustl)の卒業生であり、Sporting NewsやCBS Sportsでの経験があります。彼のキャリアや興味の範囲は、メディア業界の現在と未来に関する広範な知識と経験に基づいているようです。
著作権番号: TX 8-926-133
以下、彼がXにて開示している証拠資料の一部を翻訳していきます。
著作権番号: TX 8-926-133
ニューヨークタイムズの内容を記憶する GPT-4 の 100 の例
例 48: 「教義から離脱した教皇が同性市民連合を支持」
著作権番号: TX 8-977-327
ケース 1:23-cv-11195 文書 1-68 提出日 2023 年 12 月 27 日 ページ 63/127
ニューヨークタイムズの内容を記憶する GPT-4 の 100 の例
例 50: 「記録的な死者数と新たな変異種により、ブラジルは世界を危機にさらす」発効日: 2021-05-04
著作権番号:TX 8-926-133
ケース 1:23-cv-11195 文書 1-68 提出日 2023 年 12 月 27 日 ページ 72/127
GPT-4 記憶の 100 の例
ニューヨークタイムズのコンテンツ71
ニューヨーク・ポストのハンターに関する一面記事
例 58: 「バイデンに関する職員の尋問報告書の投稿」
発効日: 2020-12-14
著作権番号: TX 8-900-152
例 63: 「ボトムズアップ、もしかしたらやめたほうがいいかもしれない」
発効日: 2020-09-02
プロンプト (記事から抜粋):
毎日 1 ~ 2 杯飲むと健康状態が良くなるでしょうか?
長年にわたり、連邦政府の影響力のある食事ガイドラインも同様のことを示唆しており、証拠があると述べてきた
著作権番号: TX 8-983-238
例 30: 「教会連合が投票法をめぐりホームセンターのボイコットを要請」
プロンプト (記事から抜粋):
ジョージア州内の1,000以上の教会を代表する黒人信仰指導者の大規模連合が火曜日、ボイコットを呼びかけた。
裁判の結果を予測してみる
以下のような要点に注目することで、可能なシナリオを考えることはできます:
訴訟の主要な焦点:訴訟がどのような法的問題に焦点を当てているかが重要です。例えば、知的財産権、契約違反、独占禁止法違反など、訴訟の内容によって結果は大きく変わります。
証拠の質と量:あなたが述べたように、22万ページに及ぶ証拠資料の存在は、訴訟の複雑さを示しています。これらの資料がどのように裁判所に受け入れられるか、また、それらがどのように解釈されるかが鍵となります。
両社の主張:ニューヨークタイムズとOpenAIおよびMicrosoftがどのような主張をしているか、またそれに対する反論は何か、これらの要素も重要です。
法的・技術的な専門性:この訴訟は、技術的な側面と法的な側面の両方を含んでいるため、専門家の意見が大きな影響を持つ可能性があります。
公共の利益と社会的影響:裁判所は、この訴訟が公共に与える影響も考慮するかもしれません。特に、民主主義やメディア業界に与える影響は重要な要素です。
最終的には、裁判所の解釈と判断によって結果が決まります。技術的な革新と法的枠組みの間の緊張関係を示すこのような訴訟は、将来の同様の事件に対する前例を作る可能性があり、その意味で非常に注目されています。
意図的な掲載であったのか偶発的なものであったのか?
有料記事に対しても、GPT-4のブラウジング機能で、探してきたニュースを一字一句書き出し(引用元のURLは添付されていたが元来無料で読めるものではない)を書いたことが問題になっていました。なおこの機能はニューヨークタイムズからの指摘によりローンチされてすぐ停止になり有料記事を拾ってこない修正が加えられてから再度実装されました。
意図的な著作権侵害の場合、法的な結果は特に厳しいものになりがちです。意図的な侵害とは、著作権を持つ作品を無断で利用し、その著作権者の権利を故意に無視する行為を指します。このような状況では、以下の点が考慮される可能性があります:
高額な法定損害賠償:意図的な侵害の場合、米国の著作権法では、法定損害賠償金額が高く設定されています。これは、侵害行為に対する抑止効果を持たせるためです。
実際の損害と利益の没収:裁判所は、原告が受けた実際の損害に加えて、被告が侵害によって得た利益の全額を賠償金として認定することがあります。
その他の法的措置:侵害行為の停止命令や、将来の侵害を防ぐための措置も含められることがあります。
訴訟費用と弁護士費用:被告は、訴訟費用や原告側の弁護士費用も負担する可能性があります。
ニューヨークタイムズが数十億ドルの損害賠償を請求しているということは、彼らが受けたと主張する損害が非常に大きいと判断していることを示しています。著作権侵害訴訟は、特に大規模なメディア企業が関与する場合、重大な法的、経済的影響を及ぼす可能性があり、業界全体に影響を与えることもあります。
OpenAIは言い訳できないかもしれない
実際にブラウジング機能が実装されて間もない頃、ニューヨークタイムズなどの有料記事をGPT-4に読ませた内容をそのままコピペしたニュースを掲載している勝手連的サイトが雨後の筍のように多発していたものです。この部分の損害が一番大きかったのではないかと思われます。全ての有料記事がネット上にゴロゴロ転がっている状態はまさに著作権侵害です。
6 月の GPT4 モデルはまだ記憶から段落を再現できる
ブラウジング機能ではなく、学習したデータを再現できる機能が6月の段階ではgtp-4-0613と言うモデルで行う事が出来たと主張するポストもあります。添付のキャプチャー動画でその様子が確認できます。
OpenAIが提携したドイツの報道機関
今、OpenAIは報道機関やニュースメディアとの提携を進めており、記事をChatGPTの学習に使う契約を結んでいます。その件については下記のNoteに詳しく解説していますので併せてご覧ください。