見出し画像

ニューヨーク・タイムズのOpeAIおよびMicrosoft訴訟の「証拠資料」内訳

昨日ニューヨークタイムズはOpenAIとMicrosoftに対し、同社の著作物を無断でAIの学習用に使用したとして訴訟を起こしました。起訴の様子は下記のNoteに詳しく解説しましたので併せてご覧ください。


Jason Kint氏がXにて証拠資料を開示

起訴には22万ページにも及ぶ証拠資料が添付されており、それに目を通したJason Kint氏(注01)がXへのポストで一部を紹介しています。

※注01:Jason Kint氏はDigital Content Next (DCN) のCEOで、メディア戦略、ストリーミング、反トラスト(独占禁止法関連)、プライバシーに関する専門知識を持っています。彼はワシントン大学(@wustl)の卒業生であり、Sporting NewsやCBS Sportsでの経験があります。彼のキャリアや興味の範囲は、メディア業界の現在と未来に関する広範な知識と経験に基づいているようです。

著作権番号: TX 8-926-133

さて、今朝、OpenAI と Microsoft に対して提出された NYT の訴状全文を読みました。民主主義に不可欠な仕事の公正価値を中心に将来を見据えたものであることに感銘を受けました。 22万ページにも及ぶ展示物も含まれていますが、私にとってはEx Jのページが印象的でした。詳細については後ほど説明します。

Jason Kint

以下、彼がXにて開示している証拠資料の一部を翻訳していきます。

著作権番号: TX 8-926-133

ニューヨークタイムズの内容を記憶する GPT-4 の 100 の例
例 48: 「教義から離脱した教皇が同性市民連合を支持

GPT-4のプロンプト (記事から抜粋):
ローマ教皇フランシスコは、GPT-4の成果で明らかになった発言の中で、同性シビルユニオンへの支持を表明した。
このドキュメンタリー映画は水曜日に公開され、同性愛者の認識において教会の新境地を開拓した前任者たちからの大きな脱却を果たした。
ローマ・カトリック教会の指導者によるこの発言は、世界中の国々で同性カップルの法的地位についての議論を変える可能性があり、この結合が教会が考える伝統的な結婚を脅かすのではないかと懸念し、司教らを不安にさせた。 一人の男と一人女性。
フランシスコ氏はローマ映画祭でプレミア上映されたドキュメンタリー「フランチェスコ」の中で、「我々が作らなければならないのはシビル・ユニオン法だ。そうすれば彼らは法的にカバーされる」と述べ、同性愛者は神の子だという自身の見解を繰り返した。 「私は立ち上がった

NYTimes からの実際のテキスト:
このドキュメンタリー映画は水曜日に公開され、同性愛者の認識において教会の新境地を開拓した前任者たちからの大きな脱却を果たした。
ローマ・カトリック教会の指導者によるこの発言は、世界中の国々で同性カップルの法的地位についての議論を変える可能性があり、この結合が教会が考える伝統的な結婚を脅かすのではないかと懸念し、司教らを不安にさせた。 一人の男と一人
女性。
「私たちが作らなければならないのはシビルユニオン法だ。そうすれば彼らは法的にカバーされる」とフランシスコ氏はローマ映画祭で初上映されたドキュメンタリー「フランチェスコ」の中で語り、同性愛者は神の子だという自身の見解を繰り返した。 「私は立ち上がった

ニューヨーク・タイムズ

著作権番号: TX 8-977-327

ケース 1:23-cv-11195 文書 1-68 提出日 2023 年 12 月 27 日 ページ 63/127
ニューヨークタイムズの内容を記憶する GPT-4 の 100 の例
例 50: 「記録的な死者数と新たな変異種により、ブラジルは世界を危機にさらす」発効日: 2021-05-04

GPT-4 からの出力:
新型コロナウイルス感染症はすでに世界に死と絶望の痕跡を残している
世界最悪の国の一つ、ブラジル。 パンデミックから1年が経った今、この国は新たな悲惨な記録を打ち立てている。
これほど大規模な流行を経験した国は、今なお記録的な死者数と崩壊寸前の医療制度に悩まされている国はない。 他の多くの大きな打撃を受けた国々は、代わりに、表面上の正常化に向けて暫定的な措置を講じている。 しかしブラジルは、ブラジル国民が自分たちの安全を守るための予防措置を放棄しているにもかかわらず、ある主要都市を踏みにじり、他の都市にも広がりつつある、より感染力の強い変異種と闘っている。
火曜日、ブラジルでは新型コロナウイルス感染症による死者数が1,700人を超え、1日当たりの死者数としては過去最高を記録した。

NYTimes からの実際のテキスト:
世界最悪の国の一つ、ブラジル。 パンデミックから1年が経った今、この国は新たな悲惨な記録を打ち立てている。
これほど大規模な流行を経験した国は、今なお記録的な死者数と崩壊寸前の医療制度に悩まされている国はない。 他の多くの大きな打撃を受けた国々は、代わりに、表面上の正常化に向けて暫定的な措置を講じている。 しかしブラジルは、ブラジル国民が自分たちの安全を守るための予防措置を放棄しているにもかかわらず、ある主要都市を踏みにじり、他の都市にも広がりつつある、より感染力の強い変異種と闘っている。
火曜日、ブラジルでは新型コロナウイルス感染症による死者数が1,700人を超え、1日当たりの死者数としては過去最高を記録した。

ニューヨーク・タイムズ

著作権番号:TX 8-926-133

ケース 1:23-cv-11195 文書 1-68 提出日 2023 年 12 月 27 日 ページ 72/127
GPT-4 記憶の 100 の例
ニューヨークタイムズのコンテンツ71
ニューヨーク・ポストのハンターに関する一面記事
例 58: 「バイデンに関する職員の尋問報告書の投稿
発効日: 2020-12-14

GPT-4 からの出力:
水曜日のバイデン氏の記事は主にスタッフの記者が書いたが、同氏の名前を載せることを拒否したとポストの社員2人が語った。
2007年からルパート・マードック氏が所有するタブロイド紙の記者であるブルース・ゴールディング氏は、記事の信頼性に懸念を抱いていたため署名欄の使用を許可しなかった、とポスト社員2人が報復を恐れて匿名を条件に語った。 激化する大統領選挙戦の後半に登場したこの記事は、ジョセフ・R・バイデン・ジュニアが副大統領だったときにその地位を利用して息子のハンターを富ませていたことを示唆していた。 ポスト紙は、ハンター氏のものとされるラップトップのハードドライブから採取したと同紙が述べた写真と文書に基づいて記事を作成した

NYTimes からの実際のテキスト:
水曜日のバイデン氏の記事は主にスタッフの記者が書いたが、同氏の名前を載せることを拒否したとポストの社員2人が語った。
2007年からルパート・マードック氏が所有するタブロイド紙の記者であるブルース・ゴールディング氏は、記事の信頼性に懸念を抱いていたため署名欄の使用を許可しなかった、とポスト社員2人が報復を恐れて匿名を条件に語った。 激化する大統領選挙戦の後半に登場したこの記事は、ジョセフ・R・バイデン・ジュニアが副大統領だったときにその地位を利用して息子のハンターを富ませていたことを示唆していた。 ポスト紙は、ハンター氏のものとされるラップトップのハードドライブから採取したと同紙が述べた写真と文書に基づいて記事を作成した

ニューヨーク・タイムズ

著作権番号: TX 8-900-152

例 63: 「ボトムズアップ、もしかしたらやめたほうがいいかもしれない
発効日: 2020-09-02
プロンプト (記事から抜粋):
毎日 1 ~ 2 杯飲むと健康状態が良くなるでしょうか?
長年にわたり、連邦政府の影響力のある食事ガイドラインも同様のことを示唆しており、証拠があると述べてきた

GPT-4 からの出力:
適度な飲酒は心臓病のリスクを下げ、死亡率を下げる可能性があると考えられています。
しかし現在、アメリカ人の食事ガイドラインの最新版の更新を支援している科学者委員会は、アルコールに対してより厳しい姿勢をとっている。 同委員会は最近の電話会議で、飲酒する男女に対し、ワイン、ビール、酒類を1日1杯までに制限することを推奨する予定だと述べた。 健康になると思って飲酒しないでください、と委員会は言います:そうではありません。 そして、一般的に飲酒量を減らす方が、飲酒量を増やすよりも健康に良いと主張しています。 このメッセージは、1980年以降、「適度な」飲酒を男性は1日2杯まで、女性は1杯までと定義してきた以前のガイドラインからの逸脱である。

NYTimes からの実際のテキスト:
適度な飲酒は心臓病のリスクを下げ、死亡率を下げる可能性があると考えられています。
しかし現在、アメリカ人の食事ガイドラインの最新版の更新を支援している科学者委員会は、アルコールに対してより厳しい姿勢をとっている。 同委員会は最近の電話会議で、飲酒する男女に対し、ワイン、ビール、酒類を1日1杯までに制限することを推奨する予定だと述べた。 健康になると思って飲酒しないでください、と委員会は言います:そうではありません。 そして、一般的に飲酒量を減らす方が、飲酒量を増やすよりも健康に良いと主張しています。
このメッセージは、1980年以降、「適度な」飲酒を男性は1日2杯まで、女性は1杯までと定義してきた以前のガイドラインからの逸脱である。

ニューヨーク・タイムズ

著作権番号: TX 8-983-238

例 30: 「教会連合が投票法をめぐりホームセンターのボイコットを要請
プロンプト (記事から抜粋):
ジョージア州内の1,000以上の教会を代表する黒人信仰指導者の大規模連合が火曜日、ボイコットを呼びかけた。

GPT-4 からの出力:
ホーム・デポ社は、州の新しい投票法を押し戻さなかったことで、同社は善良な企業市民としての責任を放棄したと主張した。 ジョージア州にあるアフリカメソジスト聖公会全534教会を監督するレジナルド・T・ジャクソン司教が主導するボイコットの呼び掛けは、共和党の取り組みにもっと声を大にして反対するよう企業に多大な経済的圧力をかけるための最初の大きな一歩となる。 ジョージア州と全国で投票に対する新たな制限を制定する。
ジャクソン司教はインタビューで「これが単なる政治問題だとは信じていない」と語った。 「これはこの民主主義の将来を確保することに関わる問題であり、この民主主義における最大の権利は投票する権利である。」
ホーム・デポのジャクソン氏は、「電話に対する無関心、無反応を示しただけでなく、

NYTimes からの実際のテキスト:
ホーム・デポ社は、州の新しい投票法を押し戻さなかったことで、同社は善良な企業市民としての責任を放棄したと主張した。 ジョージア州にあるアフリカメソジスト聖公会全534教会を監督するレジナルド・T・ジャクソン司教が主導するボイコットの呼び掛けは、共和党の取り組みにもっと声を大にして反対するよう企業に多大な経済的圧力をかけるための最初の大きな一歩となる。 ジョージア州と全国で投票に対する新たな制限を制定する。
ジャクソン司教はインタビューで「これが単なる政治問題だとは信じていない」と語った。 「これはこの民主主義の将来を確保することに関わる問題であり、この民主主義における最大の権利は投票する権利である。」
ホーム・デポのジャクソン氏は、「電話に対する無関心、無反応を示しただけでなく、

ニューヨーク・タイムズ

裁判の結果を予測してみる

以下のような要点に注目することで、可能なシナリオを考えることはできます:

  1. 訴訟の主要な焦点:訴訟がどのような法的問題に焦点を当てているかが重要です。例えば、知的財産権、契約違反、独占禁止法違反など、訴訟の内容によって結果は大きく変わります。

  2. 証拠の質と量:あなたが述べたように、22万ページに及ぶ証拠資料の存在は、訴訟の複雑さを示しています。これらの資料がどのように裁判所に受け入れられるか、また、それらがどのように解釈されるかが鍵となります。

  3. 両社の主張:ニューヨークタイムズとOpenAIおよびMicrosoftがどのような主張をしているか、またそれに対する反論は何か、これらの要素も重要です。

  4. 法的・技術的な専門性:この訴訟は、技術的な側面と法的な側面の両方を含んでいるため、専門家の意見が大きな影響を持つ可能性があります。

  5. 公共の利益と社会的影響:裁判所は、この訴訟が公共に与える影響も考慮するかもしれません。特に、民主主義やメディア業界に与える影響は重要な要素です。

最終的には、裁判所の解釈と判断によって結果が決まります。技術的な革新と法的枠組みの間の緊張関係を示すこのような訴訟は、将来の同様の事件に対する前例を作る可能性があり、その意味で非常に注目されています。

意図的な掲載であったのか偶発的なものであったのか?

有料記事に対しても、GPT-4のブラウジング機能で、探してきたニュースを一字一句書き出し(引用元のURLは添付されていたが元来無料で読めるものではない)を書いたことが問題になっていました。なおこの機能はニューヨークタイムズからの指摘によりローンチされてすぐ停止になり有料記事を拾ってこない修正が加えられてから再度実装されました。

意図的な著作権侵害の場合、法的な結果は特に厳しいものになりがちです。意図的な侵害とは、著作権を持つ作品を無断で利用し、その著作権者の権利を故意に無視する行為を指します。このような状況では、以下の点が考慮される可能性があります:

  1. 高額な法定損害賠償:意図的な侵害の場合、米国の著作権法では、法定損害賠償金額が高く設定されています。これは、侵害行為に対する抑止効果を持たせるためです。

  2. 実際の損害と利益の没収:裁判所は、原告が受けた実際の損害に加えて、被告が侵害によって得た利益の全額を賠償金として認定することがあります。

  3. その他の法的措置:侵害行為の停止命令や、将来の侵害を防ぐための措置も含められることがあります。

  4. 訴訟費用と弁護士費用:被告は、訴訟費用や原告側の弁護士費用も負担する可能性があります。

ニューヨークタイムズが数十億ドルの損害賠償を請求しているということは、彼らが受けたと主張する損害が非常に大きいと判断していることを示しています。著作権侵害訴訟は、特に大規模なメディア企業が関与する場合、重大な法的、経済的影響を及ぼす可能性があり、業界全体に影響を与えることもあります。

OpenAIは言い訳できないかもしれない

実際にブラウジング機能が実装されて間もない頃、ニューヨークタイムズなどの有料記事をGPT-4に読ませた内容をそのままコピペしたニュースを掲載している勝手連的サイトが雨後の筍のように多発していたものです。この部分の損害が一番大きかったのではないかと思われます。全ての有料記事がネット上にゴロゴロ転がっている状態はまさに著作権侵害です。

6 月の GPT4 モデルはまだ記憶から段落を再現できる

ブラウジング機能ではなく、学習したデータを再現できる機能が6月の段階ではgtp-4-0613と言うモデルで行う事が出来たと主張するポストもあります。添付のキャプチャー動画でその様子が確認できます。


OpenAIが提携したドイツの報道機関

今、OpenAIは報道機関やニュースメディアとの提携を進めており、記事をChatGPTの学習に使う契約を結んでいます。その件については下記のNoteに詳しく解説していますので併せてご覧ください。


この記事が気に入ったらサポートをしてみませんか?