見出し画像

GPT-2: 1.5B

以下の記事を参考に書いてます。

GPT-2: 1.5B

1. GPT-2: 1.5B

「GPT-2」の段階的リリースの最終段階として、「GPT-2」の「検出モデル」と共に、最も大きな「GPT-2」の「1.5Bパラメータモデル」をリリースします。

8月以降、より大きなモデルがリリースされていますが、段階的リリースのテストケースをコミュニティに提供するため、段階的リリースを継続しています。このテストケースが将来の強力なモデルの開発者に役立つことを願っており、AIコミュニティとの責任ある公開に関する会話を積極的に続けています。

レポート
GPT-2モデル
検出モデル
モデルカード

2. 私たちの発見

◎ 1. 人間はGPT-2の出力に説得力があると感じています。
コーネル大学のパートナーは、「GPT-2」のテキストにモデルサイズの違いに応じた「信頼性スコア」を割り当てるために、人々を調査しました。1.5Bモデルの「信頼性スコア」は10点満点中6.91点でした。これは、774Mモデルの6.72点よりわずかに大きく、355Mモデルの6.07点を大きく上回っています。その結果は、774Mモデルと比較して人間が知覚した信頼性の増分が低いと思われるため、1.5Bモデルをリリースしたいという気持ちにさせてくれました。

◎ 2. GPT-2は悪用のためにファインチューニングできます。
ミドルベリー国際問題研究所のCTECのパートナーは、過激派グループが、白人至上主義、マルクス主義、聖戦主義的イスラム教、無政府主義の4つのイデオロギーの立場で「GPT-2」をファインチューニングすることで、悪用できることを発見しました。CTECは、これらのイデオロギーのための合成プロパガンダを生成するモデルを作成できることを実証しました。また、機械学習ベースの検出手法は、合成出力の検出精度が低いにもかかわらず、アクターが合成テキストを生成しているという合理的な疑いを専門家に与えることができることも示しています。

◎ 3. 検出は困難です。
合成テキストのコンテンツベースの検出は長期的な課題であると予想されます。機械学習アプローチが役立つかどうかを検証するために、社内で検出研究を行いました。そして、1.5Bの「GPT-2」で生成されたテキストを検出するための検出率が95%程度の「検出モデル」を開発しました。これは単独での検出には十分な精度ではなく、より効果的に検出するためには、「メタデータベースのアプローチ」「人間の判断」「公衆教育」と組み合わせる必要があると考えています。私たちは、このモデルを公開して、合成テキストの検出に関する研究を支援していますが、これにより、アクセス権を持つ敵対者は検出をよりうまく回避することができます。

検出精度は、学習とテストで使用される「サンプリング手法」に大きく依存することがわかりましたが、様々なサンプリング手法で学習を行うと、検出がより信頼性の高いものになることもわかりました。下図に見られるように、より大きなモデルの出力ほど検出が難しいことがわかりました。この傾向は今後も続くと予想されます。

画像1

◎ 4. これまで、悪用されたという大きな証拠は見られません。
「GPT-2」がスパムやフィッシングのような大量/低収量の操作を強化する可能性についていくつかの議論を見てきましたが、コードを書いたという証拠、文書化したという証拠・誤用の例を見たことはありません。私たちは、合成テキスト生成器の出力がより信頼性が高く一貫性のあるものになれば、誤用される可能性が高くなると考えています。私たちは、すべての脅威を認識することはできず、動機のある行為者が、モデルをリリースせずに言語モデルを複製することができることを認めています。

◎ 5. バイアスを研究するための基準が必要です。
言語モデルには「バイアス」があります。これらのバイアスをどのように研究し、議論し、対処するかを考えることは、AI研究コミュニティの課題です。私たちは、2つの方法でバイアスの課題にアプローチしてきました。

・「GPT-2」のような言語モデルに内在する問題を感じてもらうために、「モデルカード」をモデルと一緒にGitHubに公開しました。

・「GPT-2」のバイアスのいくつかについて、社内で「定性的な評価」を行いました。これらの調査は包括的なものではなく、バイアス分析のフレームワークに関する共同研究の必要性を提起しています。

3. 次のステップ

過去9ヶ月間の「GPT-2」での経験は、AIにおける責任ある出版規範を作成するための課題と機会についての貴重な洞察を与えてくれました。私たちは、「Partnership on AI」の「機械学習のための責任ある出版規範」プロジェクトへの参加や、研究コミュニティの同僚との議論を通じて、この問題への取り組みを継続していきます。

この記事が気に入ったらサポートをしてみませんか?