逐条解説 EUのAI規正法(データガバナンス、技術文書 法10条~12条、規則10条~12条)

AI規正法

第10条 データとデータガバナンス

1. 高リスクAIシステムのデータ要件 高リスクAIシステムは、学習、検証、テストの各段階で使用されるデータセットについて、特定の品質基準を満たさなければなりません。これらのデータセットは、第2項から第5項で言及される基準に従って、適切なデータガバナンスの下で管理される必要があります。

2. データガバナンスと管理の実務 データガバナンスと管理の実務は以下の要素を含むものとします:

  • (a) 関連する設計の選択

  • (b) データ収集

  • (c) 注釈、ラベリング、クリーニング、濃縮、集約などのデータ準備処理

  • (d) データに基づく仮定の策定

  • (e) データセットの利用可能性、量、適合性の事前評価

  • (f) バイアスの可能性の検討

  • (g) データギャップや欠点の特定と対処法

3. データセットの特性 訓練、検証、試験のデータセットは以下の特性を有する必要があります:

  • 適切であること

  • 代表的であること

  • 誤りがないこと

  • 完全であること

また、ハイリスクAIシステムが意図される人やグループに関して適切な統計的特性を有する必要があります。これらの特性は個々のデータセット、またはその組み合わせで満たすことができます。

4. 地理的、行動的、機能的設定の考慮 高リスクAIシステムの訓練用、検証用、試験用データセットは、特定の地理的、行動的、または機能的設定に特有の特性を考慮する必要があります。

5. 特別カテゴリーの個人データの処理 高リスクAIシステムのプロバイダーは、必要に応じて特別カテゴリーの個人データを処理することができます。これは、バイアスの監視、検出、是正を確保する目的で行われます。データの処理には、匿名化、仮名化、暗号化などの最先端のセキュリティおよびプライバシー保護措置が含まれます。

6. その他の高リスクAIシステム データによるモデル学習を伴わない高リスクAIシステムも、適切なデータガバナンスと管理慣行が適用される必要があります。

第11条 技術文書

1. 技術文書の作成と維持 高リスクAIシステムの技術文書は、市場投入前または使用開始前に作成され、常に最新の状態に維持されなければなりません。この文書は、システムが規定された要件を満たしていることを示すために必要なすべての情報を含みます。

2. 必要な情報の提供 技術文書は、国家所轄官庁および届出機関に対して、AIシステムが要件を満たしていることを評価するために必要な情報を提供する形で作成されなければなりません。これには、附属書IVに定められた要素が含まれます。

3. 技術文書の内容 附属書ⅡのA項に列挙された法律が適用される製品に関連する高リスクAIシステムの場合、技術文書には附属書IVおよび関連する法律に基づいて要求されるすべての情報が含まれていなければなりません。

4. 改正の権限 欧州委員会は、技術的進歩に対応して附属書IVを改正する権限を有します。これは、第73条に従って行われます。

第12条 記録保持

1. ログの自動記録機能 高リスクAIシステムは、運用中に事象を自動的に記録する機能を備える必要があります。これらの記録機能は公認の規格または共通の仕様に適合するものでなければなりません。

2. トレーサビリティの確保 ロギング機能は、AIシステムのライフサイクル全体にわたって機能のトレーサビリティを確保するためのものです。特に、高リスクAIシステムがリスクを提示する状況や実質的な改変が生じる状況に関して、システムの動作を監視し、市販後の監視を容易にします。

3. 記録機能の要件 附属書IIIの第1項(a)に言及される高リスクAIシステムについては、以下の情報を記録する必要があります:

  • 各使用期間の記録(開始日時および終了日時)

  • 入力データがシステムによって照合された参照データベース

  • 一致した入力データ

  • 検証に関与した自然人の識別

これにより、高リスクAIシステムの安全性と信頼性を確保し、適切な監視と評価が可能になります。

AI規正法規則

第10条 データ及びデータガバナンス

1. 高リスクAIシステムのデータセット

高リスクAIシステムが使用するデータセットは、学習、検証、テストにおいて、第2項から第5項までで定められた品質基準を満たさなければなりません。これらの基準に従うことにより、システムの信頼性と安全性が保証されます。

2. データガバナンスの適用

トレーニング、検証、およびテストのデータセットは、ハイリスクAIシステムの意図された目的に適合するようにデータガバナンスと管理慣行の対象とされます。これには以下の要素が含まれます:

  • (a) 設計の選択:システム設計においてデータ選択が重要な要素として扱われます。

  • (b) データ収集:データの収集方法およびデータの出所、特に個人データの場合は収集の目的を明確にします。

  • (c) データ準備:注釈、ラベリング、クリーニング、更新、エンリッチメント、集計などのデータ準備処理を行います。

  • (d) 前提条件の設定:データが測定し、表す情報に関する前提条件を設定します。

  • (e) データセットの評価:必要なデータセットの利用可能性、量、適合性を評価します。

  • (f) バイアスの検討:データが将来の業務に影響を与える場合、人の健康や安全、基本的権利に対する影響、法的に禁止された差別の可能性を検討します。

  • (g) バイアスの対策:検出されたバイアスに対する適切な対策を講じます。

  • (h) データの欠点の特定と対策:データのギャップや欠点を特定し、それに対処する方法を策定します。

3. データセットの特性

訓練、検証、および試験のデータセットは、以下の特性を有する必要があります:

  • 適切であること

  • 十分に代表的であること

  • 誤りがないこと

  • 完全であること

また、ハイリスクAIシステムが使用されることを意図する人またはグループに関して、適切な統計的特性を持つ必要があります。これらの特性は、個々のデータセットレベルまたはその組み合わせで満たされることが求められます。

4. 地理的、文脈的特性の考慮

データセットは、意図された目的に応じて、特定の地理的、文脈的、行動的、または機能的設定に特有の特性を考慮する必要があります。

5. 特別カテゴリーの個人データの処理

高リスクAIシステムに関連する偏りの検出及び是正を目的とし、厳密に必要な場合には、特別なカテゴリーの個人データを処理することが許可されます。この処理には、以下の条件が適用されます:

  • (a) 他のデータ処理では偏りの検出及び修正が効果的に行えないこと

  • (b) 特別なカテゴリの個人データには高度なセキュリティ及びプライバシー保護措置が適用されること

  • (c) 適切な保護措置が講じられ、権限のある者のみがアクセスできること

  • (d) 特別な個人データは他者に転送されないこと

  • (e) 偏りが修正されるか、保持期間終了時点でデータが削除されること

  • (f) 処理活動の記録には、偏り検出及び修正の必要性及び他のデータ処理方法が無効であった理由が含まれること

6. AIモデルの訓練を伴わないシステム

AIモデルの訓練を伴わない高リスクAIシステムの開発については、第2項から第5項の規定がテストデータセットにのみ適用されます。

第11条 技術文書

1. 技術文書の作成と維持

高リスクAIシステムの技術文書は、市場投入前または使用開始前に作成され、常に最新の状態に保たれなければなりません。技術文書は、システムが法規定の要件に適合していることを示すために必要な情報を含みます。

2. 簡易技術文書の提供

中小企業や新興企業は、簡易な方法で技術文書を提供することができます。このため、欧州委員会は簡易な技術文書の書式を定めることとしています。

3. 技術文書の内容

附属書IのセクションAに記載された法律の対象となる高リスクAIシステムは、附属書IVに記載されたすべての情報を含む一つの技術文書を作成しなければなりません。

4. 委任法による改正

欧州委員会は、技術的進歩に対応し、技術文書が要求事項に適合していることを確認するために必要な情報を提供するために、附属書IVを改正する権限を有します。

第12条 記録保持

1. ロギング機能

高リスクAIシステムは、システムのライフサイクル全体にわたって事象(ログ)を自動的に記録する機能を備えていなければなりません。この機能は、システムのトレーサビリティを確保するために重要です。

2. 事象の記録

ロギング機能は、以下の事象の記録を可能にする必要があります:

  • 高リスクAIシステムがリスクを提示する可能性のある状況

  • 市販後の監視を容易にするための状況

  • 高リスクAIシステムの運用監視に関する状況

3. 最低限の記録機能

附属書IIIの1(a)に言及される高リスクAIシステムについては、以下の情報を最低限記録する必要があります:

  • 各使用期間の記録(開始日時及び終了日時)

  • 入力データがシステムによって照合された参照データベース

  • 一致した入力データ

  • 結果の検証に関与した自然人の識別

これにより、システムの安全性と信頼性を確保し、適切な監視と評価が可能になります。

翻訳


10条
データとデータガバナンス

  1. データによるモデルの学習を含む技術を利用する高リスクAIシステムは、第2項から第5項までに言及される品質基準を満たす学習、検証及びテストのデータセットに基づいて開発されなければならない。

  2. 訓練、検証及び試験のデータセットは、適切なデータガバナンス及び管理の対象とする。これらの実務は、特に、(a) 関連する設計の選択に関係するものとする;
    (b) データ収集
    (c) 注釈、ラベリング、クリーニング、濃縮、集約などの関連するデータ準備処理作業;
    (d) 関連する仮定の策定、特にデータが測定し、表現すると想定される情報に関する仮定の策定;
    (e) 必要とされるデータセットの利用可能性、量及び適合性の事前評価;
    (f) バイアスの可能性を考慮した検討;
    (g) 可能性のあるデータギャップや欠点の特定と、それらのギャップや欠点にどのように対処する か。

  3. 訓練、検証、試験のデータセットは、適切で、代表的で、誤りがなく、完全なものでなければならない。これらのデータセットは、該当する場合、ハイリスク AI システムの使用が意図されている人又は人のグループに関しても、適切な統計的特性を有していなければならない。データセットのこれらの特性は、個々のデータセットのレベル又はその組み合わせで満たすことができる。

  4. 訓練用、検証用及び試験用のデータセットは、意図された目的によって必要とされる範囲内で、ハイリスクAIシステムの使用が意図される特定の地理的、行動的又は機能的設定に特有の特性又は要素を考慮しなければならない。

  5. 高リスクAIシステムに関連する偏りの監視、検出および是正を確保する目的で厳密に必要な範囲において、当該システムのプロバイダーは、規則(EU)2016/679の第9条(1)、指令(EU)2016/680の第10条および規則(EU)2018/1725の第10条(1)に言及される特別カテゴリーの個人データを処理することができる、 自然人の基本的権利及び自由のための適切な保護措置(再利用に関する技術的制限、匿名化が追求される目的に重大な影響を及ぼす可能性がある場合には、仮名化、暗号化等の最先端のセキュリティ及びプライバシー保護措置の使用を含む。

  6. モデルの学習を伴う技術を利用するもの以外の高リスクAIシステムの開発については、高リスクAIシステムが第2項に適合することを確保するために、適切なデータガバナンス及び管理慣行が適用されるものとする。
    第11条
    技術文書

  7. 高リスクAIシステムの技術文書は,当該システムが市場に投入され,又は使用開始される前に作成され,かつ,常に最新の状態に維持されなければならない。
    技術文書は,高リスクAIシステムが本章に規定する要件に準拠していることを実証し,AIシステムがこれらの要件に準拠していることを評価するために必要なすべての情報を国家所轄官庁及び届出機関に提供するような方法で作成しなければならない。最低限,附属書IVに定める要素を含まなければならない。

  8. 附属書ⅡのA項に列挙した法律が適用される製品に関連する高リスクAIシステムが上市又は供 用開始される場合,附属書Ⅳに規定するすべての情報及びこれらの法律に基づいて要求される情報を含 む一つの技術文書を作成しなければならない。

  9. 欧州委員会は、技術的進歩に照らして、技術文書が本章に定める要求事項へのシステムの適合性を評価するために必要なすべての情報を提供することを確実にするため、必要に応じて附属書IVを改正する委任法を第73条に従って採択する権限を有する。
    第12条
    記録保持

  10. 高リスクAIシステムは,高リスクAIシステムの作動中に事象(「ログ」)を自動的に記録することを可能にする機能を備えて設計及び開発されなければならない。
    これらの記録機能は,公認の規格又は共通の仕様に適合しなければならない。

  11. ロギング機能は、システムの意図された目的に適切な、ライフサイクルを通じて AI システムの機能のトレーサビリティのレベルを確保するものとする。

  12. 特に,ロギング機能は,AIシステムが第65条(1)の意味におけるリスクを提示することになる,又は実質的な改変につながる可能性のある状況の発生に関して,高リスクAIシステムの動作の監視を可能にし,かつ,第61条にいう市販後の監視を容易にするものでなければならない。

  13. 附属書 III の第 1 項の(a)に言及する高リスクの AI システムについては,記録機能は,少 なくとも次のものを提供しなければならない:
    (a) システムの各使用期間の記録(各使用の開始日時及び終了日時);
    (b) 入力データがシステムによって照合された参照データベース;
    (c) 検索の結果、一致した入力データ;
    (d) 第14条(5)で言及されている、結果の検証に関与した自然人の識別。


規則
第10条 データ及びデータガバナンス 1. データによるAIモデルの学習を含む技術を利用する高リスクAIシステムは、そのようなデータセットが使用される場合は常に、第2項から第5項までに言及される品質基準を満たす学習、検証及びテストのデータセットに基づいて開発されなければならない。
2. トレーニング、検証及びテストのデータセットは、ハイリスクAIシステムの意図された目的に適したデータガバナンス及び管理慣行の対象とする。
これらの慣行は,特に次の事項に関係するものとする:
(a) 関連する設計の選択;
(b) データ収集プロセス及びデータの出所、個人データの場合はデータ収集の本来の目的;
(c) 注釈、ラベリング、クリーニング、更新、エンリッチメント、集計など、関連す るデータ準備処理作業;
(d) 前提条件、特にデータが測定し表すと想定される情報に関する前提条件の設定;
(e) 必要とされるデータセットの利用可能性、量及び適合性の評価;
(f) 特にデータのアウトプットが将来の業務のインプットに影響を及ぼす場合、人の健康や安全に影響を及ぼし、基本的権利に否定的な影響を及ぼし、または連邦法で禁止されている差別につながる可能性のあるバイアスの観点から検討すること;
(g) (f)に従って特定された偏りの可能性を検出、防止、緩和するための適切な措置;
(h) 本規則の遵守を妨げる、関連するデータのギャップや欠点の特定、及びそれらのギャップや欠点に対処する方法。

  1. 訓練、検証及び試験のデータセットは、適切で、十分に代表的で、可能な限り誤りがなく、意図され た目的に照らして完全なものでなければならない。これらのデータセットは,該当する場合,ハイリスク AI システムの使用が意図されている人又は人のグループに関しても,適切な統計的特性を有していなければならない。データセットのこれらの特性は、個々のデータセットのレベル又はそれらの組合せのレベルで満たすことができる。

  2. データセットは、意図された目的によって必要とされる範囲において、ハイリス ク AI システムが使用されることを意図する特定の地理的、文脈的、行動的又は機能的設定に特有 の特性又は要素を考慮しなければならない。

  3. 本条第(2)項第(f)号及び第(g)号に従って、高リスクAIシステムに関連する偏りの検出及び是正を確保する目的のために厳密に必要である限りにおいて、当該システムの提供者は、自然人の基本的権利及び自由に対する適切な保護措置に従うことを条件として、例外的に、特別なカテゴリの個人データを処理することができる。規則(EU)2016/679および(EU)2018/1725ならびに指令(EU)2016/680に定める規定に加え、当該処理が行われるためには、以下の条件をすべて満たさなければならない:
    (a) 合成データまたは匿名化データを含む他のデータを処理することによって、偏りの検出および修正を効果的に満たすことができないこと;

(b) 特別なカテゴリの個人データには、個人データの再利用に関する技術的制限、および仮名化を含む最先端のセキュリティおよびプライバシー保護措置が適用されること;
(c) 特別な種類の個人データは、処理された個人データが安全に保護され、悪用を避けるために厳重な管理とアクセスの文書化を含む適切な保護措置が講じられ、適切な守秘義務を持つ権限のある者のみが個人データにアクセスできることを保証する措置の対象となる;
(d) 特別カテゴリーの個人データは、他者に転送、転送、またはその他の方法でアクセスされないこと;
(e) 特別カテゴリーの個人データは、偏りが修正されるか、または個人データの保持期間が終了した時点のいずれか早い時点で削除されること;
(f) 規則(EU)2016/679および(EU)2018/1725ならびに指令(EU)2016/680に従った処理活動の記録には、特別カテゴリーの個人データの処理が偏りを検出し修正するために厳密に必要であった理由、およびその目的が他のデータの処理では達成できなかった理由が含まれる。
6. AIモデルの訓練を伴わない高リスクAIシステムの開発については、第2項から第5項がテストデータセットにのみ適用される。

第11条
技術文書

  1. 高リスクAIシステムの技術文書は,当該システムが上市され又は使用開始される前に作成され,かつ,常に最新の状態に維持されなければならない。
    技術文書は,高リスクAIシステムが本項に規定する要件に適合していることを実証し,AIシステムがこれらの要件に適合していることを評価するために必要な情報を明確かつ包括的な形で国家所轄官庁及び届出機関に提供するような方法で作成しなければならない。AIシステムには,最低限,附属書IVに定める要素を含まなければならない。新興企業を含む中小企業は、附属書IVに規定された技術文書の要素を簡易な方法で提供することができる。そのため、欧州委員会は、小規模・零細企業のニーズを対象とした簡易な技術文書の書式を定めるものとする。新興企業を含む中小企業が附属書IVで要求される情報を簡易な方法で提供することを選択した場合、その中小企業は本項で言及された書式を使用しなければならない。ノーティファイドボディ は,適合性評価の目的のためにその様式を受け入れなければならない。

  2. 附属書 I のセクション A に列挙された連合ハーモナイゼーション法令の対象となる製品に関連する高リスク AI システムが上市又は使用開始される場合,これらの法令に基づき要求される情報だけでなく,第 1 項に定めるすべての情報を含む一式の技術文書を作成しなければならない。

  3. 欧州委員会は、技術的進歩に照らして、技術文書が本項に定める要求事項へのシステムの適合性を評価するために必要なすべての情報を提供することを確実にするために、必要に応じて附属書IVを改正するため、第97条に従って委任法を採択する権限を有する。
    第12条
    記録保持

  4. 高リスク AI システムは,技術的に,システムの耐用年数にわたる事象(ログ)の自動 記録を可能にしなければならない。

  5. システムの意図された目的に適切な高リスクAIシステムの機能のトレーサビリティのレベルを確保するため,ロギング機能は,次に関連する事象の記録を可能にしなければならない:
    (a) 高リスクAIシステムが第79条(1)の意味におけるリスクをもたらすか,又は実質的な改変をもたらす可能性のある状況を特定すること;
    (b) 第72条に規定する市販後監視を容易にすること;及び (c) 第26条(5)に規定する高リスクAIシステムの運用を監視すること。

  6. 附属書IIIの1(a)に言及する高リスクのAIシステムについては,最低限,記録機能を提供しなければならない:
    (a) システムの各使用期間の記録(各使用の開始日時及び終了日時);

(b) 入力データがシステムによって照合された参照データベース;
(c) 検索の結果、一致した入力データ;
(d) 第14条(5)で言及されている、結果の検証に関与した自然人の識別。

この記事が気に入ったらサポートをしてみませんか?