見出し画像

【実践AIガバナンス(2024/4/6)】ケース検討「Case01. デジタルMATSUMOTO」④コントロールコーディネーション(リスクシナリオ「R010.権利侵害」の場合)

シン・リスクチェーンモデルを用いたケース検討シリーズです。
前回に続いて、ケース「デジタルMATSUMOTOによる考察記事の配信」を対象にAIサービスに関わる重要なリスクシナリオのリスク対策を検討していきます(コントロール・コーディネーション)。
シン・リスクチェーンモデルのアプローチはこちらの記事をご覧ください。

前回までの振り返り(パーパス&リスクアセスメント)

前回まで、AIサービスに関わるパーパスとリスクシナリオを検討しました。

Step6. 重要なリスクシナリオごとにリスクチェーン(リスク要因の関係性)の検討

検討対象のリスクシナリオ

今回検討するリスクシナリオは以下になります。

R010.権利侵害(Very High): 
個人情報や機微情報が入力され、出力結果にも含まれて外部に配信される
・影響するパーパス:P004.サービスとしての信頼性
・影響するステークホルダー:専門家本人、第三者
・影響度:4.回復困難
・影響範囲:4.社会全体
・持続性:4.永久的
・発生確率:3.日次以下(不確実)

検討対象のリスクシナリオ

デジタルMATSUMOTOのシミュレーション

前回に続いて、デジタルMATSUMOTOに以下のプロンプトテンプレートで指示を与えて、リスクシナリオへの対策を識別します。(ChatGPTやClaudeでも同じようにできますので、良ければ試してみてください)。

以下のAIサービスについて識別された下記のリスクシナリオについて、技術・非技術を組み合わせたリスクへの対策を水平思考・コンテキスト思考・システム思考を用いて網羅的に検討してください。
※夫々の対策に簡潔な「対策名」をつけてもらい、「対策の順番」「対策名」「内容」「対策実施者」「予防・発見・対応の区分」「技術・非技術の区分」を表形式に整理してください。

【リスクシナリオ】
R010.権利侵害: 個人情報や機微情報が入力され、出力結果にも含まれて外部に配信される

===

【パーパス】
P001.価値ある考察の継続提供: 読み手に新たな視点・気づきを与える考察が継続的に提供される
P002.信頼できる情報発信: 事実に反することなく合理的な内容の考察が配信される
P003.デジタルツインの活用促進: デジタルツインAIとして、記事配信に限らずに様々な用途に活用される
P004.サービスとしての信頼性: 法・倫理に準拠し、特定のステークホルダーに不利益を与えない

===

【ステークホルダー】
専門家本人、AIサービスの開発者、エンドユーザー、サービス提供者、研究コミュニティ、データプロバイダー、法律・倫理の専門家、技術提供者

===

【AIサービスの内容】
デジタルMATSUMOTO
・「あるAIガバナンスの専門家を対象としたデジタルツイン」として、様々なトピックについて対象の専門家のような考察(1000文字程度)を生成するAIサービスである。
・AIモデルは大規模言語モデル(LLM)がベースとなっている。
・専門家のパーソナリティ・経歴・趣味等をタグ形式で構造化した情報をシステムプロンプトに設定している。
・考察したいトピックについて5行程度の簡単な箇条書きのテキストを作成し、AIサービスへインプットする。
・トピックはAIに限定されず、幅広いトピックが扱われる。
・専門家が過去に作成した文献やウェビナーでの発言メモ等をRAGアーキテクチャの知識データとして蓄積しており、インプットされたテキストと関連の強い知識データを参照して、日本語で考察を生成する。
・生成された考察は、必要に応じて専門家によって追記・修正が行われ、専門家自身のコンサルティング業務や研究活動等に活用される。また一部の考察はnote記事で公開される。
・専門家本人が「自らの知識として採用する」と判断した考察は新たに知識データに追加され、次回以降の考察生成時に活用される。

デジタルMATSUMOTOへの入力プロンプト

ここでも入力プロンプトのところで「水平思考・コンテキスト思考・システム思考を用いて」と思考方法を設定しています。
※こちらのnoteを元に色々な思考方法を試しています。

以下のようなリスク対策(コントロール)が識別されました。
出力結果をスプレッドシートに貼り付けしています。

デジタルMATSUMOTOの出力結果

次にリスクチェーンを引きながら内容を具体化していきます。

リアルチェーンを引く

デジタルMATSUMOTOが検討してくれたリスク対策を、リスクチェーンモデルの構成要素にプロットしてみます。
構成要素の内容等はこちらの記事を参考にしてください。

デジタルMATSUMOTOが認識したコントロールを以下のように構成要素にマッピングしています。

リスクシナリオ「R010.権利侵害」に対するコントロールの検討
(デジタルMATSUMOTOの検討直後)

コントロールを掛ける順番を以下のように検討していきます。
1. 予防策:事前に対策しておくこと(初期開発時含む)
2. 発見策:AIサービスの利用時に対策すること
3. 対応策:事後に対応すること

このケースでは「①プライバシー保護プロトコル」を最初のコントロールとして、他のコントロールも順番にリスクチェーン(赤い矢印)で接続しています。
諸々記述を具体化しているのですが、「③コンテンツフィルタリング」「⑥専門家のレビュー」「⑥AIモデルの監査」「⑧ユーザーフィードバック」「⑦内容の修正」「⑧ユーザーの連絡窓口」は先に検討しているリスクシナリオ「R005.不適切な表現」と共通したコントロールは同じ表記にしています。

リスクシナリオ「R010.権利侵害」に対するコントロールの検討
(編集中の画面:認識されたコントロールを紐づけ)

次に、必要と思われるコントロールをリスクチェーンに加えています。
・【AIシステム】[Accuracy] 開発・アップデート時に一応問題ないか確認
・【AIシステム】[Traceability] AIの出力結果と関連情報を記録(ログ保存)
・【サービス提供者】[Transparency] 人間がレビュー済であることの表示

リスクシナリオ「R010.権利侵害」に対するコントロールの検討
(編集中の画面:コントロールを追加)

最終的には以下のようなリスクチェーンになりました。

リスクシナリオ「R010.権利侵害」に対するコントロールの検討
(確定版)

1. 予防策:事前に対策しておくこと(初期開発時等)
①【サービス提供者】[Privacy] 倫理ガイドラインの遵守(プライバシー保護)
②【サービス提供者】[Accountability] 定期的なリスクアセスメント
③【サービス提供者】[Accountability] プライバシー及び機微情報の留意点の理解
④【AIシステム】[Data Quality] 個人情報や機微情報を学習データや入力に含めない
⑤【AIモデル】[Accuracy] 開発時に出力される表現のレビュー

2. 発見策:AIサービスの利用時に対策すること
⑥【AIシステム】[Process Integrity] コンテンツフィルタリング
⑦【AIシステム】[Traceability] AIの出力結果と関連情報を記録(ログ保存)
⑧【サービス提供者】[Auditability] AIの出力を専門家がレビュー
⑨【サービス提供者】[Transparency] 「専門家がレビュー済」と表示(いわゆる透明性の表示)

3. 対応策:事後に対応すること
⑩【サービス提供者】[Safety] 不適切な表現を修正
⑪【ユーザー】[Self-Defense] 不適切な表現があればフィードバック
⑫【サービス提供者】[Correspondence] 外部からの連絡方法を用意
⑬【サービス提供者】[Auditability] AIモデルの出力をレビュー
→ 修正があれば⑩に

Step7. リスクコントロールに具体的な手段を設定

先程検討したリスクチェーンを元にして、具体的なコントロールを検討していきます。

リスクチェーンに沿ったコントロールの具体化

この過程は人間で実施しますが、ここは企業が元々持っているソリューションやツールを活用してもらえればと思います。
最終的な一覧は以下になります(コントロール名を修正しています)。

リスクシナリオ「R010.権利侵害」に対するリスクコントロールの一覧

一部実際に行っている対策を紹介していきます。

具体的なコントロール:運営ポリシー

デジタルMATSUMOTOの運営にあたるポリシーを定めています。
①【サービス提供者】[Privacy] 倫理ガイドラインの遵守(プライバシー保護)

具体的なコントロール:エシカルチェック

前回も登場したエシカルチェックですが、個人情報や機密情報が含まれているような文章に対して注意喚起してくれます。
⑥【AIシステム】[Process Integrity] コンテンツフィルタリング

以下は最近Streamlitで作成したデジタルMATSUMOTOのシミュレータなのですが、例えば以下のようなプライバシーに関わる文章を入力すると「機密情報の漏洩」が反応してくれます。

デジタルMATSUMOTOの実行結果(Streamlit版)

もう一例、今度は営業機密のような入力をすると「機密情報の漏洩」5かつ「違法な内容」と認識してくれました

デジタルMATSUMOTOの実行結果(Streamlit版)

具体的なコントロール:透明性の表示

以下については、前回と同じく透明性の表示に関わる内容です。
⑨【サービス提供者】[Transparency] 「専門家がレビュー済」と表示(いわゆる透明性の表示)

note記事の中で「MATSUMOTO間の比較検証」としてリアル松本の論点と比較検討し、考察確定版としてレビュー済の考察を載せています。
実際の表現は個別の考察記事をご覧ください。

次回は、個別に検討したリスクコントロールをサマリーしてステークホルダー毎の役割を整理し、デジタルMATSUMOTOを対象としたシン・リスクチェーンモデルのケース検討を締めくくろうと思います。

デジタルMATSUMOTOに搭載したDALLE-3のAPIで作成しました

この記事が気に入ったらサポートをしてみませんか?