見出し画像

【動画紹介】AWS Clean Rooms【AWS Black Belt】

今回はAWS JapanさんがYoutube上に公開している学習コンテンツ「AWS Black Belt」についての動画から学習します。今回はデーターコラボレーションサービスの「AWS Clean Rooms」です。

<動画>

0:00 AWS Black Belt Online セミナーとは

AWS Black Belt Online セミナーとは
・「サービス別」「ソリューション別」「業種別」のテーマに分け提供
・AWS Japanが提供、AWSの技術担当者がテーマごとに動画を公開

【スピーカー】
鈴⽊ 康⼠郎さん
AWS Technology Partnership SaaS,
Pertner Solution Architect

アマゾン ウェブ サービス ジャパン合同会社 技術統括本部 インターネットメディア ソリューション部 ソリューション アーキテクト

1:08 受講対象者


• データクリーンルームの技術要素をキャッチアップしたい⽅
• 機密性の⾼いデータのグループ間、企業間共有に課題を抱えている⽅
• AWS を利⽤したデータコラボレーションを運⽤設計を検討されている⽅
• AWS を利⽤したデータ活⽤に興味がある⽅

1:36 アジェンダ


1. データ共有の価値と課題
2. AWS Clean Rooms の機能
3. AWS Clean Rooms の利⽤⽅法・パターン
4. AWS 他サービスとの連携
5. 料⾦・注意点
6. まとめ

2:08 データ共有の価値と課題

顧客パーソナライズのために幅広いパートナーとのデーターコラボレーションを検討しているが、さまざまな課題に直面


増え続ける顧客動向
・増え続けるタッチポイント やチャネルの膨大な行動データが必要
・今後5年間の行動データの量は、過去に作成されたデータの2 倍以上

データ断片化とデータサイロ
・⾏動データは業界全体に断⽚化
・多くの顧客インサイ トを得るために各企業がデータを組み合わせる試み
・運⽤性と拡張性の課題

顧客データ保護
・データ の収集・保存・使用をより適切にセキュリティを担保して管理

背景

数回のクリックだけで独自のクリーンルームを作成
簡単にデータコラボレーションを実現
・ローデータを直接使用することがない
・AWS上の何十万の企業とコラボレーション
・コラボレーションを安全に実施しインサイドの導出を実現
・幅広いアクセス制御で基礎データを保護
・柔軟性に飛んだ分析ルールで多様なクエリを実現

マルチパーティのコラボレーション
・コンソール上から簡単にコラボレーションという単位を作る
・コラボレーションに参加企業を招き入れる
AWS上でのデータ移動は不要
・S3上の見せたいデータのみアクセスを許可して公開
クエリ制御とその実装
・分析ルールによりデータ分析の種別を制限
暗号コンピューティング
・データを事前に暗号化
・暗号化された状態で利用
プログラム化されたアクセス
・API経由で使用できる
・機能の自動化やアプリケーションからの利用が可能

6:47 AWS Clean Rooms の機能


AWS Clean Roomsの仕組み

AWS Clean Roomsの仕組み

・「コラボレーション」という単位でデータの結合を行う
・「コラボレーション」にメンバーを招待する
・各メンバーが分析ルールを設定したデータを関連付ける
・分析ルールでクエリの制限を加え安全に共有できる
・この際にデータの移動、コピーが発生しない
・アクセス制限を変えるときは分析ルールを変更する
 ⇒ガバナンスをデータ保有者が保持
・結果がS3上に出力
・データの出力制限など、セグメントルールも管理できる

詳細について

ワークフローの流れ

・コラボレーションオーナーは1名または複数のメンバー
・メンバー(AWSアカウント)を招待する
・権限はコラボレーションの作成時に割り当てる
・参加するメンバーはメンバーシップリソースを作成し参加
・既存リソースからセットアップ済みテーブルを用意、紐付ける
・暗号化を事前に行ってから紐付けることも可能
・バックグラウンドでGlueテーブルやS3が付与される
・分析ルールを設定して付与する
・メンバーは設定されたテーブルに対してクエリーを実行
・分析ルールに適合した結果のみを出力
・結果に対してAWSサービスを使った利用ができる

コラボレーション

コラボレーション

・データコラボレーションにおける安全な論理境界
・作成時にメンバーの招待と役割、ログ出⼒の有無を指定
・クエリ実⾏可能なメンバーが 1 アカウント
・ クエリ結果受け取りメンバーが 1 アカウント
・他はデータ提供者で構成
・コラボレーションあたり最⼤ 5 アカウントが参加可能

コラボレーションメンバー

コラボレーションメンバー

・招待されたコラボレーションにメンバーシップを作成
・各メンバーのリソースはメンバーの任意タイミングで削除・追加
・メンバーシップ種別
 クエリ&データ提供
 クエリ結果受取&データ提供
 データ提供のみ

メンバーシップ種別

・メンバーシップの受け取りは「参加可能タブ」より確認

データーセット

データーセット

・Glueデータカタログに登録されているテーブルを利用
・S3データが利用可能
・Rowデータを安全にコラボレーション可能に

分析ルール

設定済みテーブルと分析ルール

・自分のGlueカタログ内テーブルをコラボレーションに提供
・列レベルの制御
・分析ルールをつけて初めて利用できるようになる
・設定済みテーブルは復数のコラボレーションに紐づけできる

3つの分析ルール

3つの分析ルール

集約タイプ

分析ルール(集約タイプ)

・集約関数での結果のみ得られる
・集約関数コントロール、結合コントロール
・個人の特定を避ける
・行データは得られない

リストタイプ

分析ルール(リストタイプ)

・インナージョインが強制される
・行データを結果として得られる

カスタムタイプ

分析ルール(カスタムタイプ)

・分析テンプレートが適用される
・分析テンプレートで事前にカスタムクエリを作成
・作成は誰でも可、実行はクエリ実行権限を持つメンバーのみ
・データ所有者にレビューが飛び許諾されて実行される

保護クエリ

・APIからの実行方法が可能

APIからの実行方法

保護クエリ(サポートSQL関数)

保護クエリ(サポートSQL関数)

ログ出力
・クエリのログを出力可能

ログ出力

暗号化コンピューティング
・メンバー間での事前の秘密鍵共有が前提
・保護クエリで保管、転送、処理中を通じて暗号化された状態に
・EtoE全てで暗号化を実行
・オンプレ環境からのアクセスはAWS PrivateLink対応も可能

暗号化コンピューティング

27:16 AWS Clean Rooms の利用方法・パターン

ユースケース(基本)
・メールアドレスでデータをJoin
・提供元のデータから自社のデータに関係のあるデータだけを抽出

ユースケース(基本)

グループ内連携
・グループ企業が保持している情報をセキュリティ高く共有
・コンプライアンスを遵守した状態

グループ内連携

業務提携
・相互にコンプライアンスを遵守しながらデータを提供・取得
・コラボレーションを2つ作成

業務提携

29:08 AWS 他サービスとの連携

・他のアナリティクスサービスとの連携がしやすい
・S3を介してデータを提供するDataProducers側のパターン
・S3を介してデータを活用するDataConsumers側のパターン

アナリティクスサービス連携

DataProducers側
・AWS Glueを利用してオリジナルデータソースからデータを抽出
 Glueデータカタログの更新とあわせてS3バケットに配置

DataProducers側

DataConsumers側
・AWS APIで保護クエリを実行
 結果ファイルはGlueJobでファイル分割やデータカタログ登録

DataConsumers側

31:46 料金・注意点

CRPU (Clean Rooms Processing Unit) を単位とした ⾃アカウントのクエリ実⾏でのコンピューティング能⼒に基づく料⾦
・分析ルールで料金が異なる
・関連サービスの料金もかかる
・コラボレーションに参加、データ提供だけでは料金が発生しない

サービス料金

主なクォータ
・不正利用や意図しない利用の制限のため
・増やす場合はマネジメントコンソールから上限緩和申請

主なクォータ

33:42 まとめ

・AWS Clean Rooms ムの構築についてサービス概要と機能
・機コラボレーションする為の暗号化や分析ルールの機能詳細
・ 具体的な利⽤パターン、他サービスとの連携

<資料>

https://pages.awscloud.com/rs/112-TZM-766/images/AWS-Black-Belt_2023_AWS-Clean-Rooms_0930_v1.pdf



この記事が気に入ったらサポートをしてみませんか?