AWS Clean Rooms のよくある質問

全般

AWS Clean Rooms は、お客様とお客様のパートナーが、集合的データセットの分析とコラボレーションを簡単に行い、元になるデータを互いに公開することなく新たなインサイトを入手できます。自身のクリーンルームを数分で作成し、パートナーとのデータセット集合の分析を数ステップで開始することができます。AWS Clean Rooms を使えば、既に AWS を使用している何十万もの企業とすぐにコラボレーションができます。AWS 環境の外部にデータを移動したり、別のプラットフォームにアップロードしたりする必要はありません。

AWS マネジメントコンソールから、実行したい分析の種類、コラボレーションしたいパートナー、コラボレーションに貢献したいデータセットを選択できます。AWS Clean Rooms では、SQL クエリと機械学習の 2 種類の分析を実行できます。

SQL クエリを実行すると、AWS Clean Rooms が、その所在場所からデータを読み取り、組み込みの柔軟な分析ルールを適用するので、データに対する制御を維持できます。AWS Clean Rooms は、各クリーンルーム参加者が実行するクエリに対する制限をカスタマイズできる、クエリコントロール、クエリ出力制限、およびクエリログを含むプライバシー強化 SQL 制御の幅広いセットを提供します。カスタム分析ルールを選択し、差分プライバシーパラメータを設定することで、AWS Clean Rooms Differential Privacy を使用できます。Differential Privacy では、数学的に裏付けられた直感的なコントロールを数クリックで行うことができるため、ユーザーのプライバシーを保護できます。また、Cryptographic Computing for Clean Rooms (C3R) は、SQL 分析中に機密データを暗号化しておくのに役立ちます。

AWS Clean Rooms ML により、お客様とパートナーは未加工データを相互に共有することなく、プライバシーが強化された機械学習 (ML) を適用して、予測的なインサイトを生成できます。AWS Clean Rooms ML Lookalike モデルを使用すると、データを使って独自のカスタムモデルをトレーニングし、パートナーには少量のレコードサンプルをコラボレーションに持ち込んでもらうことができます。これによりパートナーの基盤となるデータも保護しながら、類似レコードの拡張セットを生成することができます。医療モデリングは、今後数か月以内に利用できるようになります。

e コマースやストリーミング動画などのさまざまなデータセットで構築され、テストされている AWS Clean Rooms ML は、類似モデリングの精度を、代表的な業界ベースラインと比較して最大 36% 向上させることができます。新規顧客の開拓などの実際のアプリケーションでは、この精度の向上は数百万ドルの節約につながります。

AWS Clean Rooms のコラボレーションは、コラボレーションメンバーがパートナーと未加工データを共有することなく SQL クエリを実行して ML モデリングを実行できる、安全な論理境界です。コラボレーションに招待された企業のみがコラボレーションに参加できます。複数の参加者がデータをコラボレーションに提供し、1 人のメンバーが結果を得るということができます。招待された企業のみが AWS Clean Rooms のコラボレーションに参加できます。

AWS マネジメントコンソールまたは API オペレーションを使用してクリーンルームのコラボレーションを作成し、コラボレーションを行う企業を招待します。またコラボレーション内で各参加者が何を行えるかを選択します。その後、参加者は構造化データをクエリする方法に関するルールを設定し、データを利用して ML モデルをトレーニングできます。データセットは参加者のアカウントからコピーされず、必要なときにアクセスされるだけです。AWS Clean Rooms では、実行する分析のタイプ (SQL クエリと AWS Clean Rooms ML を使用した ML モデリング) を選択できます。SQL クエリを使用する場合、ノーコード分析ビルダー、AWS Clean Rooms Differential Privacy、暗号コンピューティングなどの追加機能も使用できます。コラボレーション参加者がデータまたはモデルをコラボレーションに関連付けて分析を実行すると、コラボレーションの出力は指定された Amazon Simple Storage Service (Amazon S3) バケットに保存されます。

AWS Clean Rooms では、コラボレーション当たり最大 5 名の参加者をサポートしています。

AWS Clean Rooms コラボレーションに誰が参加できるか、コラボレーションを誰が作成できるか、誰がコラボレーションのための招待に参加できるかをお客様が管理します。誰が参加しているかについては、コラボレーションの参加者同士で見ることができます。また、コラボレーション作成後に新しいアカウントを追加することはできません。ただし、必要に応じて、異なるお客様やパートナーによる新規のコラボレーションを設定できます。ユーザーは、自らのコンテンツに対するアクセスを確立および設定するとともに、自らが制御するユーザー、グループ、許可、認証情報を通じて、AWS サービスおよびリソースに対するアクセスを設定します。

お客様は、基盤となるデータを共有または公開することなく、SQL または AWS Clean Rooms ML モデリングを使用して、パートナーとの集合的なデータセットに関するインサイトを生成できます。

SQL を使用して複数のコラボレーション参加者がデータを提供できますが、SQL クエリを実行して結果を受け取ることができるのは参加者 1 名のみです。コラボレーションに参加すると、コラボレーション参加者は、どの当事者がクエリを実行し、どの当事者が結果を受け取り、どの当事者がコンピューティング料金を負担するかについて合意します。そのコラボレーションに招待した人だけが、設定した分析ルールに基づいてインサイトを得ることができます。AWS Clean Rooms コラボレーションを設定する場合、ユースケースに合わせて、コラボレーションメンバーごとに何が行えるかを指定できます。例えば、クエリ出力を別のメンバーに送る場合は、あるメンバーをクエリを記述できるクエリ実行者として指定し、別のメンバーを結果を受け取ることができるクエリ結果レシーバーとして指定できます。これにより、コラボレーションの作成者は、クエリを実行できるメンバーがクエリ結果にアクセスできないようにすることができます。

AWS Clean Rooms ML では、コラボレーション参加者がパートナーから類似セグメントを検索するための基準となるレコードのサンプルセットを持ち込みます。相手方の方が人口が多く、サンプルレコードとの類似性に基づいて類似セグメントを生成します。AWS Clean Rooms ML は、出力された類似セグメントを、類似セグメントの派生元となる人口が多い方の参加者が指定した送信先に送信します。

AWS Entity Resolution は AWS Clean Rooms にネイティブに統合されています。ルールベースまたはデータサービスプロバイダーベースの照合を使用して、プライバシーが強化された AWS Clean Rooms コラボレーション内で、使用することを選択した任意の共通キー (仮名化された識別子など) を使用してユーザーデータを準備、照合、およびパートナーのデータに関連付けることができます。

AWS Clean Rooms は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、欧州 (ストックホルム) で利用可能です。

AWS Clean Rooms では、柔軟な SQL 分析ルールとプライバシーを強化する ML を使用してビジネスニーズを満たすことができます。SQL 分析を使用する場合、コラボレーションで実行される SQL クエリのコンピューティング性能についての料金を支払うコラボレーション参加者を柔軟に選択できます。クリーンルーム処理ユニット (CRPU)-時間に基づいて 1 秒単位で課金されます (60 秒間の最低料金あり)。AWS Clean Rooms ML を利用する場合、1,000 件のプロファイルあたりの料金に基づいて、リクエストしたモデルトレーニングと作成された類似セグメントについての料金のみをお支払いいただきます。詳細については、「AWS Clean Roomsの料金」を参照してください。

AWS Clean Rooms の AWS Entity Resolution では、プロバイダーデータセット (LiveRamp など) を活用したルールベースまたはデータサービスプロバイダーベースの照合を使用できます。

ルールベースの照合を使用する場合、コラボレーションの少なくとも 1 人のメンバーがパートナーのデータセットと照合する前にデータを準備する必要があります。ただし、コラボレーションの作成または参加前に AWS Entity Resolution を使用してデータを準備している場合を除きます。このメンバーは、利用した場合のみデータ準備料金を負担します。コラボレーションに参加しているメンバーなら誰でも、データ照合料金を支払うことができます。また、データ照合にはコラボレーションごとに 1 回限りの料金が必要で、この料金はデータ照合の費用を支払うすべてのコラボレーション参加者に割り当てられます。

データサービスプロバイダーベースの照合を使用する場合、プロバイダー ID を使用してデータを準備するには、すべてのコラボレーションメンバーがプロバイダーサブスクリプションを取得している必要があります。すべてのコラボレーションメンバーは、パートナーのデータセットと照合する前にプロバイダー ID を使用してデータを準備する必要があります。ただし、コラボレーションの作成または参加前に AWS Entity Resolution を使用してデータを準備している場合を除きます。コラボレーションに参加しているメンバーなら誰でも、プロバイダーの ID を使用してデータ照合料金を支払うことができます。さらに、データ照合料金を支払うメンバーは、プロバイダー契約を結んでいる必要があります。AWS Data Exchange (ADX) にリストされているパブリックサブスクリプションを使用することも、任意のデータサービスプロバイダーからプライベートサブスクリプションを直接購入して、ADX に対する Bring Your Own Subscription (BYOS) を使用することもできます。 

詳細については、「AWS Clean Rooms の AWS Entity Resolution 料金」を参照してください。

AWS Clean Rooms ML

AWS Clean Rooms ML は、お客様とパートナーが機密情報を互いに共有することなく、集合データに ML モデルを適用して予測的なインサイトの可能性を引き出すのに役立ちます。この AWS Clean Rooms 機能により、パートナーをクリーンルームに招待し、AWS が管理するすぐに使用できる ML モデルを適用できます。このモデルは、各コラボレーションで数ステップで類似データセットを生成するようにトレーニングされているため、独自のモデルを構築、トレーニング、調整、デプロイするために数か月間かけて開発作業に取り組む必要がありません。

AWS Clean Rooms ML は、複数のユースケースでお客様をサポートします。例えば、航空会社は顧客に関するデータを利用したり、オンライン予約サービスと連携したりできるほか、類似の特徴を備えた見込み旅行者を特定することもできます。自動車のリース会社や保険会社は、一連の既存のリース所有者と同じような特徴を持つ自動車保険の見込み客を特定できます。ブランドや出版社は市場内の顧客の類似セグメントをモデル化して、関連性の高い広告エクスペリエンスを提供できます。基盤となるデータを他者と共有する必要はありません。医療モデリングは、今後数か月以内に利用できるようになります。

e コマースやストリーミング動画などのさまざまなデータセットで構築およびテストされている AWS Clean Rooms の ML は、類似モデリングの精度を、代表的な業界ベースラインと比較して最大 36% 向上させるのに役立ちます。新規顧客のプロスペクティング活動などの実際の適用場面では、この精度の改善は、数百万 USD のコスト削減につながる場合があります。

AWS Clean Rooms ML のルックアライクモデリングを使用すると、データを利用して独自のカスタムモデルをトレーニングしたり、パートナーにレコードの小さなサンプルをコラボレーションに持ち込んでもらったりして、お客様とパートナーの基盤となるデータを保護しながら、類似レコードの拡張セットを生成できます。AWS Clean Rooms ML は、ある参加者から少量のレコードのサンプルを取得し、さらに大量のレコードセット、または別のコラボレーション参加者のデータセットから類似セグメントを見つけます。AWS Clean Rooms ML はどちらの参加者ともデータを共有しないため、当事者はいつでもデータを削除したり、カスタムモデルを削除したりできます。結果として得られる類似セグメントの希望のサイズを指定すると、AWS Clean Rooms ML は、サンプルリスト内の固有のプロファイルを、パートナーのデータセット内のプロファイルとプライベートに照合し、コラボレーション参加者のデータセット内の各プロファイルが自らのサンプル内のプロファイルとどの程度類似しているかを予測する ML モデルをトレーニングできます。AWS Clean Rooms ML は、サンプルリストに類似したプロファイルを自動的にグループ化し、結果の類似セグメントを出力します。AWS Clean Rooms ML では、パートナーと共に ML モデルを構築、トレーニング、デプロイする場合でもデータを共有する必要がないのです。AWS Clean Rooms ML では、データはお客様のモデルのトレーニングにのみ使用されます。AWS モデルのトレーニングに使用されることはありません。モデルの予測結果の調整には直感的なコントロールを使用できます。

セキュリティとデータ保護

データ保護は AWS のセキュリティ基盤から始まり、AWS Clean Rooms は AWS Identity and Access Management (IAM)、AWS Key Management Service (AWS KMS)、AWS CloudTrail などの AWS セキュリティサービスに基づいて構築されています。これにより、既存のデータ保護戦略をデータコラボレーションのワークロードにまで拡張できます。AWS Clean Rooms を使用すると、AWS 環境の外部にデータのコピーを保持しておき、他の団体に送信して、消費者のインサイト、マーケティングの測定、予測、リスク評価のために分析を実行する必要がなくなります。

AWS Clean Rooms コラボレーションを設定し、SQL 分析を使用する場合、ユースケースに合わせて、コラボレーションメンバーごとに何が行えるかを指定できます。例えば、クエリの出力を別のメンバーに送る場合は、あるメンバーをクエリを記述できるクエリ実行者として指定し、別のメンバーを結果を受け取ることができるクエリ結果レシーバーとして指定できます。これにより、コラボレーションの作成者は、クエリを実行できるメンバーがクエリ結果にアクセスできないようにすることができます。

AWS Clean Rooms には SQL クエリコントロールもあり、分析ルール設定により、データテーブルで実行するクエリの種類や特定のクエリを制限できます。AWS Clean Rooms は、集計、リスト、カスタムの 3 種類の SQL 分析ルールをサポートします。集計分析ルールを使用すると、集計による統計 (キャンペーン測定やアトリビューションなど) を生成するクエリのみを許可するようにテーブルを設定できます。リスト分析ルールを使用すると、お客様のデータセットと、クエリを実行可能なメンバーのデータセットとの関係の分析のみをクエリで実行するように制御を設定できます。カスタム分析ルールを使用すると、特定のアカウントまたはクエリをデータセットで実行できるようにクエリレベルの制御を設定できます。カスタム分析ルールを使用する場合、Differential Privacy の使用を選択できます。AWS Clean Rooms Differential Privacy は、数学的に裏付けられた直感的なコントロールをわずか数クリックで実装できるため、ユーザーのプライバシーを保護するのに役立ちます。AWS Clean Rooms のフルマネージド機能であるため、ユーザーの再識別を防ぐために、事前の差分プライバシーの経験は必要ありません。もう 1 つのコントロールは、集約のしきい値です。これにより、クエリが再識別できる可能性のある小さなグループに絞り込まれることを回避できます。

AWS Clean Rooms ML では、データはお客様のモデルのトレーニングにのみ使用されます。AWS モデルのトレーニングに使用されることはありません。AWS Clean Rooms ML は、どの会社のトレーニングデータや類似セグメントデータも他の企業と併用しないため、モデルやトレーニングデータはいつでも削除できます。

いいえ。データセットはコラボレーション参加者の AWS アカウントに保存されます。AWS Clean Rooms は、クエリの実行、レコードの照合、ML モデルのトレーニング、シードセグメントの拡張を実行するために、コラボレーション参加者のアカウントから一時的にデータを読み取ります。分析の結果は、分析用に設計された S3 ロケーションに送信されます。

AWS Clean Rooms の AWS Entity Resolution は、コラボレーションにおける各当事者の識別子をマッピングするデータセットを生成します。マッピングデータセットは AWS Clean Rooms によって管理されます。コラボレーションのメンバーは、マッピングテーブルを表示またはダウンロードできません。コラボレーションのすべてのメンバーがこのプライバシーの適用を緩和することに同意した場合、特定のユースケースについてマッピングテーブルにクエリを実行できます。どちらの当事者も、いつでもテーブルを削除できます。

AWS Clean Rooms ML によって生成されたモデルは、サービスによって保存され、お客様が管理する AWS KMS キーで暗号化できます。また、お客様はいつでも削除できます。

AWS Clean Rooms の暗号化と分析ルールでは、共有する情報の種類を詳細に管理することができます。データのコラボレーション参加者は、あらゆるデータプライバシー関連法令を確実に遵守するため、再特定のリスクなどの各コラボレーションにおけるリスクを評価し、独自の追加的なデューデリジェンスを実施する責任を負います。機密性が高いデータや規制対象データを共有する場合は、適切な法的合意を取り、監査体制を導入して、プライバシーのリスクをさらに低減することをお勧めします。

はい。AWS サービス規約では、AWS Clean Rooms でのコラボレーションについて、一部のユースケースが禁止されています。

はい。AWS HIPAA コンプライアンスプログラムには、AWS Clean Rooms が HIPAA 対応サービスとして含まれています。AWS と事業提携契約 (BAA) を締結している場合、AWS Clean Rooms を利用して HIPAA 準拠のコラボレーションを作成できるようになりました。BAA を締結していない場合、またはお使いの HIPAA 準拠アプリケーションへの AWS の使用に関してご質問がある場合は、詳細をお問い合わせください。詳細については、「AWS の HIPAA コンプライアンス」と「ヘルスケアとライフサイエンスのための AWS」を参照してください。

SQL 分析

SQL 分析ルールでは、列レベルの制御を設定できます。これはクエリで各列をどのように使用するかを定義するのに役立ちます。例えば、集計の統計 (SUM(料金) など) を計算するために使用する列や、他のコラボレーションメンバーとテーブルを連結するために使用する列を指定できます。集計分析ルールでは、各出力行が満たす必要がある最小集計しきい値を定義することもできます。最小しきい値に達しない行は、AWS Clean Rooms で自動的に除外されます。

はい。AWS Clean Rooms で、Amazon CloudWatch Logs にクエリログを発行するように設定できます。カスタム分析ルールを使用すると、コラボレーションで実行する前に (分析テンプレートに保存されている) クエリをレビューすることもできます。 

AWS Clean Rooms Differential Privacy

差分プライバシーは、データプライバシー保護に役立つ数学的に証明されたフレームワークです。差分プライバシーの背後にある主な利点は、分析対象のデータセット内の特定の個人の有無を不明瞭にするため、制御された量のランダム性 (ノイズ) を追加することで、個人レベルでデータを保護できることです。

AWS Clean Rooms Differential Privacy は、数学的に裏付けられた直感的なコントロールをわずか数クリックで実装できるため、ユーザーのプライバシーを保護するのに役立ちます。AWS Clean Rooms のフルマネージド機能であるため、ユーザーの再識別を防ぐために、事前の差分プライバシーの経験は必要ありません。AWS Clean Rooms Differential Privacy は、コラボレーションにおける集約的なインサイトの生成における個人のデータの寄与をわかりにくくします。これにより、幅広い SQL クエリを実行して、広告キャンペーン、投資の決定、臨床研究などに関するインサイトを生成できます。

AWS Clean Rooms Differential Privacy は、データを提供できるメンバーとして AWS Clean Rooms コラボレーションを開始または参加した後、わずか数ステップで使用を開始できます。AWS Glue データカタログ内のテーブルを参照する設定済みのテーブルを作成したら、設定したテーブルにカスタム分析ルールを追加する際に、差分プライバシーを有効にするだけです。次に、設定したテーブルを AWS Clean Rooms コラボレーションに関連付け、コラボレーションで差分プライバシーポリシーを設定して、テーブルをクエリに使用できるようにします。デフォルトポリシーを使用してセットアップをすばやく完了したり、特定の要件に合わせてカスタマイズしたりできます。

AWS Clean Rooms Differential Privacy が設定されると、コラボレーションパートナーは、ユーザーのテーブルに対してクエリを実行できるようになります。差分プライバシーの概念に関する専門知識やパートナーからの追加設定は不要です。AWS Clean Rooms Differential Privacy を使用すると、クエリ実行者は、共通のテーブル式 (CTE) や、COUNT や SUM などの一般的に使用される集計関数を使用した複雑なクエリパターンなど、カスタムで柔軟な分析を実行できます。

暗号コンピューティング

暗号コンピューティングとは、機密性が高いデータを使用中に保護および暗号化する手法です。保存中、転送のための移動中、使用中にデータを暗号化できます。暗号化とは、プレーンテキストのデータを変換し、特定の「キー」がなければ解読できないようにエンコードすることを意味します。 プライベートセットインターセクション (PSI) は暗号コンピューティングの一種です。これにより、データセットを所有する 2 つ以上の団体が暗号化されたデータを比較し、計算を実行することができます。暗号化は、参加者の共有秘密キーにより、オンプレミスで実行されます。

AWS Clean Rooms には C3R が含まれます。これは、クライアント側の暗号化ツール (SDK またはコマンドラインインターフェイス (CLI)) を使用してデータを事前に暗号化するオプションを提供するものであり、AWS Clean Rooms のコラボレーションで他の参加者との共有シークレットキーを使用します。これでクエリの実行時にデータが暗号化されます。