Amazon DataZone: 統合

Amazon DataZone 統合は、次の 4 つのカテゴリに分類されます。

プロデューサーデータソース

AWS Glue データカタログと Amazon Redshift の組み込みデータソースからデータを公開します。他のすべてのタイプのソースでは、カスタムアセットタイプを定義し、Amazon DataZone パブリック API を使用してそれらのアセットを公開できます。AWS Glue Data Quality との統合では、データソースを使用してデータ品質スコアをスケジュールに基づいて取り込むことができます。

分析ツール

Amazon AthenaAmazon Redshift クエリエディタなどのサービスと連携して、クエリエディタからのデータを直接操作できるようにします。この機能は、API を使用して簡単に拡張でき、他のサードパーティツールをカスタマイズできます。Amazon DataZone では、プロジェクトのアクセスコンテキストをこれらのツールと共有できます。  

アクセスフルフィルメント

AWS Lake Formation が管理する AWS Glue テーブルと Amazon Redshift のテーブルおよびビューの許可を自動的に付与および管理します。 他のすべてのアセットに対して、Amazon DataZone はサブスクリプションリクエストや承認などのユーザーアクションに関連する標準イベントを発行します。このような標準イベントを使用して、他の AWS のサービスまたはサードパーティソリューションと統合してカスタム統合を行えます。

機械学習 (ML) ツール

Amazon SageMaker を使用することで、データアセットや ML アセットに簡単にアクセスします。ML タスクを簡単に実行して、新しく作成されたデータアセットや ML アセットをビジネスデータカタログに公開することができます。Amazon SageMaker が ML ガバナンスをサポートする方法をご覧ください。

Page Topics

主な特徴

主な特徴

豊富なメタデータとビジネスコンテキストを備えた AWS Glue データカタログまたは Amazon Redshift にあるカタログデータ。Amazon DataZone は AWS Glue コネクタを通じて、AWS、サードパーティーのサービス、オンプレミス、および Amazon AppFlow を介したその他のサービスのデータにアクセスできます。

Amazon DataZone は Lake Formation を自動化して、データコンシューマーがリクエストされたリソースのコントロールにアクセスできるようにします。Amazon DataZone が管理するアセットの場合、(データパブリッシャーが適用するポリシーに従って) 基になるテーブルへのデータアクセスは、管理者やデータ移動を必要とせずに処理されます。

アナリストや基幹業務のエンドユーザーがデータを発見、準備、変換、分析、視覚化できるように、Amazon Athena や Amazon Redshift クエリエディタなどの分析ツールにシームレスなアクセスを提供します。ユーザーは、コンソール外のアプリケーションまたは API を使用して、データをパーソナライズして表示できます。

ユーザーが、ビジネス問題に基づいたインフラストラクチャ、データ、ML リソースへのアクセスの管理を簡単に実行できるようにしましょう。Amazon SageMaker Studio からの ML 構築エクスペリエンスと Amazon DataZone からのデータガバナンス機能を統合することで、ユーザーはデータアセットと ML アセットをカタログ化、検索、共有し、それらにアクセスできるようになります。

データレイクのデータを管理

AWS を使用して、きめ細かなデータアクセス権限を一元管理およびスケーリングできます。

Amazon DataZone と AWS Glue を用いたメタデータ管理

テクニカルメタデータを管理するために、既に AWS Glue データカタログを使用しているかもしれません。AWS Glue データカタログと Amazon DataZone を組み合わることで、ビジネスデータカタログと統合するテクニカルメタデータカタログを管理する方法を学びましょう。

Amazon DataZone と AWS Glue を使用してメタデータを管理することにより、データランドスケープを統一します

ユーザー、エンジン、モデルがデータを発見できるようにするには、堅牢で包括的なメタデータ管理ソリューションが必要です。Amazon DataZone と AWS Glue データカタログを使用して、発見、管理、分析を合理化します。