Amazon DataZone: 統合
Amazon DataZone 統合は、次の 4 つのカテゴリに分類されます。
プロデューサーデータソース
AWS Glue データカタログと Amazon Redshift の組み込みデータソースからデータを公開します。他のすべてのタイプのソースでは、カスタムアセットタイプを定義し、Amazon DataZone パブリック API を使用してそれらのアセットを公開できます。AWS Glue Data Quality との統合では、データソースを使用してデータ品質スコアをスケジュールに基づいて取り込むことができます。
分析ツール
Amazon Athena や Amazon Redshift クエリエディタなどのサービスと連携して、クエリエディタからのデータを直接操作できるようにします。この機能は、API を使用して簡単に拡張でき、他のサードパーティツールをカスタマイズできます。Amazon DataZone では、プロジェクトのアクセスコンテキストをこれらのツールと共有できます。
アクセスフルフィルメント
AWS Lake Formation が管理する AWS Glue テーブルと Amazon Redshift のテーブルおよびビューの許可を自動的に付与および管理します。 他のすべてのアセットに対して、Amazon DataZone はサブスクリプションリクエストや承認などのユーザーアクションに関連する標準イベントを発行します。このような標準イベントを使用して、他の AWS のサービスまたはサードパーティソリューションと統合してカスタム統合を行えます。
機械学習 (ML) ツール
Amazon SageMaker を使用することで、データアセットや ML アセットに簡単にアクセスします。ML タスクを簡単に実行して、新しく作成されたデータアセットや ML アセットをビジネスデータカタログに公開することができます。Amazon SageMaker が ML ガバナンスをサポートする方法をご覧ください。
データレイクのデータを管理
AWS を使用して、きめ細かなデータアクセス権限を一元管理およびスケーリングできます。
Amazon DataZone と AWS Glue を用いたメタデータ管理
テクニカルメタデータを管理するために、既に AWS Glue データカタログを使用しているかもしれません。AWS Glue データカタログと Amazon DataZone を組み合わることで、ビジネスデータカタログと統合するテクニカルメタデータカタログを管理する方法を学びましょう。
Amazon DataZone と AWS Glue を使用してメタデータを管理することにより、データランドスケープを統一します
ユーザー、エンジン、モデルがデータを発見できるようにするには、堅牢で包括的なメタデータ管理ソリューションが必要です。Amazon DataZone と AWS Glue データカタログを使用して、発見、管理、分析を合理化します。