Amazon DataZone : Automatiser la découverte des données
Présentation
Accélérez la saisie manuelle des attributs de données dans le catalogue de données, qui peut être source d'erreurs. Générez le contexte commercial et recommandez des analyses pour des jeux de données afin d'améliorer les résultats de la découverte des données. Déterminez d'où proviennent vos données et quelles sources seront affectées par les modifications. L'ajout de données en l'enrichissement des données dans le catalogue de données commerciales améliore également l'expérience de recherche. Réduisez votre temps de recherche et d'utilisation des données de plusieurs semaines à plusieurs jours.
Cas d'utilisation
Vidéos
Questions fréquentes (FAQ)
Quel est le type d'informations utilisé dans le catalogue de données commerciales Amazon DataZone ?
Dans le catalogue de données commerciales Amazon DataZone, les métadonnées commerciales fournissent des informations créées ou utilisées par des professionnels et fournissent un contexte aux données organisationnelles. Cela peut inclure les informations suivantes :
- Propriété : Les organisations modernes centrées sur les données utilisent un processus de gestion des données distribué dans lequel les secteurs d'activité (LOB) sont responsables de la gestion de leurs propres données. Un catalogue permet de suivre cette propriété de manière à ce que les parties intéressées puissent rechercher et demander l'accès aux données dans le cadre de leurs tâches professionnelles.
- Classification : La découverte des données est une tâche clé que les métadonnées d'entreprise peuvent prendre en charge. La découverte de données utilise des ontologies et des taxonomies d'entreprise définies de manière centralisée pour classer les sources de données et vous aide à trouver les objets de données pertinents.
- Relations : Vous pouvez utiliser le catalogue de données commerciales Amazon DataZone pour ajouter des informations de relations sous forme de métadonnées. Comme dans le cas d'un schéma de jeu de données techniques, le catalogue de données commerciales indique les relations qui existent entre les objets du catalogue, notamment entre les bases de données, les jeux de données et leurs colonnes.
- Schéma : la fonctionnalité de recommandations de l'IA pour les descriptions peut utiliser le schéma technique et commercial pour générer des descriptions recommandées et afficher l'utilisation des données.
- Origine et consommation : le lignage des données et l’analyse d’impact, ainsi que les mappages personnalisés d’OpenLineage, sont liés dans le catalogue de données commerciales.
Quels éléments puis-je cataloguer avec Amazon DataZone ?
Amazon DataZone prend en charge les ressources de données publiées directement à partir du catalogue de données AWS Glue et d'Amazon Redshift. Ces deux sources permettent de cataloguer les données aux emplacements suivants :
- Lacs de données Amazon Simple Storage Service (Amazon S3)
- De nombreuses bases de données sur mesure AWS, comme Amazon Relational Database Service (Amazon RDS) via un crawler AWS Glue
- Plus de 100 connecteurs Amazon AppFlow, pour importer des données provenant d'applications tierces telles que Snowflake, Salesforce et Google Analytics