Amazon DataZone: Automatización del descubrimiento de datos
Información general
Elimine el tiempo que supone el ingreso manual de atributos de datos en el catálogo correspondiente, lo que también genera posibles errores. Genere un contexto empresarial y recomiende análisis para conjuntos de datos para optimizar los resultados del descubrimiento de datos. Comprenda de dónde provienen sus datos y cuáles serán las fuentes afectadas por los cambios. El aumento de datos más detallados en el catálogo de datos empresariales también mejora la experiencia de búsqueda. Reduzca el tiempo de búsqueda y uso de datos de semanas a días.
Casos de uso
Vídeos
Preguntas frecuentes
¿Qué tipo de información se usa en el catálogo de datos empresariales de Amazon DataZone?
En el catálogo de datos empresarial de Amazon DataZone, los metadatos empresariales proporcionan información cuya autoría o uso corresponde a los empresarios y dan contexto a los datos de la organización. Puede incluir la siguiente información:
- Propiedad: las organizaciones modernas centradas en los datos emplean un proceso de administración de datos distribuido en el que las líneas de negocio (LOB) se encargan de administrar sus propios datos. Un catálogo hace un seguimiento de esa propiedad para que las partes interesadas puedan buscar datos y solicitar acceso a los mismos como parte de sus tareas empresariales.
- Clasificación: el descubrimiento de datos es una tarea clave que los metadatos empresariales pueden respaldar. El descubrimiento de datos utiliza ontologías y taxonomías corporativas definidas de forma centralizada para clasificar el origen de los datos y ayudarlo a encontrar objetos de datos relevantes.
- Relaciones: puede utilizar el catálogo de datos empresarial de Amazon DataZone para agregar información de relaciones como metadatos. Al igual que ocurre con un esquema de conjunto de datos técnico, el catálogo de metadatos empresarial muestra las relaciones entre los objetos del catálogo, como las que existen entre las bases de datos, los conjuntos de datos y sus columnas.
- Esquema: las recomendaciones de IA para las descripciones pueden utilizar el esquema técnico y empresarial para generar descripciones y usos recomendados para los datos.
- Origen y consumo: el linaje de datos y el análisis de impacto, así como los mapeos personalizados de OpenLineage, están vinculados al catálogo de datos empresariales.
¿Qué puedo catalogar con Amazon DataZone?
Amazon DataZone admite activos de datos publicados directamente desde el Catálogo de datos de AWS Glue y Amazon Redshift. Estos dos orígenes pueden utilizarse para crear catálogos de datos en las siguientes ubicaciones:
- Lagos de datos de Amazon Simple Storage Service (Amazon S3)
- Muchas de las bases de datos personalizadas por AWS como Amazon Relational Database Service (Amazon RDS) a través de un rastreador AWS Glue
- Más de 100 conectores Amazon AppFlow, para importar datos de aplicaciones de terceros como Snowflake, Salesforce y Google Analytics.