Amazon DataZone: automatize a descoberta de dados
Visão geral
Elimine o tempo da entrada manual de atributos de dados no catálogo de dados, o que também introduz possíveis erros. Gere contexto corporativo e recomende análises para conjuntos de dados, o que aumenta os resultados da descoberta de dados. Entenda de onde seus dados vieram e quais fontes serão afetadas por alterações. Dados mais robustos no catálogo de dados corporativos também melhoram a experiência de pesquisa. Reduza de semanas para dias o tempo de pesquisa e uso dos dados.
Casos de uso
Vídeos
Perguntas frequentes
Que tipos de informação são usadas no catálogo de dados comerciais do Amazon DataZone?
No catálogo de dados comerciais do Amazon DataZone, os metadados comerciais fornecem informações criadas ou usadas por profissionais de empresas e contextualizam os dados organizacionais. Isso pode incluir as seguintes informações:
- Propriedade: as organizações modernas centradas em dados empregam um processo de administração de dados distribuídos em que as linhas de negócios (LOBs) são responsáveis por gerenciar os próprios dados. Um catálogo acompanha essa propriedade para que as partes interessadas possam localizar e solicitar acesso aos dados como parte de suas tarefas de negócios.
- Classificação: a descoberta de dados é uma tarefa fundamental que os metadados de negócios podem oferecer. A descoberta de dados usa ontologias e taxonomias empresariais definidas centralmente para classificar as fontes de dados e ajuda a encontrar objetos de dados relevantes.
- Relacionamentos: você pode usar o catálogo de dados comerciais do Amazon DataZone para adicionar informações de relacionamento como metadados. Assim como em um esquema de conjunto de dados técnicos, o catálogo de metadados de negócios mostra relações entre objetos no catálogo, como aquelas entre bancos de dados, conjuntos de dados e suas colunas.
- Esquema: as recomendações de IA para descrições podem usar o esquema técnico e comercial para gerar descrições recomendadas e o uso dos dados.
- Origem e consumo: a linhagem de dados e a análise de impacto, bem como os mapeamentos personalizados do OpenLineage, estão vinculados ao catálogo de dados corporativos.
O que posso catalogar com o Amazon DataZone?
O Amazon DataZone oferece suporte a ativos de dados publicados diretamente do Catálogo de Dados do AWS Glue e do Amazon Redshift. Essas duas fontes podem ser usadas para catalogar dados nos seguintes locais:
- Data lakes do Amazon Simple Storage Service (Amazon S3)
- Muitos dos bancos de dados com propósito específico da AWS, como o Amazon Relational Database Service (Amazon RDS), por meio de um crawler do AWS Glue
- Mais de 100 conectores Amazon AppFlow, para trazer dados de aplicações de terceiros, como Snowflake, Salesforce e Google Analytics