Amazon DataZone para directores de datos

Introducción a Amazon DataZone

Los directores de datos utilizan Amazon DataZone para que los usuarios empresariales, los equipos centrales de gobernanza de datos y el personal de TI participen en el proceso de gobernanza de datos. Con Amazon DataZone, se pueden simplificar las interacciones entre los miembros del equipo y las herramientas.

Casos de uso

Desglose de los silos

Los equipos necesitan visibilidad para utilizar los datos de forma eficaz en toda la empresa y mejorar así sus procesos. Dado que dispone de petabytes de datos repartidos entre varios departamentos, servicios, bases de datos locales y orígenes de terceros (como soluciones de socios y conjuntos de datos públicos), la visibilidad de todos ellos puede plantear ciertas dificultades. Para que pueda sacar el máximo partido de estos datos, los administradores y responsables deben hacerlos accesibles. Sin embargo, debe mantener el control y garantizar que solo la persona adecuada, en el contexto adecuado, pueda acceder a ellos. Con Amazon DataZone, puede capacitar a estos equipos individuales para crear sus dominios y catálogos de datos empresariales. Conserve sus datos junto con la inteligencia artificial (IA) generativa incorporada para enriquecer la taxonomía de su catálogo de datos empresariales, lo cual puede mejorar la capacidad de descubrimiento y comprensión de los datos.

Decisiones basadas en datos

Los empleados de toda la empresa (consumidores de datos) desean descubrir y analizar la información de los productores de datos para poder tomar decisiones. Sin embargo, también debe controlar este acceso para garantizar la seguridad de los datos. Por ello, resulta difícil aplicar políticas de gobernanza que tengan en cuenta los distintos datos, departamentos y casos de uso. Con Amazon DataZone, el consumidor de datos encuentra la información que necesita y solicita acceso al propietario. Luego, puede cargar los datos fácilmente en los servicios de análisis. Como resultado, los responsables de la toma de decisiones pueden obtener la información que necesitan en el momento oportuno y adoptar las medidas pertinentes basadas en los datos más recientes.

Mejora del descubrimiento y la interpretación de datos

Los consumidores de datos necesitan descripciones detalladas del contexto empresarial y documentación sobre el uso recomendado para identificar rápida y fácilmente los datos relevantes para sus casos de uso. Con los metadatos generados por la IA, pueden encontrar conjuntos de datos más valiosos relevantes para sus casos de uso y dedicar menos tiempo a las idas y vueltas con los generadores de datos. Cuando se enriquecen con estos metadatos, los consumidores de datos pueden comprender los datos y su relevancia para su caso de uso, y evitar un uso indebido de los datos para un propósito no previsto. Los consumidores de datos deben saber que pueden confiar en los datos que eligen. Para ello, evalúan las puntuaciones de calidad de los datos y comprenden el linaje de datos.

Equilibre el acceso y el control de los datos trabajando en retrospectiva desde sus iniciativas empresariales

Lea este informe de O'Reilly para obtener información sobre cómo implementar soluciones basadas en datos que requieren una gobernanza de datos moderna. Los ejecutivos obtendrán la información y los conocimientos necesarios para sortear las complejidades de la gestión de datos a escala.

Videos

AWS re:Invent 2023 - Panel de clientes de gobernanza de datos moderna (53:46)
AWS re:Invent 2023 - Prácticas recomendadas para el análisis y la IA generativa en AWS (50:13)
AWS re:Invent 2023 - Cree una estrategia de datos integral para el análisis y la IA generativa con Fannie Mae (56:21)

Preguntas frecuentes

¿Cómo logra Amazon DataZone mantener un equilibrio entre los equipos de negocio y los de infraestructura?

Amazon DataZone crea un ciclo de inercia de uso impulsado por los productores de datos (ingenieros y analistas de datos). Los productores comparten datos de forma segura, así como su contexto, con otras personas de la organización. Luego, los consumidores de datos (analistas) encuentran respuestas a preguntas empresariales a partir de los datos y los comparten con otros miembros de la organización. Este flujo de trabajo permite a los clientes crear un modelo descentralizado de propiedad de datos y gobernanza federada para la producción y el consumo de datos, en el que los productores publican sus activos de datos, son propietarios de estos y los controlan. Una vez completado el flujo de trabajo de aprobación con los propietarios de los datos, los consumidores pueden acceder a aquellos que les interesen. Esto permite a los equipos autogestionarse y elimina la posibilidad de que se produzcan obstáculos en un equipo concreto.