Por que usar o Amazon Redshift Integration for Apache Spark?
A Integração do Amazon Redshift para Apache Spark simplifica e acelera as aplicações Apache Spark que acessam dados do Amazon Redshift de serviços analíticos da AWS, como o Amazon EMR, AWS Glue e Amazon SageMaker. Ao usar o Amazon EMR, AWS Glue e SageMaker, você poderá criar rapidamente aplicações Apache Spark que leem e gravam em seu data warehouse Amazon Redshift, sem comprometer a performance ou a consistência transacional. A Integração do Amazon Redshift para Apache Spark também usa credenciais baseadas no AWS Identity and Access Management (IAM) para aumentar a segurança. Com a Integração do Amazon Redshift para Apache Spark, não há configuração manual nem manutenção de versões não certificadas de conectores de terceiros. É possível iniciar trabalhos do Apache Spark usando dados no Amazon Redshift em questão de segundos. Essa nova integração melhora a performance das aplicações Apache Spark usando dados do Amazon Redshift.
Benefícios do Amazon Redshift
Como funciona
Casos de uso
Clientes
A Huron é uma empresa global de serviços profissionais que colabora com clientes para transformar possibilidades em realidade criando estratégias sólidas, otimizando operações, acelerando a transformação digital e capacitando as empresas e suas equipes a assumir o controle do seu futuro.
“Capacitamos nossos engenheiros a construir seus pipelines de dados e aplicações com o Apache Spark usando Python e Scala. Queríamos uma solução personalizada que simplificasse as operações e fosse entregue com mais rapidez e eficiência para nossos clientes, e é isso que obtemos com o novo Amazon Redshift Integration for Apache Spark.”
Corey Johnson, gerente de arquitetura de dados, Huron Consulting
A GE Aerospace é uma fornecedora global de motores a jato, componentes e sistemas para aeronaves comerciais e militares. A empresa projeta, desenvolve e fabrica motores a jato desde a Primeira Guerra Mundial.
“A GE Aerospace usa análises da AWS e o Amazon Redshift para possibilitar insights de negócios críticos que impulsionam importantes decisões de negócios. Com o suporte à cópia automática do Amazon S3, podemos criar pipelines de dados mais simples para mover dados do Amazon S3 para o Amazon Redshift. Isso aumenta a capacidade de nossas equipes de produtos de dados de acessar dados e fornecer informações aos usuários finais. Gastamos mais tempo agregando valor por meio de dados e menos tempo em integrações.”
Alcuin Weidus, arquiteto de dados sênior, GE Aerospace
O Goldman Sachs Group, Inc. é uma instituição financeira global líder que oferece uma ampla gama de serviços financeiros em banco de investimento, valores mobiliários, gerenciamento de investimentos e banco de consumo para uma base de clientes grande e diversificada que inclui corporações, instituições financeiras, governos e indivíduos.
“Nosso foco é fornecer acesso de autoatendimento aos dados para todos os usuários do Goldman Sachs. Por meio do Legend, nossa plataforma de gerenciamento e governança de dados de código aberto, permitimos que os usuários desenvolvam aplicações centradas em dados e obtenham insights orientados por dados à medida que colaboramos em todo o setor de serviços financeiros. Com a Integração do Amazon Redshift para Apache Spark, nossa equipe de plataforma de dados poderá acessar os dados do Amazon Redshift com o mínimo de etapas manuais, permitindo ETL de código zero que aumentará nossa capacidade de tornar mais fácil para os engenheiros se concentrarem em aperfeiçoar seu fluxo de trabalho à medida que eles coletam informações completas de forma ágil. Esperamos ver uma melhoria na performance das aplicações e segurança aprimorada, pois nossos usuários agora podem acessar facilmente os dados mais recentes no Amazon Redshift.”
Neema Raphael, diretor de processamento de dados, Goldman Sachs