Instâncias G5 do Amazon EC2

Instâncias baseadas em GPU de alta performance para aplicações com uso intensivo de gráficos e inferência de machine learning

As instâncias G5 do Amazon EC2 são a última geração de instâncias baseadas em GPU NVIDIA que podem ser usadas para uma ampla variedade de casos de uso com uso intensivo de elementos gráficos e machine learning. Elas oferecem uma performance 3 vezes maior para aplicações com uso intensivo de elementos gráficos e inferência de machine learning e uma performance 3,3 vezes maior para treinamento de machine learning em comparação com instâncias G4dn do Amazon EC2.

Os clientes podem usar instâncias G5 para aplicações com uso intensivo de elementos gráficos, como estações de trabalho remotas, renderização de vídeo e jogos para produzir gráficos de alta fidelidade em tempo real. Com as instâncias G5, os clientes de machine learning obtêm alta performance e infraestrutura com bom custo-benefício para treinar e implantar modelos maiores e mais sofisticados para casos de uso de processamento de linguagem natural, visão computacional e mecanismo de recomendação.

As instâncias G5 apresentam até 8 GPUs NVIDIA A10G Tensor Core e processadores AMD EPYC de segunda geração. Elas também suportam até 192 vCPUs, até 100 Gbps de largura de banda de rede e até 7,6 TB de armazenamento local em NVMe SSD.

Novas instâncias G5 do Amazon EC2 (1:20)

Benefícios

Alta performance para aplicações com uso intensivo de elementos gráficos

As instâncias G5 oferecem desempenho gráfico até 3x maior e performance de preço até 40% melhor do que as instâncias G4dn. Elas têm mais núcleos de rastreamento de raios do que qualquer outra instância do EC2 baseada em GPU, apresentam 24 GB de memória por GPU e oferecem suporte para a tecnologia NVIDIA RTX. Isso as torna ideais para renderizar cenas realistas mais rapidamente, executar estações de trabalho virtuais poderosas e oferecer suporte a aplicações de gráficos pesados com maior fidelidade.

Alta performance e bom custo-benefício para inferência de ML

As instâncias G5 oferecem desempenho até 3x maior e performance de preço até 40% melhor para inferência de machine learning em comparação com instâncias G4dn. Elas são uma solução de alta performance e com bom custo-benefício para clientes que desejam usar bibliotecas NVIDIA como TensorRT, CUDA e cuDNN para executar suas aplicações de ML.

Treinamento com bom custo-benefício para modelos de ML moderadamente complexos

As instâncias G5 oferecem um custo de treinamento até 15% menor do que as instâncias P3 do Amazon EC2. Elas também oferecem performance até 3,3 vezes maior para treinamento de ML em comparação com instâncias G4dn. Isso as torna uma solução com bom custo-benefício para treinar modelos de machine learning moderadamente complexos e de nó único para casos de uso de processamento de linguagem natural, visão computacional e mecanismo de recomendação.

Eficiência de recursos maximizada

As instâncias G5 são baseadas no AWS Nitro System, uma combinação de hardware dedicado e hipervisor leve que fornece praticamente todos os recursos de computação e memória do hardware do host para suas instâncias para obter melhor performance e segurança em geral. Com instâncias G5, o sistema Nitro provisiona as GPUs em modo de passagem, oferecendo performance comparável ao bare-metal.

Recursos

GPU AWS NVIDIA A10G Tensor Core

As instâncias G5 são as primeiras na nuvem a apresentar GPUs NVIDIA A10G Tensor Core que oferecem alta performance para aplicações com uso intensivo de elementos gráficos e de machine learning. Cada instância possui até 8 GPUs A10G Tensor Core que vêm com 80 núcleos de rastreamento de raios e 24 GB de memória por GPU. Elas também oferecem 320 NVIDIA Tensor Cores de terceira geração, oferecendo até 250 TOPS, resultando em alta performance para workloads de trabalho de ML.

Drivers NVIDIA

As instâncias G5 oferecem aos clientes drivers NVIDIA RTX Enterprise e de jogos sem custo adicional. Os drivers NVIDIA RTX Enterprise podem ser usados para fornecer estações de trabalho virtuais de alta qualidade para uma ampla variedade de workloads com uso intensivo de elementos gráficos. Os drivers de jogos NVIDIA fornecem gráficos incomparáveis e suporte de computação para desenvolvimento de jogos. As instâncias G5 também oferecem suporte às bibliotecas CUDA, cuDNN, NVENC, TensorRT, cuBLAS, OpenCL, DirectX 11/12, Vulkan 1.1 e OpenGL 4.5.

Redes e armazenamento de alta performance

As instâncias G5 são fornecidas com até 100 Gbps de taxa de transferência de rede, permitindo que elas ofereçam suporte às necessidades de baixa latência de inferência de machine learning e aplicações com uso intensivo de elementos gráficos. Os 24 GB de memória por GPU, juntamente com suporte para até 7,6 TB de armazenamento SSD NVMe local, permitem o armazenamento local de grandes modelos e conjuntos de dados para treinamento e inferência de machine learning de alta performance. As instâncias G5 também podem armazenar grandes arquivos de vídeo localmente, resultando em maior performance gráfica e na capacidade de renderizar arquivos de vídeo maiores e mais complexos.

Baseadas no AWS Nitro System

As instâncias G5 são criadas no AWS Nitro System, que é uma coleção abundante de componentes básicos que transfere muitas das funções tradicionais de virtualização para hardware e software dedicados para oferecer alta performance, alta disponibilidade e alta segurança, além de reduzir a sobrecarga de virtualização.

Detalhes do produto

  Tamanho de instância GPU Memória de GPU (GiB) vCPUs Memória (GiB) Armazenamento (GB) Largura de banda de rede (Gbps) Largura de banda do EBS (Gbps) Preço/h* sob demanda ISP de 1 ano efetivo por hora (Linux) ISP de 3 anos efetivo por hora (Linux)
VMs de GPU única g5.xlarge 1 24 4 16 1x250 Até 10 Até 3,5 1,006 USD 0,604 USD 0,402 USD
g5.2xlarge 1 24 8 32 1x450 Até 10 Até 3,5 1,212 USD 0,727 USD 0,485 USD
g5.4xlarge 1 24 16 64 1x600 Até 25 8 1,624 USD 0,974 USD 0,650 USD
g5.8xlarge 1 24 32 128 1x900 25 16 2,448 USD 1,469 USD 0,979 USD
g5.16xlarge 1 24 64 256 1x1900 25 16 4,096 USD 2,458 USD 1,638 USD
                       
VMs com várias GPUs g5.12xlarge 4 96 48 192 1x3800 40 16 5,672 USD 3,403 USD 2,269 USD
g5.24xlarge 4 96 96 384 1x3800 50 19 8.144 USD 4,886 USD 3,258 USD
g5.48xlarge 8 192 192 768 2x3800 100 19 16,288 USD 9,773 USD 6,515 USD

* Os preços mostrados são para a região Leste dos EUA (Norte da Virgínia) da AWS. Os preços para instâncias reservadas de 1 e 3 anos são para as opções de pagamento "Adiantamento parcial" ou "Sem adiantamento antecipado" para instâncias sem a opção Adiantamento parcial.

Depoimentos de clientes

Logotipo Athenascope

O Athenascope usa desenvolvimentos de ponta em visão computacional e inteligência artificial para analisar a jogabilidade e exibir automaticamente os momentos de jogo mais atraentes para criar vídeos de destaque para jogadores e criadores de conteúdo.

“Para criar uma experiência de vídeo perfeita, a análise de vídeo de baixa latência usando nossos modelos de CV é uma meta fundamental para nós. As instâncias G5 do Amazon EC2 oferecem uma melhoria de 30% no preço/performance em relação às implantações anteriores com instâncias G4dn.”

Chris Kirmse, CEO e fundador, Athenascope

Netflix

A Netflix é um dos principais serviços de transmissão de entretenimento do mundo, com 214 milhões de assinaturas pagas em mais de 190 países que aproveitam séries de TV, documentários e longas-metragens em uma ampla variedade de gêneros e idiomas. 

“Construir um estúdio na nuvem para criar animação, efeitos visuais e conteúdo de ação ao vivo para nossos espectadores tem sido uma prioridade para nós. Queremos oferecer aos artistas a flexibilidade de acessar as estações de trabalho quando e onde precisarem. Estamos constantemente procurando maneiras de ajudar nossos artistas a inovar, oferecendo a eles o acesso a estações de trabalho mais poderosas.”

Stephen Kowalski, diretor de engenharia de infraestrutura de produção digital, Netflix

“Com as novas instâncias Amazon EC2 G5, podemos provisionar estações de trabalho gráficas de última geração que oferecem performance até 3 vezes maior em comparação com estações de trabalho com instâncias EC2 G4dn. Com as instâncias G5, os criadores de conteúdo têm a liberdade de criar conteúdo mais complexo e realista para nossos espectadores.”

Ben Tucker, líder técnico, engenharia de sistemas de produção de animação, Netflix

Varjo
"Para aplicações VR/XR de ponta, as instâncias do Amazon EC2 G5 são um divisor de águas. Somos capazes de executar aplicações profissionais na resolução de olho humano de assinatura da Varjo com três vezes a taxa de quadros em comparação com as instâncias G4dn usadas anteriormente, oferecendo aos nossos clientes uma qualidade de experiência nunca antes vista ao transmitir do servidor.” 

Urho Konttori, fundador e diretor de tecnologia, Varjo

Leia o estudo de caso »

Conceitos básicos

AWS Deep Learning AMIs (DLAMI) e AWS Deep Learning Containers (DLC)

O AWS Deep Learning AMIs (DLAMI) e o AWS Deep Learning Containers (DLC) fornecem a cientistas de dados, profissionais de ML e pesquisadores imagens de máquinas e contêineres pré-instaladas com framework de aprendizado profundo para que você comece a usar mais facilmente, permitindo ignorar o processo complicado de criar e otimizar seus ambientes de software a partir do zero. O SDK SynapseAI para os aceleradores Gaudi é integrado ao AMIs e DLCs do AWS DL, permitindo que você comece a usar rapidamente as instâncias DL1.

Amazon Elastic Kubernetes Service (EKS) ou Elastic Container Service (ECS)

Os clientes que preferem gerenciar suas próprias workloads em contêineres por meio de serviços de orquestração de contêineres podem implantar as instâncias DL1 com o Amazon EKS ou o ECS.

Recursos adicionais

Demonstração: Training deep learning models using Amazon EC2 DL1 instances (Treinar modelos de aprendizado profundo usando instâncias DL1 do Amazon EC2) (2:03)
Introducing Amazon EC2 DL1 instances (Apresentação das instâncias DL1 do Amazon EC2) (3:41)
Amazon EC2 DL1 cost-to-train comparison (Comparação do custo de treinamento da instância DL1 do Amazon EC2) (0:50)
Get started easily with Amazon EC2 DL1 instances (Comece a usar facilmente com as instâncias DL1 do Amazon EC2) (0:49)

Documentação do Habana® Gaudi® v0.15

Acesse a documentação »

Fórum do desenvolvedor Habana®

Acesse o fórum »

Repositório GitHub da Habana®

Acesse o GitHub »

Recursos

Folha de dados

GPU de núcleo tensor NVIDIA A10G: computação e gráficos acelerados para a nuvem AWS

Comece a usar a AWS

Cadastre-se para obter uma conta da AWS

Cadastre-se para obter uma conta da AWS

Obtenha acesso instantâneo ao nível gratuito da AWS.

Aprenda com tutoriais simples

Aprenda com tutoriais de 10 minutos

Explore e aprenda com tutoriais simples.

Comece a criar com o EC2 no console

Comece a criar no console

Comece a criar usando os guias detalhados que ajudam a iniciar seu projeto da AWS.