Por que usar as instâncias Trn1 do Amazon EC2?
As instâncias Trn1 do Amazon Elastic Compute Cloud (EC2), equipadas com chips AWS Trainium, são criadas especificamente para o treinamento de aprendizado profundo (DL) de alta performance dos modelos de IA generativa, incluindo grandes modelos de linguagem (LLMs) e modelos de difusão latente. As instâncias Trn1 oferecem até 50% de redução de custo de treinamento em comparação com outras instâncias do Amazon EC2. Você pode usar instâncias Trn1 para treinar mais de 100 B de parâmetros de modelos DL e de IA generativa em um amplo conjunto de aplicações, como resumo de texto, geração de código, resposta a perguntas, geração de imagens e vídeos, recomendação e detecção de fraudes.
O SDK do AWS Neuron ajuda os desenvolvedores a treinar modelos no AWS Trainium (e a implantar modelos nos chips do AWS Inferentia). Ele se integra nativamente a estruturas, como PyTorch e TensorFlow, para que você possa continuar usando seu código e fluxos de trabalho existentes para treinar modelos nas instâncias Trn1. Para saber mais sobre o suporte atual do Neuron para estruturas e bibliotecas de machine learning (ML), arquiteturas de modelos e otimizações de hardware, acesse a documentação do Neuron.
Introdução às instâncias Trn1 do Amazon EC2 com a tecnologia AWS Trainium
Benefícios
Recursos
Depoimentos de clientes e parceiros
Aqui estão alguns exemplos de como clientes e parceiros alcançaram suas metas de negócios com as instâncias Trn1 do Amazon EC2.
-
Databricks
Mais de 10.000 organizações em todo o mundo — incluindo a Comcast, a Condé Nast e mais de 50% das empresas da Fortune 500 — confiam no Databricks para unificar seus dados, análises e inteligência artificial.
-
Stockmark Co., Ltd
Com a missão de “reinventar o mecanismo de criação de valor e promover a humanidade”, a Stockmark ajuda muitas empresas a criar e construir negócios inovadores fornecendo tecnologia de processamento de linguagem natural de ponta.
-
RICOH
A RICOH oferece soluções de local de trabalho e serviços de transformação digital projetados para gerenciar e otimizar o fluxo de informações entre empresas.
-
HeliXon
-
Money Forward, Inc.
A Money Forward, Inc. presta serviços a empresas e indivíduos com uma plataforma financeira aberta e justa.
-
Magic
A Magic é uma empresa integrada de produtos e pesquisas que desenvolve IA para tornar o mundo mais produtivo.
-
Cactus Communications
A CACTUS tem um conjunto de produtos e soluções para pesquisadores e organizações que melhoram a forma como a pesquisa é financiada, publicada, comunicada e descoberta.
-
Watashiha
O Watashiha oferece um serviço de chatbot de IA inovador e interativo, o “OGIRI AI”, que incorpora humor para fornecer uma resposta divertida e imediata para uma pergunta.
-
PyTorch
-
Hugging Face
-
Amazon
Conceitos básicos
Detalhes do produto
Tamanho da instância | Chips Trainium |
Acelerador Memória (GB) |
vCPUs | Instância Memória (GiB) |
Local NVMe Armazenamento (TB) |
Rede Largura de banda (Gbps) |
EFA e RDMA Suporte |
EBS Largura de banda (Gbps) |
Sob demanda Preço por hora |
1 ano Reservada Instância Efetiva Por hora* |
3 anos Reservada Instância Efetiva Por hora* |
trn1.2xlarge | 1 | 32 | 8 | 32 | 0,5 | Até 12,5 | Não | Até 20 | USD 1,34 | USD 0,79 | USD 0,4744 |
trn1.32xlarge | 16 | 512 | 128 | 512 | 8 | 800 | Sim | 80 | USD 21,50 | USD 12,60 | USD 7,59 |
trn1n.32xlarge |
16 | 512 | 128 | 512 | 8 | 1.600 | Sim | 80 | USD 24,78 | USD 14,52 | USD 8,59 |