Perché scegliere le istanze Trn1 di Amazon EC2?
Le istanze Trn1 di Amazon Elastic Compute Cloud (EC2), basate sui chip AWS Trainium, sono create appositamente per l'addestramento di deep learning (DL) ad alte prestazioni di modelli di IA generativa, inclusi modelli linguistici di grandi dimensioni (LLM) e modelli di diffusione latente. Le istanze Trn1 offrono fino al 50% di risparmio sui costi di addestramento rispetto ad altre istanze Amazon EC2 paragonabili. È possibile utilizzare le istanze Trn1 per addestrare modelli di IA generativa e DL con oltre 100 miliardi di parametri su un'ampia gamma di applicazioni, come riepilogo del testo, generazione di codice, risposta a domande, generazione di immagini e video, consigli e rilevamento di frodi.
L’SDK AWS Neuron consente agli sviluppatori di addestrare modelli su AWS Trainium e di implementarli sui chip AWS Inferentia. Si integra in modo nativo con framework come PyTorch e TensorFlow, così che sia possibile continuare a utilizzare i flussi di lavoro e il codice esistenti per addestrare modelli sulle istanze Trn1. Per conoscere l'attuale supporto di Neuron per framework e librerie di machine learning (ML), architetture di modelli e ottimizzazioni hardware, consulta la documentazione di Neuron.
Presentazione delle istanze Amazon EC2 Trn1 con tecnologia AWS Trainium
Vantaggi
Caratteristiche
Testimonianze dei partner e dei clienti
Ecco alcuni esempi di come clienti e partner hanno raggiunto i loro obiettivi aziendali con le istanze Trn1 di Amazon EC2.
-
Databricks
Più di 10.000 organizzazioni in tutto il mondo, tra cui Comcast, Condé Nast e oltre il 50% delle aziende Fortune 500, si affidano a Databricks per unificare dati, analisi e intelligenza artificiale.
-
Stockmark Co., Ltd
Con la missione di "reinventare il meccanismo di creazione di valore e promuovere l'umanità", Stockmark aiuta molte aziende a creare e costruire attività innovative fornendo tecnologie all'avanguardia per l'elaborazione del linguaggio naturale.
-
RICOH
RICOH offre soluzioni per l'ambiente di lavoro e servizi di trasformazione digitale progettati per gestire e ottimizzare il flusso di informazioni tra le aziende.
-
HeliXon
-
Money Forward, Inc.
Money Forward, Inc. offre ad aziende e privati una piattaforma finanziaria equa e aperta.
-
Magic
Magic è un'azienda di ricerca e prodotti integrati che sta sviluppando un'IA che venga percepita come un collega allo scopo di rendere il mondo più produttivo.
-
Cactus Communications
CACTUS offre una suite di prodotti e soluzioni per ricercatori e organizzazioni in grado di migliorare il modo in cui la ricerca viene finanziata, pubblicata, comunicata e scoperta.
-
Watashiha
Watashiha offre un servizio di IA chatbot innovativo e interattivo, "OGIRI AI", che incorpora l'elemento umoristico per fornire una risposta divertente all'istante a una domanda.
-
PyTorch
-
Hugging Face
-
Amazon
Nozioni di base
Dettagli del prodotto
Dimensioni istanza | Chip Trainium |
Acceleratore Memoria (GB) |
vCPU | Istanza Memoria (GiB) |
Locale NVMe Archiviazione (TB) |
Rete Larghezza di banda (Gb/s) |
EFA e RDMA Supporto |
EBS Larghezza di banda (Gb/s) |
On demand Prezzo all'ora |
1 anno Riservate Istanza Effettivo Orario* |
3 anni Riservate Istanza Effettivo Orario* |
trn1.2xlarge | 1 | 32 | 8 | 32 | 0,5 | Fino a 12,5 | No | Fino a 20 | 1,34 USD | 0,79 USD | 0,4744 USD |
trn1.32xlarge | 16 | 512 | 128 | 512 | 8 | 800 | Sì | 80 | 21,50 USD | 12,60 USD | 7,59 USD |
trn1n.32xlarge |
16 | 512 | 128 | 512 | 8 | 1.600 | Sì | 80 | 24,78 USD | 14,52 USD | 8,59 USD |