Istanze G5 di Amazon EC2
Le istanze G5 di Amazon EC2 sono l'ultima generazione di istanze basate su GPU NVIDIA che possono essere utilizzate per un'ampia gamma di casi d'uso di grafica intensiva e machine learning. Offrono prestazioni fino a 3 volte migliori per applicazioni ad alta intensità grafica e inferenze di machine learning e prestazioni fino a 3,3 volte superiori per l'addestramento del machine learning rispetto alle istanze G4dn di Amazon EC2.
I clienti possono utilizzare le applicazioni G5 ad alta intensità grafica come stazioni di lavoro remote, rendering video e gaming per produrre grafiche ad alta fedeltà in tempo reale. Con le istanze G5, i clienti del machine learning ottengono un'infrastruttura a prestazioni elevate ed efficiente in termini di costi per addestrare e implementare modelli più grandi e sofisticati per casi d'uso quali l'elaborazione del linguaggio naturale, la visione artificiale e i motori di suggerimento.
Le istanze G5 hanno fino a 8 GPU NVIDIA A10G Tensor Core e processori AMD EPYC di seconda generazione. Supportano inoltre fino a 192 vCPU, fino a 100 Gbps di larghezza di banda della rete e fino a 7,6 TB di archiviazione SSD NVMe locale.
Vantaggi
Alte prestazioni per applicazioni ad alta intensità di grafica
Le istanze G5 offrono prestazioni grafiche fino a 3 volte superiori e un rapporto qualità-prezzo fino al 40% migliore rispetto alle istanze G4dn. Hanno più core di ray tracing rispetto a qualsiasi altra istanza EC2 basata su GPU, dispongono di 24 GB di memoria per GPU e supportano la tecnologia NVIDIA RTX. Per questo sono ideali per effettuare il rendering di scene realistiche in modo più rapido, eseguire potenti postazioni di lavoro virtuali e supportare applicazioni grafiche complesse con una maggiore fedeltà.
Alte prestazioni ed efficienza in termini di costi per l'inferenza di ML
Le istanze G5 offrono prestazioni fino a 3 volte superiori e un rapporto qualità-prezzo fino al 40% migliore per l'inferenza di machine learning rispetto alle istanze G4dn. Sono una soluzione altamente performante ed economica per i clienti che desiderano utilizzare librerie NVIDIA come TensorRT, CUDA e cuDNN per eseguire le proprie applicazioni di machine learning.
Addestramento efficiente in termini di costi per modelli di ML moderatamente complessi
Le istanze G5 offrono di costi di addestramento inferiori fino al 15% rispetto alle istanze P3 di Amazon EC2. Offrono inoltre prestazioni fino a 3,3 volte superiori per l'addestramento del machine learning rispetto alle istanze G4dn. Per questo motivo sono una soluzione conveniente per l'addestramento di modelli di machine learning moderatamente complessi e a nodo singolo per casi d'uso quali l'elaborazione del linguaggio naturale, la visione artificiale e i motori di suggerimento.
Efficienza delle risorse massimizzata
Le istanze G5 si basano sull'AWS Nitro System, una combinazione di hardware dedicato e hypervisor leggero che fornisce tutte le risorse di elaborazione e di memoria dell'hardware host alle istanze per prestazioni e sicurezza complessive migliori. Con le istanze G5, il sistema Nitro fornisce le GPU in modalità pass-through, fornendo prestazioni paragonabili a quelle del bare metal.
Caratteristiche
GPU AWS NVIDIA A10G Tensor Core
Le istanze G5 sono le prime nel cloud a utilizzare GPU NVIDIA A10G Tensor Core che offrono prestazioni elevate per applicazioni di machine learning e ad alta intensità di grafica. Ogni istanza include fino a 8 GPU A10G Tensor Core dotate di 80 core di ray tracing e 24 GB di memoria per GPU. Presentano anche 320 NVIDIA Tensor Core di terza generazione che offrono fino a 250 TOPS con prestazioni elevate per i carichi di lavoro di ML.
Driver NVIDIA
Le istanze G5 offrono ai clienti driver NVIDIA RTX Enterprise e gaming senza costi aggiuntivi. I driver NVIDIA RTX Enterprise possono essere usati per fornire workstation virtuali di alta qualità per un'ampia gamma di flussi di lavoro ad alta intensità grafica. I driver di gaming NVIDIA forniscono grafica senza precedenti e supporto di elaborazione per lo sviluppo di giochi. Le istanze G5 supportano anche le librerie CUDA, cuDNN, NVENC, TensorRT, cuBLas, OpenCL, DirectX 11/12, Vulkan 1.1 e OpenGL 4.5.
Reti e storage ad alte prestazioni
Le istanze G5 sono dotate di una velocità di trasmissione effettiva della rete fino a 100 Gbps, che consente loro di supportare le esigenze di bassa latenza dell'inferenza di machine learning e delle applicazioni ad alta intensità grafica. Grazie a 24 GB di memoria per GPU e la capacità di supportare fino a 7,6 TB di storage SSD NVMe locale, consentono l'archiviazione locale di modelli e set di dati di grandi dimensioni per l'addestramento e l'inferenza di machine learning a prestazioni elevate. Le istanze G5 possono anche archiviare file video di grandi dimensioni in locale, con un conseguente aumento delle prestazioni grafiche e della capacità di eseguire il rendering di file video più grandi e complessi.
Basate su AWS Nitro System
Le istanze G5 sono basate su AWS Nitro System, che è una ricca raccolta di blocchi costitutivi che consente di scaricare molte delle tradizionali funzioni di virtualizzazione su hardware e software dedicati per offrire elevate prestazioni, alta disponibilità e alta sicurezza riducendo al contempo il sovraccarico della virtualizzazione.
Dettagli del prodotto
Dimensioni istanza | GPU | Memoria GPU (GiB) | vCPU | Memoria (GiB) | Archiviazione (GB) | Larghezza di banda di rete (Gbps) | Larghezza di banda EBS (Gb/s) | Prezzo on demand/h* | Prezzo all'ora effettivo per 1 anno di ISP (Linux) | Prezzo all'ora effettivo per 3 anni di ISP (Linux) | |
VM a GPU singola | g5.xlarge | 1 | 24 | 4 | 16 | 1x250 | Fino a 10 | Fino a 3,5 | 1,006 USD | 0,604 USD | 0,402 USD |
g5.2xlarge | 1 | 24 | 8 | 32 | 1x450 | Fino a 10 | Fino a 3,5 | 1,212 USD | 0,727 USD | 0,485 USD | |
g5.4xlarge | 1 | 24 | 16 | 64 | 1x600 | Fino a 25 | 8 | 1,624 USD | 0,974 USD | 0,650 USD | |
g5.8xlarge | 1 | 24 | 32 | 128 | 1x900 | 25 | 16 | 2,448 USD | 1,469 USD | 0,979 USD | |
g5.16xlarge | 1 | 24 | 64 | 256 | 1x1900 | 25 | 16 | 4,096 USD | 2,458 USD | 1,638 USD | |
VM a GPU multiple | g5.12xlarge | 4 | 96 | 48 | 192 | 1x3800 | 40 | 16 | 5,672 USD | 3,403 USD | 2,269 USD |
g5.24xlarge | 4 | 96 | 96 | 384 | 1x3800 | 50 | 19 | 8,144 USD | 4,886 USD | 3,258 USD | |
g5.48xlarge | 8 | 192 | 192 | 768 | 2x3800 | 100 | 19 | 16,288 USD | 9,773 USD | 6,515 USD |
*I prezzi sono calcolati per la Regione AWS Stati Uniti orientali (Virginia settentrionale). Per quanto riguarda le istanze che non prevedono pagamenti anticipati parziali, i prezzi per le istanze riservate di 1 anno e di 3 anni si applicano alle opzioni di pagamento "parzialmente anticipato" o "nessun anticipo".
Testimonianze dei clienti
Athenascope sfrutta gli ultimi sviluppi nel campo della visione artificiale e dell'intelligenza artificiale per analizzare il gameplay, individuare automaticamente i momenti più avvincenti dei giochi e creare video salienti per videogiocatori e creatori di contenuti.
"Usare i nostri modelli di CV per ottenere un'analisi video a bassa latenza è un obiettivo fondamentale volto a creare un'esperienza video fluida. Le istanze G5 di Amazon EC2 offrono un miglioramento del 30% nel rapporto prezzo/prestazioni rispetto alle precedenti implementazioni con istanze G4dn".
Chris Kirmse, CEO & Founder di Athenascope
Netflix è uno dei principali servizi di intrattenimento in streaming al mondo, con oltre 214 milioni di abbonati in più di 190 Paesi che possono fruire di serie TV, documentari e lungometraggi in un'ampia varietà di generi e lingue.
"Costruire uno studio nel cloud per creare animazioni, effetti visivi e contenuti live action per i nostri spettatori è una priorità per noi. Desideriamo dare agli artisti la flessibilità di accedere alle postazioni di lavoro quando e dove ne hanno bisogno. Siamo costantemente alla ricerca di modi per aiutare i nostri artisti a innovarsi offrendo loro l'accesso a postazioni di lavoro più potenti".
Stephen Kowalski, Director of Digital Production Infrastructure Engineering di Netflix
"Grazie alle nuove istanze G5 di Amazon EC2, possiamo effettuare il provisioning di workstation grafiche di gamma elevata che offrono prestazioni fino a 3 volte superiori rispetto alle workstation con istanze G4dn di EC2. Con le istanze G5, i creatori di contenuti hanno la possibilità di creare in modo più complesso e realistico per i nostri visualizzatori".
Ben Tucker, Technical Lead, Animation Production Systems Engineering di Netflix
"Per le applicazioni VR/XR di fascia alta, le istanze Amazon EC2 G5 sono rivoluzionarie. Siamo in grado di eseguire applicazioni professionali con la risoluzione tipica di Varjo, che raggiunge i livelli dell'occhio umano, con una frequenza di fotogrammi tre volte superiore rispetto alle istanze G4dn utilizzate in precedenza, offrendo ai nostri clienti un'esperienza di qualità ineguagliata durante lo streaming dal server".
Urho Konttori, Founder and Chief Technology Officer di Varjo
Nozioni di base
Gli AWS Deep Learning AMI (DLAMI) e gli AWS Deep Learning Containers (DLC)
Gli AWS Deep Learning AMI (DLAMI) e AWS Deep Learning Containers (DLC) forniscono ai Data Scientist, a chi lavora con il ML e ai ricercatori le macchine e le immagini container preinstallate nei framework di Deep Learning per semplificare l'inizio facendoti saltare il complicato processo di creazione e ottimizzazione dei tuoi ambienti software da zero. Il SynapseAI SDK per i Gaudi Accelerator è integrato nei DL AMI e nei DLC di AWS permettendoti di iniziare velocemente a utilizzare le istanze DL1.
Amazon Elastic Kubernetes Service (EKS) o Elastic Container Service (ECS)
I clienti che preferiscono gestire i propri carichi di lavoro containerizzati tramite i servizi di orchestrazione dei container possono distribuire istanze DL1 con Amazon EKS o ECS.
Risorse aggiuntive
Documentazione Habana® Gaudi® v0.15
Forum per sviluppatori Habana®
Repository GitHub di Habana®
Risorse
GPU tensor core NVIDIA A10G: elaborazione e grafica accelerate per il cloud AWS
Nozioni di base su AWS
Registrati per creare un account AWS
Ottieni accesso istantaneo al piano gratuito di AWS.
Impara con i tutorial di 10 minuti
Esplora e impara con semplici tutorial.
Inizia a lavorare nella console
Inizia a creare seguendo le istruzioni contenute nelle guide dettagliate per avviare un progetto AWS.