Istanze G4 di Amazon EC2
Le istanze GPU più convenienti del settore per l'inferenza di machine learning e applicazioni a uso intensivo di grafica
Le istanze G4 di Amazon EC2 sono le istanze GPU più convenienti e versatili del settore per l'implementazione di modelli di machine learning come la classificazione delle immagini, il rilevamento di oggetti e il riconoscimento vocale e per applicazioni a uso intensivo di grafica come workstation grafiche remote, streaming di giochi e rendering grafico. Le istanze G4 sono disponibili con una scelta di GPU NVIDIA (G4dn) o GPU AMD (G4ad).
Le istanze G4dn sono dotate di GPU NVIDIA T4 e CPU Intel Cascade Lake personalizzate e sono ottimizzate per l'inferenza di machine learning e la formazione su piccola scala. Queste istanze offrono anche prestazioni elevate alle applicazioni a uso intensivo di grafica, tra cui workstation remote, streaming di giochi e rendering grafico. Queste istanze sono ideali anche per i clienti che preferiscono utilizzare software NVIDIA come RTX Virtual Workstation e librerie come CUDA, CuDNN e NVENC.
Le istanze G4ad sono dotate delle più recenti GPU AMD Radeon Pro V520 e processori AMD EPYC di seconda generazione. Queste istanze offrono le migliori prestazioni di prezzo nel cloud per le applicazioni grafiche, tra cui workstation remote, streaming di giochi e rendering grafico. Rispetto a istanze comparabili, offrono prestazioni di prezzo fino al 45% migliori per le applicazioni ad alta intensità di grafica.
Istanze G4dn di Amazon EC2
Le istanze G4dn, basate su GPU NVIDIA T4, sono le istanze basate su GPU più economiche nel cloud per l'inferenza del machine learning e l'addestramento su piccola scala. Forniscono inoltre prestazioni elevate e sono una soluzione conveniente per applicazioni grafiche ottimizzate per GPU NVIDIA che utilizzano librerie NVIDIA come CUDA, CuDNN e NVENC. Forniscono fino a 8 GPU NVIDIA T4, 96 vCPU, rete da 100 Gbps e archiviazione SSD locale basata su NVMe da 1,8 TB e sono disponibili anche come istanze bare metal.
Vantaggi
Aumento delle prestazioni e riduzione dei costi di inferenza del machine learning
Le istanze G4dn sono dotate di GPU NVIDIA T4 che offrono una velocità effettiva a bassa latenza fino a 40 volte migliore rispetto alle CPU, quindi è possibile soddisfare più richieste in tempo reale. Inoltre, le istanze G4dn sono ottimizzate per essere convenienti per l'inferenza del machine learning, che può rappresentare fino al 90% dei costi operativi complessivi per le iniziative di machine learning.
Addestramento su piccola scala economicamente vantaggioso
Le istanze G4dn sono utili anche per processi di addestramento del machine learning su piccola scala/entry-level per quelle aziende o istituzioni che sono meno sensibili al tempo dell’addestramento. Le istanze G4dn offrono fino a 65 TFLOP di prestazioni FP16 e sono una soluzione convincente per lavori di formazione su piccola scala.
Alte prestazioni per applicazioni ad alta intensità di grafica
Le istanze G4dn hanno prestazioni grafiche fino a 1,8 volte migliori e capacità di transcodifica video fino a 2 volte rispetto alle istanze G3 della generazione precedente. I clienti possono configurare workstation virtuali con accesso alle workstation NVIDIA RTX senza costi aggiuntivi.
Caratteristiche
Basato su GPU NVIDIA T4
Le GPU NVIDIA T4 accelerano diversi carichi di lavoro cloud, tra cui addestramento, inferenza e grafica di deep learning. Basate sulla nuova architettura NVIDIA Turing, le GPU T4 sono dotate di Turing Tensor Core multi-precisione e nuovi RT Core. La tecnologia Turing Tensor Core con elaborazione multi-precisione per ML potenzia prestazioni rivoluzionarie da FP32 a FP16 a INT8, oltre alle precisioni INT4. Offre prestazioni fino a 9,3 volte superiori rispetto alle CPU durante l'addestramento e fino a 36 volte l'inferenza.
Reti e archiviazione ad alte prestazioni
Le istanze G4dn offrono fino a 100 Gbps di rete per applicazioni che richiedono una velocità effettiva elevata. Le istanze G4dn supportano anche l'adattatore Elastic Fabric (EFA) che consente ai clienti di eseguire applicazioni che richiedono alti livelli di comunicazioni tra nodi su larga scala. Queste istanze offrono fino a 1,8 TB di storage SSD basato su NVMe per applicazioni che richiedono un accesso rapido ai dati archiviati localmente.
Driver RTX e gaming
Le istanze G4dn offrono ai clienti driver NVIDIA RTX e gaming senza costi aggiuntivi. I driver RTX possono essere utilizzati per fornire workstation virtuali di alta qualità per un'ampia gamma di flussi di lavoro visivamente intensivi. Il driver di gaming fornisce grafica senza precedenti e supporto di elaborazione per lo sviluppo di giochi.
Istanze G4ad di Amazon EC2
Le istanze G4ad, basate su GPU AMD Radeon Pro V520, offrono le migliori prestazioni di prezzo per le applicazioni ad alta intensità di grafica nel cloud. Queste istanze offrono prestazioni di prezzo migliori fino al 45% rispetto alle istanze G4dn, che erano già le istanze più economiche nel cloud, per applicazioni grafiche come workstation grafiche remote, streaming di giochi e rendering che sfruttano le API standard del settore come OpenGL, DirectX e Vulkan. Forniscono fino a 4 GPU AMD Radeon Pro V520, 64 vCPU, rete a 25 Gb/s e archiviazione SSD locale basata su NVMe da 2,4 TB.
Vantaggi
Istanze dalle prestazioni più elevate e dal costo più basso per applicazioni ad alta intensità di grafica
Le istanze G4ad sono le istanze più economiche nel cloud per le applicazioni ad alta intensità di grafica. Offrono prestazioni di prezzo migliori fino al 45%, incluse prestazioni grafiche fino al 40% migliori, rispetto a istanze comparabili per applicazioni grafiche come workstation grafiche remote, streaming di giochi e rendering che sfruttano le API standard del settore come OpenGL, DirectX e Vulkan.
Gestione semplificata delle postazioni di lavoro virtuali al minor costo nel cloud
Le istanze G4ad consentono ai clienti di configurare workstation virtuali con capacità di simulazione, rendering e progettazione ad alte prestazioni in pochi minuti, consentendo ai clienti di scalare rapidamente. I clienti possono utilizzare il software AMD Radeon Pro for Enterprise e il protocollo di visualizzazione remota ad alte prestazioni, NICE DCV, con istanze G4ad senza costi aggiuntivi per gestire i loro ambienti di workstation virtuali con supporto per un massimo di due monitor 4k per GPU.
Affidabilità in applicazioni di terze parti
La soluzione grafica professionale AMD include un ampio processo di test e certificazione delle applicazioni di fornitori di software indipendenti (ISV) chiamato Day Zero Certification Program. Ciò aiuta a garantire che gli sviluppatori possano sfruttare le ultime funzionalità del software AMD Radeon Pro for Enterprise combinate con l'affidabilità del software certificato il giorno del rilascio del driver.
Caratteristiche
Basato da GPU AMD Radeon Pro V520
Le GPU AMD Radeon Pro V520 forniscono un'accelerazione ad alte prestazioni per la grafica come workstation virtuali, immagini generate dal computer (CGI), streaming di giochi e creazione di contenuti digitali (DCC). Queste GPU sono costruite sull'architettura RDNA di AMD che è iper efficiente, con bassa latenza e larghezza di banda da CPU a GPU elevata necessaria per consentire esperienze di gioco e workstation di alta qualità. Con una pipeline grafica migliorata, l'architettura RDNA è progettata per rendere i tuoi giochi più veloci con prestazioni per clock più elevate.
Archiviazione dell'istanza locale
Le istanze G4ad offrono fino a 2,4 TB di spazio di archiviazione NVMe locale per un rapido accesso ai dati, consentendo ai clienti di creare in modo efficiente contenuti 3D fotorealistici e ad alta risoluzione per film, giochi ed esperienze AR/VR.
Driver grafici di livello professionale
Le istanze G4ad forniscono driver grafici di livello professionale senza costi aggiuntivi. Questi driver possono essere utilizzati per fornire la migliore esperienza di workstation virtuale per un'ampia gamma di flussi di lavoro visivamente intensivi e grafica senza precedenti e supporto di elaborazione per lo sviluppo di giochi.
Testimonianze dei clienti
Ubitus è un'azienda innovativa all'avanguardia nella creazione di tecnologie di cloud gaming. Attraverso le loro piattaforme, gli utenti possono godere di un'esperienza di gioco AAA su qualsiasi dispositivo, inclusi smartphone, tablet, console di gioco, smart TV e computer, purché siano connessi a una rete a banda larga.
“Ubitus ha sfruttato le capacità della GPU di AWS per collaborare con IO Interactive per rilasciare una versione cloud di Hitman 3 su un dispositivo di gioco altamente portatile. Con l'introduzione delle istanze G4ad di Amazon EC2, siamo stati in grado di adattare fino al 50% in più di flussi simultanei per istanza senza modificare alcun codice, consentendoci di ottimizzare i nostri costi. La struttura a basso costo ci consente di portare più giochi come Hitman 3 ai giocatori di tutto il mondo".
Wesley Kuo, CEO - Ubitus.
“Land F/X sfrutta l'accelerazione GPU per aiutare i professionisti della progettazione a massimizzare le prestazioni e i costi. land F/X utilizzava le istanze G4dn per il proprio sviluppo e con il lancio di G4ad è stato in grado di migrare rapidamente il loro utilizzo ottenendo un miglioramento delle prestazioni del 67% nel rendering e un risparmio del 25% rispetto al precedente utilizzo della GPU.“
Jeremiah Farmer CEO/Developer - Land F/X
Duolingo è una piattaforma di educazione linguistica gratuita che è diventata il modo più popolare per imparare le lingue online. Gli scienziati dell'apprendimento delle lingue, gli ingegneri di machine learning e gli esperti di intelligenza artificiale di Duolingo utilizzano i dati di oltre 300 milioni di studenti per aumentare costantemente l'efficacia della piattaforma.
"Man mano che i nostri team di machine learning e di ricerca crescevano, abbiamo deciso di aggiornare la nostra infrastruttura di elaborazione basata su Amazon ECS esistente per supportare i tipi di istanze basate su GPU Amazon EC2 P3 e G4 per scalare meglio il nostro modello di sviluppo. Le AMI ottimizzate per ECS di Amazon per le istanze GPU ci hanno aiutato a far funzionare il nuovo cluster molto rapidamente e abbiamo scoperto che le istanze G4 hanno raddoppiato le nostre velocità di addestramento ML rispetto alle istanze P2, portando a un risparmio sui costi del 33%, mentre le istanze P3 quadruplicato le prestazioni e fornito un risparmio sui costi del 15%. Nel complesso, le istanze G4 sono adatte ai nostri casi d'uso generali poiché forniscono un buon equilibrio tra costi e prestazioni e le istanze P3 sono ideali quando la velocità aggiuntiva è fondamentale per un particolare carico di lavoro".
Max Blaze, Staff Operations Engineer - Duolingo
"Blacknut è il principale servizio indipendente di cloud gaming che fornisce al grande pubblico un'esperienza "click & play", su qualsiasi dispositivo, da un catalogo di oltre 500 videogiochi. Per adempiere alla nostra missione di fornire bassa latenza, tempi di caricamento veloci e un'esperienza di gioco fluida, dobbiamo essere situati il più vicino possibile ai giocatori. Con le istanze EC2 G4dn, possiamo fornire ai nostri giocatori un tempo medio di caricamento di 10 secondi o meno per gioco, garantendo un'esperienza di gioco complessivamente positiva. Possiamo anche lanciare la nostra soluzione in nuovi mercati in meno di 2 mesi, e questa reattività ci ha permesso di schierare nuovi partner globali ogni mese dal 2020, tra cui Telecom Italia, Swisscom, POST, Drei Austria e Ais in Thailandia. Il nostro servizio è ora attivo in più di 40 mercati".
Pascal Manchon, Blacknut CTO
Nel 2018, Snap Inc (Snap), nota per la sua app di messaggistica Snapchat, ha avuto una nuova idea intrigante: creare una serie di video animati con protagonista il Bitmoji di ogni utente, l'avatar personalizzato dei cartoni animati che è la caratteristica distintiva di Snapchat. Ogni settimana, Bitmoji TV debuttava con nuovi episodi costituiti da stupidi video animati e sceneggiati professionalmente da 3 a 8 minuti in cui i Bitmoji degli utenti e dei loro amici erano le stelle, facendo di tutto, dalla lotta contro gli zombi alla competizione in una bassa gravità " Olimpiadi lunari". Con le istanze G4 di Amazon EC2, Snap è stato in grado di creare un tipo di intrattenimento personalizzato divertente e audace che è stato reso abbastanza rapidamente da consentire a milioni di persone di divertirsi contemporaneamente, mantenendo bassi i costi di elaborazione.
"Con le istanze G4 di Amazon EC2 rispetto alle istanze G3 di Amazon EC2 abbiamo ottenuto un incremento del 50% a fronte di un costo superiore del 10%".
Brad Kotsopolous, Software Engineer - Snap Inc.
Nearmap è stata fondata a Perth, in Australia, nel 2007 ed è cresciuta da una piccola startup a leader nell'imaging digitale. L'azienda è specializzata nella creazione di immagini 2D e 3D da foto aeree di paesaggi, una risorsa preziosa per un'ampia varietà di settori. Per Nearmap, l'impatto dell'aggiornamento alle istanze G4 di Amazon EC2 è stato immediato e profondo: l'azienda è stata in grado di eseguire tre volte più dati allo stesso costo rispetto alle istanze G2 di Amazon EC2, in un processo che è sembrato semplice e la cui integrazione è risultata perfetta con gli strumenti AWS che stava già utilizzando.
"I nostri clienti si affidano a noi per fornire modelli di realtà 3D altamente accurati calcolati da fotografie aeree multi-angolo in ampie aree di copertura. Usiamo circa 870 mila core di GPU al giorno. Eravamo soliti eseguire questa pipeline su istanze Amazon EC2 G2, ma siamo passati a istanze Amazon EC2 G4 e abbiamo ridotto i nostri costi del 67%".
John Corbett, Director - Vision Systems
Untold Studios ha distribuito varie configurazioni di workstation virtuali AWS, comprese le istanze G4, che dispongono di GPU NVIDIA T4 e tecnologia RTX e sono ottimizzate per flussi di lavoro VFX e animazione. Con opzioni di istanze estese tra cui scegliere, Untold Studios può abbinare in modo più accurato i tipi di macchine virtuali a carichi di lavoro specifici, un approccio che è vantaggioso sia dal punto di vista creativo che economico.
“G4 ha avuto un enorme impatto sul nostro modo di lavorare. Possiamo aggiornare un'intera flotta di workstation con una riga di codice, in modo che gli artisti possano lavorare più velocemente, migliorando la creatività in tutto ciò che facciamo".
Sam Reid, Head of Technology - Untold Studios
Dettagli del prodotto
Dimensioni istanza | GPU | vCPU | Memoria (GiB) | Archiviazione dell'istanza (GB) | Larghezza di banda di rete (Gb/s) | Larghezza di banda EBS (Gbps) | Prezzo on demand/h* | Istanza riservata effettiva di 1 anno all'ora* (Linux) | Istanza riservata effettiva di 3 anni all'ora* (Linux) | |
G4dn |
||||||||||
VM a GPU singola | g4dn.xlarge | 1 | 4 | 16 | 1 x 125 SSD NVMe | Fino a 25 | Fino a 3,5 | 0,526 USD | 0,316 USD | 0,210 USD |
g4dn.2xlarge | 1 | 8 | 32 | 1 x 225 SSD NVMe | Fino a 25 | Fino a 3,5 | 0,752 USD | 0,452 USD | 0,300 USD | |
g4dn.4xlarge | 1 | 16 | 64 | 1 x 225 SSD NVMe | Fino a 25 | 4,75 | 1,204 USD | 0,722 USD | 0,482 USD | |
g4dn.8xlarge | 1 | 32 | 128 | 1 x 900 SSD NVMe | 50 | 9,5 | 2,176 USD | 1,306 USD | 0,870 USD | |
g4dn.16xlarge | 1 | 64 | 256 | 1 x 900 SSD NVMe | 50 | 9,5 | 4,352 USD | 2,612 USD | 1,740 USD | |
VM a GPU multiple | g4dn.12xlarge | 4 | 48 | 192 | 1 x 900 SSD NVMe | 50 | 9,5 | 3,912 USD | 2,348 USD | 1,564 USD |
g4dn.metal | 8 | 96 | 384 | 2 x 900 SSD NVMe | 100 | 19 | 7,824 USD | 4,694 USD | 3,130 USD | |
G4ad |
||||||||||
VM a GPU singola | g4ad.xlarge | 1 | 4 | 16 | 1 x 150 SSD NVMe | Fino a 10 | Fino a 3 | 0,379 USD | 0,227 USD | 0,178 USD |
g4ad.2xlarge | 1 | 8 | 32 | 1 x 300 SSD NVMe | Fino a 10 | Fino a 3 | 0,541 USD | 0,325 USD | 0,254 USD | |
g4ad.4xlarge | 1 | 16 | 64 | 1 x 600 SSD NVMe | Fino a 10 | Fino a 3 | 0,867 USD | 0,520 USD | 0,405 USD | |
VM a GPU multiple | g4ad.8xlarge | 2 | 32 | 128 | 1 x 1200 SSD NVMe | 15 | 3 | 1,734 USD | 1,040 USD | 0,810 USD |
g4ad.16xlarge | 4 | 64 | 256 | 1 x 2400 SSD NVMe | 25 | 6 | 3,468 USD | 2,081 USD | 1,619 USD |
* I prezzi sono calcolati per la regione AWS Stati Uniti orientali (Virginia settentrionale). Per quanto riguarda le istanze che non prevedono pagamenti anticipati parziali, i prezzi per le istanze riservate di 1 anno e di 3 anni si applicano alle opzioni di pagamento "parzialmente anticipato" o "nessun anticipo".
Nozioni di base sulle istanze G4dn
Utilizzo di AMI e container predefiniti di AWS
Con le AMI di Amazon Deep Learning o Deep Learning Containers, è possibile avviare rapidamente istanze Amazon EC2 con popolari framework preinstallati di apprendimento profondo, tra cui TensorFlow, PyTorch, Apache MXNet, Chainer, Gluon, Horovod, e Keras per addestrare modelli di intelligenza artificiale sofisticati e personalizzati, sperimentare con nuovi algoritmi o apprendere nuove competenze e tecniche. Per ulteriori informazioni, visita la pagina del prodotto AMI di Amazon Deep Learning o la pagina del prodotto AWS Deep Learning Containers.
Le AMI RTX Virtual Workstation NVIDIA supportano fino a quattro display 4K per GPU per le app di visualizzazione. Le AMI di gaming NVIDIA renderizza i video a 60 FPS e supporta l'esecuzione di un singolo display 4K su base GPU.
Crea la tua AMI personalizzata con i driver NVIDIA
I driver NVIDIA Data Center forniscono le migliori prestazioni per carichi di lavoro computazionali altamente intensivi spesso presenti in Deep Learning, Data Science e HPC.
I driver NVIDIA RTX possono essere utilizzati per abilitare il software NVIDIA RTX Virtual Workstation. RTX vWS offre supporto per un massimo di quattro display 4K per GPU. I driver NVIDIA Gaming supportano le schede grafiche, le soluzioni di gioco e la tecnologia di gioco più avanzate del mondo. Questo driver offre supporto per un singolo display 4K su base GPU.
Per informazioni su come installare questi driver sulla tua istanza, segui questi collegamenti per Linux e Windows.
Nozioni di base sulle istanze G4ad
Utilizzo delle AMI pre-integrate da AWS
I driver AMD Radeon Pro Software for Enterprise forniscono grafica ad alte prestazioni per workstation virtuali, streaming di giochi, rendering e altre applicazioni grafiche. Per iniziare rapidamente, puoi utilizzare le AMI fornite da AWS che includono il software AMD Radeon Pro for Enterprise preinstallato. Queste AMI sono disponibili sull’AMD Radeon Pro Marketplace.
Crea la tua AMI personalizzata con i driver AMD
I driver AMD Radeon Pro Software for Enterprise possono essere utilizzati per configurare le istanze con una grafica professionale potente e affidabile. Le workstation fornite con questi driver possono supportare fino a due display 4K.
Per informazioni su come installare questi driver sulla tua istanza per creare la tua AMI personalizzata, segui questi link per Linux e Windows.
Risorse
Blog AWS Compute
Approfondimento sulle nuove istanze G4ad di Amazon EC2
Blog AMD
La guida definitiva: impostare istanze Amazon EC2 G4ad
Blog AMD
Le istanze Amazon EC2 G4ad basate su AMD accelerano i flussi di lavoro dei motori di gioco nel cloud
Blog AMD
Accedi ai tuoi dati e progetta ovunque con Autodesk® Inventor® e le istanze G4ad Amazon EC2
Blog AMD
La guida definitiva: impostare istanze Amazon EC2 G4ad
Nozioni di base su AWS
Registrati per creare un account AWS
Impara con i tutorial di 10 minuti
Inizia a lavorare con AWS
Ulteriori informazioni sugli altri tipi di istanze di Amazon EC2