Instancias G4 de Amazon EC2
Las instancias GPU más rentables de la industria para inferencia de machine learning y aplicaciones con uso intensivo de gráficos
Las instancias G4 de Amazon EC2 son las instancias GPU más rentables y versátiles de la industria para implementar modelos de machine learning, como clasificación de imágenes, detección de objetos y reconocimiento por voz, y para las aplicaciones con uso intensivo de gráficos, como estaciones de trabajo remotas de gráficos, streaming de juegos y renderización de gráficos. Las instancias G4 están disponibles con la opción de GPU NVIDIA (G4dn) o GPU AMD (G4ad).
Las instancias G4dn cuentan con GPU NVIDIA T4 y CPU Intel Cascade Lake, y están optimizadas para inferencia de machine learning y formación a pequeña escala. Estas instancias también le brindan alto rendimiento a aplicaciones con uso intensivo de gráficos, lo que incluye estaciones de trabajo remotas de gráficos, streaming de juegos y renderización de gráficos. Estas instancias también son ideales para los clientes que prefieren usar software NVIDIA, como RTX Virtual Workstation, y bibliotecas, como CUDA, CuDNN y NVENC.
Las instancias G4ad cuentan con las GPU más recientes de AMD Radeon Pro V520 y con los procesadores AMD EPYC de segunda generación. Estas instancias también le brindan la mejor relación entre precio y rendimiento en la nube para aplicaciones de gráficos, lo que incluye estaciones de trabajo remotas de gráficos, streaming de juegos y renderización de gráficos. En comparación con instancias similares, ofrecen una relación entre precio y rendimiento hasta un 45 % mejor para las aplicaciones con uso intensivo de gráficos.
Instancias G4dn de Amazon EC2
Las instancias G4dn, con tecnología de GPU NVIDIA T4, son las instancias de menor costo basadas en GPU en la nube para la inferencia de machine learning y la formación a pequeña escala. Además, proporcionan un alto rendimiento y son una solución rentable para las aplicaciones gráficas optimizadas para las GPU NVIDIA que usan bibliotecas NVIDIA, como CUDA, CuDNN y NVENC. Proporcionan hasta 8 GPU NVIDIA T4, 96 vCPUs, red de 100 Gbps y 1,8 TB de almacenamiento local SSD basado en NVMe y también están disponibles como instancias bare metal.
Beneficios
Aumente el rendimiento y reduzca los costos de inferencia de machine learning
Las instancias G4dn están equipadas con GPU NVIDIA T4, que ofrece un rendimiento de latencia baja hasta 40 veces mejor que las CPU, por lo que se puede responder a más solicitudes en tiempo real. Además, las instancias G4dn están optimizadas para ser rentables para la inferencia de machine learning, lo que puede representar hasta un 90 % de los costos operativos para las iniciativas de machine learning.
Formación rentable a pequeña escala
Las instancias G4dn también son útiles para los trabajos de formación de machine learning a pequeña escala/nivel principiante para las empresas o instituciones que tienen menos presión del tiempo de formación. Las instancias G4dn ofrecen hasta 65 TFLOPS de rendimiento FP16 y son una atractiva solución para los trabajos de formación a pequeña escala.
Aplicaciones de gráficos avanzados de alto rendimiento
Las instancias G4dn tienen un rendimiento de gráficos hasta 1,8 veces mejor y una capacidad de transcodificación de videos hasta 2 veces mejor que las instancias G3 de la generación anterior. Los clientes pueden configurar estaciones de trabajo virtuales con acceso a estaciones de trabajo NVIDIA RTX por un costo adicional.
Características
Con tecnología de GPU de NVIDIA T4
Las GPU de NVIDIA T4 aceleran diversas cargas de trabajo en la nube, lo que incluye formación en aprendizaje profundo e inferencia y gráficos. Basadas en la nueva arquitectura NVIDIA Turing, las GPU T4 cuentan con núcleos Tensor de Turing y nuevos núcleos RT. La tecnología de núcleos Tensor de Turing con informática de multiprecisión para ML posibilita un rendimiento revolucionario desde FP32 hasta FP16 e INT8, además de precisiones INT4. Ofrece un rendimiento hasta 9,3 veces mayor que las CPU de formación y hasta 36 veces mayor en inferencia.
Redes y almacenamiento de alto rendimiento
Las instancias G4dn ofrecen hasta 100 Gbps de redes para aplicaciones que requieren un alto rendimiento. Las instancias G4dn también son compatibles con Elastic Fabric Adapter (EFA) que les permite a los clientes ejecutar aplicaciones que requieren altos niveles de comunicación entre nodos a escala. Estas instancias ofrecen hasta 1,8 TB de almacenamiento SSD basado en NVMe para aplicaciones que requieren acceso rápido a datos almacenados de forma local.
Controladores de RTX y juegos
Las instancias G4dn les ofrecen a los clientes controladores de RTX y juegos NVIDIA sin costo adicional. Los controladores de RTX pueden utilizarse para proporcionar estaciones de trabajo virtual de calidad para una gran variedad de flujos de trabajo con visuales de avanzada. El controlador de juegos proporciona gráficos incomparables y soporte informático para el desarrollo de juegos.
Instancias G4ad de Amazon EC2
Las instancias G4ad, con tecnología de GPU AMD Radeon Pro V520, ofrecen la mejor relación entre precio y rendimiento para aplicaciones con uso intensivo de gráficos en la nube. Estas instancias ofrecen una relación entre precio y rendimiento hasta un 45 % mejor en comparación con las instancias G4dn, que ya eran las instancias de más bajo costo en la nube, para las aplicaciones de gráficos, como las estaciones de trabajo remotas de gráficos, streaming de juegos y renderizaciones que aprovechan las API estándar de la industria, como OpenGL, DirectX y Vulkan. Proporcionan hasta 4 GPU AMD Radeon Pro V520, 64 vCPUs, redes de 25 Gbps y almacenamiento local SSD basado en NVMe de 2,4 TB.
Beneficios
Instancias del más alto rendimiento y el más bajo costo para aplicaciones con uso intensivo de gráficos
Las instancias G4ad son las de más bajo costo en la nube para aplicaciones con uso intensivo de gráficos. Ofrecen una relación entre precio y rendimiento hasta un 45 % mejor, además de un rendimiento un 40 % mejor en gráficos, en comparación con instancias similares de aplicaciones de gráficos, como las estaciones de trabajo remotas de gráficos, streaming de juegos y renderizaciones que aprovechan las API estándar de la industria, como OpenGL, DirectX y Vulkan.
Administración simplificada de estaciones de trabajo virtuales al menor costo en la nube
Las instancias G4ad les permiten a los clientes configurar estaciones de trabajo virtuales con capacidad de simulación, renderización y diseño de alto rendimiento en minutos, lo que les permite a los clientes escalar rápidamente. Los clientes pueden utilizar AMD Radeon Pro Software for Enterprise y el protocolo de visualización remota de alto rendimiento, NICE DCV, con instancias G4ad sin costo adicional para administrar sus entornos de estaciones de trabajo virtuales con soporte para hasta dos monitores 4k por GPU.
Confiabilidad en aplicaciones de terceros
La solución de gráficos profesionales AMD incluye una extensa prueba de aplicación de proveedor de software independiente (ISV) y un proceso de certificación llamado Day Zero Certification Program. Esto lo ayuda a asegurarse de que los desarrolladores puedan aprovechar las características más recientes del AMD Radeon Pro Software for Enterprise con la fiabilidad del software certificado el día del lanzamiento del controlador.
Características
Con tecnología de GPU AMD Radeon Pro V520
Las GPU AMD Radeon Pro V520 ofrecen aceleración de alto rendimiento para gráficos, como por ejemplo en estaciones de trabajo virtuales, imágenes generadas por computadora (CGI), streaming de juegos y creación de contenido digital (DCC). Estas GPU se crean con arquitectura RDNA de AMD que es hipereficiente, tiene baja latencia y la banda ancha de CPU a GPU alta necesaria para habilitar estaciones de trabajo y experiencias de juego de alta calidad. Con una canalización de gráficos mejorada, la arquitectura RDNA está diseñada para hacer que sus juegos sean más rápidos y tengan un mayor rendimiento por ciclo del reloj.
Almacenamiento local de instancias
Las instancias G4ad ofrecen hasta 2,4 TB de almacenamiento NVMe local para un rápido acceso a los datos, lo que les permite a los clientes crear contenido 3D fotorrealista y de alta resolución para películas, juegos y experiencias de realidad aumentada y realidad virtual.
Controladores gráficos de nivel profesional
Las instancias G4ad ofrecen controladores gráficos de nivel profesional sin costo adicional. Estos controladores pueden utilizarse para ofrecer la mejor experiencia de estación de trabajo virtual para una gran variedad de flujos de trabajo con uso intensivo de imágenes y gráficos incomparables y soporte informático para el desarrollo de juegos.
Historias de clientes
Ubitus es una innovadora empresa que lidera la creación de tecnología de juegos en la nube. A través de sus plataformas, los usuarios pueden disfrutar una experiencia de juego AAA en cualquier dispositivo, como smartphones, tablets, consolas de juegos, televisores inteligentes y equipos, siempre y cuando estén conectados a una red de banda ancha.
“Ubitus aprovechó las capacidades de GPU de AWS para asociarse con IO Interactive con el fin de lanzar una versión en la nube de Hitman 3 en un dispositivo de juegos muy portátil. Con la presentación de las instancias G4ad de Amazon EC2, pudimos incorporar hasta un 50 % más de transmisiones por instancia sin cambiar ningún código, lo que nos permite optimizar nuestros costos. La estructura de costos más bajos nos permite llevar más juegos, como Hitman 3, a los clientes de todo el mundo”.
Wesley Kuo, director ejecutivo (CEO) de Ubitus.
“Land F/X aprovecha la aceleración de la GPU para ayudar a los profesionales del diseño mientras que maximiza su rendimiento y costo. Land F/X había estado utilizando instancias G4dn para su desarrollo y, con el lanzamiento de G4ad, pudo migrar rápidamente su uso, lo que generó una mejora del rendimiento del 67 % en renderizaciones, mientras que ahorró un 25 % en comparación con su uso anterior de la GPU”.
Jeremiah Farmer, director ejecutivo (CEO)/desarrollador de Land F/X
Duolingo es una plataforma de educación en idiomas que se convirtió en la forma más popular para aprender idiomas online. Los científicos de aprendizaje de idiomas, los ingenieros de machine learning y los expertos en IA de Duolingo utilizan datos de más de 300 millones de estudiantes para aumentar constantemente la efectividad de la plataforma.
"A medida que crecieron nuestros equipos de ML y de investigación, decidimos actualizar nuestra infraestructura informática basada en Amazon ECS para que sea compatible con los tipos de instancias basadas en GPU, P3 y G4 de Amazon EC2, para poder escalar mejor nuestro modelo de desarrollo. Las AMI de Amazon optimizadas para ECS nos ayudaron a poner en funcionamiento rápidamente el nuevo clúster, y notamos que las instancias G4 duplicaron nuestra velocidad de formación de ML en comparación con las instancias P2, lo que llevó a un ahorro del 33 % en los costos, mientras que las instancias P3 cuadruplicaron el rendimiento y nos facilitaron un 15 % de ahorro de costos. En general, las instancias G4 son aptas para nuestros casos de uso general, ya que ofrecen un buen equilibrio entre costo y rendimiento, y las instancias P3 son ideales cuando la velocidad adicional es esencial para una carga de trabajo en particular".
Max Blaze, ingeniero de operaciones de personal de Duolingo
“Blacknut es el principal servicio de videojuegos en la nube independiente que brinda al público general una experiencia “click & play”, en cualquier dispositivo, con un catálogo de más de 500 videojuegos. Para llevar a cabo nuestra misión de ofrecer latencia baja, tiempos de carga reducidos y una experiencia de juego fluida, necesitamos estar ubicados lo más cerca posible de los jugadores. Con las instancias G4dn de EC2, podemos brindar a nuestros jugadores un tiempo de carga promedio de 10 segundos o menos por juego, de modo que garantizamos una experiencia de juego positiva en su conjunto. También podemos implementar nuestra solución en nuevos mercados en menos de dos meses, y esta capacidad de reacción nos permitió implementar nuevos socios globales cada mes desde 2020, incluidos Telecom Italia, Swisscom, POST, Drei Austria y Ais en Tailandia. Nuestro servicio ahora está activo en más de 40 mercados”.
Pascal Manchon, director de tecnología de Blacknut
En 2018, Snap Inc. (Snap), conocido por su aplicación de mensajería Snapchat, tuvo una curiosa nueva idea: crear una serie de videos animados protagonizados por el Bitmoji de cada usuario (el avatar personalizado que es la característica destacada de Snapchat). Cada semana, Bitmoji TV presentaría nuevos episodios con absurdos videos de 3 a 8 minutos, con guiones y animación profesional, en los que los Bitmojis de los usuarios y sus amigos serían las estrellas, y harían de todo, desde luchar contra zombis hasta competir sin gravedad en unas olimpíadas en la luna llamadas “Moonlympics”. Con las instancias G4 de Amazon EC2, Snap pudo crear un tipo de entretenimiento personalizado, divertido y audaz que se renderizó lo suficientemente rápido como para que millones de personas pudieran disfrutarlo al mismo tiempo, mientras que mantuvieron sus costos informáticos bajos.
"Con las instancias G4 de Amazon EC2, en comparación con las instancias G3 de Amazon EC2, obteníamos un aumento del 50 % con un costo solo un 10 % más alto”.
Brad Kotsopolous, ingeniero de Software en Snap Inc.
Nearmap fue fundada en Perth, Australia, en 2007 y creció de una pequeña empresa emergente a una empresa líder en imágenes digitales. La empresa se especializa en crear imágenes 2D y 3D de fotos aéreas de paisajes, un valioso recurso para una amplia variedad de industrias. Para Nearmap, el impacto de pasar a instancias G4 de Amazon EC2 fue inmediato y profundo: la empresa pudo ejecutar tres veces más datos por el mismo costo que las instancias G2 de Amazon EC2, en un proceso cómodo y cuya integración se produjo sin problemas con las herramientas de AWS que ya se estaban utilizando.
“Nuestros clientes confían en nosotros para brindarles modelos de realidad en 3D muy precisos y calculados mediante fotografía aérea multiángulo capaz de abarcar grandes extensiones. Utilizamos alrededor de 870 mil núcleos de GPU por día. Solíamos utilizar esta canalización en instancias G2 de Amazon EC2, pero nos cambiamos a las instancias G4 de Amazon EC2 y pudimos reducir nuestros costos un 67 %”.
John Corbett, director de Vision Systems
Untold Studios implementó varias configuraciones de estaciones de trabajo virtuales de AWS, incluidas las instancias G4, que cuentan con GPU NVIDIA T4 y tecnología RTX, y están optimizadas para flujos de trabajo VFX y de animación. Con opciones de instancias expandidas para elegir, Untold Studios puede combinar con mayor precisión los tipos de máquinas virtuales con cargas de trabajo específicas, un enfoque que es beneficioso tanto a nivel creativo como económico.
“G4 tuvo un gran impacto en la forma en la que trabajamos. Podemos actualizar una flota completa de estaciones de trabajo con una sola línea de código para que los artistas puedan trabajar con más rapidez y mejorar así la creatividad en todo lo que hacemos”.
Sam Reid, director de Tecnología de Untold Studios
Detalles del producto
Tamaño de la instancia | GPU | vCPU | Memoria (GiB) | Almacenamiento de instancias (GB) | Ancho de banda de red (Gbps) | Banda ancha de EBS (Gbps) | Precio de la instancia bajo demanda por hora* | Valor por hora real en una instancia reservada por 1 año* (Linux) | Valor por hora real en una instancia reservada por 3 años* (Linux) | |
G4dn |
||||||||||
MV con una sola GPU | g4dn.xlarge | 1 | 4 | 16 | 1 x 125 SSD NVMe | Hasta 25 | Hasta 3,5 | 0,526 USD | 0,316 USD | 0,210 USD |
g4dn.2xlarge | 1 | 8 | 32 | 1 x 225 SSD NVMe | Hasta 25 | Hasta 3,5 | 0,752 USD | 0,452 USD | 0,300 USD | |
g4dn.4xlarge | 1 | 16 | 64 | 1 x 225 SSD NVMe | Hasta 25 | 4,75 | 1,204 USD | 0,722 USD | 0,482 USD | |
g4dn.8xlarge | 1 | 32 | 128 | 1 x 900 SSD NVMe | 50 | 9,5 | 2,176 USD | 1,306 USD | 0,870 USD | |
g4dn.16xlarge | 1 | 64 | 256 | 1 x 900 SSD NVMe | 50 | 9,5 | 4,352 USD | 2,612 USD | 1,740 USD | |
MV con varias GPU | g4dn.12xlarge | 4 | 48 | 192 | 1 x 900 SSD NVMe | 50 | 9,5 | 3,912 USD | 2,348 USD | 1,564 USD |
g4dn.metal | 8 | 96 | 384 | 2 x 900 SSD NVMe | 100 | 19 | 7,824 USD | 4,694 USD | 3,130 USD | |
G4ad |
||||||||||
MV con una sola GPU | g4ad.xlarge | 1 | 4 | 16 | 1 x 150 SSD NVMe | Hasta 10 | Hasta 3 | 0,379 USD | 0,227 USD | 0,178 USD |
g4ad.2xlarge | 1 | 8 | 32 | 1 x 300 SSD NVMe | Hasta 10 | Hasta 3 | 0,541 USD | 0,325 USD | 0,254 USD | |
g4ad.4xlarge | 1 | 16 | 64 | 1 x 600 SSD NVMe | Hasta 10 | Hasta 3 | 0,867 USD | 0,520 USD | 0,405 USD | |
MV con varias GPU | g4ad.8xlarge | 2 | 32 | 128 | 1 x 1200 SSD NVMe | 15 | 3 | 1,734 USD | 1,040 USD | 0,810 USD |
g4ad.16xlarge | 4 | 64 | 256 | 1 x 2400 SSD NVMe | 25 | 6 | 3,468 USD | 2,081 USD | 1,619 USD |
* Los precios que se muestran son para la región EE. UU. Este (Norte de Virginia) de AWS. Los precios de las instancias reservadas para 1 y 3 años son para las opciones de pago “parcial por adelantado”, y “sin pago por adelantado” para instancias sin la opción de pago parcial.
Introducción a las instancias G4dn
Utilice AMI y contenedores precreados de AWS
Al utilizar Deep Learning AMIs o Deep Learning Containers de Amazon, usted puede lanzar rápidamente instancias de Amazon EC2 preinstaladas con marcos e interfaces populares de aprendizaje profundo, como TensorFlow, PyTorch y MXNet, para formar modelos de inteligencia artificial personalizados y sofisticados, probar algoritmos nuevos o aprender nuevas técnicas o habilidades. Para obtener más información, visite la página de productos de Deep Learning AMIs de Amazon o la página de productos de AWS Deep Learning Containers.
Las AMI RTX Virtual Workstation de NVIDIA pueden ejecutar hasta cuatro pantallas 4k por GPU para las aplicaciones de visualización. Las AMI de juegos de NVIDIA ofrecen videos a 60 FPS y pueden ejecutar una pantalla 4K por cada GPU.
Cree su propia AMI personalizada con controladores NVIDIA
Los controladores del centro de datos de NVIDIA ofrecen el mejor rendimiento para las cargas de trabajo informáticas muy intensas que generalmente se encuentran en el aprendizaje profundo, la ciencia de datos y la HPC.
Los controladores RTX de NVIDIA pueden usarse para habilitar el software de NVIDIA RTX Virtual Workstation. RTX vWS admite hasta cuatro pantallas 4k por cada GPU. Los controladores de juegos de NVIDIA son compatibles con las tarjetas gráficas, las soluciones de juegos y las tecnologías de juegos más avanzadas. Este controlador admite una pantalla 4K por cada GPU.
Para saber cómo instalar estos controladores en su instancia, siga estos enlaces para Linux y Windows.
Introducción a las instancias G4ad
Utilice AMI precreadas de AWS
Los controladores de AMD Radeon Pro Software for Enterprise proporcionan gráficos de alto rendimiento para estaciones de trabajo virtuales, streaming de juegos y otras aplicaciones gráficas. Para comenzar rápidamente, puede utilizar las AMI proporcionadas por AWS que tienen AMD Radeon Pro Software for Enterprise preinstalado. Estas AMI están disponibles en AMD Radeon Pro Marketplace.
Cree su propia AMI personalizada con controladores AMD
Los controladores AMD Radeon Pro Software for Enterprise pueden utilizarse para configurar instancias con potentes gráficos de confianza y nivel profesional. Las estaciones de trabajo abastecidas con estos controladores pueden admitir hasta dos pantallas 4K.
Para saber cómo instalar estos controladores en su instancia y crear su propia AMI personalizada, siga estos enlaces para Linux y Windows.
Recursos
Blog de informática de AWS
Análisis profundo de las nuevas instancias G4ad de Amazon EC2
Blog de AMD
La guía completa: configuración de instancias G4ad de Amazon EC2
Blog de AMD
Las instancias G4ad de Amazon EC2 basadas en AMD aceleran los flujos de trabajo de los motores de videojuegos en la nube
Blog de AMD
Acceda a los datos y al diseño en cualquier lugar con Autodesk® Inventor® y las instancias G4ad de Amazon EC2
Blog de AMD
La guía completa: configuración de instancias G4ad de Amazon EC2
Introducción a AWS
Regístrese para obtener una cuenta de AWS
Aprenda con tutoriales de 10 minutos
Comience a crear con AWS
Más información sobre otros tipos de instancias de Amazon EC2