¿Por qué Trainium?
AWS Trainium es el chip de machine learning (ML) que AWS creó especialmente para el entrenamiento de aprendizaje profundo (DL) de más de 100 mil millones de modelos de parámetros. Cada instancia Trn1 de Amazon Elastic Compute Cloud (Amazon EC2) implementa hasta 16 aceleradores Trainium que ofrecen una solución de bajo costo y alto rendimiento para el entrenamiento de DL en la nube. Aunque el uso del DL y la IA generativa se acelera, muchos equipos de desarrollo tienen presupuestos fijos, lo que limita el alcance y la frecuencia de la formación necesaria para mejorar sus modelos y aplicaciones. Las instancias Trn1 de Amazon EC2 basadas en Trainium solucionan este problema al ofrecer un tiempo de entrenamiento más rápido y hasta un 50 % de ahorro en el costo del entrenamiento con respecto a instancias comparables de EC2. Trainium se ha optimizado para entrenar el procesamiento del lenguaje natural, la visión artificial y los modelos de recomendación utilizados en un amplio conjunto de aplicaciones, como el resumen de texto, la generación de código, la respuesta a preguntas, la generación de imágenes y videos, la recomendación y la detección de fraudes.
El SDK de AWS Neuron ayuda a los desarrolladores a entrenar modelos en los aceleradores Trainium (y a implementarlos en los aceleradores de AWS Inferentia). Se integra de forma nativa con marcos populares de machine learning, como PyTorch y TensorFlow, para que pueda continuar entrenando los aceleradores Trainium y utilizando su código y flujos de trabajo existentes.