Trainium を利用すべき理由
AWS Trainium は、AWS が 1,000 億件以上のパラメータモデルの深層学習 (DL) トレーニングを行うために専用に構築された機械学習 (ML) チップです。Amazon Elastic Compute Cloud (Amazon EC2) の各 Trn1 インスタンスは、最大 16 個の Trainium アクセラレーターをデプロイし、クラウドでの DL トレーニングのために高性能かつ低コストのソリューションを提供します。DL と生成 AI の使用は加速していますが、多くの開発チームの予算は固定されているため、モデルやアプリケーションを改善するために必要なトレーニングの範囲と頻度が制限されています。Trainium ベースの EC2 Trn1 インスタンスは、同等の Amazon EC2 インスタンスよりも最大 50% 低いトレーニングコストを提供しながら、トレーニング時間を短縮することで、この課題を解決します。Trainium は、テキスト要約、コード生成、質問応答、画像と動画の生成、レコメンデーション、不正検出などの幅広い用途で使用される自然言語処理、コンピュータビジョン、レコメンダーモデルのトレーニングに最適化されています。
AWS Neuron SDK は、デベロッパーが Trainium アクセラレーターでモデルをトレーニングする (および AWS Inferentia アクセラレーターにそれらのモデルをデプロイする) のに役立ちます。PyTorch や TensorFlow などの人気のフレームワークとネイティブに統合するため、引き続き Trainium アクセラレーターでトレーニングし、既存のコードやワークフローを使用できます。