為什麼選擇 Trainium?
AWS Trainium 是 AWS 專為 100B 以上之參數模型深度學習 (DL) 訓練打造的機器學習 (ML) 晶片。每個 Amazon Elastic Compute Cloud (Amazon EC2) Trn1 執行個體最多部署 16 個 Trainium 加速器,為雲端 DL 訓練提供高效能、低成本的解決方案。儘管 DL 和生成式 AI 的使用正在加速推進,但許多開發團隊僅有固定的預算,這限制了改進其模型和應用程式所需的訓練範圍和頻率。基於 Trainium 的 Amazon EC2 Trn1 執行個體能縮短訓練時間,同時比同類 EC2 執行個體節省高達 50% 的訓練成本,從而解決了此難題。Trainium 已經過最佳化,可訓練用於文字摘要、程式碼產生、問題答覆、影像和影片產生、建議及詐騙偵測等廣泛應用中的自然語言處理、電腦視覺和推薦模型。
AWS Neuron SDK 可協助開發人員在 Trainium 加速器上訓練模型 (並將其部署在 AWS Inferentia 加速器上)。其與 PyTorch 和 TensorFlow 等熱門架構原生整合,因此您可以繼續在 Trainium 加速器上訓練,並且使用現有程式碼和工作流程。