分散型機械学習 (ML) トレーニングを数千の高速インスタンスにスケーリングし、本番環境で推論用のモデルをシームレスにデプロイします。
最新のドライバー、フレームワーク、ライブラリ、ツールを使用して、AWS Trainium、AWS Inferentia、NVIDIA GPU などのアクセラレータで開発できます。
セキュリティの脆弱性に対処するために定期的にパッチが適用されたカスタマイズされた安定したマシンイメージにより、リスクを軽減します。
仕組み
AWS Deep Learning AMI (DLAMI) は、ML の実践者や研究者向けに、Amazon EC2 での深層学習を加速するための厳選された安全なフレームワーク、依存関係、ツールのセットを提供します。Amazon Linux と Ubuntu 用に構築された Amazon Machine Images (AMI) には、TensorFlow、PyTorch、NVIDIA CUDA ドライバーとライブラリ、Intel MKL、Elastic Fabric Adapter (EFA)、AWS OFI NCCL プラグインが予め構成されているため、これらのフレームワークとツールを大規模にすばやくデプロイして実行できます。
ユースケース
自動運転車の開発
サポートされている数百万の仮想テストでモデルを検証することにより、高度な ML モデルを大規模に開発し、自動運転車 (AV) テクノロジーを安全に開発します。
自然言語処理
Hugging Face Transformers などの最新のフレームワークとライブラリを使用して、AWS インスタンスのインストールと設定を加速し、実験と評価を高速化します。
ヘルスケアデータ分析
高度な分析、ML、および深層学習の各機能を使用して、傾向を特定し、健康に関するさまざまな raw データから予測を行います。
高速化されたモデルトレーニング
DLAMI には、事前設定されたドライバー、Intel Math Kernel Library (MKL)、Python パッケージ、および Anaconda Platform を通じた最新の NVIDIA GPU アクセラレーションが含まれています。
お客様事例
Cimpress は、お客様中心の起業家精神にあふれた印刷物の大量カスタマイズ事業に投資し、長期的に構築しています。Cimpress を使用すると、お客様、組織、または愛する人に、簡単かつ手頃な価格で印象を与えることができます。Cimpress は、企業のブランド力を高める販促資料であれ、誕生を祝う発表であれ、お客様が望む個別のパーソナライズと、物理的な製品の具体的な影響を組み合わせています。
「Cimpress は AWS 深層学習 AMI を使用して、機械学習環境を迅速にセットアップしてデプロイしています。DLAMI は、コンピュータービジョンと生成系 AI 向けの深層学習モデルのトレーニングと展開という中核的な作業に集中することで、運用上のオーバーヘッドを削減し、製品をより早く市場に投入できます」
Ajay Joshi 氏、主任ソフトウェアエンジニア、Cimpress
Flip AI は、GenAI 初のネイティブオブザーバビリティプラットフォームであり、データやプラットフォームにとらわれず、メトリクス、イベント、ログ、トレースを含むすべてのオブザーバビリティモダリティを理解し、予測分析とインシデントの根本原因分析を数秒で生成します。
「Flip AI では、本番環境のインシデントをデバッグする DevOps 用の独自の LLM をトレーニングし、企業が最高レベルのカスタマーエクスペリエンスを達成できるよう支援しています。このトレーニングには、簡単にカスタマイズできる高性能なセットアップが必要です。DLAMI を使用すれば、CUDA ドライバーや Pytorch 関連の最適化と格闘する必要がなくなります。本当に効果的です。GPU の使用率を向上させることで、モデルをより効率的にトレーニングできるようになり、推論にかかる時間を数十ミリ秒短縮できるようになりました」。
Flip AI、CTO、Sunil Mallya 氏
最初に行うべきこと
モデルのトレーニングを加速する方法を確認する
DLAMI が開発とモデルのトレーニングを促進する方法について説明します。
AMI の詳細
プロジェクトに合った AMI とインスタンスタイプを選択してください。
ハンズオントレーニングを受講する
10 分間のチュートリアルでビルドを開始することができます。