优势

使用预打包且经过完整测试的 Docker 镜像,在几分钟内部署深度学习环境。

通过适用于常见框架(如 TensorFlow、PyTorch 和 Apache MXNet)的优化模型训练,自动提升性能。

以微服务的方式将机器学习(ML)快速添加到在 Amazon EKS 和 Amazon EC2 上运行的应用程序中。

通过与 Amazon SageMaker、Amazon EKS 和 Amazon ECS 集成构建自定义机器学习工作流,用于训练、验证和部署。

使用案例

无人驾驶汽车 (AV) 部署

大规模开发高级 ML 模型,在您的环境中安全、快速地部署 AV 技术。

自然语言处理 (NLP)

使用最新的框架和库(包括 Hugging Face Transformers)减少部署 ML 模型所需的时间,同时加快投入生产的时间。

医疗保健数据分析

使用高级分析、ML 和深度学习功能分析不同的原始运行状况数据,以此识别趋势并进行预测。

支持的深度学习容器

有关深度学习容器支持的详细信息,请参阅发行说明

  框架: PyTorch TensorFlow    
  操作系统: Ubuntu Linux      
  实例: NVIDIA GPU AWS Trainium AWS Inferentia  
  平台: Amazon EC2 Amazon ECS Amazon EKS AWS Graviton

客户成功案例

  • Roblox

    Roblox 是一个沉浸式的游戏和创作平台,为人们提供了数百万种聚会方式,邀请其社区成员探索、创造和分享无尽的独特体验。Roblox 全球社区由数百万名开发人员组成,他们通过 Roblox Studio 创建和发布自己的沉浸式多人游戏体验。Roblox Studio 是该平台的多合一创作引擎,任何人都可以利用它构建自己想象中的一切。

    作为 Roblox 人工智能平台的一部分,我们在整个业务中训练并部署 250 多个模型。实际上,Roblox 上的每一次互动都有某种形式的人工智能驱动,包括安全性、生成式人工智能 3D 内容创作、体验推荐、实时翻译和其他用例。我们正在将 AWS 深度学习容器用于我们的 EKS GPU 节点组,因此我们不必担心基础设施、Nvidia 驱动程序和 CUDA 安装——这是可直接使用的。我们可以专注于对我们真正重要的事情,改进 GPU 调度和 GPU 利用率,以使我们的用户受益,降低我们为这些人工智能工作负载提供服务的成本。

    Denis Goupil,Roblox 首席机器学习工程师

深入了解 AWS