Amazon SageMaker 数据和人工智能治理常见问题

数据和人工智能治理

下一代 Amazon SageMaker 可简化湖仓、人工智能模型和应用程序中数据和人工智能的发现、治理和协作。借助基于 Amazon DataZone 构建的 Amazon SageMaker Catalog,用户可以使用生成式人工智能创建的元数据进行语义搜索,安全地发现和访问已获批准的数据和模型,也可以直接使用自然语言询问 Q 开发者版来查找数据。用户可以在 SageMaker Unified Studio(预览版)中集中使用具有精细访问控制的单一权限模型,以一致地定义和强制执行访问策略。通过轻松发布和订阅工作流程,无缝共享和协作处理数据和人工智能资产。借助 Amazon SageMaker,您可以使用 Amazon Bedrock 防护机制保护您的 AI 模型,并实施负责任的人工智能策略。通过数据质量监控和自动化、敏感数据检测以及数据和机器学习任务流水线,让整个组织安心无忧。

您可以通过 Amazon SageMaker Unified Studio(预览版)访问 SageMaker Catalog,前者是用于数据和人工智能开发的单一环境。为了以编程方式设置、配置或集成现有流程,SageMaker Catalog 发布了 API,并附有如何使用现有 Amazon DataZone API 的指南。

  • 难以跨团队查找和共享数据:数据生产者和消费者难以在整个组织内快速查找和共享相关数据集。这种低效率导致浪费时间搜索数据并限制协作。
  • 对数据质量和人工智能模型输出缺乏信任:由于缺乏对数据来源、质量和访问模式的可见性,组织难以信任其数据质量和人工智能模型输出的准确性。
  • 不一致的数据访问和隐私侵犯行为:组织难以执行一致的数据访问策略,从而可能导致对敏感信息的未经授权的访问。
  • 难以遵守法规和内部政策:由于缺乏全面的审计和监控工具,组织发现难以维持监管合规性和遵守内部政策。

Amazon SageMaker 中的数据和人工智能治理可帮助数据团队:

  • 更快地发现数据和进行协作:用户可以在组织内快速查找和共享相关数据,从而减少搜索信息所花费的时间,促进团队合作。
  • 通过任务流水线和质量增强信任:跟踪数据来源,提高数据质量,增强对数据驱动型决策和人工智能模型输出的信心。
  • 增强数据和人工智能模型的安全性:确保数据和模型只能通过项目访问,从而确保仅获授权用户才能查看项目中的资产,维护安全和隐私标准。
  • 降低业务风险和提高监管合规性:记录活动有助于组织遵守行业法规和内部政策,从而帮助降低组织风险。
  • 通过资产搜索和发现提高业务生产力:搜索和发现数据和人工智能资产,以增强团队能力,减少查找关键资产所花费的时间,推动更快的数据驱动型决策。
  • 集中式数据访问策略管理:从单点定义和管理数据访问规则,从而在各种 AWS 服务和第三方环境中实现一致的应用程序。
  • 通过业务背景和分类丰富数据:向数据集添加元数据和分类,确保用户更容易了解数据与特定业务需求的相关性和适用性。
  • 记录用户和系统活动:监控和记录与数据和人工智能系统的交互,提供对使用模式和潜在安全问题的可见性。
  • 人工智能/机器学习数据治理实施:将数据治理原则扩展到人工智能和机器学习流程,确保只有经过批准的数据才能用于模型训练,并确保人工智能系统遵守规定的权限和道德准则。

Amazon SageMaker Catalog 基于 Amazon DataZone 构建,以统一的用户体验提供相同的治理功能。Amazon DataZone 体验保持不变,以便现有 Amazon DataZone 客户在需要时继续使用熟悉的界面。

有关定价详情,请访问:https://aws.amazon.com/datazone/pricing/。