监控和可观测性

获得洞察力并提高应用程序和基础设施的性能

为什么选择监控和可观测性?

AWS 的全栈可观测性包括 AWS 原生、应用程序性能监控(APM)和开源解决方案,让您能够随时了解整个技术栈中发生的情况。 AWS 可观测性让您可以在云、混合或本地环境中的网络、基础设施和应用程序中收集、关联、聚合和分析遥测数据,以便深入了解系统的行为、性能和运行状况。这些见解可帮助您更快地检测、调查和修复问题;结合人工智能和机器学习,以主动反应、预测和预防问题。

优势

随时随地了解系统中正在发生的情况,以便为最终用户提供最佳体验。快速检测问题、有效调查并尽快修复,以最大程度地减少对客户的干扰并缩短平均解决时间(MTTR)。

当出现应用程序问题时,从一开始就让正确的利益相关者参与任何警报。IT 和业务团队能够在简化复杂任务的同时自动执行日常和重复的任务。通过合作,IT 和业务团队可以利用来自可观测性数据的洞察,以采取更加以用户为中心的方法并提供卓越的最终用户体验。

在数百万个实例中,一个应用程序 CPU 使用量的微小性能改进最终可以节省数百万美元。同样,通过使用可观测性来了解和预测您未来的容量需求,您可以利用预订和现货定价节省大量成本。

提升改进应用程序、基础设施和网络可用性时的客户体验和业务成果。减少停机时间并为您的最终客户构建快速、无缝的数字体验。这使您的内部团队和最终客户都可以有效运营,以加快开发和部署速度。

  • Rego Consulting

    在过去的一年里,CloudWatch Synthetics 和一个基于 Amazon CloudWatch 警报、Amazon SES 和 AWS Lambda 函数的简单系统让我们能够主动响应客户的应用程序和基础设施问题。借助 CloudWatch Synthetics,我们的开发运维和支持团队甚至能够在客户通知我们问题之前就开始分析和解决问题。CloudWatch Synthetics 是为我们的客户超越 SLA/SLO 并最终帮助我们取得成功的关键组成部分。

    Steve Seaney,Rego Consulting SaaS DevOps 和架构高级副总裁
  • Booking.com

    我们一直在寻找一种简单且无缝的集成,我们可以快速启动并运行以收集我们产品的核心网络重要指标。我们一直在使用 Amazon CloudWatch RUM 来监控我们的网站性能,特别是页面加载时间、JavaScript 错误和其他核心 Web 重要指标。使用 RUM 帮助我们的团队收集和衡量我们网站的实际性能指标,同时也为我们提供一种统一的方式来收集和分析这些数据。RUM 得以脱颖而出的原因在于,它能够与我们的产品以及 CloudWatch 的其他部分无缝集成,使我们能够使用收集到的数据进行进一步处理,而不必担心连接丢失或数据短缺。

    Matt Crouch,Booking.com Web 架构师
  • Mapbox

    我们一直在寻求将所有监控、日志记录、指标和报警合并到单一工具中。CloudWatch 帮助我们减轻了建立、配置和学习第三方系统的运营负荷。我们的团队使用 CloudWatch 广泛地监控多种重要工作负载的错误率和状态代码。CloudWatch 可实现更高级的自动化,扩展所有个体的容量。

    Emily McAfee,Mapbox 平台工程经理
  • HP Print Business

    HP Print Org 支持在 Amazon Elastic Kubernetes Service(EKS)上运行的 500 多项服务。该团队使用自托管 Prometheus 来监控硬件和服务指标。随着平台的发展,他们难以满足监控需求,尤其是维护自托管、多区域的 Prometheus 设置

    Venkat Prasad Durga,HP Print Business 软件设计专员