Возможности Amazon CloudWatch
Обзор
Общие вопросы
Amazon CloudWatch – это сервис мониторинга и управления, который предоставляет ценные с практической точки зрения данные об AWS, гибридных, локальных и других облачных приложениях, а также ресурсах инфраструктуры. Вы можете собирать и просматривать операционные данные и данные о производительности в виде журналов и метрик на одной платформе, а не в отдельных хранилищах таких данных (на серверах, в сети или в базе данных). С помощью CloudWatch можно отслеживать полный стек (приложения, инфраструктуру, сеть и сервисы) и использовать предупреждения, журналы и события для автоматизации действий в целях сокращения среднего времени устранения проблем (MTTR). Это позволяет освободить важные ресурсы, чтобы сосредоточиться на создании приложений и повышении коммерческой ценности.
CloudWatch предоставляет полезную информацию, которая позволяет оптимизировать производительность приложений, управлять использованием ресурсов и оценивать работоспособность системы в целом. CloudWatch обновляет метрики и данные журналов с интервалом в одну секунду, обеспечивает хранение данных (метрик) в течение 15 месяцев и дает возможность выполнять расчеты с использованием метрик. Это позволяет анализировать исторические данные для оптимизации затрат и получать интерактивные сведения для оптимизации приложений и ресурсов инфраструктуры. Аналитику контейнеров CloudWatch можно использовать для настройки оповещений, мониторинга контейнерных приложений и микросервисов, а также устранения неполадок в них. CloudWatch собирает, хранит и обобщает данные об использовании процессора, памяти, диска и сети, а также диагностическую информацию, например о сбоях при перезапуске контейнера, чтобы помочь инженерам DevOps находить проблемы и быстро устранять их. Аналитика контейнеров предоставляет аналитику от сервисов управления контейнерами, таких как Amazon ECS для Kubernetes (EKS), Эластичный сервис контейнеров Amazon (ECS), AWS Fargate и автономная платформа Kubernetes (k8s).
Сбор данных
Простой сбор и хранение журналов
Сервис Amazon CloudWatch Logs позволяет собирать и хранить журналы ресурсов, приложений и сервисов в режиме, близком к реальному времени. Существуют три основные категории журналов.
1. Предоставленные журналы. Эти журналы автоматически публикуются сервисами AWS от вашего имени. В настоящее время поддерживаются два типа журналов: журналы Amazon VPC Flow Logs и Amazon Route 53.
2. Журналы, публикуемые сервисами AWS. В настоящее время более 30 сервисов AWS публикуют журналы в CloudWatch. В их число входят Amazon API Gateway, AWS Lambda, AWS CloudTrail и многие другие.
3. Пользовательские журналы. Это журналы пользовательских приложений и локальных ресурсов, а также журналы из других облаков.
Можно установить агент CloudWatch с помощью AWS Systems Manager или без труда публиковать журналы с помощью действия API PutLogData.
Сбор и агрегирование метрик приложений и инфраструктуры
Amazon CloudWatch позволяет собирать метрики инфраструктуры более чем из 70 сервисов AWS, таких как Amazon Elastic Compute Cloud (Amazon EC2), Amazon DynamoDB, Amazon Simple Storage Service (Amazon S3), Amazon ECS, AWS Lambda и Amazon API Gateway, без каких-либо действий со стороны пользователя. Например, инстансы Amazon EC2 автоматически публикуют метрики загрузки процессора, передачи данных и использования диска, что позволяет отслеживать изменения состояния. Можно использовать встроенные метрики API Gateway для обнаружения задержек или встроенные метрики AWS Lambda для обнаружения ошибок или ограничений. Аналогичным образом, Amazon CloudWatch также позволяет собирать метрики приложений (например, активность пользователя, ошибки или использование памяти) для мониторинга производительности, устранения неполадок и отслеживания тенденций. Можно использовать агент CloudWatch или вызов сервиса API PutMetricData для публикации этих метрик в CloudWatch. Если требуются более подробные метрики, чем стандартные метрики инфраструктуры, например метрики сегментов Amazon Kinesis Data Streams, то можно просто подключить их для каждого ресурса. Аналогичным образом предоставляются метрики приложений с частотой до одного раза в секунду, которые можно использовать для статистики, визуализации и создания предупреждений с высокой степенью детализации.
Сбор и агрегация метрик и журналов контейнеров
Сервис Container Insights упрощает сбор и агрегацию специально подобранных метрик и журналов системы контейнеров. Он собирает метрики производительности вычислений, среди которых информация об использовании процессора, памяти, сети и диска. Сервис производит сбор для каждого контейнера в виде событий производительности и автоматически генерирует пользовательские метрики, используемые для мониторинга и предупреждений. События производительности поступают в виде журналов CloudWatch Logs с метаданными о запущенном окружении, такими как идентификатор инстанса Amazon EC2, сервис, точка подключения и идентификатор тома Amazon Elastic Block Store (Amazon EBS). Это упрощает мониторинг и устранение неполадок. Пользовательские метрики CloudWatch автоматически извлекаются из этих журналов, после чего их можно анализировать с помощью языка расширенных запросов CloudWatch Logs Insights. Container Insights также позволяет собирать журналы приложений (stdout / stderr), пользовательские журналы, предопределенные журналы инстанса Amazon EC2, журналы плоскости данных Amazon EKS / k8s и журналы плоскости управления Amazon EKS. Для сбора журналов кластеров Amazon EKS и k8s можно использовать заранее настроенный агент FluentD. Подробнее см. в документации по настройке журналов Container Insights. Для сбора журналов приложений Amazon ECS можно использовать драйвер Журналов Amazon CloudWatch или Fluent Bit.
Сбор и агрегация метрик и журналов Lambda
Аналитика CloudWatch Lambda упрощает сбор и объединение специально подобранных метрик и журналов из функций AWS Lambda. Он собирает метрики производительности вычислений, среди которых информация об использовании ЦПУ, памяти и сети. Сервис производит сбор для каждой функции Lambda в виде событий производительности и автоматически генерирует пользовательские метрики, используемые для мониторинга и предупреждений. События производительности собираются в виде журналов CloudWatch для упрощения мониторинга и устранения неполадок. Пользовательские метрики CloudWatch автоматически извлекаются из этих журналов, после чего их можно анализировать с помощью языка расширенных запросов CloudWatch Logs Insights. Подробнее см. в документации по началу работы с Lambda Insights.
Потоковые метрики
Потоки метрик Amazon CloudWatch позволяют создавать непрерывные потоки метрик в режиме, близком к реальному времени, в выбранное вами местоположение. Это упрощает отправку метрик CloudWatch популярным сторонним поставщикам сервисов с использованием HTTP-адреса Amazon Kinesis Data Firehose. Вы можете создать непрерывный масштабируемый поток, включив в него самые актуальные метрики CloudWatch для работы панелей управления, предупреждений и других инструментов, которые зависят от точных и своевременных метрик. Вы без проблем можете направить метрики в озеро данных на AWS, например на Amazon S3, и начать анализировать использование или производительность с помощью таких инструментов, как Amazon Athena.
Мониторинг
Наблюдаемость нескольких из множества аккаунтов AWS
Наблюдение за несколькими аккаунтами в Amazon CloudWatch позволяет отслеживать приложения, охватывающие несколько аккаунтов в регионе Amazon Web Services, и устранять проблемы. Вы можете централизованно искать хранящиеся в аккаунтах группы журналов, выполнять запросы Logs Insights в нескольких аккаунтах и создавать правила Contributor Insights для нескольких аккаунтов, чтобы определить участников, создающих наибольшее количество записей в журнале. Вы можете визуализировать показатели многих аккаунтов в консолидированном представлении, создавать сигналы тревоги, которые оценивают метрики из других аккаунтов, чтобы узнавать об отклонениях и проблемных тенденциях. Используя наблюдаемость нескольких аккаунтов в Container Insights, вы можете отслеживать контейнерную среду вашей организации и выявлять риски до того, как будет затронута работа пользователей. Наблюдая за несколькими аккаунтами в CloudWatch, вы можете просматривать интерактивную карту приложений для нескольких аккаунтов с помощью ServiceLens, легко углубляясь в соответствующие метрики, журналы и трассировки. Вы также можете использовать эту функцию для настройки потока метрик, охватывающих несколько аккаунтов Amazon в регионе Amazon Web Services. Наблюдение за несколькими аккаунтами в CloudWatch дает целостную картину рабочих процессов всего за несколько шагов и не требует дополнительных линий передачи данных, позволяя экономить время, силы и средства на управление инфраструктурой и приложениями.
Комплексное представление всех рабочих процессов в панелях управления
Панели управления Amazon CloudWatch позволяют создавать пригодные для многократного использования графики и обеспечивают единое представление данных для визуализации облачных ресурсов и приложений. Метрики и данные журналов можно отображать в графическом виде рядом друг с другом на одной панели управления, что позволяет быстро получить необходимые данные и выявить причину проблемы по результатам диагностики. Например, можно визуализировать ключевые метрики, такие как использование процессора и памяти, и сопоставить их с имеющимися ресурсами. Можно связать шаблон журнала с определенной метрикой и настроить предупреждения, чтобы выявлять проблемы с производительностью и операционные неполадки. Это дает общее представление о работоспособности системы и позволяет быстро устранять неполадки, что уменьшает MTTR.
Составные предупреждения
С помощью составных предупреждений Amazon CloudWatch можно комбинировать множество оповещений и снижать уровень помех от них. Если возникшая проблема затрагивает несколько его ресурсов, вы получите одно предупреждение для всего приложения, а не по одному для каждого затронутого ресурса. Это поможет сосредоточиться на поиске первопричины операционных проблем и сократить время простоя приложения. Вы можете указывать общее состояние для группировки таких ресурсов, как приложение, регион AWS или зона доступности.
Высокочастотные предупреждения
С помощью предупреждений Amazon CloudWatch можно установить для метрик пороговые значения, по достижении которых будут выполняться определенные действия. Можно создавать высокочастотные предупреждения, устанавливать процентильные пороги и настраивать выполнение какого-либо действия при необходимости. Например, можно создавать предупреждения на основе метрик Amazon EC2, настраивать уведомления и выполнять одно или несколько действий для обнаружения и отключения неиспользуемых или неэффективно используемых инстансов. Предупреждения в режиме реального времени на основе метрик и событий позволяют свести к минимуму время простоя и потенциальное влияние на бизнес.
Сопоставление журналов и метрик
Приложения и ресурсы инфраструктуры генерируют множество операционных данных и данных мониторинга в виде журналов и метрик. Amazon CloudWatch предоставляет единую платформу для доступа к этим наборам данных и их визуализации, а также позволяет без труда сопоставлять их. Это позволяет быстро выявить основную причину проблемы по результатам диагностики. Можно связать шаблон журнала, например ошибку, с конкретной метрикой и настроить предупреждения, чтобы выявлять проблемы с производительностью и операционные неполадки.
Application Insights
Amazon CloudWatch Application Insights производит автоматизированную настройку возможностей наблюдения для ваших корпоративных приложений, чтобы вы получали сведения об их работоспособности. Это позволяет определить и настроить основные метрики и журналы во всех ваших ресурсах приложения и технологических стеках, т. е. базах данных, веб-серверах (IIS) и серверах приложений, операционной системе, балансировщиках нагрузки и запросах. Сервис непрерывно отслеживает эти телеметрические данные для обнаружения и сопоставления аномалий и ошибок, уведомляя вас о проблемах, возникших в приложении. Чтобы устранять неполадки, он создает автоматизированные панели управления для обнаруженных проблем со связанными метрическими аномалиями и журналами ошибок, а также с дополнительной аналитической информацией об их возможной исходной причине. Это позволяет быстро корректировать работу приложений, обеспечивая их эффективность без влияния на конечных пользователей.
Аналитика контейнеров
Аналитика контейнеров с улучшенной наблюдаемостью
Аналитика контейнеров с улучшенной наблюдаемостью теперь доступна для Эластичного сервиса Amazon Kubernetes (Amazon EKS) в EC2, Amazon Elastic Container Service (Amazon ECS) в EC2 и ECS на Fargate. Улучшенная наблюдаемость предоставляет подробные метрики, такие как показатели производительности ECS и EKS на уровне контейнера, метрики состояния EKS Kube и метрики плоскости управления EKS, позволяя визуально детализировать различные уровни контейнеров и легко выявлять такие проблемы, как потеря доступа к памяти в отдельных контейнерах. Также данный сервис показывает список уровней контейнеров, потребляющих большое количество ресурсов, что позволяет выявлять риски в своей среде, даже если вы еще не настроили предупреждения, а также принимать упреждающие меры до того, как это повлияет на работу конечного пользователя. Аналитика контейнеров с улучшенной наблюдаемостью имеет простой интерфейс, позволяющий автоматически настраивать кластеры с помощью дополнения наблюдаемости CloudWatch Observability для EKS или с одним переключением на ECS, чтобы сразу приступить к обработке данных телеметрии.
Container Insights без улучшенной возможности наблюдения
Аналитика контейнеров CloudWatch собирает, агрегирует и обобщает метрики и журналы ваших контейнерных приложений и микросервисов, работающих в Amazon ECS, Amazon EKS, на платформах Kubernetes в Amazon EC2 и AWS Fargate (для Amazon ECS и Amazon EKS). Аналитика контейнеров собирает метрики контейнеров (процессора, памяти, диска и сети) и сетевые метрики по умолчанию. Сервис предоставляет более подробную диагностическую информацию (например, о сбоях при перезапуске контейнера), чтобы помочь выявить проблемы и быстро их устранить. Аналитика контейнеров обеспечивает наблюдение за ними на автоматических информационных панелях, что позволяет легко отслеживать состояние и производительность приложений. Также в метриках Аналитики контейнеров можно настроить оповещения CloudWatch, чтобы получать уведомления об аномалиях до того, как это повлияет на производительность приложения.
Интернет-монитор
Интернет-монитор показывает, как проблемы Интернета влияют на производительность и доступность между вашими приложениями, размещенными в AWS, и вашими конечными пользователями. Эта информация помогает ускорить диагностику проблем, выполняя ее за несколько минут, а не за несколько дней. Вы можете обозревать измерения для различных временных интервалов и в различной степени детализации географических зон, быстро визуализировать влияние проблем и затем принять меры для улучшения взаимодействия конечных пользователей (например, переключив к другим сервисам AWS или перенаправив трафик рабочей нагрузки через другие регионы AWS). Если проблема вызвана сетью AWS, на панель работоспособности AWS автоматически придет уведомление, в котором будут указаны шаги, предпринимаемые AWS для устранения проблемы. Internet Monitor предоставляет измерения для метрик CloudWatch и журналов CloudWatch, чтобы поддерживать интеграцию информации о работоспособности географических зон и сетей в зависимости от конкретного приложения. Internet Monitor также отправляет сведения о связанных с работоспособностью событиях на Amazon EventBridge, поэтому вы можете настроить оповещения. Internet Monitor контролирует приложение посредством виртуальных частных облаков (VPC) Amazon, баз раздачи Amazon CloudFront и каталогов Amazon WorkSpaces.
Мониторинг и аналитика Lambda
Lambda Insights предоставляет автоматические панели управления в консоли CloudWatch. Эти панели отображают производительность и ошибки вычислений. На каждой панели отображается список метрик за выбранный период времени, что позволяет (в зависимости от выбранного интервала и функции) перейти к более подробным журналам приложений, отслеживаниям AWS X‑Ray и событиям производительности.
Обнаружение аномалий
Сервис Amazon CloudWatch Anomaly Detection применяет алгоритмы машинного обучения для непрерывного анализа данных метрики и обнаруживает аномалии. С его помощью можно создавать предупреждения, пороговые значения для которых автоматически изменяются в отношении шаблонов естественных метрик, например сезонных колебаний в зависимости от времени, дня недели или изменения тенденций. Кроме того, можно визуализировать метрики в виде полос обнаружения аномалий. Таким образом вы сможете отслеживать и выявлять неожиданные изменения в метриках и устранять их причины.
ServiceLens
С помощью сервиса Amazon CloudWatch ServiceLens можно из единого центра визуализировать данные о работоспособности, производительности и доступности ваших приложений. Он работает совместно с метриками и журналами CloudWatch, а также с маршрутами из сервиса AWS X-Ray, позволяя вам получать полную картину своих приложений и их зависимостей. Вы можете быстро обнаруживать элементы, ухудшающие производительность, выявлять первопричины проблем, связанных с приложениями, и определять затронутых пользователей. С помощью сервиса CloudWatch ServiceLens можно получить полную картину ваших приложений в трех основных областях: мониторинг инфраструктуры (с использованием метрик и журналов, чтобы понимать, какие ресурсы используются для поддержки ваших приложений), мониторинг транзакций (использование маршрутов для понимания зависимостей между вашими ресурсами) и мониторинг конечных пользователей (использование программ-осведомителей для мониторинга адресов и уведомления вас в случае ухудшения условий работы для конечных пользователей). В сервисе CloudWatch ServiceLens имеется карта сервисов, на которой визуализированы контекстные связи между всеми вашими ресурсами, и интуитивно понятный интерфейс, благодаря чему вы можете еще глубже изучать сопоставленные данные мониторинга.
Synthetics
Сервис Amazon CloudWatch Synthetics упрощает мониторинг адресов приложений. Он круглосуточно и без выходных выполняет тестирование ваших адресов и оповещает вас, если их поведение отличается от ожидаемого. Эти тесты можно настроить для проверки доступности, задержек, транзакций, испорченных или неработоспособных ссылок, пошагового выполнения задач, ошибок загрузки страниц, задержек нагрузки для активов пользовательских интерфейсов, потоков сложных мастеров или потоков проверки в ваших приложениях. Вы также можете использовать сервис CloudWatch Synthetics, чтобы выявлять адреса приложений, для которых получены аварийные сигналы, и сопоставлять их с проблемами базовой инфраструктуры, что позволяет уменьшить MTTR. Благодаря этому новому компоненту сервис CloudWatch теперь собирает трафик программ-осведомителей, которые могут непрерывно проверять условия работы ваших клиентов, даже если их трафик не проходит через ваши приложения. Это позволяет обнаруживать проблемы до того, как их обнаружат ваши клиенты. Сервис CloudWatch Synthetics поддерживает мониторинг ваших REST API, URL-адресов и контента веб-сайтов, проверяет наличие неавторизованных изменений вследствие фишинга, инъекции кода или выполнения межсайтовых сценариев.
RUM
Amazon CloudWatch RUM предоставляет возможность контролировать производительность приложений на стороне клиента и снижает MTTR. Он позволяет собирать данные о производительности интернет-приложений на стороне клиента в режиме, близком к реальному времени, чтобы выявлять и диагностировать проблемы. CloudWatch RUM в сочетании с данными CloudWatch Synthetics предоставляет еще больше информации о взаимодействии с пользователем. Вы можете визуализировать аномальные показатели производительности и применять отладочные данные (сообщения об ошибках, трасссировки стеков, сеансы пользователей и так далее) для устранения проблем с производительностью (вызванных ошибками JavaScript, сбоями или задержками). Вы можете получить ценные сведения о разных аспектах влияния на пользователя, например количество подключенных пользователей, их географическое расположение и используемые браузеры. CloudWatch RUM агрегирует данные о пути пользователя в вашем приложении, которые помогут вам определить приоритеты при выпуске новых возможностей и исправлении ошибок.
Принятие мер
Auto Scaling
Auto Scaling позволяет автоматизировать планирование ресурсов. Можно установить для ключевой метрики пороговое значение, по достижении которого будет отправляться предупреждение и автоматически выполняться действие Auto Scaling. Например, можно настроить рабочий процесс Auto Scaling для добавления или удаления инстансов EC2 на основании метрик загрузки ЦПУ и оптимизировать таким образом затраты на ресурсы.
Автоматизация реагирования на операционные изменения с помощью CloudWatch Events
CloudWatch Events генерирует поток системных событий, описывающих изменение ресурсов AWS, в режиме, близком к реальному времени. Сервис позволяет быстро реагировать на операционные изменения и принимать корректирующие меры. От пользователя требуется только создать правила, прописав в них события, актуальные для приложения, и автоматические действия при наступлении таких событий. Например, можно создать правило для вызова функций AWS Lambda или отправки оповещения в тему Amazon Simple Notification Service (Amazon SNS).
Предупреждения и автоматизация действий для кластеров EKS, ECS и k8s
Для кластеров Amazon EKS и k8s Аналитика контейнеров позволяет вызывать предупреждения по вычислительным метрикам, чтобы запускать политики автомасштабирования для группы «Автомасштабирование» Amazon EC2 и предоставляет возможность останавливать, перезапускать и восстанавливать любые инстансы Amazon EC2, а также завершать их работу. В случае с кластерами Amazon ECS вы можете использовать вычислительные метрики из своих задач и сервисов для Автомасштабирования сервисов.
Анализ
Анализируйте журналы
Amazon CloudWatch Logs Insights позволяет извлекать больше полезной информации из данных журналов. Вы можете выполнять запросы к журналам, отправленным в CloudWatch, в консоли AWS или создавать запросы с агрегированием, фильтрами и регулярными выражениями для полного контроля над операциями. Кроме того, можно визуализировать данные временных рядов, глубоко изучить отдельные события журнала и экспортировать результаты запросов на панели управления CloudWatch.
Благодаря генеративному искусственному интеллекту вы можете использовать для запросов к журналам естественный язык (предварительная версия) и быстро получать полезную информацию, задавая такие вопросы, как «Покажите мне самые медленные функции Lambda». Вы можете описать нужные данные журнала простым языком, а CloudWatch автоматически сгенерирует индивидуальный запрос, что упрощает анализ журналов, позволяет быстрее анализировать их и получать аналитические данные независимо от вашего опыта.
Технологии искусственного интеллекта и машинного обучения позволяют ускорить исследование журналов с помощью сервиса CloudWatch Logs Anomaly Detection, в котором используются алгоритмы машинного обучения, основанные на многолетних операционных данных Amazon.com и AWS в огромных масштабах. Благодаря этому CloudWatch может распознавать общие структуры записей журнала, извлекать важное содержимое, выявлять тенденции и аномалии, помогая сократить MTTR без необходимости настраивать параметры конфигурации.
С помощью CloudWatch Logs Live Tail вы можете интерактивно и централизованно анализировать потоковые данные журналов в режиме реального времени. Запускайте контекстные запросы для беспрепятственного перехода от мониторинга журналов в реальном времени к более глубокой аналитике и ускоренному расследованию и разрешению инцидентов. Live Tail устраняет необходимость в специализированных решениях и объединяет важнейшие функции ведения журнала, помогая сократить время обнаружения и устранения проблем.
Новая интеграция CloudWatch Logs и OpenSearch Service позволяет клиентам AWS запрашивать и анализировать журналы как в CloudWatch, так и в OpenSearch Service, обеспечивая доступ к лучшим возможностям обоих решений без необходимости в сложных конвейерах данных и операциях извлечения, преобразования и загрузки (ETL). Клиенты AWS могут централизованно хранить журналы в CloudWatch Logs, используя при этом глубокую аналитику на основе OpenSearch Service. Клиенты CloudWatch Logs получат доступ к запросам OpenSearch Service (язык конвейерной обработки и поддержка SQL-запросов) и автоматическим панелям управления популярных журналов, предоставляемых AWS (например, VPC, WAF, CloudTrail). Клиенты OpenSearch Service получат доступ к журналам CloudWatch Logs без дублирования данных и управления соответствующими конвейерами. Используя OpenSearch Service Discover, они могут анализировать данные операционных журналов, хранящиеся в CloudWatch Logs, с использованием языка OpenSearch Service SQL и Piped Processing Language, что упрощает выполнение сложных запросов и визуализаций без перемещения данных.
Точные данные с длительным сроком хранения
Amazon CloudWatch позволяет до 15 месяцев хранить метрики для отслеживания тенденций и сезонности. Это дает возможность анализировать исторические данные для точной настройки использования ресурсов. Кроме того, CloudWatch позволяет получать метрики работоспособности с детализацией вплоть до одной секунды, включая пользовательские метрики из локальных приложений клиента. Точные данные, поступающие в режиме реального времени, повышают качество визуализации и дают возможность определять и отслеживать тенденции для оптимизации производительности приложений и работоспособности системы.
Специальные операции над метриками
Amazon CloudWatch Metric Math позволяет выполнять расчеты с использованием нескольких метрик в целях анализа в режиме реального времени. Благодаря этому можно без труда получать аналитическую информацию на основании существующих метрик CloudWatch, чтобы лучше понимать состояние и производительность инфраструктуры. Полученные расчетные метрики можно визуализировать в Консоли управления AWS, добавлять их в панели управления CloudWatch или извлекать с помощью действия API GetMetricData. Metric Math поддерживает арифметические операции сложения, вычитания, деления и умножения, а также математические функции суммирования, поиска среднего арифметического, минимума, максимума и среднеквадратического отклонения.
Анализируйте телеметрию контейнеров и Lambda
CloudWatch Container Insights и Lambda Insights упрощают анализ данных наблюдаемости за счет сопоставления метрик, журналов и трассировок, а также упрощают детализацию данных для более быстрого анализа первопричин неполадок и их устранения. Container Insights и Lambda Insights предоставляют глубокие ссылки на XRay для анализа трассировки и на подробные журналы, такие как события в журналах производительности, журналы приложений (stdout/stderr) и настраиваемые журналы для расширенной аналитики с помощью CloudWatch Logs Insights. Container Insights также обеспечивает визуализацию событий жизненного цикла Amazon ECS, метрик уровня инстансов Amazon EC2, плоскости данных Amazon EKS/k8S и плоскости управления Amazon EKS, обеспечивая комплексную наблюдаемость в контейнерных средах.
Используя генератор запросов на естественном языке CloudWatch, вы также можете запрашивать метрики и журналы для контейнеров и бессерверных приложений, работающих на AWS Lambda, задавая такие вопросы, как «Покажите мне самые медленные функции Lambda». Это поможет вам анализировать телеметрию и данные независимо от вашего опыта работы с языками запросов.
Анализ метрик, журналов и отслеживаний Lambda
Сервис Lambda Insights упрощает анализ наблюдаемых данных на основе метрик, журналов и отслеживаний, делая более удобным переход от автоматических панелей управления к подробным данным событий производительности, журналам приложений и пользовательским журналам c помощью языка расширенных запросов CloudWatch Logs Insights.
Contributor Insights
Теперь сервис Amazon CloudWatch включает сервис Contributor Insights, который анализирует данные временных рядов и создает представления со сведениями об элементах, которые сильнее всего влияют на производительность системы. После настройки сервиса Contributor Insights он работает непрерывно, не требуя вмешательства пользователя. Благодаря этому разработчики и операторы могут быстрее выявлять, диагностировать и устранять проблемы во время эксплуатационных мероприятий. Сервис Contributor Insights помогает понять, кто или что (например, определенный ресурс, аккаунт клиента или вызов API) оказывает влияние на производительность вашей системы и приложений. Это позволяет обнаруживать выбросы, находить самые проблемные шаблоны трафика и ранжировать наиболее используемые системные процессы. Вы можете создавать правила Contributor Insights, чтобы оценивать шаблоны в структурированных событиях журналов по мере их поступления в сервис CloudWatch Logs, в том числе журналов из сервисов AWS, например сервисов AWS CloudTrail, Amazon Virtual Private Cloud (Amazon VPC), Amazon API Gateway и любых других пользовательских журналов, отправляемых вашим сервисом или локальными серверами, например журналов доступа Apache, а также журналов из других облаков. Сервис Contributor Insights оценивает эти события журналов в режиме почти реального времени и отображает отчеты, в которых показаны основные элементы, оказывающие влияние на систему, и количество уникальных элементов в наборе данных. Элемент, оказывающий влияние на систему, – это агрегированная метрика на основе измерений, содержащихся в полях журналов в сервисе CloudWatch Logs, например идентификатор аккаунта или интерфейса в сервисе VPC Flow Logs либо любой другой пользовательский набор измерений. Вы можете сортировать и фильтровать данные этих элементов на основе ваших собственных пользовательских критериев. Данные отчетов Contributor Insights можно отображать на панелях управления CloudWatch, строить на их основе графики рядом с метриками CloudWatch и добавлять их в аварийные сигналы CloudWatch.
Metrics Insights
Amazon CloudWatch Metrics Insights представляет собой быстрое и гибкое ядро выполнения запросов SQL, которое позволяет выявлять тенденции и шаблоны в изменениях миллионов операционных метрик в режиме, близком к реальному времени. Metrics Insights предоставляет более подробную информацию о производительности приложений и инфраструктуры в большом масштабе, поддерживая гибкие запросы и интерактивное агрегирование метрик. Запросы Metrics Insights позволяют создать мощные и наглядные визуализации, чтобы выполнять упреждающий мониторинг, быстро обнаруживать проблемы и снижать значение MTTR.
Evidently
Amazon CloudWatch Evidently позволяет разработчикам приложений проводить эксперименты и выявлять непреднамеренные воздействия новых возможностей, прежде чем развертывать их для открытого использования. Это позволяет снизить риски, связанные с выпуском новых возможностей. Evidently позволяет оценить влияние обновлений на весь стек приложения еще до выпуска, чтобы этот процесс стал более надежным. При выпуске обновлений вы сможете применить их к ограниченному подмножеству пользователей и отслеживать для них ключевые метрики, например время загрузки страниц или показатели конверсии, а затем постепенно увеличивать трафик для обновленной версии. Также Evidently позволяет экспериментировать с дизайном, собирать данные о пользователях и выбирать наиболее эффективные решения.
Соответствие требованиям и безопасность
Общие вопросы
Сервис Amazon CloudWatch интегрирован с Управлением идентификацией и доступом AWS (IAM), что позволяет контролировать доступ пользователей и ресурсов к данным, а также определять способ доступа к ним.
Кроме того, Amazon CloudWatch Logs соответствует требованиям PCI и FedRamp. Данные шифруются при хранении и передаче. Можно также шифровать группы журналов с помощью AWS Key Management Service (AWS KMS) для обеспечения дополнительной безопасности и соответствия требованиям.
Защита данных журналов Amazon CloudWatch Logs помогает настраивать политики защиты данных, с помощью которых можно обнаруживать и защищать конфиденциальные данные, записываемые системами и приложениями. Эта функция автоматически определяет и маскирует конфиденциальную информацию в журналах, используя машинное обучение и сопоставление шаблонов в соответствии с определенной вами политикой. Защита данных может помочь оптимизировать архитектуру, освободив приложения от логики защиты данных, и в то же время помогает выполнять поставленные цели. Вы можете настроить политики защиты данных для сканирования журналов по мере их заполнения, чтобы определять, насколько конфиденциальную информацию они содержат, и при обнаружении таковой маскировать ее. Маскированные данные могут также раскрываться для проверки, выполняемой инженерами по безопасности, посредством назначения высоких привилегий в IAM.