Encontre e corrija problemas com eficiência, melhore a integridade do aplicativo e ofereça melhores experiências ao cliente
Três sinais fundamentais de observabilidade são métricas, logs (dados semiestruturados) e rastreamentos (fluxos de solicitações do início ao fim em todas as dependências). Esses sinais são o resultado de ambientes monitorados, como contêineres, microsserviços e aplicativos. O objetivo é fornecer uma experiência integrada para que os engenheiros de DevOps e de confiabilidade do site isolem eventos essenciais e usem todos os sinais de observabilidade para isolar problemas em aplicativos e microsserviços conteinerizados executados em qualquer lugar. O Amazon OpenSearch Service combina análise de dados de log e rastreamento em uma única solução.
Operações de observabilidade
O Amazon OpenSearch Service fornece novas funcionalidades para ajudar na solução de problemas de observabilidade. Use interfaces abertas para coletar, rotear e transformar dados de telemetria (inclusive OpenTelemetry, Fluentd, Fluent Bit, Logstash, Data Prepper e outras). É possível pesquisar e analisar grandes volumes de dados semiestruturados com funcionalidades nativas. É possível visualizar, monitorar e alertar com detecção de anomalias os recursos de observabilidade do OpenSearch Dashboards e conduzir análise interativa e visualizações de dados com a Piped Processing Language (PPL), uma interface de consulta.
O Amazon OpenSearch Service lida com observabilidade, análise de rastreamento, análise de logs e problemas de monitoramento de desempenho de aplicativos (APM) em quatro dimensões:
Coletar: primeiro, é preciso coletar dados para análise. A coleta abrange a obtenção, o enriquecimento, a filtragem, a transformação e a normalização de dados de várias fontes.
Detectar: muitas vezes, os clientes detectam problemas assim que eles surgem. Frequentemente, existe um retardo entre o início de um problema e o momento em que você é avisado. Você quer reduzir esse retardo o máximo possível. A detecção deve ser proativa e multifacetada (como alarmes em telemetria). A detecção de anomalias é uma ferramenta essencial, bem como a capacidade de reunir alarmes relacionados para reduzir a fadiga do alarme. Outros componentes centrais da detecção são visualização e monitoramento, que o Amazon OpenSearch Service executa com um componente denominado OpenSearch Dashboards. É possível até mesmo analisar interativamente os dados com ferramentas, como PPL.
Investigar: a investigação ocorre onde as pessoas gastam mais tempo durante um evento operacional. A investigação geralmente envolve várias pessoas. Esse é o maior contribuinte para o Tempo médio para o incidente (MTTI) e o Tempo médio para a recuperação (MTTR). Atravessar o caos e entender no que se concentrar continua a ser uma tarefa difícil. Use logs, métricas e rastreamentos para ajudá-lo a realizar rapidamente a análise da causa-raiz, enquanto faz a correlação entre métricas, logs e rastreamentos, na AWS, no local ou em outras nuvens. Colabore nas investigações e documente sua análise com os blocos de anotações do OpenSearch Dashboard.
Remediar: depois da identificação da causa de uma falha, é preciso remediá-la. Não há nada pior do que tentar consertar alguma coisa e piorar a situação. Não se esqueça de realizar uma análise pós-evento para determinar como a falha poderia ter sido evitada previamente. Documente as alterações propostas para evitar a recorrência do problema. Seu objetivo deve ser garantir que o mesmo problema jamais ocorra novamente. Porém, se ocorrer, você poderá identificá-lo e remediá-lo automaticamente.
Como funciona: OpenSearch Service
Para análise de logs, existem várias tarefas para a criação de um pipe de ingestão. Os produtores são servidores back-end, serviços da AWS, servidores Web e outros, incluindo OpenTelemetry, AWS Distro para OpenTelemetry, Jaeger e Zipkin. Os coletores transferem os dados da fonte, possivelmente transformando-os localmente. Para serviços nativos da AWS, pode ser usado o agente do Amazon Kinesis ou o agente do Amazon CloudWatch. Para código aberto, os coletores comuns são Elastic Beats, Fluentd, Fluentbit ou o coletor do OpenTelemetry. Os agregadores armazenam informações dos coletores, que reduzem as conexões gerais para o Amazon OpenSearch Service. Em seguida, o Amazon OpenSearch Service indexa e analisa o resultado dos agregadores. Para visualizar e monitorar os resultados, use o OpenSearch Dashboards ou Kibana.
Monitoramento de desempenho de aplicativos
Às vezes, o APM é o primeiro nível de maturidade da observabilidade. Porém, o APM, isoladamente, não é suficiente. Seu aplicativo está tendo o desempenho esperado, mesmo se o painel de monitoramento de aplicativos estiver todo verde? Seus clientes estão tendo a experiência do usuário de que necessitam? Qual o uso do seu aplicativo? Que partes do seu aplicativo estão atingindo os limites de escala? Em que região geográfica você está observando o maior crescimento? Que tendências você pode visualizar e para quais deve fazer planos? Se você pudesse reunir as métricas, poderia ter a certeza de que, ao implantar um novo código ou uma mudança na infraestrutura, poderia observar o impacto dessas mudanças. A observabilidade aprimora o APM para responder a essas perguntas adicionais.
Clientes
Recursos de observabilidade
Blogs e a documentação
Postagem de novidades da AWS
Nova interface de observabilidade e análise de logs
O Amazon OpenSearch Service agora inclui uma interface de observabilidade e recursos de monitoramento de log, que oferecem a desenvolvedores e engenheiros de DevOps os insights necessários para diagnosticar problemas de performance mais rapidamente e reduzir o tempo de inatividade da aplicação.
Blog sobre big data da AWS
Getting started with trace analytics (Comece a usar análise de rastreamento)
Desenvolvedores e equipes operacionais de TI podem usar esse recurso para solucionar problemas de desempenho e disponibilidade nos seus aplicativos distribuídos.
Documentação da AWS
Trace Analytics for Amazon OpenSearch Service (Trace Analytics para Amazon OpenSearch Service)
Saiba como usar o Trace Analytics, que faz parte do plugin OpenSearch Observability, para analisar dados de rastreamento de aplicativos distribuídos.
Caso de uso de observabilidade
O que é observabilidade?
Saiba como usar o Trace Analytics, que faz parte do plugin OpenSearch Observability, para analisar dados de rastreamento de aplicações distribuídas.
Artigo de observabilidade
Além da eficiência: superando a complexidade digital por meio da observabilidade
As organizações estão buscando otimizar o desempenho do sistema, mas estão perdendo oportunidades de fazer isso. Neste relatório, saiba como as empresas podem integrar práticas de observabilidade para aumentar a eficiência, fornecer informações sobre ameaças à segurança e aumentar a reputação da marca.
Workshops
A funcionalidade de observabilidade do Amazon OpenSearch Service permite que você faça mais do que simplesmente monitorar e entender não somente que eventos estão ocorrendo, mas por que estão ocorrendo. Neste workshop, você aprenderá como instrumentalizar, coletar e analisar métricas, rastreamentos e dados de log desde front-ends do usuário até back-ends do serviço e tudo que estiver entre eles. Junte isso tudo ao Amazon OpenSearch Service, AWS Distro para OpenTelemetry, FluentBit e Data Prepper.
Amostras de workshop do Github: Microservice observability with Amazon OpenSearch Service (Observabilidade de microsserviços com o Amazon OpenSearch Service)
Diagrama de arquitetura de referência da AWS
Vídeos
Podcasts
Perguntas frequentes
P: O que é o Trace Analytics?
O Trace Analytics é um novo recurso do Amazon OpenSearch Service que permite aos desenvolvedores e aos operadores de TI encontrar e corrigir problemas de performance em aplicações distribuídas, resultando em tempos de resolução de problemas mais rápidos. O Trace Analytics foi desenvolvido usando o OpenTelemetry, um projeto da Cloud Native Computing Foundation (CNCF) que fornece um único conjunto de APIs, bibliotecas, atendentes e serviços de coletor para capturar rastreamentos e métricas distribuídos, o que permite aos clientes aproveitar o Trace Analytics sem precisarem reinstrumentar suas aplicações. O Trace Analytics foi desenvolvido pelo OpenSearch, que é de código aberto e está disponível gratuitamente ao público geral para download e uso.
P: Por que devo usar o Trace Analytics?
Os desenvolvedores e Ops de TI precisam do Trace Analytics para encontrar e corrigir problemas de performance em suas aplicações distribuídas. Adicionando dados de rastreamento aos recursos de análise de log existentes do Amazon OpenSearch Service, os clientes podem usar o mesmo serviço para isolar a origem de problemas de performance e diagnosticar sua causa raiz. Além disso, com o suporte ao padrão OpenTelemetry, o Trace Analytics é compatível com a integração com os SDKs Jaeger e Zipkin, dois sistemas de rastreamento distribuídos populares de código aberto, o que permite que os desenvolvedores continuem usando esses SDKs e não precisem reinstrumentar suas aplicações.
P: Como o Trace Analytics se relaciona/funciona com o Amazon OpenSearch Service?
O Trace Analytics é um recurso integrado do Amazon OpenSearch Service. O recurso está disponível para todos os clientes sem custo extra. O Trace Analytics tem uma interface de usuário baseada no OpenSearch Dashboards e no Kibana para visualizar e explorar dados de rastreamento e está integrado aos principais recursos do Amazon OpenSearch Service, como detecção de anomalias, alertas, controle de acesso detalhado e segurança empresarial. O Trace Analytics complementa o uso do Amazon OpenSearch Service por parte dos clientes para pesquisa e análise de dados de log ao resolver problemas de performance de aplicações.
P: Quais fontes de dados com suporte pelo Trace Analytics?
Atualmente, o Trace Analytics oferece suporte à coleta de dados de rastreamento de bibliotecas de aplicações e SDKs compatíveis com o OpenTelemetry Collector de código aberto, incluindo os SDKs Jaeger, Zipkin e X-Ray. O Trace Analytics também se integra ao AWS Distro para OpenTelemetry, que é uma distribuição de APIs, SDKs e atendentes/coletores do OpenTelemetry. É uma distribuição segura e eficiente de componentes do OpenTelemetry que foi testada para uso em produção e tem o suporte da AWS. Os clientes podem usar o AWS Distro para OpenTelemetry para coletar rastreamentos e métricas de várias soluções de monitoramento, incluindo o Amazon OpenSearch Service e o AWS X-Ray para dados de rastreamento e o Amazon CloudWatch para métricas.
P: Como faço para começar a usar o Trace Analytics?
Para começar a usar o Trace Analytics, siga a documentação aqui.
Obtenha acesso instantâneo ao nível gratuito da AWS.