Identifiez et corrigez efficacement les problèmes, améliorez l'intégrité des applications et offrez de meilleures expériences aux clients.

Les trois signaux d'observabilité fondamentaux sont les métriques, les journaux (données semi-structurées) et les traces (flux de demandes du début à la fin à travers l'ensemble des dépendances). Ces signaux sont la sortie des environnements surveillés, comme les conteneurs, les microservices et les applications. L'objectif est de proposer une expérience intégrée aux ingénieurs DevOps et de fiabilité des sites en vue d'isoler les événements critiques, mais aussi d'utiliser tous les signaux d'observabilité pour isoler les problèmes liés aux applications conteneurisées et aux microservices qui s'exécutent n'importe où. Amazon OpenSearch Service combine l'analytique des données de journaux et de trace en une seule solution.

Présentation de l'observabilité avec Amazon OpenSearch Service sur AWS On Air (21:19)

Opérations d'observabilité

Amazon OpenSearch Service offre de nouvelles fonctionnalités pour vous aider à résoudre vos problèmes d'observabilité. Utilisez des interfaces ouvertes pour collecter, acheminer et transformer les données de télémétrie (notamment OpenTelemetry, Fluentd, Fluent Bit, Logstash, Data Prepper, etc.). Vous pouvez rechercher et analyser de grandes quantités de données semi-structurées grâce à des fonctionnalités natives. Vous pouvez visualiser, surveiller et émettre des alertes grâce aux fonctionnalités d'observabilité de détection des anomalies des tableaux de bord OpenSearch, et effectuer une analyse et une visualisation interactives des données à l'aide du Piped Processing Language (PPL), une interface de requête.

Amazon OpenSearch Service aborde le problème de l'observabilité, de l'analytique des traces, de l'analytique des journaux et de la surveillance des performances des applications (APM) sous quatre aspects :

Collecter : tout d'abord, vous devez collecter les données à analyser. La collecte comprend la collecte, l'enrichissement, le filtrage, la transformation et la normalisation des données provenant de plusieurs sources.

Détecter : souvent, les clients ne détectent pas les problèmes dès qu'ils surviennent. Il existe souvent un décalage entre le moment où un problème survient et celui où vous en êtes informé. Vous souhaitez donc le réduire autant que possible. La détection doit être proactive et multidimensionnelle (par exemple, des alarmes sur la télémétrie). La détection des anomalies est un outil essentiel, de même que la possibilité de relier entre elles des alarmes connexes afin de réduire la fatigue des alarmes. Un élément essentiel de la détection est également la visualisation et la surveillance, ce que fait Amazon OpenSearch Service à l'aide d'un composant nommé OpenSearch Dashboards. Vous pouvez même analyser les données de manière interactive avec des outils comme PPL.

Enquêter : l'enquête est l'activité à laquelle on consacre le plus de temps au cours d'un événement opérationnel celle qui mobilise généralement plusieurs personnes. C'est elle qui contribue le plus au temps moyen jusqu'à l'incident (MTTI) et au temps moyen de récupération (MTTR). Faire la part des choses et savoir sur quoi se concentrer demeure une tâche complexe. Utilisez les journaux, les métriques et le traçage pour vous aider à mener rapidement une analyse de la cause racine, tout en établissant une corrélation entre les métriques, les journaux et les traces sur AWS, sur site ou dans d’autres clouds. Vous pouvez collaborer sur les enquêtes et documenter votre analyse avec les blocs-notes OpenSearch Dashboard. 

Corriger : après avoir identifié la cause d'un échec, vous devez le corriger. Il n'y a rien de pire que d'essayer de réparer quelque chose et d'aggraver la situation. N'oubliez pas de procéder à une analyse post-événement afin de déterminer comment vous auriez pu éviter l'échec à l'origine. Documentez les changements proposés afin d'éviter que le problème ne se reproduise. Votre objectif doit être de faire en sorte que le même problème ne se reproduise jamais. Mais si tel est le cas, vous devez être en mesure de l'identifier et de le corriger automatiquement.

Principe de fonctionnement : OpenSearch Service

Principe de fonctionnement - OpenSearch Service

Pour l'analytique des journaux, il existe plusieurs tâches pour créer un canal d'intégration. Les producteurs sont des serveurs dorsaux, des services AWS, des serveurs web et bien d'autres encore, notamment OpenTelemetry, AWS Distro for OpenTelemetry, Jaeger et Zipkin. Les collecteurs déplacent les données depuis la source, en les transformant éventuellement localement. Pour les services AWS natifs, vous pouvez utiliser l'agent Amazon Kinesis ou l'agent Amazon CloudWatch. Pour open source, les collecteurs standard sont Elastic Beats, Fluentd, Fluentbit ou OpenTelemetry. Les agrégateurs mettent les informations provenant des collecteurs en tampon, ce qui réduit considérablement le nombre total de connexions vers Amazon OpenSearch Service. Ensuite, Amazon OpenSearch Service indexe et analyse le résultat des agrégateurs. Pour visualiser et surveiller les résultats, vous pouvez utiliser OpenSearch Dashboards ou Kibana.

Surveillance des performances de l'application

Parfois, la surveillance des performances de l'application (APM) constitue le premier niveau de maturité de l'observabilité. Toutefois, l'APM ne suffit pas Votre application fonctionne-t-elle réellement comme prévu, même si tous les voyants de votre tableau de bord de surveillance des applications sont au vert ? Vos clients bénéficient-ils de l'expérience utilisateur dont ils ont besoin ? Quelle est l'utilisation de votre application ? Quels composants de votre application se heurtent à des limites d'échelle ? Dans quelle région géographique constatez-vous la croissance la plus marquée ? Quelles tendances pouvez-vous visualiser et planifier ? Si vous pouviez rassembler des métriques, vous pourriez avoir la certitude que lorsque vous déployez un nouveau code ou modifiez votre infrastructure, vous pouvez constater l'impact de ces changements. L'observabilité avance l'APM pour répondre à ces questions supplémentaires.

Clients

Chase International : l'expérience client toujours disponible à grande échelle
Dow Jones et 3M : observabilité avec Amazon OpenSearch Service

Ressources d'observabilité

Blogs et documentation.

Billet de blog sur les nouveautés AWS


Nouvelle interface d'observabilité et analytiques des journaux

Amazon OpenSearch Service comprend désormais des fonctionnalités d'interface d'observabilité et de suivi de la journalisation, qui offrent aux développeurs et aux ingénieurs DevOps les informations dont ils ont besoin pour diagnostiquer les problèmes de performances plus rapidement et réduire les arrêts de l'application.

Blog AWS consacré à big data


Démarrer avec Trace Analytics

Les développeurs et les équipes IT Ops peuvent utiliser cette fonctionnalité pour résoudre les problèmes de performance et de disponibilité de leurs applications distribuées.

Documentation AWS


Trace Analytics pour Amazon OpenSearch Service

Apprenez à utiliser Trace Analytics, qui fait partie du plugin OpenSearch Observability, afin d'analyser les données de trace des applications distribuées.

Observabilité - Cas d'utilisation


Qu'est-ce que l'observabilité ?

Apprenez à utiliser Trace Analytics, qui fait partie du plugin OpenSearch Observability, afin d'analyser les données de trace des applications distribuées.

Article sur l'observabilité


Au-delà de l'efficacité : surmonter la complexité numérique grâce à l'observabilité

Les entreprises cherchent à optimiser les performances de leurs systèmes, mais elles ratent des occasions de le faire. Dans ce rapport, découvrez comment les entreprises peuvent intégrer des pratiques d'observabilité pour gagner en efficacité, fournir des informations sur les menaces de sécurité et renforcer la réputation de la marque.

Ateliers

La fonctionnalité d'observabilité d'Amazon OpenSearch Service vous permet d'aller au-delà de la simple surveillance afin de comprendre non seulement quels événements se produisent, mais aussi pourquoi ils se produisent. Dans cet atelier, vous apprendrez à instrumenter, collecter et analyser les métriques, les traces et les données de journal, depuis les user frontends des utilisateurs jusqu'aux backends des services et tout ce qui se trouve entre les deux. Mettez cela en commun avec Amazon OpenSearch Service, AWS Distro for OpenTelemetry, FluentBit et Data Prepper.

Diagramme d'architecture de référence AWS

Observabilité avec les journaux, les traces et les mesures

En savoir plus »

Vidéos

Garantir la fiabilité et le temps de fonctionnement grâce à des solutions d'observabilité
Introduction de l'observabilité avec Amazon OpenSearch Service

Podcasts

FAQ

Q : Qu'est-ce que Trace Analytics ? 
Trace Analytics est une nouvelle fonction d'Amazon OpenSearch Service qui permet aux développeurs et aux opérateurs informatiques de trouver et de résoudre les problèmes de performance des applications distribuées, ce qui entraîne des délais de résolution de problèmes plus rapides. Trace Analytics a été créé à l'aide d'OpenTelemetry, un projet de la Cloud Native Computing Foundation (CNCF) qui fournit un ensemble unique d'API, de bibliothèques, d'agents et de services de collecteurs pour capturer les traces et les métriques distribuées, ce qui permet aux clients d'exploiter Trace Analytics sans devoir ré-instrumenter leurs applications. Trace Analytics est optimisé par le projet OpenSearch qui est open source et peut être téléchargé et utilisé gratuitement par tout un chacun.

Q : Pourquoi utiliser Trace Analytics ?
Les développeurs et opérateurs informatiques ont besoin de Trace Analytics pour identifier et résoudre les problèmes de performance de leurs applications distribuées. En ajoutant des données de trace aux capacités d'analyse de journaux existantes d'Amazon OpenSearch Service, les clients peuvent utiliser le même service pour isoler la source des problèmes de performance et diagnostiquer leur cause racine. De plus, grâce à a la prise en charge du standard OpenTelemetry, Trace Analytics peut être intégré aux kits SDK Jaeger et Zipkin, deux systèmes de traçage open source populaires, ce qui permet aux développeurs de continuer à utiliser ces kits SDK sans devoir ré-instrumenter leurs applications.

Q : Comment Trace Analytics interagit-il avec Amazon OpenSearch Service ?
Trace Analytics est une fonction intégrée d'Amazon OpenSearch Service. Elle est à la disposition de tous les clients sans frais supplémentaires. Trace Analytics possède une interface utilisateur basée sur OpenSearch Dashboards et sur Kibana pour la visualisation et l'exploration des données de trace, et est intégré aux fonctions clés d'Amazon OpenSearch Service telles que la détection des anomalies, les alertes, le contrôle précis des accès et la sécurité de l'entreprise. Trace Analytics vient compléter l'utilisation par les clients d'Amazon OpenSearch Service pour la recherche et l'analyse des données de journalisation lors de la résolution de problèmes de performance des applications.

Q : Quelles sources de données Trace Analytics prend-il en charge ?
Aujourd'hui, Trace Analytics prend en charge la collecte de données de trace à partir de bibliothèques d'applications et de kits SDK compatibles avec le collecteur OpenTelemetry open source, y compris les kits SDK Jaeger, Zipkin et X-Ray. Trace Analytics s'intègre également à AWS Distro for OpenTelemetry, qui est une distribution des API, des kits SDK et des agents/collecteurs d'OpenTelemetry. Il s'agit d'une distribution performante et sûre des composants OpenTelemetry qui a été testée pour la production et est prise en charge par AWS. Les clients peuvent utiliser AWS Distro for OpenTelemetry pour collecter des traces et des métriques pour plusieurs solutions de surveillance, y compris Amazon OpenSearch Service et AWS X-Ray pour les données de trace, et Amazon CloudWatch pour les métriques.

Q : Comment commencer à utiliser Trace Analytics ?
Pour commencer à utiliser Trace Analytics, consultez la documentation ici.

En savoir plus sur la tarification Amazon OpenSearch Service
Visiter la page de tarification

En savoir plus sur la tarification Amazon OpenSearch Service.

En savoir plus 
Créer gratuitement un compte
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Commencez à créer sur la console
Prêt à créer ?

Commencez à créer dans la Console de gestion AWS.

Mise en route