Amazon Comprehend fournit le traitement du langage naturel, la détection et la rédaction des données d'identification personnelle (PII), la classification personnalisée et la détection d'entités, ainsi que la modélisation de rubriques, permettant ainsi une large gamme d'applications capables d'analyser du texte brut et, avec certaines API, des formats de documents comme PDF et Word.
- Traitement du langage naturel : les API Amazon Comprehend de reconnaissance d'entité, d'analyse de ressenti, d'analyse de syntaxe, d'extraction de phrases clés et de détection de la langue peuvent être utilisées pour extraire des informations de textes en langage naturel. Ces demandes sont mesurées en unités de 100 caractères (1 unité = 100 caractères), avec une facturation minimale de 3 unités (300 caractères) par demande.
- Données d'identification personnelle (PII) : l'API de détection de PII permet de trouver tous les emplacements des entités PII (données d'identification personnelle) sélectionnées dans un document. Elle peut être utilisée pour créer des versions rédigées de documents. L'API d'identification des PII vous indique si un document comprend les données d'identification personnelle identifiables sélectionnées ou non. Ces demandes sont également mesurées en unités de 100 caractères (1 unité = 100 caractères), avec facturation minimale de 3 unités (300 caractères) pour chaque demande.
- Comprehend personnalisé : les API de classification personnalisée et d'entités personnalisées peuvent entraîner un modèle NLP (Natural Language Processing) personnalisé afin qu'il classe le texte et extrait des entités personnalisées. Les demandes d'inférence asynchrones sont mesurées en unités de 100 caractères, 3 unités (300 caractères) étant facturées au minimum pour chaque demande. Vous êtes facturé 3 USD par heure pour la formation des modèles (facturation à la seconde) et 0,50 USD par mois pour la gestion des modèles personnalisés. Pour les demandes d'inférence asynchrones de classification personnalisée et d'entités, prévoyez un point de terminaison avec un débit adéquat. Vous serez facturé pour toute la durée d'existence de votre point de terminaison, du moment de sa création à sa suppression.
- Modélisation de rubriques : identifie les thèmes ou rubriques d'un recueil de documents stocké dans Amazon S3. Elle identifie les sujets les plus courants de la collection et les classe par groupes avant d'associer tel ou tel document à une rubrique. Vous êtes facturé en fonction de la taille totale des documents traités par tâche. Les 100 premiers Mo sont facturés à un tarif fixe. Au-delà de 100 Mo, vous êtes facturé par Mo.
- Confiance et sécurité (nouveau) : l'API de détection de toxicité Comprehend peut être utilisée pour détecter le contenu toxique du texte. De même, la fonctionnalité de classification de sécurité Comprehend prompt peut être utilisée pour détecter les invites de saisie dangereuses pour les modèles et applications linguistiques volumineux. Ces demandes sont mesurées en unités de 100 caractères (1 unité = 100 caractères), avec une facturation minimale de 3 unités (300 caractères) par demande.
- Pour en savoir plus sur la tarification Amazon Comprehend Medical, cliquez ici.
- Vous pouvez estimer vos coûts à l'aide du calculateur de prix AWS.
- Sélectionnez la région USA Est (Virginie du Nord) dans le sélecteur de région ci-dessous pour voir les prix de toutes les API
Avec les API Amazon Comprehend, vous pouvez traiter du texte brut non structuré et , avec certaines API, d'autres fichiers texte comme les documents PDF et Word.
Les demandes d'inférence sont mesurées en unités de 100 caractères, avec facturation minimale de 3 unités (300 caractères) par demande.
Les demandes d'inférence sont mesurées en unités de 100 caractères, avec facturation minimale de 3 unités (300 caractères) pour chaque demande.
Les points de terminaison sont facturés à la seconde, avec un minimum de 60 secondes. Les frais continueront à être facturés à partir du moment où vous démarrez le point de terminaison jusqu'à sa suppression, même si aucun document n'est analysé.
Une unité d'inférence (UI) fournit un débit de 100 caractères/seconde à votre point de terminaison géré. Des UI supplémentaires peuvent être ajoutées pour augmenter le débit. Chaque UI sera facturée 0,0005 USD par seconde.
*pour extraire du texte de documents PDF scannés, utilisez l'API Detect Document Text d'Amazon Textract.
Pour les 100 premiers Mo
Pour chaque Mo au-delà de 100 Mo
Vous êtes facturé en fonction de la taille totale des documents traités par chaque tâche de modélisation de thèmes. Les 100 premiers Mo sont facturés à un tarif fixe. Au-delà de 100 Mo, vous êtes facturé par Mo.
Amazon Comprehend propose une offre gratuite couvrant 50 000 unités de texte (5 millions de caractères) par API et par mois.
Les API éligibles comprennent l'extraction de phrases clés, le sentiment, le sentiment ciblé, la reconnaissance d'entités, la détection du langage, la détection d'événements, l'analyse syntaxique, la détection d'informations confidentielles, le contenu d'informations confidentielles et la classification de sécurité rapide.
Remarque : Custom Comprehend (entités personnalisées et classification personnalisée) ne propose pas d'offre gratuite. Cela comprend l'entraînement du modèle, l'inférence et la gestion de modèle.
L'offre gratuite Amazon Comprehend est disponible pour tous les clients AWS, nouveaux ou non, pendant 12 mois à compter de la date de leur première demande Amazon Comprehend.
Exemples de tarification Amazon Comprehend
Exemple 1 - Analyse des commentaires client
Supposons que vous avez créé une application à l'aide d'Amazon Comprehend pour analyser les commentaires des clients sur votre magasin en ligne. Vous avez reçu 10 000 commentaires de clients qui contiennent 550 caractères chacun. Vous utilisez le service depuis plus d'un an.
Calcul du coût total :
Taille de chaque demande = 550 caractères
Nombre d'unités par demande = 6
Nombre total d'unités : 10 000 (demandes) x 6 (unités par demande) = 60 000
Prix unitaire = 0,0001 USD
Coût total = [nb d'unités] x [coût par unité] = 60 000 x 0,0001 USD = 6,00 USD
Exemple 2 - Catégorisation de documents par sujets
Supposons que vous disposiez d'un ensemble de documents de recherche d'une taille totale de 240 Mo que vous souhaitez classer par thème et que vous désirez recommander des documents à vos clients en fonction de leurs centres d'intérêts. Supposons également que vous utilisez le service depuis plus d'un an et que vous ne pouvez pas bénéficier de l'offre gratuite.
Calcul du coût total :
Nombre total de mégaoctets traités = 240
Nombre de mégaoctets facturés à un tarif fixe de 1 USD = 100
Nombre de mégaoctets facturés à 0,004 USD/Mo = 140 [240 – 100]
Coût total de la tâche = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD
Exemple 3 - Classification de commentaires client à l’aide de l’API de classification personnalisée
Supposons que vous voulez former un classificateur pour organiser automatiquement les nouveaux commentaires des clients qui proviennent de votre site web. 10 clients envoient leurs commentaires chaque minute, et chaque commentaire fait 300 caractères. La formation du modèle personnalisé prend une heure et vous prévoyez conserver ce modèle pendant un mois. La formation des modèles vous coûtera donc 3 USD et les frais de stockage des modèles s'élèveront à 0,50 USD par mois. Supposons également que vous utilisez le service depuis plus d'un an et que vous ne pouvez pas bénéficier de l'offre gratuite.
Pour une classification asynchrone des commentaires, vous payez en fonction du nombre de caractères dans vos documents. Pour une classification en temps réel, vous devez prévoir un point de terminaison avec un débit suffisant pour traiter votre cas d'utilisation et vous payez pour la durée de mise en service du point de terminaison.
Calcul du coût d'inférence pour la classification asynchrone :
Taille de chaque demande par jour = 4 320 000 caractères [300 caractères x 10 documents x 1 440 minutes]
Nombre d'unités par demande = 43 200 unités [432 000 caractères ÷ 100 caractères par unité]
Prix unitaire = 0,0005 USD
Coût d'inférence total des unités = 21,60 USD [43 200 unités x 0,0005 USD]
Coût total = 25,10 USD [21,60 USD d'inférence + 3 USD de formation des modèles + 0,50 USD de stockage des modèles]
Calcul du coût total pour la classification synchrone :
Commençons par calculer le débit nécessaire. Chaque minute, nous classifions 10 documents de 300 caractères chacun. Ce qui équivaut à :
50 caractères par seconde [300 caractères x 10 documents ÷ 60 secondes]
Donc, il vous faudra prévoir un point de terminaison avec 1 Unité d'Inférence (UI), qui offre un débit de 100 caractères par seconde.
Prix pour 1 UI = 0,0005 USD par seconde
Les coûts dépendent de la durée pendant laquelle vous maintenez actif votre point de terminaison de classification en temps réel, quel que soit le nombre de demandes d'inférence effectuées.
Si vous activez votre point de terminaison de classification en temps réel pendant 12 heures par jour :
Coût total d'inférence = 21,60 USD [0,0005 USD x 3 600 secondes x 12 heures]
Coût total = 25,10 USD [21,60 USD d'inférence + 3 USD de formation des modèles + 0,50 USD de stockage des modèles]
Veuillez noter que des frais seront appliqués en fonction du débit prévu et de la durée d'activité du point de terminaison. Si vous avez besoin d'un débit plus élevé, la tarification sera la suivante :
Prix pour 2 UI = 0,001 USD par seconde [0,0005 USD x 2]
Prix pour 3 UI = 0,0015 USD par seconde [0,0005 USD x 3]
Exemple 4 - Analyse des commentaires client à l’aide de l'API des entités personnalisées
Calcul du coût total :
Taille de chaque demande = 5,500,000 caractères
Nombre d'unités par demande = 55,000 unités [5,500,000 caractères ÷ 100 caractères par unité]
Prix unitaire = 0,0005 USD
Coût total des unités = 27,5 USD [55 000 unités x 0,0005 USD]
Heures totales pour l'entraînement du modèle = 1,5 heure
Prix par heure = 3 USD
Coût total de l'entraînement du modèle = 4,5 USD [1,5 heure x 3 USD]
Nombre de mois pour la gestion de modèle = 1 mois
Prix par mois = 0,50 USD
Coût total de la gestion de modèle = 0,50 USD [1 mois x 0,50 USD]
Coût total = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]
Exemple 5 - Extraction d’événements et des informations associées à l’aide de la détection d’événements
Calcul du coût total :
Nombre de caractères traités = 1 500 000 caractères [3 000 articles x 500 caractères]
Nombre d'unités traitées = 45 000 unités [1 500 000 x 3 types d’événements ÷ 100 caractères par unité]
Prix unitaire = 0,003 USD
Coût total des unités = 135 USD [45 000 unités x 0,003 USD]
Exemple 6 - Identification de documents contenant des informations personnelles identifiables à l’aide de l’API d’identification des PII
Calcul du coût total :
Taille de chaque demande = 550 caractères
Nombre d'unités par demande = 6
Nombre total d'unités : 60 000 [10 000 demandes x 6 unités par demande]
Prix unitaire = 0,000002 USD
Coût total = 0,12 USD [60 000 unités x 0,000002 USD]
Exemple 7 - Rédaction de PII à partir de documents à l’aide de l’API de détection de PII
Calcul du coût total :
Taille de chaque demande = 550 caractères
Nombre d'unités par demande = 6
Nombre total d'unités : 60 000 [10 000 demandes x 6 unités par demande]
Prix unitaire = 0,0001 USD
Coût total = 6 USD [60 000 unités x 0,0001 USD]
Exemple 8 - Extraction d'entités d'une demande de prêt hypothécaire à l'aide de l'API d'entité personnalisée
Calcul du coût d'inférence pour la classification asynchrone :
Taille de chaque demande par jour = 2 500 000 caractères [100 demandes/jour x 10 documents x 2 500 caractères]
Nombre d'unités par demande = 25 000 unités [2 500 000 caractères ÷ 100 caractères par unité]
Prix unitaire = 0,0005 USD
Coût d'inférence total des unités = 12,50 USD [25 000 unités x 0,0005 USD]
Coût Amazon Textract pour l'API Detect Document Text = 1,50 USD [100 demandes/jour x 10 documents x 0,0015 USD par page, jusqu'à 1 000 000 pages]
Coût total = 17,50 USD [12,50 USD inférence + 1,50 USD Textract + 3 USD entraînement de modèle + 0,50 USD stockage du modèle]
Exemple 9 - Analyse des réponses à un sondage auprès des employés
Calcul du coût total :
Taille de chaque demande = 350 caractères
Nombre d'unités par demande = 4
Nombre total d'unités : 100 000 (demandes) x 4 (unités par demande) = 400 000
Prix unitaire = 0,0001 USD (pour 0 à 10 millions d'unités)
Coût total = [nb d'unités] x [coût unitaire] = 400 000 x 0,0001 USD = 40,00 USD
Exemple 10 - Détection de la toxicité dans les commentaires en ligne sur un site Web
Calcul du coût total :
Taille de chaque demande = 100 caractères
Nombre d'unités par demande = 1 Total
Unités = 100 millions d'UI [100 millions de commentaires x 1 unité par demande]
Prix par unité = 0,0001 USD [de 0 à 10 millions d'UI] + 0,00005 USD [de 10 à 50 millions d'UI] + 0,000025 USD [de 50 à 100 millions d'UI]
Coût total = [nb d'unités] x [coût unitaire]
= [10 millions X 0,001 USD] + [40 millions X 0,00005 USD] + [50 millions X 0,000025 USD]
= 1 000 USD + 2 000 USD + 1 250 USD
= 4 250 USD
Exemple 11 - Détection des messages non sécurisés dans une application d'IA générative
Calcul du coût total :
Taille de chaque demande = 500 caractères
Nombre d'unités par demande = 5
Nombre total d'unités = 50 millions d'UI [10 millions de commentaires x 5 unités par demande]
Prix par unité = 0,0001 USD [de 0 à 10 millions d'UI] + 0,00005 USD [de 10 à 50 millions d'UI] + 0,000025 USD [de 50 à 100 millions d'UI]
Coût total = [nb d'unités] x [coût unitaire]
= [10 millions X 0,001 USD] + [40 millions X 0,00005 USD]
= 1 000 USD + 2 000 USD
= 3 000 USD
En savoir plus sur les fonctionnalités d'Amazon Comprehend