Amazon Comprehend ermöglicht die natürliche Sprachverarbeitung, die Erkennung und Schwärzung personenbezogener Daten (PII), die benutzerdefinierte Klassifizierung und Erkennung von Entitäten sowie die Modellierung von Themen. Dies ermöglicht eine breite Palette von Anwendungen, die Rohtext und mit einigen APIs auch Dokumentformate wie PDF und Word analysieren können.
- Verarbeitung natürlicher Sprache: Amazon-Comprehend-APIs für Entitäterkennung, Sentiment-Analyse, Syntax-Analyse, Schlüsselphrasen-Extraktion und Spracherkennung können verwendet werden, um Erkenntnisse aus natürlichsprachlichem Text zu gewinnen. Diese Anfragen werden in Einheiten von 100 Zeichen gemessen (1 Einheit = 100 Zeichen), mit einer Mindestgebühr von 3 Einheiten (300 Zeichen) pro Anfrage.
- Personenbezogene Information (PII): Die PII-Erkennung-API findet Stellen ausgewählter personenbezogener Informationen (PII)-Entitäten einem Dokument und kann zur Erstellung von geschwärzten Versionen von Dokumenten verwendet werden. Die Enthält PII-API teilt Ihnen mit, ob ein Dokument die ausgewählte PII enthält oder nicht. Diese Anfragen werden ebenfalls in Einheiten von 100 Zeichen (1 Einheit = 100 Zeichen) gemessen. Pro Anfrage wird ein Mindestpreis in Höhe von 3 Einheiten (300 Zeichen) fällig.
- Benutzerdefiniertes Comprehend: Die APIs für benutzerdefinierte Klassifizierung und Entitäten können ein benutzerdefiniertes NLP-Modell trainieren, um Text zu kategorisieren und benutzerdefinierte Entitäten zu extrahieren. Asynchrone Inferenz-Anfragen werden in Einheiten von 100 Zeichen gemessen. Pro Anfrage wird ein Mindestpreis in Höhe von 3 Einheiten (300 Zeichen) fällig. Ihnen werden 3 USD pro Stunde für die Modellschulung (nach Sekunden abgerechnet) und 0,50 USD pro Monat für benutzerdefiniertes Modellmanagement in Rechnung gestellt. Für synchrone Inferenzanfragen für benutzerdefinierte Klassifizierung und Entitäten stellen Sie einen Endpunkt mit dem entsprechenden Durchsatz bereit. Die Rechnungsstellung erfolgt vom Zeitpunkt des Starts Ihres Endpunkts bis zu dessen Löschung.
- Themenmodellierung: Die Themenmodellierung identifiziert relevante Begriffe oder Themen aus einer Sammlung von Dokumenten, die in Amazon S3 gespeichert sind. Es identifiziert die am häufigsten vorkommenden Themen in der Sammlung und ordnet sie in Gruppen an, bevor es feststellt, welche Dokumente zu welchem Thema gehören. Die Kosten werden anhand der Gesamtgröße des verarbeiteten Dokuments pro Auftrag berechnet. Die ersten 100 MB sind in der Flatrate enthalten. Ab 100 MB kostet jedes MB extra.
- Vertrauen und Sicherheit (neu): Die Comprehend-Toxizitätserkennungs-API kann verwendet werden, um toxische Inhalte aus Texten zu erkennen. In ähnlicher Weise kann die Sicherheitsklassifizierungsfunktion „Comprehend Prompt“ verwendet werden, um unsichere Eingabeaufforderungen für große Sprachmodelle und Anwendungen zu erkennen. Diese Anfragen werden in Einheiten von 100 Zeichen gemessen (1 Einheit = 100 Zeichen), mit einer Mindestgebühr von 3 Einheiten (300 Zeichen) pro Anfrage.
- Weitere Informationen über die Preise für Amazon Comprehend Medical finden Sie hier.
- Sie können Ihre Kosten mit Hilfe des AWS-Preisrechners schätzen.
- Wählen Sie in der Regionsauswahl unten die Region USA Ost (Nord-Virginia) aus, um die Preise für alle APIs anzuzeigen
Mit den Amazon Comprehend APIs können Sie sowohl unstrukturierten, rohen Text als auch - mit einigen APIs - andere Textdateien wie PDF- und Word-Dokumente verarbeiten.
Inferenz-Anfragen werden in Einheiten von 100 Zeichen gemessen. Pro Anfrage wird ein Mindestpreis in Höhe von 3 Einheiten (300 Zeichen) fällig.
Inferenz-Anfragen werden in Einheiten von 100 Zeichen gemessen. Pro Anfrage wird ein Mindestpreis in Höhe von 3 Einheiten (300 Zeichen) fällig.
Die Endpunkte werden in Sekundenabstufungen in Rechnung gestellt, wobei die Mindestdauer 60 Sekunden beträgt. Gebühren fallen ab dem Zeitpunkt des Starts des Endpunkts bis zu dessen Löschung fortlaufend an, auch wenn keine Dokumente analysiert werden.
Eine Inferenz-Einheit (IE) bietet einen Durchsatz von 100 Zeichen/Sekunde auf Ihrem verwalteten Endpunkt. Sie können zusätzliche IEs für mehr Durchsatz bereitstellen. Für jede IE fallen 0,0005 USD pro Sekunde an.
*um Text aus gescannten PDF-Dokumenten zu extrahieren, wird Amazon Textract Detect Document Text API aufgerufen.
Für die ersten 100 MB
Für jedes MB über 100 MB
Die Kosten werden anhand der Gesamtgröße des verarbeiteten Dokuments pro Topic-Modellierungs-Auftrag berechnet. Die ersten 100 MB sind in der Flatrate enthalten. Ab 100 MB kostet jedes MB extra.
Amazon Comprehend bietet ein kostenloses Kontingent mit 50 000 Einheiten Text (5 Mio. Zeichen) pro API und Monat.
Zu den berechtigten APIs gehören Schlüsselphrasenextraktion, Sentiment, Targeted Sentiment, Entitätenerkennung, Spracherkennung, Ereigniserkennung, Syntaxanalyse, Detect PII, Contains PII und Prompt Safety Classification.
Hinweis: Custom Comprehend (kundenspezifische Entitäten und kundenspezifische Klassifikation) bietet kein kostenloses Kontingent. Dazu gehören Modelltraining, Inferenz und Modellmanagement.
Die kostenlose Stufe von Amazon Comprehend steht sowohl neuen als auch bestehenden AWS-Kunden für 12 Monate zur Verfügung, beginnend mit dem Datum ihrer ersten Amazon Comprehend-Anfrage.
Amazon Comprehend – Preisbeispiele
Beispiel 1 – Analyse von Kundenkommentaren
Nehmen wir an, Sie haben mit Amazon Comprehend eine Anwendung zur Analyse von Kundenkommentaren in Ihrem Online-Shop entwickelt. Sie haben 10 000 Kundenkommentare erhalten, die jeweils 550 Zeichen umfassen, und Sie befinden sich im zweiten Jahr der Servicenutzung.
Berechnung der Gesamtkosten:
Größe jeder Anfrage = 550 Zeichen
Anzahl der Einheiten pro Anfrage = 6
Gesamtzahl der Einheiten: 10 000 (Anfragen) * 6 (Einheiten pro Anfrage) = 60 000
Preis pro Einheit = 0,0001 USD
Gesamtkosten = [Anz. Einheiten] x [Kosten pro Einheit] = 60 000 x 0,0001 USD = 6,00 USD
Beispiel 2 – Kategorisierung von Dokumenten nach Titeln
Nehmen wir an, Sie haben eine Reihe an Forschungsdokumenten, die insgesamt 240 MB groß sind. Diese Dokumente wollen Sie nach Thema kategorisieren und Ihren Kunden entsprechend ihrer Interessen vorschlagen. Nehmen wir außerdem an, dass Sie sich im zweiten Servicenutzungsjahr befinden und deshalb kein kostenloses Kontingent nutzen können.
Berechnung der Gesamtkosten:
Gesamtanzahl der verarbeiteten Megabyte = 240
Megabyte, die über die Flatrate von 1 USD abgerechnet werden = 100
Megabyte, die mit 0,004 USD pro MB abgerechnet werden = 140 [240-100]
Gesamtkosten des Auftrags = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD
Beispiel 3 – Klassifizieren von Kunden-Feedback mithilfe der benutzerdefinierten Klassifizierungs-API
Nehmen wir an, Sie möchten ein Klassifizierungstool trainieren, um neues Kundenfeedback von Ihrer Website automatisch zu organisieren. 10 Kunden geben jede Minute Feedback ein und jedes Feedback umfasst 300 Zeichen. Es dauert eine Stunde das benutzerdefinierte Modell zu trainieren, und Sie planen dieses Modell für einen Monat zu behalten. Die Modellschulungskosten betragen daher 3 USD und die Modellspeicherkosten liegen bei 0,50 USD pro Monat. Nehmen wir außerdem an, dass Sie sich im zweiten Servicenutzungsjahr befinden und deshalb kein kostenloses Kontingent nutzen können.
Um das Feedback asynchron zu klassifizieren, zahlen Sie nach Anzahl der Zeichen in Ihren Dokumenten. Zur Klassifizierung in Echtzeit stellen Sie einen Endpunkt mit ausreichendem Durchsatz bereit, um Ihren Anwendungsfall abzuwickeln, und zahlen für die Betriebszeit des Endpunkts.
Inferenzkostenberechnung für asynchrone Klassifizierung:
Größe der jeweiligen Anfrage pro Tag = 4 320 000 Zeichen [300 Zeichen * 10 Dokumente * 1 440 Minuten]
Anzahl an Einheiten pro Anfrage = 43 200 Einheiten [432 000 Zeichen/100 Zeichen pro Einheit]
Preis pro Einheit = 0,0005 USD
Gesamtinferenzkosten für Einheiten = 21,60 USD [43 200 Einheiten x 0,0005 USD]
Gesamtkosten = 25,10 USD [21,60 USD Inferenz + 3 USD Modelltraining + 0,50 USD Modellspeicher]
Berechnung der Gesamtgebühren für die synchrone Klassifizierung:
Berechnen wir zuerst den erforderlichen Durchsatz. Jede Minute klassifizieren wir 10 Dokumente mit je 300 Zeichen. Das ergibt:
50 Zeichen pro Sekunde [300 Zeichen x 10 Dokumente ÷ 60 Sekunden]
Daher müssen Sie einen Endpunkt mit 1 Inferenzeinheit (IE) bereitstellen, der einen Durchsatz von 100 Zeichen/Sekunde ermöglicht.
Preis für 1 IE = 0,0005 USD pro Sekunde
Kosten fallen je nach Dauer der Aktivität des Endpunkts zur Echtzeitklassifizierung an, aber ungeachtet der Anzahl der Inferenzaufrufe.
Falls Sie Ihren Endpunkt zur Echtzeitklassifizierung 12 Stunden täglich ausführen:
Gesamtkosten für Inferenz = 21,60 USD [0,0005 USD x 3 600 Sekunden x 12 Stunden]
Gesamtkosten = 25,10 USD [21,60 USD Inferenz + 3 USD Modelltraining + 0,50 USD Modellspeicher]
Beachten Sie, dass Kosten für den bereitgestellten Durchsatz und für die Dauer der Aktivität des Endpunkts anfallen. Falls Sie mehr Durchsatz bereitstellen müssen, beträgt der Preis:
Preis für 2 IE = 0,001 USD pro Sekunde [0,0005 USD x 2]
Preis für 3 IE = 0,0015 USD pro Sekunde [0,0005 USD x 3]
Beispiel 4 – Analyse von Kundenkommentaren mithilfe der API für benutzerdefinierte Entitäten
Berechnung der Gesamtkosten:
Größe jeder Anfrage = 5,500,000 Zeichen
Anzahl an Einheiten pro Anfrage = 55,000 Einheiten [5.500.000 Zeichen / 100 Zeichen pro Einheit]
Preis pro Einheit = 0,0005 USD
Gesamtkosten der Einheiten = 27,5 USD [55,000 Einheiten x 0,0005 USD]
Gesamtanzahl der Stunden für Modellschulung = 1,5 Stunden
Preis pro Stunde = 3 USD
Gesamtkosten für Modellschulung = 4.5 USD [1,5 Stunden x 3 USD]
Anzahl an Monaten für Modell-Verwaltung = 1 Monat
Preis pro Monat = 0,50 USD
Gesamtkosten für Modellverwaltung = 0,50 USD [1 Monat x 0,50 USD]
Gesamtkosten = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]
Beispiel 5 – Extrahieren von Ereignissen und den zugehörigen Informationen mithilfe der Ereigniserkennung
Berechnung der Gesamtkosten:
Anzahl der verarbeiteten Zeichen = 1.500.000 Zeichen [3.000 Artikel x 500 Zeichen]
Anzahl der verarbeiteten Einheiten = 45.000 Einheiten [1.500.000 x 3 Ereignistypen ÷ 100 Zeichen pro Einheit]
Preis pro Einheit = 0,003 USD
Gesamtkosten der Einheiten = 135 USD [45 000 Einheiten x 0,003 USD]
Beispiel 6 – Identifizieren von Dokumenten mit PII unter Verwendung der Enthält-PII-API
Berechnung der Gesamtkosten:
Größe jeder Anfrage = 550 Zeichen
Anzahl der Einheiten pro Anfrage = 6
Gesamteinheiten = 60 000 [10 000 Anfragen x 6 Einheiten pro Anfrage]
Preis pro Einheit = 0,000002 USD
Gesamtkosten = 0,12 USD [60 000 Einheiten x 0,000002 USD]
Beispiel 7 – Schwärzung von personenbezogenen Daten aus Dokumenten mithilfe der API zur Erkennung personenbezogener Daten
Berechnung der Gesamtkosten:
Größe jeder Anfrage = 550 Zeichen
Anzahl der Einheiten pro Anfrage = 6
Gesamteinheiten = 60 000 [10 000 Anfragen x 6 Einheiten pro Anfrage]
Preis pro Einheit = 0,0001 USD
Gesamtkosten = 6 USD [60 000 Einheiten x 0,0001 USD]
Beispiel 8 – Extrahieren von Hypothekenantragsentitäten mithilfe der benutzerdefinierten Entitäts-API
Inferenzkostenberechnung für asynchrone Klassifizierung:
Umfang jeder Anfrage pro Tag = 2 500 000 Zeichen [100 Anwendungen/Tag * 10 Dokumente * 2 500 Zeichen]
Anzahl an Einheiten pro Anfrage = 25 000 Einheiten [2 500 000 Zeichen / 100 Zeichen pro Einheit]
Preis pro Einheit = 0,0005 USD
Gesamtinferenzkosten für Einheiten = 12,50 USD [25 000 Einheiten x 0,0005 USD]
Amazon-Textract-Kosten für Detect Document Text API = 1,50 USD [100 Anwendungen/Tag * 10 Dokumente * 0,0015 USD Preis pro Seite, bis zu 1M Seiten]
Gesamtpreis = 17,50 USD [12,50 USD Inferenz + 1.50 USD Textract + 3 USD Modelltraining + 0,50 USD Modellspeicher]
Beispiel 9 – Analyse der Antworten auf Mitarbeiterbefragungen
Berechnung der Gesamtkosten:
Größe jeder Anfrage = 350 Zeichen
Anzahl der Einheiten pro Anfrage = 4
Gesamteinheiten: 100 000 (Anfragen) x 4 (Einheiten pro Anfrage) = 400 000
Preis pro Einheit = 0,0001 USD (von 0–10 Mio. Einheiten)
Gesamtpreis = [Anz. Einheiten] x [Preis pro Einheit] = 400 000 x 0,0001 USD = 40,00 USD
Beispiel 10 – Nachweis von Toxizität in Online-Kommentaren auf einer Website
Berechnung der Gesamtkosten:
Größe jeder Anfrage = 100 Zeichen
Anzahl der Einheiten pro Anfrage = 1 Insgesamt
Einheiten = 100 Mio. IUs [100 Mio. Kommentare x 1 Einheit pro Anfrage]
Preis pro Einheit = 0,0001 USD [von 0 bis 10 Mio. IE] + 0,00005 USD [von 10 Mio. IE – 50 Mio. IE] + 0,000025 USD [von 50 Mio. IE – 100 Mio. IE]
Gesamtpreis = [Anz. Einheiten] x [Preis pro Einheit]
= [10 MX0,001 USD] + [40 MX 0,00005 USD] + [50 MX0,000025 USD]
= 1 000 USD + 2 000 USD + 1 250 USD
= 4 250 USD
Beispiel 11 – Erkennung unsicherer Eingabeaufforderungen in generativen KI-Anwendungen
Berechnung der Gesamtkosten:
Größe jeder Anfrage = 500 Zeichen
Anzahl der Einheiten pro Anfrage = 5
Gesamtzahl der Einheiten = 50 Mio. IU [10 Mio. Kommentare x 5 Einheiten pro Anfrage]
Preis pro Einheit = 0,0001 USD [von 0 bis 10 Mio. IE] + 0,00005 USD [von 10 Mio. IE – 50 Mio. IE] + 0,000025 USD [von 50 Mio. IE – 100 Mio. IE]
Gesamtpreis = [Anz. Einheiten] x [Preis pro Einheit]
= [10 M X 0,001] + [40 M X 0,00005]
= 1 000 USD + 2 000 USD
= 3 000 USD
Weitere Informationen zu Amazon Comprehend-Funktionen