Amazon Textract ist ein Machine Learning (ML)-Service, der automatisch Text, Handschrift und Daten aus gescannten Dokumenten extrahiert. Es geht über eine einfache optische Zeichenerkennung (OCR) hinaus, um Daten aus Formularen und Tabellen zu identifizieren, zu verstehen und zu extrahieren. Mit Amazon Textract zahlen Sie nur für das, was Sie tatsächlich nutzen. Es fallen weder Mindestgebühren noch Vorausleistungen an. Amazon Textract berechnet nur die verarbeiteten Seiten, unabhängig davon, ob Sie Text, Text mit Tabellen, Formulardaten, Abfragen oder Rechnungen und Ausweisdokumente verarbeiten. Lesen Sie die Häufig gestellten Fragen für weitere Informationen über die Seiten und die akzeptable Nutzung von Amazon Textract.
Amazon Textract verfügt über fünf APIs: Detect-Document-Text-API, Analyze-Document-API, Analyze-Expense-API und Analyze-Lending-API.
Detect-Document-Text-API verwendet optische Zeichenerkennungstechnologie (OCR), um den Text und die Handschrift aus einem Dokument zu extrahieren.
Die Analyze-Document-API bietet die vier Funktionen Formulare, Tabellen, Abfragen und Signaturen.. Sie sind flexibel und können jede beliebige Kombination von Formularen, Tabellen, Abfragen und Signaturen zusammen aufrufen.
- Analyze-Document-API für Formulare extrahiert Daten wie Schlüsselwert-Paare („Vorname“ und den dazugehörigen Wert: „Jane Smith“). Es verwendet auch OCR-Technologie, um den gesamten Text und die Handschrift aus einem Dokument zu extrahieren.
- Analyze Document API für Tabellen extrahiert auch tabellarische Daten, die in Spalten und Zeilen organisiert sind. Es verwendet auch OCR-Technologie, um den gesamten Text und die Handschrift aus einem Dokument zu extrahieren.
- Analyze Document API für Abfragen bietet Ihnen die Flexibilität, die benötigten Informationen aus einem Dokument anzugeben (z. B. „Wie lautet der Name des Kunden?“) und diese Daten (z. B. „Jane Doe“) als Teil der Antwort zu erhalten. Sie müssen sich keine Gedanken über die Struktur der Daten im Dokument oder Unterschiede in der Anordnung der Daten in verschiedenen Formaten und Versionen des Dokuments machen. Es verwendet auch OCR-Technologie, um den gesamten Text und die Handschrift aus einem Dokument zu extrahieren.
- Die Analyze Document API für benutzerdefinierte Abfragen bietet Ihnen die Möglichkeit, das Feature für benutzerdefinierte Abfragen für Ihre geschäftsspezifischen Dokumente aufzurufen. Sie trainieren einen Adapter mithilfe der AWS-Konsole und verwenden die Adapter-ID in Ihrer Analyze Document API-Anfrage, um benutzerdefinierte Abfragen zu verwenden.
- Die Analyze Document API for Signatures bietet die Möglichkeit, handschriftliche Signaturen, elektronische Signaturen und Initialen auf jedem Dokument oder Bild zu erkennen. Es verwendet auch OCR-Technologie, um den gesamten Text und die Handschrift aus einem Dokument zu extrahieren.
Individuelles Angebot anfordern
Wenden Sie sich für Anwendungsfälle mit hohem Volumen an unser Vertriebsteam, um ein individuelles Preisangebot anzufordern.
Kostenloses Kontingent
Im Rahmen des kostenlosen Kontingents für AWS können Sie Amazon Textract zum Einstieg kostenlos verwenden. Das kostenlose Kontingent dauert drei Monate und neue AWS-Kunden können bis zu Folgendes analysieren:
Detect Document Text API: 1 000 Seiten pro Monat
Analyze-Document-API:
- 1 000 Seiten pro Monat bei ausschließlicher Verwendung von Signaturen
- 100 Seiten pro Monat bei Verwendung von Formularen, Tabellen und Layoutfunktionen
- Jeweils 100 Seiten pro Monat für Abfragen, Formulare + Abfragen, Tabellen + Abfragen, Formulare + Tabellen + Abfragen
- Es gibt kein kostenloses Kontingent für benutzerdefinierte Abfragen
Analyze Expense API: 100 Seiten pro Monat
Analyze-ID-API: 100 Seiten pro Monat
Analyze-Lending-API: 2 000 Seiten pro Monat
Preise von Amazon-Textract-API
Vorgeschulte Features
*Analyze Document API enthält OCR, unabhängig vom ausgewählten Funktionstyp
*Analyze Expense und Analyze ID APIs enthalten OCR in der Ausgabe
Vorgeschulte + maßgeschneiderte Features
Preisbeispiele außerhalb des kostenlosen Kontingents
Preisbeispiel 1 – Detect Document Text API
Nehmen wir an, Sie möchten den Text aus 100 000 Seiten von Forschungsberichten extrahieren, indem Sie die Detect Document Text API verwenden. Der Preis pro Seite in der Region USA West (Oregon) für die ersten eine Million Seiten beträgt 0,0015 USD bei einem Preis von 150 USD.
Gesamtanzahl bearbeiteter Seiten = 100 000
Preis pro Seite = 0,0015 USD
Gesamtkosten pro Monat = 0,0015 USD * 100 000 + 150 USD * 500 000 = 7 500 USD
Preisbeispiel 2 – Detect-Document-Text-API
Nehmen wir mal an, dass Sie Text von 2 Millionen Seiten Untersuchungsberichten mit Detect Document Text API extrahieren möchten. Der Preis pro Seite in der Region USA West (Oregon) beträgt 0,0015 USD pro Seite für die erste Million der Seiten und über 1 Million Seiten kosten 0,0006 USD pro Seite. Demzufolge würde die Bearbeitung von 2 Millionen Seiten insgesamt 2 100 USD kosten.
Gesamtanzahl bearbeiteter Seiten = 2 000 000
Preis pro Seite = 0,0015 USD für die ersten 1 Million und 0,0006 USD für mehr als 1 Million.
Gesamtkosten pro Monat = Gesamtgebühr pro Monat = 0,0015 USD * 1 000 000 USD + 0,0006 USD * 1 000 000 USD = 1 500 USD + 600 USD = 2 100 USD
Preisbeispiel 3 – Analyze-Document-API – Formulare und Tabellen
Nehmen wir mal an, dass Sie Text und strukturierte Daten von 5 000 Seiten Steuerformularen mit Analyze Document API extrahieren möchten. Der Preis pro Seite in der Region USA West (Oregon) für 1 Million Seiten mit Tabellen beträgt 0,015 USD und bei Formularen beträgt er 0,05 USD pro Seite, insgesamt 325 USD.
Gesamtanzahl bearbeiteter Seiten = 5 000 Seiten
Preis pro Seite mit Tabellen = 0,015 USD
Preis pro Seite mit Formular (Schlüssel-Wert-Paar) = 0,05 USD
Gesamtgebühren = 0,015 USD * 5 000 USD + 0,05 USD * 5 000 USD = 75 USD + 250 USD = 325 USD
Preisbeispiel 4 – Analyze-Document-API – Formulare und Tabellen
Nehmen wir mal an, dass Sie Text, Formulare und Tabellen von 2 Millionen Seiten Steuerformularen mit Analyze Document API extrahieren möchten. Der Preis pro Seite der Region USA West (Oregon) für 1 Million Seiten mit Tabellen beträgt 0,015 USD und 0,01 USD pro Seite für mehr als 1 Million Seiten. Der Preis für Seiten mit Formularen beträgt 0,05 USD für 1 Mio. Seiten und 0,04 USD für mehr als 1 Mio. Seiten. Die Gesamtkosten belaufen sich auf 115 000 USD.
Gesamtanzahl bearbeiteter Seiten = 2 000 000 Seiten
Preis pro Seite mit Formular (Schlüssel-Wert-Paar) = 0,05 USD für die erste Million Seiten und 0,04 USD für die nächsten 1 Million
Gesamtgebühren = 0,015 USD * 1 000 000 + 0,01 USD * 1 000 000 + 0,05 USD * 1 000 000 + 0,04 USD * 1 000 000 = 15 000 USD + 10 000 USD + 50 000 + 40 000 = 115 000 USD
Preisbeispiel 5 – Analyze Document API – Abfragen
Nehmen wir mal an, dass Sie Text von 5 000 Seiten Hypothekenformularen mit Analyze Document API extrahieren möchten. Sie möchten auch 10 spezifische Datenpunkte von jeder Seite über Abfragen extrahieren. Der Preis pro Seite in der Region USA West (Oregon) für eine Million Seiten beträgt 0,015 USD, also insgesamt 75 USD.
Gesamtanzahl bearbeiteter Seiten = 5 000 Seiten
Preis pro Seite mit Suchanfragen = 0,015 USD
Gesamtgebühren = 0,015 USD x 5 000 USD = 75 USD
Preisbeispiel 6 – Analyze-Document-API – Formulare, Tabellen und Abfragen
Angenommen, Sie möchten mit der Analyze-Document-API Text, Formulare und Tabellen aus zwei Millionen Seiten mit Gehaltsabrechnungen extrahieren. Sie möchten auch 10 spezifische Datenpunkte von jeder Seite über Abfragen extrahieren. Der Preis pro Seite in der Region USA West (Oregon) für eine Million Seiten mit Tabellen, Formularen und Abfragen beträgt 0,070 USD und 0,055 USD pro Seite nach einer Million Seiten. Die Gesamtkosten belaufen sich auf 125 000 USD.
Gesamtanzahl bearbeiteter Seiten = 2 000 000 Seiten
Preis für die Seite mit Tabellen, Formularen und Abfragen = 0,070 USD für die erste Million und 0,055 USD für die nächste Million
Gesamtgebühr = 0,070 USD x 1 000 000 + 0,055 USD x 1 000 000 = 70 000 USD + 55 000 USD = 125 000 USD
Preisbeispiel 7 – Analyze-Document-API – Formulare und Abfragen
Angenommen, Sie möchten die Text- und Tabellendaten aus 5 000 Seiten von Steuerformularen mithilfe der Analyze-Document-API extrahieren. Sie möchten auch 10 spezifische Datenpunkte von jeder Seite über Abfragen extrahieren. Der Preis pro Seite in der Region USA West (Oregon) für eine Million Seiten mit Tabellen und Abfragen beträgt 0,020 USD und 0,015 USD pro Seite nach einer Million Seiten. Die Gesamtkosten belaufen sich auf 100 USD.
Gesamtanzahl bearbeiteter Seiten = 5 000 Seiten
Preis pro Seite mit Tabellen und Abfragen = 0,020 USD
Gesamtgebühr = 0,020 USD x 5 000 USD = 100 USD
Preisbeispiel 8 – Analyze-Document-API – Abfragen
Nehmen wir mal an, dass Sie Signaturen erkennen und den Rohtext von 100 000 Seiten Hypothekendokumenten mit Analyze Document extrahieren möchten
API – Unterschriften-Merkmalstyp. Der Preis pro Seite in der Region USA West (Oregon) für die erste Million Seiten beträgt 0,0035 USD, für Kosten von
350 USD.
Gesamtanzahl bearbeiteter Seiten = 100 000
Preis pro Seite = 0,0035 USD
Gesamtkosten pro Monat = 0,00035 USD x 100 000 = 350 USD
Preisbeispiel 9 – Analyze-Document-API – Abfragen
Angenommen, Sie möchten Signaturen erkennen und den Rohtext aus 5 Mio. Seiten von Hypothekendokumenten mithilfe der Analyze-Document-API extrahieren
– Unterschriften-Merkmalstyp. Der Preis pro Seite in der Region USA West (Oregon) für die erste Million Seiten beträgt 0,00035 USD, für Kosten von 20 USD.
Gesamtanzahl bearbeiteter Seiten = 5 000 000
Preis pro Seite für die ersten 1 Mio. Seiten = 0,0035 USD x 1 000 000 = 3 500 USD
Preis pro Seite für die nächsten 4 Mio. Seiten = 0,0014 USD x 4 000 000 = 5 600 USD
Summe = 3 500 USD + 5 600 USD = 9 100 USD
Preisbeispiel 10 – Analyze-Expense-API
Nehmen wir an, dass Sie Daten von 100 000 Rechnungen mit der Analyze-Expense-API extrahieren möchten. Der Preis pro Seite im Westen der USA (Oregon) für 1 Mio. Seiten mit Tabellen beträgt 0,01 USD und Sie bearbeiten 100.000 Rechnungen. Die Gesamtkosten belaufen sich auf 1.000 USD. Siehe die nachfolgende Berechnung:
Gesamtanzahl bearbeiteter Seiten = 100 000
Preis pro Seite = 0,01 USD
Gesamtgebühr pro Monat = 0,01 USD x 100 000 = 1 000 USD
Preisbeispiel 11 – Analyze-Expense-API
Nehmen wir an, dass Sie Daten von 1 500 000 Rechnungen mit er Analyze-Expense-API extrahieren möchten. Der Preis pro Seite im Westen der USA (Oregon) für 1 Mio. Seiten beträgt 0,01 USD pro Seite und 0,008 USD pro Seite für mehr als 1 Mio. Seiten. Die Gesamtkosten belaufen sich auf 14.000 USD. Siehe die nachfolgende Berechnung:
Gesamtanzahl bearbeiteter Seiten = 1 500 000
Preis pro Seite mit Tabelle = 0,01 USD für die erste Million der Seiten und 0,008 USD für die nächsten 500 000
Gesamtkosten pro Monat = 0,01 USD x 1 000 000 + 0,008 USD x 500 000 = 14 000 USD
Preisbeispiel 12 – Analyze-ID-API
Nehmen wir an, Sie wollen Informationen aus 100 000 Ausweisdokumenten mithilfe der Analyze-ID-API extrahieren. Der Preis pro Seite in der Region USA West (Oregon) für 100 000 Seiten beträgt 0,025 USD pro Seite für bis zu 100 000 Seiten. Die Gesamtkosten belaufen sich auf 2 500 USD.
Gesamtanzahl bearbeiteter Seiten = 100 000
Preis pro Seite = 0,025 USD
Gesamtkosten pro Monat = 0,025 USD x 100 000 = 2 500 USD
Preisbeispiel 13 – Analyze-ID-API
Nehmen wir an, Sie wollen Informationen aus 600 000 Ausweisdokumenten mithilfe der Analyze-ID-API extrahieren. Der Preis pro Seite in der Region USA West (Oregon) für 100 000 Seiten beträgt 0,025 USD und 0,01 USD pro Seite für mehr als 100 000 Seiten. Die Gesamtkosten würden sich auf 7 500 USD belaufen.
Gesamtanzahl bearbeiteter Seiten = 600 000
Preis pro Seite = 0,025 USD für die ersten 100 000 Seiten und 0,01 USD für die nächsten 500 000
Gesamtkosten pro Monat = 0,025 USD x 100 000 + 0,01 USD x 500 000 = 7 500 USD
Preisbeispiel 14 – Analyze-Lending-API
Nehmen wir an, Sie möchten mithilfe der Analyze-Lending-API Informationen aus 200 000 Seiten von Hypothekenkreditdokumenten extrahieren. Der Preis pro Seite in der Region USA West (Oregon) beträgt 0,07 USD pro Seite für bis zu einer Million Seiten. Von den 200 000 Seiten, die Sie verarbeitet haben, hat Analyze Lending die Klassifizierung und Extraktion für die unterstützten Dokumenttypen durchgeführt, was zu einer Klassifizierung und Datenextraktion von 100 000 Seiten führte. Die Gesamtkosten belaufen sich auf 7 000 USD für die 100 000 Seiten.
Gesamtanzahl bearbeiteter Seiten = 200 000
Insgesamt unterstützte Seiten mit Klassifizierung und Extraktion = 100 000
Preis pro Seite = 0,07 USD
Gesamtkosten pro Monat = 0,07 USD x 100 000 = 7 000 USD
Preisbeispiel 15 – Analyze-Lending-API
Nehmen wir an, Sie möchten mithilfe der Analyze-Lending-API Informationen aus 2 000 000 Seiten von Hypothekenkreditdokumenten extrahieren. Der Preis pro Seite in der Region USA West (Oregon) beträgt 0,07 USD pro Seite für bis zu einer Million Seiten und 0,055 USD pro Seite nach 1 000 000 Seiten. Von den 2 000 000 Seiten, die Sie verarbeitet haben, hat Analyze Lending die Klassifizierung und Extraktion für die unterstützten Dokumenttypen durchgeführt, was zu einer Klassifizierung und Datenextraktion von 1 200 000 Seiten führte. Die Gesamtkosten belaufen sich auf 81 000 USD für die 1 200 000 Seiten.
Gesamtanzahl bearbeiteter Seiten = 2 000 000
Insgesamt unterstützte Seiten mit Klassifizierung und Extraktion = 1 200 000
Preis pro Seite = 0,07 USD für die erste 1 Mio. und 0,055 USD für die nächsten 200 000
Gesamtkosten pro Monat = 0,07 USD x 1 000 000 + 0.055 USD x 200 000 = 81 000 USD
Preisbeispiel 16 – Analyze-Document-API – Layout und Tabellen
Sie müssen mithilfe der Analyze Document API Layout und Tabellen aus zwei Millionen Seiten mit Finanzberichten extrahieren. Das Layout ist kostenlos verfügbar, wenn es mit der Tabellenfunktion verwendet wird. Die Preise für Tabellen in der Region USA West (Oregon) betragen 0,015 USD pro Seite für die ersten 1 Mio. Seiten in einem Monat und 0,010 USD pro Seite für Seiten mit mehr als 1 Mio. Seiten pro Monat.
Gesamtanzahl bearbeiteter Seiten = 2 000 000 Seiten
Preis für die ersten 1 Mio. Seiten = 0,015 USD * 1.000.000 = 15.000 USD
Preis für die nächsten 1 Mio. Seiten = 0,010 USD * 1.000.000 = 10.000 USD
Gesamtkosten = 25 000 USD
Preisbeispiel 17 – Analyze Document API – Benutzerdefinierte Abfragen
Sie müssen mithilfe von benutzerdefinierten Abfragen Daten aus 5 Millionen Seiten extrahieren. Die Preise in der Region USA West (Oregon) betragen 0,025 USD pro Seite für die ersten 1 Mio. Seiten in einem Monat und 0,015 USD pro Seite für Seiten mit mehr als 1 Mio. Seiten pro Monat.
Gesamtanzahl bearbeiteter Seiten = 5 000 000 Seiten
Preis für die ersten 1 Mio. Seiten = 0,025USD * 1 000 000 = 25 000 USD
Preis für die nächsten 4 Mio. Seiten = 0,015 USD * 4 000 000 = 60 000 USD
Gesamtkosten = 85 000 USD
Preisbeispiel 18 – Analyze Document API – Vorgeschulte Formulare und benutzerdefinierte Abfragen
Sie müssen mithilfe von vorgeschulten Formularen und benutzerdefinierten Abfragen Datenpunkte aus 2 Millionen Seiten extrahieren. Die Preise in der Region USA West (Oregon) betragen 0,065 USD pro Seite für die ersten 1 Mio. Seiten in einem Monat und 0,050 USD pro Seite für Seiten mit mehr als 1 Mio. Seiten pro Monat.
Gesamtanzahl bearbeiteter Seiten = 2 000 000 Seiten
Preis für die ersten 1 Mio. Seiten = 0,065 USD * 1 000 000 = 65 000 USD
Preis für die nächsten 1 Mio. Seiten = 0,050 USD * 1 000 000 = 50 000 USD
Gesamtgebühren = 115 000 USD
Erfahren Sie mehr darüber, wie Amazon Textract Texte und strukturierte Daten aus fast allen Dokumenten extrahiert.
Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent.
Beginnen Sie mit der Entwicklung mit Amazon Textract in der AWS-Managementkonsole.