Amazon Textract è un servizio di machine learning (ML) che estrae automaticamente testo, scrittura a mano, elementi di layout e dati da documenti scansionati. Si spinge oltre il semplice riconoscimento ottico dei caratteri (OCR) per identificare, capire ed estrarre dati da moduli e tabelle. Tutti i dati estratti vengono restituiti con coordinate di riquadri di delimitazione, cioè cornici poligonali che racchiudono ciascun dato identificato, ad esempio una parola, una riga, una tabella o singole celle all'interno di una tabella. Amazon Textract restituisce anche un punteggio di affidabilità per tutti gli oggetti che è in grado di identificare, consentendo di prendere decisioni informate su come utilizzare i risultati.
Query personalizzate
Amazon Textract ti offre la possibilità di personalizzare la funzionalità Query preaddestrata e migliorare la precisione di estrazione su tipi di documenti specifici della tua azienda, mantenendo al contempo il controllo e la proprietà dei tuoi dati. Tramite la console AWS puoi caricare solo dieci documenti di esempio, annotare i dati e personalizzare la funzionalità Query preaddestrata in poche ore.
Layout
Amazon Textract ti offre la possibilità di estrarre elementi di layout come paragrafi, titoli, elenchi, intestazioni, piè di pagina e altro dai documenti. Layout è un tipo di funzionalità nell'API Analyze Document. I clienti possono utilizzare Layout come funzionalità autonoma o in combinazione con altri tipi di funzionalità di analisi del documento.
Riconoscimento ottico dei caratteri
L’OCR di Amazon Textract rileva automaticamente il testo stampato e scritto a mano da documenti e immagini. L'OCR basato su ML di Textract è in grado di riconoscere il testo in vari caratteri e stili e può anche gestire testo rumoroso o distorto.
Estrazione da moduli
È possibile individuare automaticamente coppie chiave-valore nelle immagini dei documenti e mantenere il contesto senza alcun intervento manuale. Una coppia chiave-valore è un set di elementi di dati collegati. Ad esempio, in un documento, il campo "First Name" (Nome) è la chiave e "Jane" il valore. Ciò permette di importare facilmente i dati estratti in un database o di utilizzarli come variabile in un'applicazione. Con le soluzioni OCR tradizionali, chiavi e valori vengono estratti come testo semplice e la loro relazione si perde a meno di non scrivere e mantenere regole a codifica fissa per ogni modulo.
Estrazione dalle tabelle
Amazon Textract preserva la composizione dei dati archiviati nelle tabelle durante l'estrazione. Ciò è utile per i documenti costituiti per la maggior parte da dati strutturati, come report finanziari o referti medici con tabelle in colonne e righe. È possibile caricare automaticamente i dati estratti su un database attraverso uno schema predefinito. Ad esempio, le righe di elementi numerici e quantità di un inventario manterranno la loro associazione, in modo che un'applicazione per la gestione degli inventari possa incrementare gli elementi totali in modo semplice.
Rilevamento di firme
Amazon Textract consente di rilevare le firme su qualsiasi documento o immagine. In questo modo è facile rilevare automaticamente le firme su documenti come assegni, moduli di richiesta di prestito e moduli di richiesta di risarcimento. La posizione delle firme e i punteggi di affidabilità associati sono inclusi nella risposta API.
Estrazione basata su query
Amazon Textract ti fornisce la flessibilità di specificare i dati che devi estrarre dai documenti utilizzando query. È possibile specificare le informazioni necessarie sotto forma di domande in linguaggio naturale (ad esempio, "Come si chiama il cliente?") e ricevere l'informazione esatta (ad esempio, "John Doe") come parte della risposta dell'API. Non è necessario conoscere la struttura dei dati nel documento (tabella, modulo, campo implicato, dati annidati) o preoccuparsi delle variazioni tra versioni e formati dei documenti. Le query di Textract sono pre-addestrate su un'ampia varietà di documenti, tra cui buste paga, estratti conto, moduli W-2, moduli di richiesta di prestito, note ipotecarie, richieste di risarcimento e tessere sanitarie. La flessibilità fornita dalle query di Textract riduce la necessità di post-elaborazione, affidamento alle revisioni manuali dei dati estratti o addestramento di modelli di ML.
Analyze Lending
L'API Analyze Lending è un'API di elaborazione intelligente dei documenti gestita e preconfigurata che automatizza completamente l'estrazione di informazioni dai pacchetti di prestito. I clienti possono semplicemente caricare i documenti del proprio mutuo nell'API Analyze Lending e i modelli di machine learning integrati classificheranno e suddivideranno il pacchetto di documenti in base al tipo di documento.
Fatture e ricevute
Fatture e ricevute possono avere un'ampia gamma di layout, pertanto l'estrazione di dati manuale su larga scala è un processo lungo e difficile. Amazon Textract sfrutta il machine learning (ML) per capire il contesto di fatture e ricevute ed estrae automaticamente dati rilevanti, ad esempio nome del fornitore, numero della fattura, prezzi delle voci, importo totale e termini di pagamento.
Documenti d'identità
Amazon Textract sfrutta il machine learning (ML) per capire il contesto di documenti d'identità come passaporti e patenti di guida statunitensi senza la necessità di modelli o configurazione. È possibile estrarre automaticamente informazioni specifiche come data di scadenza e data di nascita oppure identificare ed estrarre in modo intelligente le informazioni implicite come il nome e l'indirizzo. Utilizzando Analyze ID, le aziende che forniscono servizi di verifica dei documenti d'identità e quelle che operano nei settori finanziario, sanitario e assicurativo possono facilmente automatizzare la creazione di account, la pianificazione di appuntamenti, le domande di lavoro e altro, permettendo ai clienti di inviare un'immagine o una scansione del proprio documento d'identità.
Prezzi di Amazon Textract
Amazon Textract è un servizio di machine learning (ML) che estrae automaticamente testo, scrittura a mano e dati da documenti scansionati. Si spinge oltre il semplice riconoscimento ottico dei caratteri (OCR) per identificare, capire ed estrarre dati da moduli e tabelle. Con Amazon Textract paghi solo in base all'uso effettivo. Non sono previste tariffe minime né impegni anticipati. Amazon Textract addebita solo le pagine elaborate, a prescindere che tu estragga testo, testo con tabelle, dati di moduli, query o che elabori fatture e documenti di identità. Consulta le domande frequenti per avere ulteriori dettagli sulle pagine e sull'uso accettabile di Textract.
Inizia a utilizzare Amazon Textract senza impegni anticipati o contratti a lungo termine.
Ottieni l'accesso immediato al piano gratuito di AWS.
Inizia subito a utilizzare Amazon Textract nella Console di gestione AWS.