Recursos do Amazon Textract

Por que escolher o Amazon Textract?

O Amazon Textract corresponde a um serviço de machine learning (ML) que extrai automaticamente textos impressos ou manuscritos, elementos de layout e dados de documentos digitalizados. Esse recurso faz mais do que o simples reconhecimento óptico de caracteres (OCR): ele identifica, entende e extrai dados de formulários e tabelas. Todos os dados extraídos são retornados com coordenadas da caixa delimitadora: estruturas de polígonos envolvendo cada parte de dado identificado, como uma palavra, uma linha, uma tabela ou células individuais dentro de uma tabela. O Amazon Textract também retorna uma pontuação de confiança para todas as identificações, o que permite tomar decisões embasadas sobre como usar os resultados.

Saiba mais

Recursos gerais

Open all

Consultas personalizadas

O Amazon Textract oferece a capacidade de personalizar o recurso de consultas pré-treinadas e melhorar a precisão da extração em tipos de documentos específicos da sua empresa, enquanto você mantém o controle e a propriedade dos seus dados. Por meio do Console da AWS, você pode fazer upload de até dez documentos de amostra, anotar os dados e personalizar o recurso de consultas pré-treinadas em poucas horas.

Saiba mais

Layout

O Amazon Textract oferece a capacidade de extrair elementos de layout, como parágrafos, títulos, listas, cabeçalhos, rodapés e muito mais dos documentos. O Layout é um tipo de atributo na API Analyze Document. Os clientes podem usar o Layout como um recurso independente ou em combinação com outros tipos de atributo Analyze Document.

Saiba mais

Reconhecimento óptico de caracteres

O OCR do Amazon Textract detecta automaticamente textos impressos e manuscritos em documentos e imagens. O OCR baseado em ML da Textract pode reconhecer texto em várias fontes e estilos, além de lidar com textos ruidosos ou distorcidos.

Saiba mais

Extração de formulários

É possível detectar pares de chave-valor nas imagens de um documento e reter o contexto sem intervenção manual. Um par de chave-valor é um conjunto de itens de dados vinculados. Por exemplo, em um documento, o campo “Nome” é a chave e “Jane” é o valor. Isso faz com que seja fácil importar os dados extraídos para um banco de dados ou fornecê-los como uma variável em uma aplicação. Com as soluções tradicionais de OCR, as chaves e os valores são extraídos como texto simples e a relação entre eles é perdida, a menos que regras embutidas em código sejam escritas e mantidas para cada formulário.

Saiba mais

Detecção de assinatura

O Amazon Textract tem capacidade de detectar assinaturas em qualquer documento ou imagem. Isso facilita a detecção automática de assinaturas em documentos como cheques, formulários de solicitação de empréstimos e declarações. A localização das assinaturas e pontuações de confiança associadas estão incluídas na resposta da API.

Saiba mais

Extração de tabelas

O Amazon Textract preserva a composição dos dados armazenados nas tabelas durante a extração. Isso é útil para documentos compostos majoritariamente por dados estruturados, como relatórios financeiros ou registros médicos com tabelas em colunas e linhas. É possível carregar automaticamente os dados extraídos em um banco de dados usando um esquema predefinido. Por exemplo, as linhas de números e quantidades de itens em um relatório de inventário reterão a associação para que uma aplicação de gerenciamento de inventário possa facilmente incrementar os totais do item.

Saiba mais

Analyze Lending

A API Analyze Lending é uma API de processamento pré-configurado, inteligente e gerenciado de documentos que automatiza totalmente a extração de informações de pacotes de empréstimo. Os clientes apenas carregam seus documentos de hipoteca para a API Analyze Lending e os modelos de machine learning pré-criados classificarão e dividirão o pacote de documentos por tipo de documento.

Saiba mais

Extração baseada em query

Agora, o Amazon Textract oferece a flexibilidade de especificar os dados necessários para fazer a extração de documentos usando queries. É possível especificar as informações necessárias na forma de perguntas em linguagem natural (por exemplo, “Qual é o nome do cliente”) e receber as informações exatas (por exemplo, “João da Silva”) como parte da resposta da API. Não é necessário conhecer a estrutura dos dados no documento (tabela, formulário, campo implícito, dados aninhados) ou preocupar-se com as variações entre versões e formatos do documento. As queries do Textract são treinadas previamente em uma grande variedade de documentos, inclusive holerites, extratos bancários, formulários W-2, formulários de solicitação de empréstimo, letras hipotecárias, documentos de sinistros e cartões de seguros. A flexibilidade oferecida pelas queries do Textract reduz a necessidade de implementar pós-processamento, dependência de revisões manuais dos dados extraídos ou a necessidade de treinar modelos de ML.

Saiba mais

Faturas e recibos

Faturas e recibos podem ter uma grande variedade de formatos, o que dificulta e aumenta o tempo para extrair manualmente dados em escala. O Amazon Textract usa machine learning (ML) para compreender o contexto das faturas e recibos e extrai automaticamente os dados relevantes, como o nome do vendedor, número da fatura, preço dos itens, valor total e modo de pagamento.

Saiba mais

Documentos de identidade

O Amazon Textract usa machine learning (ML) para compreender o contexto dos documentos de identidade, como o passaporte e a carteira de habilitação dos EUA, sem a necessidade de recorrer a modelos ou configuração. Você pode extrair automaticamente informações específicas como a data de vencimento ou a data de nascimento e identificar e extrair de forma inteligente informações implícitas, como nome e endereço. Ao usar a Analyze ID, negócios que oferecem serviços de verificação de identidade, e aqueles das áreas de finanças, saúde e seguros, podem automatizar facilmente a criação de contas, agendamento de compromissos, candidaturas a emprego, e muito mais, ao permitir que os clientes enviem uma foto ou digitalização do documento de identidade.

Saiba mais

Preços do Amazon Textract

O Amazon Textract é um serviço de machine learning (ML) que extrai automaticamente texto impresso ou manuscrito e dados de documentos digitalizados. Esse recurso faz mais do que o simples reconhecimento óptico de caracteres (OCR): ele identifica, entende e extrai dados de formulários e tabelas. Com o Amazon Textract, o pagamento é feito conforme o uso. Não há taxas mínimas nem compromissos antecipados. O Amazon Textract cobra somente pelas páginas processadas, quer você extraia texto, texto com tabelas, dados de formulários e consultas ou processe faturas e documentos de identidade. Consulte as Perguntas frequentes para saber mais detalhes sobre as páginas e o uso aceitável do Textract.

Próximas etapas

Free Tier

Cadastre-se para obter uma conta gratuita

Cadastrar-se

Console

Comece a criar no console

Cadastrar-se

Selecione suas preferências de cookies

Recursos do Amazon Textract

Por que escolher o Amazon Textract?

Page Topics

Recursos gerais

Consultas personalizadas

Layout

Reconhecimento óptico de caracteres

Extração de formulários

Detecção de assinatura

Extração de tabelas

Analyze Lending

Extração baseada em query

Faturas e recibos

Documentos de identidade

Preços do Amazon Textract

Próximas etapas

Cadastre-se para obter uma conta gratuita

Comece a criar no console

Selecione suas preferências de cookies

Recursos do Amazon Textract

Por que escolher o Amazon Textract?

Page Topics

Recursos gerais

Consultas personalizadas

Layout

Reconhecimento óptico de caracteres

Extração de formulários

Detecção de assinatura

Extração de tabelas

Analyze Lending

Extração baseada em query

Faturas e recibos

Documentos de identidade

Preços do Amazon Textract

Próximas etapas

Cadastre-se para obter uma conta gratuita

Comece a criar no console

Encerramento do suporte para o Internet Explorer