O Amazon Comprehend fornece um processamento de linguagem natural, detecção e redação de informações de identificação pessoal (PII), detecção de classificações e entidades personalizadas e modelagem de tópicos, oferecendo uma ampla gama de aplicações que podem analisar textos brutos e, com certas APIs, formatos de documento como PDF e Word.
- Processamento de linguagem natural: APIs do Amazon Comprehend para reconhecimento de entidades, análise de sentimentos, análise de sintaxe, extração de frases-chave e detecção de linguagem podem ser usadas para extrair insights de texto de linguagem natural. Essas solicitações de inferência são medidas em unidades de 100 caracteres (1 unidade = 100 caracteres), com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.
- Informações de identificação pessoal (PII): a API de detecção PII encontra localizações de entidades de informações de identificação pessoal ("PII") escolhidas dentro de um documento e pode ser usada para criar versões com conteúdo removido de documentos. A API contém PII informa se um documento contém ou não as PII escolhidas. As solicitações também são medidas em unidades de 100 caracteres (1 unidade = 100 caracteres), com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.
- Comprehend personalizado: as APIs de entidades e classificação personalizadas podem treinar um modelo de NLP personalizado para categorizar textos e extrair entidades personalizadas. As solicitações de inferência assíncrona são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação. Você será cobrado 3 USD por hora pelo treinamento de modelos (cobrado por segundo) e 0,50 USD por mês pelo gerenciamento de modelos personalizados. Para solicitações de inferência síncrona de Custom Classification e Entities, você provisiona um endpoint com taxa de transferência adequada. Você é cobrado desde o momento em que inicia o endpoint até ele ser excluído.
- Modelagem de tópicos: identifica termos ou tópicos relevantes de uma coleção de documentos armazenada no Amazon S3. Ela identificará os tópicos mais comuns da coleção e os organizará em grupos, então mapeará quais documentos pertencem a qual tópico. Você é cobrado de acordo com o tamanho total de documentos processados por trabalho. Os primeiros 100 MB são cobrados usando uma taxa fixa. Acima de 100 MB, você é cobrado por MB.
- Confiança e segurança (novidade): a API de Detecção de toxicidade do Comprehend pode ser usada para detectar conteúdo tóxico em texto. Da mesma forma, o atributo Classificação de segurança de prompts do Comprehend pode ser usado para detectar prompts de entrada não seguros em modelos e aplicações de linguagem grande. Essas solicitações de inferência são medidas em unidades de 100 caracteres (1 unidade = 100 caracteres), com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.
- Saiba mais sobre o preço do Amazon Comprehend Medical aqui.
- Você pode fazer uma estimativa de seus custos usando a calculadora de preços da AWS.
- Selecione a região Leste dos EUA (Norte da Virgínia) no seletor de regiões abaixo para ver os preços de todas as APIs
Com as APIs do Amazon Comprehend, é possível processar textos brutos não estruturados e, com certas APIs, outros arquivos de texto, como documentos PDF ou Word.
As solicitações de inferência são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.
As solicitações de inferência são medidas em unidades de 100 caracteres, com uma cobrança mínima de 3 unidades (300 caracteres) por solicitação.
Endpoints são cobrados em incrementos de um segundo, com um limite mínimo de 60 segundos. Você continuará sujeito a cobranças a partir do momento que iniciar o endpoint até ele ser excluído, mesmo que nenhum documento seja analisado.
Uma unidade de inferência (UI) fornece uma taxa de transferência de 100 caracteres/segundo no endpoint gerenciado. Você pode provisionar UIs adicionais para conseguir mais taxa de transferência. Será cobrado o valor de 0,0005 USD por segundo para cada UI.
*para extrair texto de documentos PDF digitalizados, chama-se a API Amazon Textract Detect Document Text.
Para os primeiros 100 MB
Para cada MB acima de 100 MB
Você é cobrado de acordo com o tamanho total de documentos processados por trabalho de modelagem de tópicos. Os primeiros 100 MB são cobrados usando uma taxa fixa. Acima de 100 MB, você é cobrado por MB.
O Amazon Comprehend oferece um nível gratuito que abrange 50 mil unidades de texto (5 milhões de caracteres) por API por mês.
As APIs elegíveis incluem Extração de frases-chave, Sentimento, Sentimento direcionado, Reconhecimento de entidades, Detecção de linguagem, Detecção de eventos, Análise de sintaxe, Detecção de PII, Contém PII e Classificação de segurança de prompts.
Obs.: o Comprehend personalizado (entidades personalizadas e classificação personalizada) não oferece um nível gratuito. Estão incluídos treinamento do modelo, inferência e gerenciamento do modelo.
O nível gratuito do Amazon Comprehend está disponível para clientes novos e existentes da AWS por 12 meses a partir da data da primeira solicitação do Amazon Comprehend.
Exemplos de preço do Amazon Comprehend
Exemplo 1: análise de comentários de clientes
Vamos supor que você criou uma aplicação usando o Amazon Comprehend para analisar os comentários dos clientes em sua loja on-line. Você recebeu 10.000 comentários de clientes com 550 caracteres cada. Você está no segundo ano de uso do serviço.
Cálculo da cobrança total:
Tamanho de cada solicitação = 550 caracteres
Número de unidades por solicitação = 6
Total de unidades: 10.000 (solicitações) x 6 (unidades por solicitação) = 60.000
Preço por unidade = 0,0001 USD
Custo total = [nº de unidades] x [custo por unidade] = 60.000 x USD 0,0001 = USD 6,00
Exemplo 2: categorização de documentos por tópicos
Vamos supor que você tem um conjunto de documentos de pesquisa totalizando 240 MB de tamanho. Você quer categorizar os documentos por tópico e recomendá-los aos clientes de acordo com sua área de interesse. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito.
Cálculo da cobrança total:
Total de megabytes processados = 240
Megabytes cobrados a uma taxa fixa de 1 USD = 100
Megabytes cobrados a 0,004 USD/MB = 140 [240-100]
Custo total do trabalho = USD 1,00 + [140 x USD 0,004] = USD 1,00 + USD 0,56 = USD 1,56
Exemplo 3: classificação de feedback de clientes usando a API de classificação personalizada
Digamos que você queira treinar um classificador para organizar automaticamente novo comentário de clientes recebido no seu site. 10 clientes inserem comentários a cada minuto e cada comentário tem 300 caracteres. O treinamento do modelo personalizado leva uma hora e você pretende manter o modelo por um mês. Portanto, o custo do treinamento do modelo será de 3 USD e do armazenamento do modelo será de 0,5 USD pelo mês. Além disso, vamos supor que você esteja no segundo ano de uso do serviço e não esteja qualificado para a oferta de nível gratuito.
Para classificar os comentários de forma assíncrona, você paga pelo número de caracteres em documentos. Para classificar em tempo real, você provisiona um endpoint com taxa de transferência suficiente para tratar seu caso de uso e pagar pelo tempo em que o endpoint está ativo.
Cálculo de custo de inferência para classificação assíncrona:
Tamanho de cada solicitação por dia = 4.320.000 caracteres [300 caracteres * 10 documentos * 1.440 minutos]
Número de unidades por solicitação = 43,200 unidades [432.000 caracteres ÷ 100 caracteres por unidade]
Preço por unidade = USD 0,0005
Custo total de inferência por unidades = 21,60 USD [43.200 unidades x 0,0005 USD]
Custo total = 25,10 USD [21,60 USD de inferência + 3 USD de treinamento de modelo + 0,50 USD de armazenamento de modelo]
Cálculo de cobrança total para classificação assíncrona:
Primeiro, vamos calcular a taxa de transferência exigida. A cada minuto, estamos classificando 10 documentos, cada um com 300 caracteres. Isso equivale a:
50 caracteres por segundo [300 caracteres x 10 documentos ÷ 60 segundos]
Você precisará provisionar um endpoint com 1 unidade de inferência (UI), gerando uma taxa de transferência de 100 caracteres/segundo.
Preço por 1 UI = 0,0005 USD por segundo
Você incorrerá em custos de acordo com o tempo de ativação do endpoint de classificação em tempo real, independentemente do número de chamadas feitas.
Se estiver executando o endpoint de classificação em tempo real 12 horas por dia:
Custo total de inferência = 21,60 USD [0,0005 USD x 3600 segundos x 12 horas]
Custo total = 25,10 USD [21,60 USD de inferência + 3 USD de treinamento de modelo + 0,50 USD de armazenamento de modelo]
Note que o valor é cobrado pela taxa de transferência provisionada e pelo tempo de ativação do endpoint. Se você precisasse provisionar mais taxa de transferência, o preço seria:
Preço por 2 UIs = 0,001 USD por segundo [0,0005 USD x 2]
Preço por 3 UIs = USD 0,0015 por segundo [USD 0,0005 x 3]
Exemplo 4: análise de comentários de clientes usando a API de entidades personalizadas
Cálculo da cobrança total:
Tamanho de cada solicitação = 5,500,000 caracteres
Número de unidades por solicitação = 55,000 unidades [5.500.000 caracteres ÷ 100 caracteres por unidade]
Preço por unidade = USD 0,0005
Custo total das unidades = USD 27,5 [55.000 unidades x USD 0,0005]
Total de horas para treinamento do modelo = 1,5 hora
Preço por hora = USD 3
Custo total para treinamento do modelo = 4,5 USD [1,5 horas x 3 USD]
Número de meses para gerenciamento de modelos = 1 mês
Preço por mês = USD 0,50
Custo total do gerenciamento de modelos = USD 0,50 [1 mês x USD 0,50]
Custo total = USD 37 [USD 27,5 + USD 4,5 + USD 0,50]
Exemplo 5: extração de eventos e das informações associadas usando a detecção de eventos
Cálculo da cobrança total:
Número de caracteres processados = 1.500.000 caracteres [3.000 artigos x 500 caracteres]
Número de unidades processadas = 45.000 unidades [1.500.000 x 3 tipos de eventos ÷ 100 caracteres por unidade]
Preço por unidade = 0,003 USD
Custo total das unidades = USD 135 [45.000 unidades x USD 0,003]
Exemplo 6: identificação de documentos com PII usando a API Contém PII
Cálculo da cobrança total:
Tamanho de cada solicitação = 550 caracteres
Número de unidades por solicitação = 6
Total de unidades = 60.000 [10.000 solicitações x 6 unidades por solicitação]
Preço por unidade = 0,000002 USD
Custo total = USD 0,12 [60.000 unidades x USD 0,000002]
Exemplo 7: remoção de PII de documentos usando a API Detecção de PII
Cálculo da cobrança total:
Tamanho de cada solicitação = 550 caracteres
Número de unidades por solicitação = 6
Total de unidades = 60.000 [10.000 solicitações x 6 unidades por solicitação]
Preço por unidade = 0,0001 USD
Custo total = USD 6 [60.000 unidades x USD 0,0001]
Exemplo 8: extração de entidades de aplicação de hipoteca usando a API de entidade personalizada
Cálculo de custo de inferência para classificação assíncrona:
Tamanho de cada solicitação por dia = 2.500.000 caracteres [100 aplicações/dia * 10 documentos * 2.500 caracteres]
Número de unidades por solicitação = 25.000 unidades [2.500.000 caracteres ÷ 100 caracteres por unidade]
Preço por unidade = USD 0,0005
Custo total de inferência por unidades = USD 12,50 [25.000 unidades x USD 0,0005]
Custo do Amazon Textract para a API Detect Document Text = USD 1,50 [100 aplicações/dia * 10 documentos * USD 0,0015 preço por página, até 1 milhão de páginas]
Custo total = USD 17,50 [USD 12,50 de inferência + USD 1.50 de Textract + USD 3 de treinamento de modelo + USD 0,50 de armazenamento de modelo]
Exemplo 9: analisar respostas de pesquisa com funcionários
Cálculo da cobrança total:
Tamanho de cada solicitação = 350 caracteres
Número de unidades por solicitação = 4
Total de unidades: 100.000 (solicitações) x 4 (unidades por solicitação) = 400.000
Preço por unidade = USD 0,0001 (de 0-10M unidades)
Custo total = [n.º de unidades] x [custo por unidade] = 400.000 x USD 0,0001 = USD 40,00
Exemplo 10: Detecção de toxicidade em comentários online de sites
Cálculo da cobrança total:
Tamanho de cada solicitação = 100 caracteres
Número de unidades por solicitação = 1 total
Unidades = 100 milhões de IUs [100 milhões de comentários x 1 unidade por solicitação]
Preço por unidade = USD 0,0001 [de 0 a 10 milhões de IUs] + USD 0,00005 [de 10 milhões a 50 milhões de IUs] + USD 0,000025 [de 50 milhões a 100 milhões de IUs]
Custo total = [nº de unidades] x [custo por unidade]
= [10MXUSD 0,001]+[40MXUSD 0,00005]+[50MXUSD 0,000025]
= USD 1.000 + USD 2.000 + USD 1.250
= USD 4.250
Exemplo 11: Detecção de prompts não seguros em uma aplicação de IA generativa
Cálculo da cobrança total:
Tamanho de cada solicitação = 500 caracteres
Número de unidades por solicitação = 5
Total de unidades = 50 milhões de IUs [10 milhões de comentários x 5 unidades por solicitação]
Preço por unidade = USD 0,0001 [de 0 a 10 milhões de IUs] + USD 0,00005 [de 10 milhões a 50 milhões de IUs] + USD 0,000025 [de 50 milhões a 100 milhões de IUs]
Custo total = [nº de unidades] x [custo por unidade]
= [10M X USD 0.001]+[40M X USD 0,00005]
= USD 1.000 + USD 2.000
= USD 3.000
Saiba mais sobre os atributos do Amazon Comprehend