インテリジェントドキュメント処理のための Amazon Comprehend

ドキュメント処理を自動化し、正確なインサイトを抽出する

インテリジェントドキュメント処理のための Amazon Comprehend を使う理由

企業は、ドキュメントをアプリケーションで使用できるようにするために、それらの手動またはデジタルでの前処理に多くの時間と労力を費やしています。ドキュメントには、さまざまな形式、タイプ、レイアウトがあり、これを時間のかかる、間違いが発生しやすい、コストのかかるプロセスにしています。チームにはインテリジェントなドキュメント処理を自動化するための機械学習 (ML) の専門知識がない場合がありますが、チームはビジネス要件によって拡張し、正確な結果を提供できるシンプルで効率的なソリューションを求めています。

Amazon Comprehend は、事前の機械学習経験の必要なしにドキュメント処理を自動化できるようにします。分類および抽出機能を使用して、さまざまなドキュメントタイプをすばやく処理し、ビジネス上の決定を知らせるためのインサイトを正確に抽出します。機能にアクセスして、機密データを検出して保護し、コンプライアンス要件を満たすのに役立つようにします。 

インテリジェントドキュメント処理のための Amazon Comprehend の利点

インサイトをさまざまなドキュメントタイプからすばやく正確に処理して抽出します。
定義したクラスとエンティティを用いて、ドメイン、業界、またはビジネス要件に特有のカスタムモデルを作成します。
ドキュメント処理パイプラインを自動化し、機械学習の経験の必要なしで大規模なモデルの管理を行います。
ドキュメント内の個人を特定できる情報を見つけて保護し、プライバシーおよびコンプライアンス要件を満たすようにします。

特徴

Page Topics

全般

全般

デジタルまたはスキャンされたテキストと半構造化ドキュメントの両方の処理のために単一の API を使用します。PDF、Docx、JPEG、TIFF、PNG、plaintext UTF-8 などのドキュメントタイプのオンデマンドおよびバッチ処理サポートにアクセスします。

ユースケースまたは業界のためのドメイン特有のドキュメントカテゴリー (W2、自動車および住宅保険の請求など) と用語 (名前、頭字語、製品コード、注文タイプなど) を正確に取得するためのカスタムモデルを構築します。ユーザーだけが作成およびアクセスするデータで構築した、専用の機械学習モデルとエンドポイントを使用します。

光学文字認識 (OCR) と自然言語処理 (NLP) を組み合わせることで、ドキュメント処理の結果を改善します。トレーニング時に追加のデータセットを使用して、分類およびエンティティ認識の精度を向上させます。

すぐに使えるモデル管理機能を用いて、モデルをすばやくトレーニング、デプロイ、管理します。単一ステップの推論を用いて、モデルからインサイトにアクセスします。

Amazon Comprehend がサポートする複数の言語にわたってドキュメントを処理することでユースケースの範囲を広げ、翻訳の必要性を減らします。

Amazon Comprehend PII リダクション機能を使用して、大規模なドキュメントでの PII データの発見とリダクションを自動化できるようにします。

ユースケース

ポリシーや医療コードなどの医療請求書と請求フォームからの重要な情報を分類および抽出して、請求処理を完了するための正確なインサイトを提供します。

信用評価および引受業務のために、損益計算書、本人確認書類、およびローン申請書類からエンティティを抽出します。  

法的契約書の処理を自動化し、高リスクの書類の分類と選別を行い、交渉を通知するためのケース番号、商標、および条項などのインサイトを抽出します。 

税金の引当と申告のために、請求書、契約書、W2 フォーム、銀行取引明細書、およびインボイスからインサイトを分類および抽出します。

リソース

ドキュメント

インテリジェントなドキュメント処理のための Amazon Comprehend の使用を開始します。

ドキュメントを読む

インテリジェントなドキュメント処理のための Amazon Comprehend の使用を開始する