Amazon Comprehend 提供了自然語言處理、個人身分識別資訊 (PII) 偵測和編輯、自訂分類和實體偵測以及主題建模,支援多種可以分析原始文字的應用程式,以及使用一些 API 處理 PDF 和 Word 之類的文件格式。

  • 自然語言處理︰對於實體辨識、情感分析、語法分析、關鍵片語擷取以及語言偵測的 Amazon Comprehend API,可用於從自然語言文字中擷取洞察。這些請求會以 100 個字元 (1 個單位 = 100 個字元) 為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。
  • 個人身分識別資訊 (PII):偵測 PII API 會尋找文件內所選個人身份資訊 ("PII") 實體的位置,並可用於建立文件的編校版本。包含 PII API 會指示文件是否包含所選的 PII。這些請求還會以 100 個字元 (1 個單位 = 100 個字元) 為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。
  • 自訂 Comprehend:自訂分類和實體 API 可以訓練自訂 NLP 模型,以分類文字並擷取自訂實體。非同步推論請求會以 100 個字元為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。模型訓練需支付的費用為每小時 3 USD (以秒計費),自訂模型管理則為每月 0.50 USD。針對同步自訂分類和實體推論請求,可以為端點佈建適當的輸送量。您需要為從啟動端點到刪除端點的這段時間付費。
  • 主題建模:主題建模可識別 Amazon S3 存放的文件集合中相關的詞彙或主題。該功能可識別集合中最常見的主題並分組,然後將文件對應到所屬的主題。會根據每個任務處理的文件大小總計向您收取費用。前 100 MB 會依固定費率計費。超過 100 MB 的部分,會依每 MB 的費用計費。
  • 信任與安全 (新):Comprehend 毒害偵測 API 可用於偵測文字中的毒害性內容。同樣,Comprehend 提示安全分類功能可用於偵測對大型語言模型和應用程式不安全的輸入提示。這些請求會以 100 個字元 (1 個單位 = 100 個字元) 為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。
  • 對於 Amazon Comprehend Medical 定價,請在此處進一步了解。
  • 您可以使用 AWS 定價計算器估算成本。
  • 在下面的區域選取器中選擇美國東部 (維吉尼亞北部) 區域,以檢視所有 API 的定價

 

如果每月所需的量高於 1 億個單位,請聯絡我們取得定價資訊。
NLP 請求會以 100 個字元為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。

使用 Amazon Comprehend API,您可以處理非結構化的原始文字,也可以使用一些 API 處理其他文字檔,如 PDF 和 Word 文件。 

自訂 Comprehend

自訂實體和分類
針對 PDF*、Word 和純文字文件上的非同步實體辨識

推論請求會以 100 個字元為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。

針對非同步分類

推論請求會以 100 個字元為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。

針對同步分類和實體辨識

端點以每秒遞增的方式計費,最低限制 60 秒。從啟動端點到刪除端點的這段時間,即使沒有分析任何文件,也會繼續產生費用。

一個推論單位 (IU) 在受管端點上提供每秒 100 個字元的輸送量。您可以佈建額外的推論單位以提高輸送量。每個推論單位每秒將產生 0.0005 USD。

模型訓練每小時 3 USD

*若要從掃描的 PDF 文件中擷取文字,需要呼叫 Amazon Textract Detect Document Text API

主題建模

前 100 MB

超過 100 MB 的每 MB

會根據每個主題建模任務處理的文件大小總計向您收取費用。前 100 MB 會依固定費率計費。超過 100 MB 的部分,會依每 MB 的費用計費。

免費方案

5 萬個單位的文字 (500 萬個字元)

Amazon Comprehend 提供免費方案優惠,每個 API 每月包含 5 萬個單位的文字 (500 萬個字元)。

符合條件的 API 包括關鍵片語擷取、情感、目標情感、實體辨識、語言偵測、事件偵測、語法分析、偵測 PII、包含 PII 和提示安全分類。

注意:自訂 Comprehend (自訂實體和自訂分類) 不提供免費方案優惠。這包含模型訓練、推斷和模型管理。

5 個任務,每個任務最多 1 MB (主題建模)

從第一個 Amazon Comprehend 請求的日期開始,Amazon Comprehend 免費方案可供 AWS 新客戶和現有客戶使用 12 個月。

Amazon Comprehend 定價範例

範例 1 – 分析客戶評論

假設您建立一個使用 Amazon Comprehend 的應用程式來分析線上儲存的客戶意見。您收到 10,000 封客戶意見,每封意見有 550 個字元,而您是第二年使用本服務。

總費用計算:

每個請求大小 = 550 個字元

每個請求單位數 = 6

單位總計:10,000 (請求數) x 6 (每個請求單位數) = 60,000

單價 = 0.0001 USD

總成本 = [單位數] x [每單位成本] = 60,000 x 0.0001 USD = 6.00 USD


範例 2 – 依主題分類文件

假設您有一批大小總計 240 MB 的研究文件,您想要依主題分類,以便根據客戶的興趣範圍來推薦文件。同時假設您是第二年使用本服務,不具備免費方案優惠資格。

總費用計算:

總共處理的 MB 數 = 240

依 1 USD 固定費率計費的 MB 數 = 100

依 0.004 USD/MB 計費的 MB 數 = 140 [240-100]

任務總成本 = 1.00 USD + [140 x 0.004 USD] = 1.00 USD + 0.56 USD = 1.56 USD


範例 3 – 使用自訂分類 API 分類客戶意見回饋

假設您想訓練分類器,以自動整理來自您網站的新客戶回饋。每分鐘有 10 位客戶輸入意見回饋,每個意見回饋為 300 個字元。訓練自訂模型需要一小時,而且您計劃將這個模型保留一個月。因此,本月的模型訓練費用為 3 USD,模型儲存體費用為 0.5 USD。同時假設您是第二年使用本服務,不具備免費方案優惠資格。 

若要對意見回饋進行非同步分類,您需要按文件中的字元數付費。若要實時分類,您需要為端點佈建足夠的輸送量,以處理使用案例並為端點啟動的這段時間付費。

非同步分類的推論成本計算:

每天每項請求的大小 = 4,320,000 個字元 [300 個字元 * 10 個文件 * 1,440 分鐘]

每個請求單位數 = 43,200 單位 [432,000 個字元 ÷ 每單位 100 個字元]

單價 = 0.0005 USD

此單位的總推論費用 = 21.60 USD [43,200 單位 x 0.0005 USD]

總費用 = 25.10 USD [推論 21.60 USD + 模型訓練 3 USD + 模型儲存體 0.50 USD]

同步分類的總費用計算:

首先,我們來計算所需的輸送量。我們每分鐘對 10 個文件 (每個文件 300 個字元) 分類。從而得出︰

每秒 50 個字元 [300 個字元 x 10 個文件 ÷ 60 秒]

因此,您需要為端點佈建 1 個推論單位 (IU),輸送量為每秒 100 個字元。

1 個推論單位價格 = 每秒 0.0005 USD

無論您進行多少次推論叫用,都會根據即時分類端點保持作用中狀態的時間而產生費用。

若您每天執行即時分類端點 12 小時:

推論總費用 = 21.60 USD [0.0005 USD x 3600 秒 x 12 小時]

總費用 = 25.10 USD [推論 21.60 USD + 模型訓練 3 USD + 模型儲存體 0.50 USD]

請注意,您需要為佈建的輸送量和端點處於作用中狀態的時間付費。若您需要在整個期間佈建更多資源,則價格為:

2 個推論單位價格 = 每秒 0.001 USD [0.0005 USD x 2]

3 個推論單位價格 = 每秒 0.0015 USD [0.0005 USD x 3]


範例 4 – 使用自訂實體 API 分析客戶註解

假設您想訓練自訂實體模型,以從您的網站自動擷取客戶回饋中的自訂字詞。訓練任務需要 1.5 小時,您可以分析 10,000 則客戶回饋,每則長度為 550 個字元。您計劃將此模型保留一個月。同時假設您是第二年使用本服務,不具備免費方案優惠資格。

總費用計算:

每個請求大小 = 5,500,000 個字元

每個請求單位數 = 55,000 單位 [5,500,000 個字元 ÷ 每單位 100 個字元]

單價 = 0.0005 USD

此單位總費用 = 27.5 USD [55,000 單位 x 0.0005 USD]

模型訓練總時數 = 1.5 小時

每小時價格 = 3 USD

模型訓練總費用 = 4.5 USD [1.5 小時 x 3 USD]

模型管理月數 = 1 個月

每月價格 = 0.50 USD 

模型管理總費用 = 0.50 USD [1 個月 x 0.50 USD]

總費用 = 37 USD [27.5 USD + 4.5 USD + 0.50 USD]


範例 5 – 使用事件偵測擷取事件和相關資訊

假設您要從 3,000 篇文章 (每篇 500 個字元) 中擷取 3 種事件類型,而您正處於使用該服務的第二年。

總費用計算:

處理的字元數 = 1,500,000 個字元 [3,000 篇文章 x 500 個字元]

處理的單位數 = 45,000 個單位 [1,500,000 x 3 種事件類型 ÷ 每個單位 100 個字元]

單價 = 0.003 USD

此單位總費用 = 135 USD [45,000 個單位 x 0.003 USD]


範例 6 – 使用包含 PII API 的 PII 來識別文件

假設您建立一個使用 Amazon Comprehend 的應用程式來分析線上儲存的客戶意見。您已經收到 10,000 個客戶註釋,每個註釋為 550 個字元,並且您需要確定哪些文件包含 PII,以便可以將其存放在安全的位置。假設您正在使用該服務的第二年。

總費用計算:

每個請求大小 = 550 個字元

每個請求單位數 = 6

單位總計 = 60,000 [10,000 個請求 x 每個請求 6 個單位]

單價 = 0.000002 USD

總費用 = 0.12 USD [60,000 個單位 x 0.000002 USD]


範例 7 – 使用偵測 PII API 從文件中編校 PII

假設您建立一個使用 Amazon Comprehend 的應用程式來分析線上儲存的客戶意見。您已經收到 10,000 個客戶註釋,每個註釋為 550 個字元,並且在封存文件之前,您需要建立文件的編校版本。假設您正在使用該服務的第二年。

總費用計算:

每個請求大小 = 550 個字元

每個請求單位數 = 6

單位總計 = 60,000 [10,000 個請求 x 每個請求 6 個單位]

單價 = 0.0001 USD

總費用 = 6 USD [60,000 個單位 x 0.0001 USD]

範例 8 – 使用自訂實體 API 擷取抵押貸款應用程式實體

假設您想要訓練一個自訂實體擷取模型,以從抵押貸款應用程式中擷取 10 個自訂實體。每天有 100 位客戶申請,每人提供一份 10 頁的掃描 PDF 文件,每頁包含 2,500 個字元。使用 Amazon Textract,我們假設在使用 Detect Document Text API 擷取實體之前,需要從已處理的每個頁面擷取文字。訓練自訂模型需要一小時,而且您計劃將這個模型保留一個月。因此,本月的模型訓練費用為 3 USD,模型儲存體費用為 0.5 USD。同時假設您是第二年使用本服務,不具備免費方案優惠資格。若要以非同步方式擷取自訂實體,您需要按文件中的字元數付費。若要即時擷取實體,您需要為端點佈建足夠的輸送量,以處理使用案例並為端點啟動的這段時間付費。

非同步分類的推論成本計算:

每天每項請求的大小 = 2,500,000 個字元 [100 個字元/天 * 10 個文件 * 2,500 個字元]

每個請求單位數 = 25,000 單位 [2,500,000 個字元 ÷ 每單位 100 個字元]

單價 = 0.0005 USD

單位的總推論費用 = 12.50 USD [25,000 單位 x 0.0005 USD]

Detect Document Text API 的 Amazon Textract 成本 = 1.50 USD [100 個應用程式/天 * 10 個文件 * 每頁 0.0015 USD 價格,最多 1,000,000 頁]

總費用 = 17.50 USD [推論 12.50 USD + Textract 1.50 USD + 模型訓練 3 USD + 模型儲存體 0.50 USD]

 

範例 9 – 分析員工問卷調查回應

讓我們假設您已使用 Amazon Comprehend Targeted Sentiment 建置一個應用程式來分析貴公司的員工問卷調查回應。您收到 10 萬個問卷調查回應,每個回應有 350 個字元,而您是第二年使用此服務。

總費用計算:

每個請求大小 = 350 個字元

每個請求單位數 = 4

單位總計:100,000 (請求數) x 4 (每個請求單位數) = 400,000

單價 = 0.0001 USD (來自 0-1,000 萬個單位)

總成本 = [單位數] x [每單位成本] = 400,000 x 0.0001 USD = 40.00 USD

 

範例 10 – 在網站的線上評論中偵測毒害性內容

假設您建立一個使用 Amazon Comprehend 的應用程式來分析網站的毒害性內容。您收到 1 億個客戶評論,每個評論為 100 個字元,您需要確定哪些評論本質上具有毒害性,並且應當進行編輯。假設您正在使用該服務的第二年。

            總費用計算:

            每個請求大小 = 100 個字元

            每個請求單位數 = 共計 1 個

            單位 = 1 億個 IU [1 億個評論 x 每個請求 1 個單位]

            每單位價格 = 0.0001 USD [從 0 到 1,000 萬個 IU] + 0.00005 USD [從 1,000 萬到 5,000 萬個 IU] + 0.000025 USD [從 5,000 萬到 1 億個 IU]

            總成本 = [單位數] x [每單位成本]

            = [1,000 萬 X 0.001 USD]+[4,000 萬 X 0.00005 USD]+[5,000 萬 X 0.000025 USD]

            = 1,000 USD + 2,000 USD + 1,250 USD

            = 4,250 美元

範例 11 – 在生成式 AI 應用程式中偵測不安全提示

假設您使用 Amazon Comprehend 建立了一個應用程式,在使用者與您的生成式 AI 產品互動時偵測不安全的輸入提示。您已收到 1,000 萬個輸入提示,每個字元為 500 個字元,您需要識別哪些提示不安全。假設您正在使用該服務的第二年。

            總費用計算:

            每個請求大小 = 500 個字元

            每個請求單位數 = 5

            單位總計 = 5,000 萬個 IU [1,000 萬個評論 x 每個請求 5 個單位]

            每單位價格 = 0.0001 USD [從 0 到 1,000 萬個 IU] + 0.00005 USD [從 1,000 萬到 5,000 萬個 IU] + 0.000025 USD [從 5,000 萬到 1 億個 IU]

            總成本 = [單位數] x [每單位成本]

            = [1,000 萬 X 0.001 USD] + [4,000 萬 X 0.00005 USD]

            = 1,000 USD + 2,000 USD

            = 3,000 美元

進一步了解 Amazon Comprehend 功能

瀏覽功能頁面
準備好開始使用了嗎?
註冊
還有其他問題嗎?
聯絡我們