Amazon Comprehend 提供了自然語言處理、個人身分識別資訊 (PII) 偵測和編輯、自訂分類和實體偵測以及主題建模,支援多種可以分析原始文字的應用程式,以及使用一些 API 處理 PDF 和 Word 之類的文件格式。
- 自然語言處理︰對於實體辨識、情感分析、語法分析、關鍵片語擷取以及語言偵測的 Amazon Comprehend API,可用於從自然語言文字中擷取洞察。這些請求會以 100 個字元 (1 個單位 = 100 個字元) 為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。
- 個人身分識別資訊 (PII):偵測 PII API 會尋找文件內所選個人身份資訊 ("PII") 實體的位置,並可用於建立文件的編校版本。包含 PII API 會指示文件是否包含所選的 PII。這些請求還會以 100 個字元 (1 個單位 = 100 個字元) 為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。
- 自訂 Comprehend:自訂分類和實體 API 可以訓練自訂 NLP 模型,以分類文字並擷取自訂實體。非同步推論請求會以 100 個字元為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。模型訓練需支付的費用為每小時 3 USD (以秒計費),自訂模型管理則為每月 0.50 USD。針對同步自訂分類和實體推論請求,可以為端點佈建適當的輸送量。您需要為從啟動端點到刪除端點的這段時間付費。
- 主題建模:主題建模可識別 Amazon S3 存放的文件集合中相關的詞彙或主題。該功能可識別集合中最常見的主題並分組,然後將文件對應到所屬的主題。會根據每個任務處理的文件大小總計向您收取費用。前 100 MB 會依固定費率計費。超過 100 MB 的部分,會依每 MB 的費用計費。
- 信任與安全 (新):Comprehend 毒害偵測 API 可用於偵測文字中的毒害性內容。同樣,Comprehend 提示安全分類功能可用於偵測對大型語言模型和應用程式不安全的輸入提示。這些請求會以 100 個字元 (1 個單位 = 100 個字元) 為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。
- 對於 Amazon Comprehend Medical 定價,請在此處進一步了解。
- 您可以使用 AWS 定價計算器估算成本。
- 在下面的區域選取器中選擇美國東部 (維吉尼亞北部) 區域,以檢視所有 API 的定價
使用 Amazon Comprehend API,您可以處理非結構化的原始文字,也可以使用一些 API 處理其他文字檔,如 PDF 和 Word 文件。
推論請求會以 100 個字元為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。
推論請求會以 100 個字元為單位計費,每個請求最低收費單位是 3 個單位 (300 個字元)。
端點以每秒遞增的方式計費,最低限制 60 秒。從啟動端點到刪除端點的這段時間,即使沒有分析任何文件,也會繼續產生費用。
一個推論單位 (IU) 在受管端點上提供每秒 100 個字元的輸送量。您可以佈建額外的推論單位以提高輸送量。每個推論單位每秒將產生 0.0005 USD。
*若要從掃描的 PDF 文件中擷取文字,需要呼叫 Amazon Textract Detect Document Text API。
前 100 MB
超過 100 MB 的每 MB
會根據每個主題建模任務處理的文件大小總計向您收取費用。前 100 MB 會依固定費率計費。超過 100 MB 的部分,會依每 MB 的費用計費。
Amazon Comprehend 提供免費方案優惠,每個 API 每月包含 5 萬個單位的文字 (500 萬個字元)。
符合條件的 API 包括關鍵片語擷取、情感、目標情感、實體辨識、語言偵測、事件偵測、語法分析、偵測 PII、包含 PII 和提示安全分類。
注意:自訂 Comprehend (自訂實體和自訂分類) 不提供免費方案優惠。這包含模型訓練、推斷和模型管理。
從第一個 Amazon Comprehend 請求的日期開始,Amazon Comprehend 免費方案可供 AWS 新客戶和現有客戶使用 12 個月。
Amazon Comprehend 定價範例
範例 1 – 分析客戶評論
假設您建立一個使用 Amazon Comprehend 的應用程式來分析線上儲存的客戶意見。您收到 10,000 封客戶意見,每封意見有 550 個字元,而您是第二年使用本服務。
總費用計算:
每個請求大小 = 550 個字元
每個請求單位數 = 6
單位總計:10,000 (請求數) x 6 (每個請求單位數) = 60,000
單價 = 0.0001 USD
總成本 = [單位數] x [每單位成本] = 60,000 x 0.0001 USD = 6.00 USD
範例 2 – 依主題分類文件
假設您有一批大小總計 240 MB 的研究文件,您想要依主題分類,以便根據客戶的興趣範圍來推薦文件。同時假設您是第二年使用本服務,不具備免費方案優惠資格。
總費用計算:
總共處理的 MB 數 = 240
依 1 USD 固定費率計費的 MB 數 = 100
依 0.004 USD/MB 計費的 MB 數 = 140 [240-100]
任務總成本 = 1.00 USD + [140 x 0.004 USD] = 1.00 USD + 0.56 USD = 1.56 USD
範例 3 – 使用自訂分類 API 分類客戶意見回饋
假設您想訓練分類器,以自動整理來自您網站的新客戶回饋。每分鐘有 10 位客戶輸入意見回饋,每個意見回饋為 300 個字元。訓練自訂模型需要一小時,而且您計劃將這個模型保留一個月。因此,本月的模型訓練費用為 3 USD,模型儲存體費用為 0.5 USD。同時假設您是第二年使用本服務,不具備免費方案優惠資格。
若要對意見回饋進行非同步分類,您需要按文件中的字元數付費。若要實時分類,您需要為端點佈建足夠的輸送量,以處理使用案例並為端點啟動的這段時間付費。
非同步分類的推論成本計算:
每天每項請求的大小 = 4,320,000 個字元 [300 個字元 * 10 個文件 * 1,440 分鐘]
每個請求單位數 = 43,200 單位 [432,000 個字元 ÷ 每單位 100 個字元]
單價 = 0.0005 USD
此單位的總推論費用 = 21.60 USD [43,200 單位 x 0.0005 USD]
總費用 = 25.10 USD [推論 21.60 USD + 模型訓練 3 USD + 模型儲存體 0.50 USD]
同步分類的總費用計算:
首先,我們來計算所需的輸送量。我們每分鐘對 10 個文件 (每個文件 300 個字元) 分類。從而得出︰
每秒 50 個字元 [300 個字元 x 10 個文件 ÷ 60 秒]
因此,您需要為端點佈建 1 個推論單位 (IU),輸送量為每秒 100 個字元。
1 個推論單位價格 = 每秒 0.0005 USD
無論您進行多少次推論叫用,都會根據即時分類端點保持作用中狀態的時間而產生費用。
若您每天執行即時分類端點 12 小時:
推論總費用 = 21.60 USD [0.0005 USD x 3600 秒 x 12 小時]
總費用 = 25.10 USD [推論 21.60 USD + 模型訓練 3 USD + 模型儲存體 0.50 USD]
請注意,您需要為佈建的輸送量和端點處於作用中狀態的時間付費。若您需要在整個期間佈建更多資源,則價格為:
2 個推論單位價格 = 每秒 0.001 USD [0.0005 USD x 2]
3 個推論單位價格 = 每秒 0.0015 USD [0.0005 USD x 3]
範例 4 – 使用自訂實體 API 分析客戶註解
總費用計算:
每個請求大小 = 5,500,000 個字元
每個請求單位數 = 55,000 單位 [5,500,000 個字元 ÷ 每單位 100 個字元]
單價 = 0.0005 USD
此單位總費用 = 27.5 USD [55,000 單位 x 0.0005 USD]
模型訓練總時數 = 1.5 小時
每小時價格 = 3 USD
模型訓練總費用 = 4.5 USD [1.5 小時 x 3 USD]
模型管理月數 = 1 個月
每月價格 = 0.50 USD
模型管理總費用 = 0.50 USD [1 個月 x 0.50 USD]
總費用 = 37 USD [27.5 USD + 4.5 USD + 0.50 USD]
範例 5 – 使用事件偵測擷取事件和相關資訊
總費用計算:
處理的字元數 = 1,500,000 個字元 [3,000 篇文章 x 500 個字元]
處理的單位數 = 45,000 個單位 [1,500,000 x 3 種事件類型 ÷ 每個單位 100 個字元]
單價 = 0.003 USD
此單位總費用 = 135 USD [45,000 個單位 x 0.003 USD]
範例 6 – 使用包含 PII API 的 PII 來識別文件
總費用計算:
每個請求大小 = 550 個字元
每個請求單位數 = 6
單位總計 = 60,000 [10,000 個請求 x 每個請求 6 個單位]
單價 = 0.000002 USD
總費用 = 0.12 USD [60,000 個單位 x 0.000002 USD]
範例 7 – 使用偵測 PII API 從文件中編校 PII
總費用計算:
每個請求大小 = 550 個字元
每個請求單位數 = 6
單位總計 = 60,000 [10,000 個請求 x 每個請求 6 個單位]
單價 = 0.0001 USD
總費用 = 6 USD [60,000 個單位 x 0.0001 USD]
範例 8 – 使用自訂實體 API 擷取抵押貸款應用程式實體
非同步分類的推論成本計算:
每天每項請求的大小 = 2,500,000 個字元 [100 個字元/天 * 10 個文件 * 2,500 個字元]
每個請求單位數 = 25,000 單位 [2,500,000 個字元 ÷ 每單位 100 個字元]
單價 = 0.0005 USD
單位的總推論費用 = 12.50 USD [25,000 單位 x 0.0005 USD]
Detect Document Text API 的 Amazon Textract 成本 = 1.50 USD [100 個應用程式/天 * 10 個文件 * 每頁 0.0015 USD 價格,最多 1,000,000 頁]
總費用 = 17.50 USD [推論 12.50 USD + Textract 1.50 USD + 模型訓練 3 USD + 模型儲存體 0.50 USD]
範例 9 – 分析員工問卷調查回應
總費用計算:
每個請求大小 = 350 個字元
每個請求單位數 = 4
單位總計:100,000 (請求數) x 4 (每個請求單位數) = 400,000
單價 = 0.0001 USD (來自 0-1,000 萬個單位)
總成本 = [單位數] x [每單位成本] = 400,000 x 0.0001 USD = 40.00 USD
範例 10 – 在網站的線上評論中偵測毒害性內容
總費用計算:
每個請求大小 = 100 個字元
每個請求單位數 = 共計 1 個
單位 = 1 億個 IU [1 億個評論 x 每個請求 1 個單位]
每單位價格 = 0.0001 USD [從 0 到 1,000 萬個 IU] + 0.00005 USD [從 1,000 萬到 5,000 萬個 IU] + 0.000025 USD [從 5,000 萬到 1 億個 IU]
總成本 = [單位數] x [每單位成本]
= [1,000 萬 X 0.001 USD]+[4,000 萬 X 0.00005 USD]+[5,000 萬 X 0.000025 USD]
= 1,000 USD + 2,000 USD + 1,250 USD
= 4,250 美元
範例 11 – 在生成式 AI 應用程式中偵測不安全提示
總費用計算:
每個請求大小 = 500 個字元
每個請求單位數 = 5
單位總計 = 5,000 萬個 IU [1,000 萬個評論 x 每個請求 5 個單位]
每單位價格 = 0.0001 USD [從 0 到 1,000 萬個 IU] + 0.00005 USD [從 1,000 萬到 5,000 萬個 IU] + 0.000025 USD [從 5,000 萬到 1 億個 IU]
總成本 = [單位數] x [每單位成本]
= [1,000 萬 X 0.001 USD] + [4,000 萬 X 0.00005 USD]
= 1,000 USD + 2,000 USD
= 3,000 美元