Amazon SageMaker 免費方案

Amazon SageMaker 可供免費試用。Amazon SageMaker 作為 AWS 免費方案的一部分,您可以免費開始使用。免費方案從您建立第一個 SageMaker 資源的第一個月開始計算。下表提供 Amazon SageMaker 免費方案的詳細資訊。

Amazon SageMaker 功能 前 2 個月的每月免費方案用量
Studio 筆記本和筆記本執行個體 Studio 筆記本中 250 小時的 ml.t3.medium 執行個體,或筆記本執行個體中 250 小時的 ml.t2 中型執行個體或 ml.t3.medium 執行個體
RStudio on SageMaker RSession 應用程式上 250 小時的 ml.t3.medium 執行個體和 RStudioServerPro 應用程式的免費 ml.t3.medium 執行個體
Data Wrangler 25 小時的 ml.m5.4xlarge 執行個體
特徵商店 1,000 萬寫入單位、1,000 萬讀取單位、25 GB 儲存 (標準線上儲存)
訓練 50 小時的 m4.xlarge 或 m5.xlarge 執行個體
Amazon SageMaker with TensorBoard 300 小時的 ml.r5.large 執行個體
即時推論 125 小時的 m4.xlarge 或 m5.xlarge 執行個體
無伺服器推論 150,000 秒的按需推論持續時間
Canvas 每月 160 小時的工作階段時間
HyperPod 50 小時的 m5.xlarge 執行個體

隨需定價

  • Studio Classic
  • Amazon SageMaker Studio Classic
    Studio Classic 在我們的舊式 IDE 體驗中提供一步式 Jupyter 筆記本。該基礎運算資源具有充分的彈性,且筆記本可以輕鬆與其他筆記本共享,以實現順暢協作。相關費用將依您所選擇的執行個體類型,以及使用的持續時間計費。

  • JupyterLab
  • Amazon SageMaker JupyterLab
    在數秒內啟動全受管 JupyterLab。將最新的 Web 互動式開發環境用於筆記本、程式碼和資料。相關費用將依您所選擇的執行個體類型,以及使用的持續時間計費。

  • 程式碼編輯器
  • Amazon SageMaker 程式碼編輯器
    程式碼編輯器基於 Code-OSS (Visual Studio Code – 開放原始碼),可讓您編寫、測試、偵錯和執行分析與 ML 程式碼。它與 SageMaker Studio 完全整合,並支援 Open VSX 延伸登錄檔中可用的 IDE 延伸。

  • RStudio
  • RStudio
    RStudio 提供隨需雲端運算資源,加速模型開發並改進生產力。 您要為您選擇用於執行 RStudio 工作階段應用程式和 RStudio Server Pro 應用程式的執行個體類型付費。

    RStudioServerPro 應用程式

  • 筆記本執行個體
  • 筆記本執行個體
    筆記本執行個體是執行 Jupyter 筆記本應用程式的運算執行個體。相關費用將依您所選擇的執行個體類型,以及使用的持續時間計費。

  • 處理
  • Amazon SageMaker 處理
    Amazon SageMaker 處理讓您可以在全受管基礎架構上輕鬆執行前期處理、後期處理和模型評估工作負載。相關費用將依您所選擇的執行個體類型,以及使用的持續時間計費。

  • TensorBoard
  • Amazon SageMaker with TensorBoard
    Amazon SageMaker with TensorBoard 提供託管的 TensorBoard 體驗,以視覺化 Amazon SageMaker 訓練任務的模型融合問題並偵錯。

  • Data Wrangler
  • Amazon SageMaker Data Wrangler

    Amazon SageMaker Data Wrangler 可將機器學習彙總和準備資料所需的時間從數週減少至數分鐘。您將需要針對用於清理、探索和視覺化資料的時間付費。執行 SageMaker Data Wrangler 執行個體的客戶需遵守下面的定價。* 在 SageMaker Canvas 工作區執行個體上執行 SageMaker Data Wrangler 的客戶需遵守 SageMaker Canvas 定價。如需詳細資訊,請參閱 SageMaker Canvas 定價頁面

    Amazon SageMaker Data Wrangler 任務

    在從 SageMaker Data Wrangler 匯出資料流時,系統將建立 Amazon SageMaker Data Wrangler 任務。透過 SageMaker Data Wrangler 任務,您可以自動化您的資料準備工作流程。SageMaker Data Wrangler 任務可協助您在新資料集上重新套用資料準備工作流程,以幫您節省時間 (以秒計費)。

  • 特徵商店
  • Amazon SageMaker Feature Store
    Amazon SageMaker Feature Store 是一個中央儲存庫,用於擷取、儲存和提供用於機器學習的功能。SageMaker Feature Store 中的特徵群組寫入、讀取和資料儲存需支付費用,標準線上商店和記憶體內線上儲存的定價有所不同。

     針對標準線上儲存,資料儲存依每月每 GB 計費。針對輸送量,您可在隨需或佈建容量模式之間進行選擇。針對隨需,寫入將依每 KB 的寫入請求單位計費,讀取將依每 4KB 的讀取請求單位計費,資料儲存則依每月每 GB 計費。針對佈建容量模式,您可以指定預期的應用程式所需之讀取和寫入容量。SageMaker Feature Store 針對每秒每次寫入按一個 WCU 計費 (最多 1 KB),針對每秒每次讀取按一個 RCU 計費 (最多 4 KB)。即使您沒有完全利用佈建的容量,也將向您收取在特徵群組中佈建的輸送容量 (讀取和寫入) 費用。

    如果是記憶體內線上儲存,寫入會依每 KB 的寫入請求單位計費,每次寫入最少 1 個單位;讀取會依每 KB 的讀取請求單位計費;每次讀取最少 1 個單位,而資料儲存則依每 GB 每小時計費。記憶體內線上商店收取最低資料儲存費用,即每小時 5 GiB (5.37GB)。

  • 培訓
  • Amazon SageMaker 培訓
    Amazon SageMaker 提供您培訓、調校和偵錯模型的一切所需,讓您輕鬆培訓機器學習 (ML) 模型。您需要為選擇的執行個體類型用量付費。當您在培訓期間使用 Amazon SageMaker 偵錯工具偵錯問題並監控資源時,您可以使用內建規則來偵錯您的培訓任務,或撰寫您自己的自訂規則。使用內建規則對培訓任務偵錯是免費的。針對自訂規則,相關費用將依您所選擇的執行個體類型,以及使用的持續時間計費。

  • MLflow
  • Amazon SageMaker with MLflow
    Amazon SageMaker with MLflow 允許客戶只需按實際用量付費。客戶會根據運算和儲存成本為 MLflow 追蹤伺服器付費。

    客戶會根據追蹤伺服器的大小和執行的小時數來支付運算費用。此外,客戶會為 MLflow 追蹤伺服器上儲存的任何中繼資料付費。

  • 即時推論
  • Amazon SageMaker 託管:即時推論
    Amazon SageMaker 為需要即時預測的使用案例提供即時推論。您需要為選擇的執行個體類型用量付費。當您使用 Amazon SageMaker Model Monitor 維護高度精準的模型以供即時推論使用時,您可以使用內建規則監控模型或撰寫自己的自訂規則。若是內建規則,您可以免費使用高達 30 小時的監控。額外費用將依使用的持續時間而定。當您使用自己的自訂規則時,系統將單獨向您收費。

  • 非同步推論
  • Amazon SageMaker 非同步推論:
    Amazon SageMaker 非同步推論是一種近乎即時的推論選項,可將傳入的請求排入佇列,並以非同步方式處理。當您需要在資料到達時處理大型酬載,或執行具有較長推論處理時間且沒有低於一秒延遲需求的模型時,請使用此選項。將依您選擇的執行個體類型向您收費。

  • 批次轉換
  • Amazon SageMaker Batch Transform
    使用 Amazon SageMaker Batch Transform 時,您無須將資料集分解為多個區塊或管理即時端點。SageMaker Batch Transform 可讓您針對大型或小型批次資料集進行預測。相關費用將依您所選擇的執行個體類型,以及使用的持續時間計費。

  • 無伺服器推論
  • Amazon SageMaker 無伺服器推論
    Amazon SageMaker 無伺服器推論可讓您部署機器學習模型進行推論,而無需設定或管理任何基本基礎設施。 您可以使用隨需無伺服器推論,或將佈建並行新增至端點,以取得可預測的效能。

    使用隨需無伺服器推論,您只需支付用於處理推論請求的運算容量,依毫秒和處理的資料量計費。運算費用取決於您選擇的記憶體組態。

    佈建並行

    或者,您也可以為無伺服器端點啟用佈建並行功能。佈建並行功能可讓您在無伺服器端點上以可預測的效能和高擴展性部署模型,方法是讓您的端點針對指定數量的並行要求在指定的時間內保持預熱。與隨需無伺服器推論一樣,啟用佈建並行時,您需要支付用於處理推論請求的運算容量 (以毫秒計費) 以及處理的資料量。您也可以依據設定的記憶體、佈建的持續時間和啟用的並行數量來支付佈建並行用量的費用。

  • JumpStart
  • Amazon SageMaker JumpStart
    Amazon SageMaker JumpStart 透過一鍵存取常用的模型集合 (也稱為「模型動物園」),協助您快速輕鬆地開始使用機器學習。Jumpstart 還提供端對端解決方案來解決常見的 ML 使用案例,這些使用案例可根據您的需求進行定製。使用 JumpStart 模型或解決方案無需額外付費。需要依據使用的基礎訓練和推論執行個體時數向您計費,就像您手動建立它們一樣。

  • 效能分析工具
  • Amazon SageMaker Profiler 會收集系統層級資料,以視覺化呈現高解析度 CPU 和 GPU 追蹤圖。此工具旨在協助資料科學家和工程師識別深度學習模型中與硬體相關的效能瓶頸,從而節省端對端訓練的時間和成本。目前,SageMaker Profiler 僅支援利用 ml.g4dn.12xlarge、ml.p3dn.24xlarge 和 ml.p4d.24xlarge 訓練運算執行個體類型,對訓練任務進行效能分析。

    區域:美國東部 (俄亥俄)、美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、歐洲 (法蘭克福)、歐洲 (愛爾蘭) 和以色列 (特拉維夫)。

    Amazon SageMaker Profiler 目前為預覽版,且支援區域的客戶無需支付任何費用。 

  • HyperPod
  • Amazon SageMaker HyperPod
    Amazon SageMaker HyperPod 專為加速基礎模型 (FM) 開發而建置。為了使 FM 訓練更具彈性,它會持續監控叢集運作狀態,即時修復和更換故障節點,並儲存頻繁的檢查點,以自動恢復訓練而不會失去進度。SageMaker HyperPod 預先設定了 SageMaker 分散式訓練庫,可讓您提高 FM 訓練效能,同時充分利用叢集的運算和網路基礎設施

    注意:SageMaker HyperPod 定價不包含連線至 HyperPod 叢集的服務費用,例如 Amazon EKS、Amazon FSx for Lustre 和 Amazon Simple Storage Service (Amazon S3)。

  • 推論最佳化
  • 推論最佳化工具組可讓您輕鬆實作最新的推論最佳化技術,以在 Amazon SageMaker 上實現最先進的 (SOTA) 成本效能,同時節省開發人員數月的時間。您可以從 SageMaker 提供的熱門最佳化技術選單中進行選擇,並提前執行最佳化工作,針對效能和準確度量度測量結果進行比較,然後將最佳化模型部署到 SageMaker 端點以進行推論。

執行個體詳細資訊

Amazon SageMaker P5 執行個體產品詳細資訊

執行個體大小 vCPU 執行個體記憶體 (TiB) GPU 型號  GPU 總 GPU 記憶體 (GB) 每個 GPU 記憶體 (GB) 網路頻寬 (Gbps) GPUDirect RDMA GPU 端對端 執行個體儲存體 (TB) EBS 頻寬 (Gbps)
ml.p5.48xlarge 192 2 NVIDIA H100 8 640 HBM3 80 3200 EFAv2   900 GB/s NVSwitch   8x3.84 NVMe SSD 80

Amazon SageMaker P4d 執行個體產品詳細資訊

執行個體大小 vCPU 執行個體記憶體 (GiB) GPU 型號 GPU 總 GPU 記憶體 (GB) 每個 GPU 記憶體 (GB) 網路頻寬 (Gbps) GPUDirect RDMA GPU 端對端 執行個體儲存體 (GB) EBS 頻寬 (Gbps)
ml.p4d.24xlarge 96 1152 NVIDIA A100 8 320 HBM 2 40 400 ENA 和 EFA 600 GB/s NVSwitch 8x1000 NVMe SSD 19
ml.p4de.24xlarge 96 1152 NVIDIA A100 8 640 HNM2e 80 400 ENA 和 EFA 600 GB/s NVSwitch 8X1000 NVMe SSD 19

Amazon SageMaker P3 執行個體產品詳細資訊

執行個體大小 vCPU 執行個體記憶體 (GiB) GPU 型號 GPU 總 GPU 記憶體 (GB) 每個 GPU 記憶體 (GB) 網路頻寬 (Gbps) GPU 端對端 執行個體儲存體 (GB) EBS 頻寬 (Gbps)
ml.p3.2xlarge 8 61 NVIDIA V100 1 16 16 最多 10 僅限 EBS 1.5
ml.p3.8xlarge 32 244 NVIDIA V100 4 64 16 10 NVLink 僅限 EBS 7
ml.p3.16xlarge 64 488 NVIDIA V100 8 128 16 25 NVLink 僅限 EBS 14
ml.p3dn.24xlarge 96 768 NVIDIA V100 8 256 32 100 NVLink 2 x 900 NVMeSSD 19

Amazon SageMaker P2 執行個體產品詳細資訊

執行個體大小 vCPU 執行個體記憶體 (GiB) GPU 型號 GPU 總 GPU 記憶體 (GB) 每個 GPU 記憶體 (GB) 網路頻寬 (Gbps) EBS 頻寬 (Gbps)
ml.p2.xlarge 4 61 NVIDIA K80 1 12 12 最多 10
ml.p2.8xlarge 32 488 NVIDIA K80 8 96 12 10 10
ml.p2.16xlarge 64 732 NVIDIA K80 16 192 12 25 20

Amazon SageMaker G4 執行個體產品詳細資訊

執行個體大小 vCPU 執行個體記憶體 (GiB) GPU 型號 GPU 總 GPU 記憶體 (GB) 每個 GPU 記憶體 (GB) 網路頻寬 (Gbps) 執行個體儲存體 (GB) EBS 頻寬 (Gbps)
ml.g4dn.xlarge 4 16 NVIDIA T4 1 16 16 最多 25 1 x 125 NVMe SSD 最多 3.5
ml.g4dn.2xlarge 8 32 NVIDIA T4 1 16 16 最多 25 1 x 125 NVMe SSD 最多 3.5
ml.g4dn.4xlarge 16 64 NVIDIA T4 1 16 16 最多 25 1 x 125 NVMe SSD 4.75
ml.g4dn.8xlarge 32 128 NVIDIA T4 1 16 16 50 1 x 900 NVMe SSD 9.5
ml.g4dn.16xlarge 64 256 NVIDIA T4 1 16 16 50 1 x 900 NVMe SSD 9.5
ml.g4dn.12xlarge 48 192 NVIDIA T4 4 64 16 50 1 x 900 NVMe SSD 9.5

Amazon SageMaker G5 執行個體產品詳細資訊

執行個體大小 vCPU 執行個體記憶體 (GiB) GPU 型號 GPU 總 GPU 記憶體 (GB) 每個 GPU 記憶體 (GB) 網路頻寬 (Gbps) EBS 頻寬 (Gbps) 執行個體儲存體 (GB)
ml.g5n.xlarge 4 16 NVIDIA A10G 1 24 24 最多 10 最多 3.5 1x250
ml.g5.2xlarge 8 32 NVIDIA A10G 1 24 24 最多 10 最多 3.5 1x450
ml.g5.4xlarge 16 64 NVIDIA A10G 1 24 24 最多 25 8 1x600
ml.g5.8xlarge 32 128 NVIDIA A10G 1 24 24 25 16 1x900
ml.g5.16xlarge 64 256 NVIDIA A10G 1 24 24 25 16 1x1900
ml.g5.12xlarge 48 192 NVIDIA A10G 4 96 24 40 16 1x3800
ml.g5.24xlarge 96 384 NVIDIA A10G 4 96 24 50 19 1x3800
ml.g5.48xlarge 192 768 NVIDIA A10G 8 192 24 100 19 2x3800

Amazon SageMaker Trn1 執行個體產品詳細資訊

執行個體大小 vCPU 記憶體 (GiB) Trainium 加速器 總加速器記憶體 (GB) 每個加速器記憶體 (GB) 執行個體儲存體 (GB) 網路頻寬 (Gbps) EBS 頻寬 (Gbps)
ml.trn1.2xlarge 8 32 1 32 32 1 x 500 NVMe SSD 最多 12.5 最多 20
ml.trn1.32xlarge 128 512 16 512 32 4 x 2,000 NVMe SSD 800 80

Amazon SageMaker Inf1 執行個體產品詳細資訊

執行個體大小 vCPU 記憶體 (GiB) Inferentia 加速器 總加速器記憶體 (GB) 每個加速器記憶體 (GB) 執行個體儲存體 加速器間互連 網路頻寬 (Gbps) EBS 頻寬 (Gbps)
ml.inf1.xlarge 4 8 1 8 8 僅 EBS 最多 25 最多 4.75
ml.inf1.2xlarge 8 16 1 8 8 僅 EBS 最多 25 最多 4.75
ml.inf1.6xlarge 24 48 4 32 8 僅 EBS 25 4.75
ml.inf1.24xlarge 96 192 16 128 8 僅 EBS 100 19

Amazon SageMaker Inf2 執行個體產品詳細資訊

執行個體大小 vCPU 記憶體 (GiB) Inferentia 加速器 總加速器記憶體 (GB) 每個加速器記憶體 (GB) 執行個體儲存體 加速器間互連 網路頻寬 (Gbps) EBS 頻寬 (Gbps)
ml.inf2.xlarge 4 16 1 32 32 僅 EBS 最多 25 最多 10
ml.inf2.8xlarge 32 128 1 32 32 僅 EBS 最多 25 10
ml.inf2.24xlarge 96 384 6 196 32 僅 EBS 50 30
ml.inf2.48xlarge 192 768 12 384 32 僅 EBS 100 60

Amazon SageMaker Studio

Amazon SageMaker Studio 是用於完整 ML 開發的單一 Web 型介面,提供全受管整合式開發環境 (IDE) 和專用工具的選擇。您可以免費存取 SageMaker Studio。您只需為 SageMaker Studio 內不同 IDE 和 ML 工具所使用的基礎運算和儲存付費。

您可以使用 SageMaker Studio、適用於 Python 的 AWS SDK (Boto3) 或 AWS Command Line Interface (AWS CLI) 的眾多服務,包括:

  • SageMaker Studio 上的 IDE 可透過一系列全受管 IDE 執行完整的 ML 開發,包括 JupyterLab、基於程式碼 OSS 的程式碼編輯器 (Visual Studio Code – 開放原始碼),以及 RStudio。
  • SageMaker Pipelines 可自動化並管理 ML 工作流程
  • SageMaker Autopilot 可自動建立具有完全可視性的機器學習 (ML) 模型
  • SageMaker Experiments 可整理並追蹤您的培訓任務和版本
  • SageMaker Debugger 可以在培訓期間對異常情況進行偵錯
  • SageMaker Model Monitor 可維護高品質模型
  • SageMaker Clarify 可以更詳盡地說明您的機器學習 (ML) 模型,以及偵測偏差
  • SageMaker JumpStart 可以輕鬆為許多使用案例部署 ML 解決方案。 對於 Amazon SageMaker 代表您進行的基礎 API 呼叫,您可能會因解決方案中使用的其他 AWS 服務而產生費用。
  • SageMaker Inference Recommender 可以取得正確端點組態的建議

您只需根據在 SageMaker 或其他 AWS 服務中的基礎運算和儲存資源用量付費即可。

若要使用 Amazon Q Developer 免費方案,請遵循此處的說明。若要使用 Amazon Q Developer 專業方案,必須訂閱 Amazon Q Developer。請參閱此處了解 Amazon Q Developer 定價。

基礎模型評估

SageMaker Clarify 使用自動和人為評估方法來支援基礎模型評估。這些模型各有不同的定價。如果您要透過 Amazon SageMaker JumpStart 評估尚未部署至您帳戶的基礎模型,SageMaker 會在推論期間將 JumpStart 模型暫時部署在 SageMaker 執行個體上。特定執行個體將符合 JumpStart 為該模型提供的執行個體建議。

自動評估:
基礎模型評估以 SageMaker 處理任務執行。評估任務將調用 SageMaker 推論。客戶須支付推論和評估任務的費用。客戶僅支付評估任務期間產生的費用。評估任務的成本將是評估執行個體每小時成本和主機執行個體每小時成本的總和。

人工評估︰
當您使用人工評估功能時,即使用自備員工,您須支付以下三個項目的費用:1) 用於推論的 SageMaker 執行個體、2) 用於執行託管人工評估的 SageMaker 處理任務的執行個體,以及 3) 每項完成的人工評估任務收費 0.21 美元。人工任務定義為當人類工作者在人工評估使用者介面,提交單一提示及其相關推論回應的評估時發生的事件。無論您在評估任務中有 1 個或 2 個模型,還是您自備推論,價格都相同,包含的評估維度數量和評分方法均不受影響。針對所有 AWS 區域,每項任務都採用 0.21 美元的相同定價。由於人力由您提供,人力無需另外收費。

AWS 受管評估:
針對 AWS 受管專家評估,在與 AWS 專家評估團隊合作時,定價依私人參與中的評估需求自訂。

Amazon SageMaker Studio Lab

您可以免費使用 Amazon SageMaker Studio Lab 建置和訓練 ML 模型。 SageMaker Studio Lab 為開發人員、學者和資料科學家提供無組態開發環境,免費了解和實驗 ML。

Amazon SageMaker Canvas

Amazon SageMaker Canvas 透過使用視覺化點選式介面為商業分析師提供產生準確機器學習 (ML) 預測的能力 (無需程式碼或機器學習 (ML) 經驗),延伸機器學習 (ML) 的存取。

Amazon SageMaker Data Labeling

Amazon SageMaker Data Labeling 提供兩種資料標記產品和服務,Amazon SageMaker Ground Truth Plus 和 Amazon SageMaker Ground Truth。您可以進一步了解 Amazon SageMaker Data Labeling,它是一項全受管資料標記服務,可讓您輕鬆建置用於 ML 的高度精準培訓資料集。

Amazon SageMaker 影子測試

SageMaker 透過針對目前部署的模型測試其效能,幫助您執行影子測試以在生產發行前評估新的 ML 模型。除了為託管影子模型而佈建的 ML 執行個體和 ML 儲存的用量費用外,SageMaker 影子測試不收取額外費用。ML 執行個體和 ML 儲存維度的定價與前述定價表中指定的即時推理選項相同。在影子部署內外處理的資料不收取額外費用。

Amazon SageMaker Edge

進一步了解 Amazon SageMaker Edge 定價,以最佳化、執行並監控邊緣裝置機群上的機器學習 (ML) 模型。 

Amazon SageMaker Savings Plans

Amazon SageMaker Savings Plans 可協助您降低高達 64% 的成本。該計畫會自動套用至符合資格的 SageMaker ML 執行個體用量,包括 SageMaker Studio Notebook、SageMaker Notebook Instance、SageMaker Processing、SageMaker Data Wrangler、SageMaker Training、SageMaker Real-Time Inference,以及 SageMaker Batch Transform,而不論執行個體系列、大小或區域為何。例如,您可以隨時將用量從美國東部 (俄亥俄) 執行的 CPU 執行個體 ml.c5.xlarge 變更為美國西部 (奧勒岡) 執行的 ml.Inf1 執行個體,以推導工作負載,並自動繼續支付 Savings Plans 的價格。 

進一步了解 »

使用 Amazon SageMaker 的總體擁有成本 (TCO)

相較於其他以雲端為基礎的自我管理解決方案,Amazon SageMaker 在三年內的總體擁有成本 (TCO) 至少降低了 54%。進一步了解 Amazon SageMaker 的完整 TCO 分析

定價範例

  • 作為資料科學家,您需要花 20 天時間使用 JupyterLab,在 ml.g4dn.xlarge 執行個體上每天 6 小時對筆記本、程式碼和資料進行快速實驗。您可以建立並執行 JupyterLab 空間,以存取 JupyterLab IDE。僅對在 JupyterLab 空間執行時使用的執行個體收取運算費用。JupyterLab 空間的儲存費用會累積,直到刪除為止。

    運算

    執行個體 持續時間 總持續時間 每小時費用 總計
    ml.g4dn.xlarge 6 小時 20 6 * 20 = 120 小時 0.7364 USD 88.368 USD

    儲存

    您將使用一般用途 SSD 儲存 480 小時 (24 小時 * 20 天)。在每月每 GB 收取 0.1125 USD 的區域中:
    每月每 GB 0.112 USD * 5 GB * 480/(24 小時/天 * 30 天/月) = 0.373 USD

  • 作為 ML 工程師,您需要花費 20 天時間在 ml.g4dn.xlarge 執行個體上使用程式碼編輯器進行 ML 生產程式碼編輯、執行和偵錯,每天 6 小時。您可以建立並執行程式碼編輯器空間,來存取程式碼編輯器 IDE。僅對在程式碼編輯器空間執行時使用的執行個體收取運算費用。程式碼編輯器空間的儲存費用會累積,直到刪除為止。

    運算

    執行個體 持續時間 總持續時間 每小時費用 總計
    ml.g4dn.xlarge 6 小時 20 6 * 20 = 120 小時 0.7364 USD 88.368 USD

    儲存

    您將使用一般用途 SSD 儲存 480 小時 (24 小時 * 20 天)。在每月每 GB 收取 0.1125 USD 的區域中:
    每月每 GB 0.112 USD * 5 GB * 480/(24 小時/天 * 30 天/月) = 0.373 USD

  • 一位資料科學家在 Amazon SageMaker Studio Classic 中使用筆記本時進行下列循序動作。

    1. 在 ml.c5.xlarge 執行個體上的 TensorFlow 核心中開啟筆記本 1,然後在此筆記本上工作 1 小時。
    2. 在 ml.c5.xlarge 執行個體上開啟筆記本 2。這會在執行筆記本 1 的同一個 ml.c5.xlarge 執行個體中自動開啟。 
    3. 同時使用筆記本 1 和筆記本 2,花了 1 小時。
    4. 這位資料科學家共需支付 2 小時的 ml.c5.xlarge 用量費用。對於她在同時使用筆記本 1 和筆記本 2 的一小時重疊時間,每個核心應用程式計為 0.5 小時,因此需支付 1 小時的費用。
    核心應用程式 筆記本執行個體 小時 每小時費用 合計
    TensorFlow ml.c5.xlarge 1 0.204 USD 0.204 USD
    TensorFlow ml.c5.xlarge 0.5 0.204 USD 0.102 USD
    資料科學 ml.c5.xlarge 0.5 0.204 USD 0.102 USD
            0.408 USD
  • 一位資料科學家在使用 RStudio 時進行下列循序動作︰

    1. 在 ml.c5.xlarge 執行個體上啟動 RSession 1,然後在這個筆記本上工作 1 小時。
    2. 在 ml.c5.xlarge 執行個體上啟動 RSession 2。這會在執行 RSession 1 的同一個 ml.c5.xlarge 執行個體中自動開啟。
    3. 同時使用 RSesssion 1 和 RSession 2,花了 1 小時。
    4. 這位資料科學家共需支付兩 (2) 小時的 ml.c5.xlarge 用量費用。至於她在同時使用 RSession 1 和 RSession 2 的一小時重疊時間,每個 RSession 應用程式計為 0.5 小時,因此需支付 1 小時的費用。

    同時,無論是否存在正在執行的 RSessions,RServer 都在 24/7 全天候執行。如果管理員選擇 "Small" (小型,ml.t3.medium),則為免費。如果管理員選擇 "Medium" (中型,ml.c5.4xlarge) 或 "Large" (大型,ml.c5.9xlarge),則只要為 SageMaker 網域啟用 RStudio,就會按小時收費。

    RSession 應用程式 RSession 執行個體 小時 每小時費用 合計
    基準速率 ml.c5.xlarge 1 0.204 USD 0.204 USD
    基準速率 ml.c5.xlarge 0.5 0.204 USD 0.102 USD
    基準速率 ml.c5.xlarge 0.5 0.204 USD 0.102 USD
            0.408 USD
  • Amazon SageMaker Processing 僅向您收取執行任務期間所使用的執行個體費用。在 Amazon S3 中提供輸入資料以供處理時,Amazon SageMaker 會在處理任務開始時從 Simple Storage Service (Amazon S3) 下載資料到本機檔案儲存。

    資料分析師會執行處理任務,在兩個 ml.m5.4xlarge 執行個體上預先處理並驗證資料,任務持續時間為 10 分鐘。她在 S3 上傳 100 GB 的資料集,作為處理任務的輸入,然後 (約為相同大小的輸出) 資料會再存回 S3。

    小時 處理執行個體 每小時費用 合計
    1 * 2 * 0.167 = 0.334 ml.m5.4xlarge 0.922 USD 0.308 USD
    一般用途 (SSD) 儲存 (GB) 每小時費用 合計
    100 GB * 2 = 200 0.14 USD 0.0032 USD

    Amazon SageMaker 處理任務小計 = 0.308 USD。
    200 GB 一般用途 SSD 儲存小計 = 0.0032 USD。
    這個範例的總計價格為 0.3112 USD。

  • 在表中,您將在 3 天內共 18 小時中使用 Amazon SageMaker Data Wrangler 來準備資料。此外,您將建立 SageMaker Data Wrangler 任務,並以週為單位準備更新的資料。每個任務會持續 40 分鐘,每週執行並持續一個月。

    使用 Data Wrangler 的每月總費用 = 16.596 USD + 2.461 USD = 19.097 USD

    應用程式 SageMaker Studio 執行個體 持續時間 總持續時間 每小時費用 費用小計
    SageMaker Data Wrangler ml.m5.4xlarge 3 6 小時 18 小時 0.922 USD 16.596 USD
    SageMaker Data Wrangler 任務 ml.m5.4xlarge - 40 分鐘 2.67 小時 0.922 USD 2.461 USD

    作為一位資料科學家,您每天需要花費 6 小時,並連續三天使用 Amazon SageMaker Data Wrangler 清理、探索並視覺化您的資料。由於要執行資料準備管道,您接下來會啟動每週執行 SageMaker Data Wrangler 任務的排程。

    下表總結您當月的總使用量,以及使用 Amazon SageMaker Data Wrangler 的相關費用。

  • ++ 所有小數點後讀取單位均四捨五入至下一個整數

    資料儲存
    總儲存資料 = 31.5 GB
    每月資料儲存費用 = 31.5 GB * 0.45 USD = 14.175 USD

    Amazon SageMaker Feature Store 的每月總費用= 56.875 USD + 3.185 USD + 14.175 USD = 74.235 USD

    一個月中的某天 寫入總計 寫入單位總計 讀取總計 讀取單位總計
    第 1 天至第 10 天 100,000 次寫入 
    (10,000 次寫入 * 10 天)
    2,500,000 
    (100,000 * 25KB)
    100,000 
    (10,000 * 10 天)
    700,000++ 
    (100,000 * 25/4 KB)
             
    第 11 天 200,000 次寫入 5,000,000 
    (200,000* 25KB)
    200,000 次讀取 1,400,000++ 
    (200,000* 25/4KB)
             
    第 12 至第 30 天 1,520,000 次寫入 
    (80,000 * 19 天)
    38,000,000 
    (1,520,000 * 25KB)
    1,520,000 次寫入
    (80,000 * 19 天)
    10,640,000++
    (1,520,000 * 25/4KB)
             
    總可收費單位   45,500,000 個寫入單位   12,740,000 個讀取單位
    每月讀寫費用   56.875 USD 
    (4,550 萬個寫入單位 * 每百萬次寫入 1.25 USD)
      3.185 USD 
    (1,274 萬個讀取單位 * 每百萬次讀取 0.25 USD)

    您擁有一個 Web 應用程式,會向 Amazon SageMaker Feature Store 發出每次 25 KB 的讀取和寫入操作。在一個月的前 10 天中,您應用程式接收到的流量很少,因此對 SageMaker 特徵存放區每天進行 10,000 次寫入和 10,000 次讀取。在該月的第 11 天,您的應用程式受到社群媒體的關注,應用程式流量在當天達到 200,000 次寫入和 200,000 次讀取。然後,您的應用程式進入較規律的流量模式,到月底為止每天平均有 80,000 次寫入和 80,000 次讀取。

    下表總結您當月的總使用量,以及使用 Amazon SageMaker Feature Store 的相關費用。

  • 此範例中的訓練和偵錯總費用為 2.38 USD。Amazon SageMaker Debugger 內建規則所使用的運算執行個體和一般用途儲存磁碟區不會產生額外費用。

      適用於訓練的一般用途 (SSD) 儲存 (GB) 適用於偵錯工具內建規則的一般用途 (SSD) 儲存 (GB) 適用於偵錯工具自訂規則的一般用途 (SSD) 儲存 (GB) 每月每 GB 費用 小計
    使用容量 3 2 1    
    費用 0 USD 內建規則儲存磁碟區無須額外費用 0 USD 0.10 USD 0 USD

     

    小時 訓練執行個體 偵錯執行個體 每小時費用 小計
    4 * 0.5 = 2.00 ml.m4.4xlarge 0.96 USD 1.92 USD
    4 * 0.5 * 2 = 4 內建規則執行個體無須額外費用 0 USD 0 USD
    4 * 0.5 = 2 ml.m5.xlarge 0.23 USD 0.46 USD
            -------
            2.38 USD

    一位資料科學家花了一個星期製作新模型。她在 ml.m4.4xlarge 上為模型進行 4 次 30 分鐘的訓練,依照使用 Amazon SageMaker Debugger 時的訓練,使用 2 個內建規則和她自己撰寫的 1 個自訂規則。她指定自動規則使用 ml.m5.xlarge 執行個體。她在 Simple Storage Service (Amazon S3) 中使用 3 GB 訓練資料進行訓練,並將 1 GB 模型輸出推送到 Simple Storage Service (Amazon S3)。SageMaker 為每個訓練執行個體建立一般用途 SSD (gp2) 磁碟區。SageMaker 也為指定的每個規則建立一般用途 SSD (gp2) 磁碟區。在此範例中,總共將建立 4 個一般用途 SSD (gp2) 磁碟區。SageMaker 偵錯工具發送 1 GB 偵錯資料到客戶的 Amazon S3 儲存貯體。

  • 您擁有兩個資料科學家團隊。一個團隊有 10 名資料科學家,另一個團隊有 40 名資料科學家。為顧及這兩個團隊,您可選擇啟用兩個不同的 MLflow 追蹤伺服器:一個小型伺服器和一個中型伺服器。每個團隊正在進行機器學習 (ML) 實驗,並且需要記錄其訓練嘗試產生的指標、參數和成品。他們希望每月使用 MLflow 追蹤伺服器 160 小時。假設每個資料科學團隊都儲存 1 GB 的中繼資料來追蹤實驗中的執行。月底的帳單依以下方式計算費用:  

    小型執行個體的運算費用:160 * 0.60 USD = 96 USD
    中型執行個體的運算費用:160 * 1.40 USD = 166.4 USD
    兩個團隊的儲存費用:2 * 1 * 0.10 = 0.20 USD

    總計 = 262.60 USD

  • 訓練、託管和監控小計 = 305.827 USD。每月託管 3,100 MB 處理的資料輸入和 310 MB 處理的資料輸出小計 = 0.054 USD。此範例的費用總計為每月 305.881 USD。

    請注意,針對使用 ml.m5.xlarge 執行個體的內建規則,每月可免費跨所有端點彙總的監控時間最長為 30 小時。

     

    每月輸入資料量 – 託管 每月輸出資料量 – 託管 每 GB 資料輸入或輸出的費用 合計
    100 MB * 31 = 3,100 MB   0.016 USD 0.0496 USD
      10 MB * 31 = 310 MB 0.016 USD 0.00496 USD
    每月時數 託管執行個體 Model Monitor 執行個體 每小時費用 合計
    24 * 31 * 2 = 1488 ml.c5.xlarge   0.204 USD 303.522 USD
    31*0.08 = 2.5   ml.m5.4xlarge 0.922 USD 2.305 USD

    範例 #5 中的模型接著部署到兩 (2) 個 ml.c5.xlarge 執行個體的生產環境,來進行可靠的多可用區域託管。Amazon SageMaker Model Monitor 在一 (1) 個 ml.m5.4xlarge 執行個體上啟用,並排程每天進行一次監控任務。每個監控任務可能需要 5 分鐘才能完成。模型每天收到 100 MB 的資料,推論大小是輸入資料的 1/10。

  • SageMaker 非同步推論小計 = 15.81 USD + 0.56 USD + 2 * 0.0048 = 16.38 USD。此範例的非同步推論總費用為每月 16.38 USD

    每月輸入資料量 每月輸出資料量 每 GB 資料輸入或輸出的費用 合計
    10 KB * 1,024 * 31 = 310 MB 10 KB * 1,024 * 31 = 310 MB 0.02 USD 0.0048
      10 KB * 1,024 * 31 = 310 MB 0.02 USD 0.0048
    一般用途 (SSD) 儲存 (GB) 每月每 GB 費用 合計
    4 0.14 USD 0.56 USD
    每月時數 託管執行個體 每小時費用 合計
    2.5 * 31 * 1 = 77.5 ml.c5.xlarge 0.20 USD 15.81 USD

    Amazon SageMaker 非同步推論對端點使用的執行個體收費。未主動處理請求時,您可以設定自動擴展以將執行個體計數縮減為零以節省成本。對於 Amazon S3 中的輸入承載,從 Amazon S3 讀取輸入資料並將輸出資料寫入相同區域中的 S3 無需付費。

    範例 #5 中的模型用於執行 SageMaker 非同步推論端點。端點設定為在 1 個 ml.c5.xlarge 執行個體上執行,並在未主動處理請求時將執行個體計數縮減規模為零。端點中的 ml.c5.xlarge 執行個體已連接 4GB 一般用途 (SSD) 儲存。在此範例中,端點在每天 2 小時內保持執行個體計數為 1,並有 30 分鐘的冷卻時間,之後在當天剩餘時間內將執行個體計數縮減為零。因此,您需要為每天 2.5 小時的用量付費。 

    端點每天處理 1,024 個請求。Amazon S3 中每個叫用請求/回應主體的大小為 10 KB,每個推論請求承載為 100 MB。推論輸出是輸入資料大小的 1/10,這些資料存放回相同區域的 Simple Storage Service (Amazon S3) 中。在此範例中,資料處理費用適用於請求和回應主體,但不適用於向 Simple Storage Service (Amazon S3) 傳輸或從 Simple Storage Service (Amazon S3) 傳輸的資料。 

  • 在此範例中,推論費用總計為 2.88 USD。

    小時 託管執行個體 每小時費用 合計
    3 * 0.25 * 4 = 3 小時 ml.m4.4xlarge 0.96 USD 2.88 USD

    範例 #5 中的模型是用來執行 SageMaker 批次轉換。資料科學家在 3 ml.m4.4xlarge 上執行四個獨立的 SageMaker 批次轉換任務,每個任務耗時 15 分鐘。每次執行時,她在 S3 上傳 1 GB 的評估資料集,而且推論的大小是輸入資料的 1/10,然後再存回 S3。

  • 每月資料處理費用

    資料處理 (GB) 每 GB 資料輸入或輸出的費用 每月資料處理費用
    10 GB 0.016 USD 0.16 USD

    隨需 SageMaker 無伺服器推論持續時間費用小計 = 40 USD。10GB 資料處理費用小計 = 0.16 USD。此範例的費用總計為 40.16 USD。

    每月運算費用

    請求數 每個請求的持續時間 總推論持續時間 (秒) 每秒成本 每月推論持續時間費用
    1,000 萬 100 毫秒 1 百萬 0.00004 USD 40 USD

    使用隨需無伺服器推論,您只需支付用於處理推論請求的運算容量,依毫秒和處理的資料量計費。運算費用取決於您選擇的記憶體組態。

    如果您配置 2 GB 的記憶體給端點,一個月執行 1,000 萬次,每次執行 100 毫秒,並處理總計 10 GB 的資料輸入/輸出,則您的費用計算方式如下:

  • 假設您正在為薪資處理公司執行聊天機器人服務。您預計 3 月底的客戶查詢會在報稅截止日期之前激增。但是,對於本月剩餘時間,預計流量會很低。因此,您可以部署具有 2GB 記憶體的無伺服器端點,並在當月最後 5 天內的 9am-5pm (8 小時) 新增 100 個佈建並行,在此期間,您的端點會處理總計 1,000 萬個請求和 10GB 的資料輸入/輸入。聊天機器人在本月剩餘時間內執行隨需無伺服器推論,並處理 300 萬個請求和 3GB 的資料輸入/輸出。我們假設每個請求的持續時間為 100ms。

    佈建並行 (PC) 費用
    PC 價格為每秒 0.000010 USD
    PC 用量持續時間 (秒) = 5 天 * 100 部電腦 * 8 小時 * 3600 秒 = 14,400,000 秒
    PC 用量費用 = 14,400,000 秒 * 每秒 0.000010 USD = 144 USD。

    佈建並行服務流量的推論持續時間費用
    推論持續時間價格為每秒 0.000023 USD
    PC 的總推論持續時間 (秒) = 1,000 萬 * (100 毫秒) /1000 = 100 萬秒。
    PC 的推論持續時間費用 = 1,000,000 秒 * 每秒 0.000023 USD = 23 USD

    按需推論持續時間費用
    每月運算價格為每秒 0.00004 USD,免費方案提供 150,000 秒。
    總運算 (秒) = (300) 萬 * (100ms) /1000= 30 萬秒。
    總運算 – 免費方案運算 = 每月計費運算 (秒)
    30 萬秒 – 15 萬秒 = 15 萬秒
    每月運算費用 = 15 萬 * 0.00004 USD = 6 USD

    資料處理
    輸入/輸出資料處理成本/GB = 0.016 USD
    處理的 GB 總計 = 10+3 = 13
    總成本 = 0.016 USD * 13 = 0.208 USD

    三月總費用
    總費用 = 佈建並行費用 + 佈建並行推論持續時間 + 隨需運算推論持續時間 + 資料處理費用
    = 144 USD + 23 USD + 6 USD + 0.208 USD = 173.2 USD

  • 客戶使用 JumpStart 部署預先訓練的 BERT Base Uncased 模型,以將客戶評論情緒分類為正面或負面。

    客戶會將模型部署至兩 (2) 個 ml.c5.xlarge 執行個體,來進行可靠的多可用區域託管。模型每天收到 100 MB 的資料,推論大小是輸入資料的 1/10。

    每月時數 託管執行個體 每小時費用 合計
    24 * 31 * 2 = 1488 ml.c5.xlarge 0.204 USD 303.55 USD
     
    每月輸入資料量 – 託管 每月輸出資料量 – 託管 每 GB 資料輸入或輸出的費用

    合計

    100 MB * 31 = 3,100 MB   0.02 USD 0.06 USD
      10 MB * 31 = 310 MB 0.02 USD 0.01 USD
     

    訓練、託管和監控小計 = 305.827 USD。每月託管 3,100 MB 處理的資料輸入和 310 MB 處理的資料輸出小計 = 0.06 USD。此範例的費用總計為每月 305.887 USD。

  • 假設您想佈建 4 ml.g5.24xlarge 叢集 1 個月 (30 天),且為每個執行個體額外增加 100 GB 的儲存,以支援模型開發。 此範例中叢集和額外儲存的總費用為 29,374.40 USD。

    運算

    執行個體 持續時間 執行個體 每小時費用 小計
    ml.g5.24xlarge 30 天 * 24 小時 = 720 小時 4 10.18 USD 29,318.40 USD

    儲存

    一般用途 (SSD) 儲存 持續時間 執行個體 每月每 GB 費用 小計
    100 GB 30 天 * 24 小時 = 720 小時 4 0.14 USD 56.00 USD
  • 使用 SageMaker Clarify 的基礎模型評估,僅針對執行自動評估任務時使用的執行個體收費。若您選取自動評估任務和資料集,SageMaker 會將提示資料集從 Amazon S3 載入 SageMaker 評估執行個體。

    在下列範例中,ML 工程師在美國東部 (維吉尼亞北部) 對 Llama2 7B 模型執行評估,以實現總結任務準確性。Llama 2 7B 推論的建議執行個體類型為 ml.g5.2xlarge。建議評估的最小執行個體為 ml.m5.2xlarge。在此範例中,任務會執行 45 分鐘 (視資料集大小而定)。在此範例中,評估任務和詳細結果的成本將為 1.48 美元。

    處理任務時間 (範例)

    區域

    執行個體類型

    執行個體

    每小時費用

    費用

    0.45

    us-east-1

    LLM 託管

    ml.g5.2xlarge

    1.52 USD

    1.14 USD

    0.45

    us-east-1

    評估

    ml.m5.2xlarge

    0.46 USD

    0.35 USD

    總計

           

    1.48 美元

    在下一個範例中,維吉尼亞州的相同工程師執行另一項評估任務,以實現總結任務準確性,但使用自訂版本的 Llama 2 7B,該版本已部署至其帳戶且正在執行。在此情況下,由於模型已部署至其帳戶,因此唯一的增量成本將是評估執行個體。

    處理任務時數

    區域

    執行個體類型

    執行個體

    每小時費用

    費用

    0.45

    us-east-1

    評估

    ml.m5.2xlarge

    0.46 USD

    0.35 USD

    總計

           

    0.35 USD

  • 在下列範例中,美國東部 (維吉尼亞北部) 的機器學習工程師對 Llama-2-7B 執行人工評估,以實現總結任務準確性,並使用其自己的私有人力進行評估。Llama-2-7B 的建議執行個體類型為 ml.g5.2xlarge。針對以人工評估處理任務建議的最小執行個體為 ml.t3.medium。Llama-2-7B 的推論執行 45 分鐘 (取決於資料集的大小)。資料集包含 50 個提示,開發人員需要 2 名工作者對每個提示回應集進行評分 (可在建立評估任務時設定為「每個提示的工作者」參數)。此評估任務中將有 100 項任務 (每位工作者每個提示回應對為 1 項任務:2 個工作者 x 50 個快速回應集 = 100 個人工任務)。人力需要一天 (24 小時) 來完成評估任務中全部 100 項人工評估任務 (取決於工作者人數和技能水準,以及提示和推論回應的長度/複雜性)。

    運算時數

    人工任務

    區域

    執行個體類型

    執行個體

    每小時費用

    每項人工任務成本

    總成本

    0.45

     

    美國東部 (維吉尼亞北部)

    LLM 託管

    ml.g5.2xlarge

    1.52 USD

     

    1.14 USD

    24

     

    美國東部 (維吉尼亞北部)

    處理任務

    ml.t3.medium

    0.05 USD

     

    1.20 USD

     

    100

    隨時

         

    0.21 USD

    21.00 美元

    總計

               

    23.34 美元

    在下一個範例中,美國東部 (維吉尼亞北部) 的相同工程師執行相同的評估任務,但使用 Llama-2-7B 已部署至其帳戶且正在執行。在此情況下,唯一的增量成本將是評估處理任務和人工任務。

    運算時數

    人工任務

    區域

    執行個體類型

    執行個體

    每小時費用

    每項人工任務成本

    總成本

    24

     

    美國東部 (維吉尼亞北部)

    處理任務

    ml.t3.medium

    0.05 USD

     

    1.20 USD

     

    100

    隨時

         

    0.21 USD

    21.00 美元

    總計

               

    22.20 美元