Amazon EC2 G4 執行個體是業界最經濟實惠且多用途的 GPU 執行個體,適用於部署機器學習模型,例如影像分類、物體偵測和語音辨識,也適用於圖形密集型應用程式,例如遠端圖形工作站、遊戲串流和圖形轉譯。G4 執行個體有 NVIDIA GPU (G4dn) 或 AMD GPU (G4ad) 可供選擇。
G4dn 執行個體特別具備 NVIDIA T4 GPU 和自訂 Intel Cascade Lake CPU,已針對機器學習推論和小規模訓練優化。這些執行個體也讓圖形密集型應用程式具有高效能,包括遠端工作站、遊戲串流和圖形轉譯。這些執行個體也非常適合偏好使用 NVIDIA 軟體 (例如 RTX Virtual Workstation) 和例如 CUDA、CuDNN 和 NVENC 等程式庫的客戶。
G4ad 執行個體特別採用最新 AMD Radeon Pro V520 GPU 和第 2 代 AMD EPYC 處理器。這些執行個體可為圖形應用程式提供最佳雲端價格效能,包括遠端工作站、遊戲串流和圖形轉譯。 與相當的執行個體比較,在於圖形密集型應用程式的價格效能可勝出高達 45%。
Amazon EC2 G4dn 執行個體
G4dn 執行個體採用 NVIDIA T4 GPU 技術,是機器學習推論和小規模訓練的最低成本 GPU 型雲端執行個體。此外也能發揮高效能,對於使用 NVIDIA 程式庫例如 CUDA、CuDNN 和 NVENC,針對 NVIDIA GPU 優化的圖形應用程式而言,是經濟實惠的解決方案。可提供高達 8 個 NVIDIA T4 GPU、96 個 vCPU、100 Gbps 聯網,和 1.8 TB 的本機 NVMe 型 SSD 儲存,亦可作為裸機執行個體使用。
優勢
提高效能,降低機器學習推論成本
G4dn 執行個體配備 NVIDIA T4 GPU,能有比 CPU 更強高達 40 倍的低延遲輸送量,因此能即時服務更多請求。此外,G4dn 執行個體已針對機器學習推論的經濟實惠優化,在機器學習計劃中可佔高達 90% 的整體營運成本。
經濟實惠的小規模訓練
對訓練時間較不敏感的企業或機構,其小規模/入門級機器學習訓練任務若選擇 G4dn 執行個體,也相當實用。G4dn 執行個體能發揮高達 65 TFLOP 的 FP16 效能,對小規模訓練任務而言是出色的解決方案。
賦與圖形密集型應用程式的高效能
比起上一代 G3 執行個體,G4dn 執行個體有更強至 1.8 倍的圖形效能,及高達 2 倍的影像轉碼能力。客戶能設定可存取 NVIDIA RTX Workstations 的虛擬工作站,不需額外費用。
特色
採用 NVIDIA T4 GPU 技術
NVIDIA T4 GPU 能為多元的雲端工作負載加速,包括深度學習訓練和推論以及圖形。基於新 NVIDIA Turing 架構,T4 GPU 有多重精準 Turing Tensor Cores 和新的 RT Cores。有機器學習 (ML) 多重精準運算能力的 Turing Tensor Core 技術,能使效能突破性地從 FP32 至 FP16 至 INT8,以及 INT4 的精準。與 CPU 相較,對於訓練能提高多達 9.3 倍的效能,推論方面高達 36 倍。
高效能聯網與儲存
對於要求高輸送量的應用程式,G4dn 執行個體可提供高達 100 Gbps 的聯網能力。G4dn 執行個體也支援 Elastic Fabric Adapter (EFA),可讓客戶大規模執行需要高層級節點內通訊的應用程式。 這些執行個體可提供高達 1.8 TB 的 NVMe 型 SSD 儲存,對於需要快速存取存放於本機的資料的應用程式相當適合。
RTX 與遊戲驅動程式
G4dn 執行個體可為客戶提供 NVIDIA RTX 和 Gaming 驅動程式,不需額外費用。RTX 驅動程式可用以為廣泛的視覺密集工作流程提供高品質的虛擬工作站。Gaming 驅動程式能為遊戲開發提供無人能及的圖形與運算支援。
Amazon EC2 G4ad 執行個體
G4ad 執行個體採用 AMD Radeon Pro V520 GPU 技術,為雲端中的圖形密集型應用程式提供最優價格效能。對於採用產業標準 API (例如 OpenGL、DirectX 和 Vulkan) 的圖形應用程式,例如遠端圖形工作站、遊戲串流和轉譯,與 G4dn 執行個體相比,這些執行個體能有高達 45% 的更佳價格效能,而 G4dn 執行個體已為雲端成本最低的執行個體。可提供多達 4 個 AMD Radeon Pro V520 GPU、64 個 vCPU、25 Gbps 聯網,及 2.4 TB 的本機 NVMe 型 SSD 儲存。
優勢
圖形密集型應用程式的效能最高且成本最低的執行個體
G4ad 執行個體是雲端中圖形密集型應用程式成本最低的執行個體。對於採用產業標準 API (例如 OpenGL、DirectX 和 Vulkan) 的圖形應用程式,例如遠端圖形工作站、遊戲串流和轉譯,與相當的執行個體相比,可提供高達 45% 的更佳價格效能,包括圖形效能更強 40%。
以雲端最低成本簡化對虛擬工作站的管理
G4ad 執行個體可讓客戶在幾分鐘內設定具有高效能模擬、轉譯和設計能力的虛擬工作站,允許客戶迅速擴展。 客戶能使用 AMD Radeon Pro Software for Enterprise 和高效能的遠端顯示傳輸協定 NICE DCV,採用 G4ad 執行個體不需額外費用,即可管理其每 GPU 支援多達兩台 4K 監視器的虛擬工作站環境。
第三方應用程式的可靠性
AMD 專業圖形解決方案包含廣泛的獨立軟體開發廠商 (ISV) 應用程式測試與認證程序,名為 Day Zero Certification Program。如此可更確保開發人員自驅動程式發行當日起即可利用最新的 AMD Radeon Pro Software for Enterprise 功能,並兼具認證軟體的可靠性。
特色
採用 AMD Radeon Pro V520 GPU 技術
AMD Radeon Pro V520 GPU 可提供例如虛擬工作站、電腦成像 (CGI)、遊戲串流和數位內容創作 (DCC) 的圖形高效能加速。這些 GPU 建置在 AMD 的 RDNA 架構之上,具備建立高品質工作站和遊戲體驗所需的效率超高、低延遲又高 CPU 至 GPU 頻寬。圖形管道已經提升的 RDNA 架構旨在以每時脈更高的效能之下,加快為您的遊戲執行轉譯。
本地執行個體儲存體
G4ad 執行個體提供高達 2.4 TB 的本機 NVMe 儲存以進行快速資料存取,讓客戶能針對電影、遊戲和 AR/VR 體驗,高效建立相片般逼真且高解析度的 3D 內容。
專業級圖形驅動程式
G4ad 執行個體可提供專業級圖形驅動程式,不需額外費用。這些驅動程式能用以為遊戲開發所適用的廣泛視覺密集工作流程和無人能及的圖形與運算支援,提供最佳虛擬工作站體驗 。
客戶案例
Ubitus 是為建置雲端遊戲技術領路的創新公司。透過其平台,使用者能以可連線至寬頻網路的任意裝置享受 AAA 遊戲體驗,包括智慧型手機、平板電腦、遊戲機、智慧型電視和電腦。
「Ubitus has 利用 AWS 的 GPU 功能與 IO Interactive 合作,發行雲端版 Hitman 3 至高度便攜的遊戲裝置。 Amazon EC2 G4ad 執行個體推出時,我們能絲毫未改程式碼之下讓每個執行個體多容納高達 50% 的並行串流,達到成本最佳化的效果。成本結構降低,使我們能為全球玩家推出更多遊戲,例如 Hitman 3。」
Ubitus 執行長 Wesley Kuo
「Land F/X 利用 GPU 加速協助設計專業人員,同時最大化其效能與成本比。Land F/X 於開發時期即已使用 G4dn 執行個體,隨著 G4ad 推出,也能迅速遷移其用量,使得轉譯上獲得 67% 的效能提升,同時與先前使用 GPU 相比節省了 25%。」
Land F/X 執行長/開發人員 Jeremiah Farmer
Duolingo 是免費語言教育平台,創下線上學習語言最熱門的途徑。Duolingo 的語言學習科學家、機器學習工程師和 AI 專家使用超過 3 億學習者的資料,持續提高該平台的效用。
「隨著我們的機器學習 (ML) 和研究團隊成長,我們決定更新現有的 Amazon ECS 運算基礎設施,以支援 Amazon EC2 P3 和 G4 GPU 型執行個體類型,更加擴展我們的開發模型。Amazon 針對 GPU 執行個體的 ECS 優化 AMI 協助我們極快地將新叢集啟動執行,也發現與 P2 執行個體相比,G4 執行個體使得機器學習 (ML) 的訓練速度加倍,成本節約了 33%,同時 P3 執行個體則使效能成為四倍,並且節省成本 15%。整體來看,G4 執行個體適合我們的一般使用案例,因為能在成本與效能之間達到良好平衡;對於特定工作負載而言增加速度很重要時,P3 執行個體是理想的選擇。」
Duolingo 人員營運工程師 Max Blaze
「Blacknut 是領先的獨立雲端遊戲服務,透過 500 多種影片遊戲型錄,可在任何裝置上為公眾帶來「即點即玩」體驗。為了完成我們提供低延遲、快速載入時間和流暢遊戲體驗的使命,我們需要盡可能地靠近玩家。憑藉 EC2 G4dn 執行個體,我們可以為玩家提供每場遊戲 10 秒或更短的平均載入時間,從而保證積極的整體遊戲體驗。我們還可以在不到 2 個月的時間內向新市場推出我們的解決方案,而這種回應能力讓我們自 2020 年以來,每個月都能部署新的全球合作夥伴,包括 Telecom Italia、Swisscom、POST、Drei Austria 和泰國的 Ais。我們的服務現已在 40 多個市場推出。」
Blacknut 技術長 Pascal Manchon
2018 年,Snap Inc.(Snap) 這家以 Snapchat 簡訊應用程式知名的公司有了巧妙的新點子:建立一系列動畫影片,其中由各使用者的 Bitmoji 這種個性化卡通虛擬化身 (Snapchat 的招牌功能) 演出。每一週,Bitmoji TV 會首播新劇集,內容為傻氣的專業設計腳本加動畫的 3 至 8 分鐘影片,其中的明星為使用者及好友的 Bitmoji,劇情從擊退殭屍到比賽低重力 “Moonlympics” (月球奧林匹克),五花八門。 使用 Amazon EC2 G4 執行個體,Snap 能建立趣味又大方的個人化娛樂,轉譯速度快到足供數百萬人同時享受,又能維持低運算成本。
「使用 Amazon EC2 G4 執行個體與 Amazon EC2 G3 執行個體相較,我們以高 10% 的成本獲得 50% 的提振。」
Snap Inc. 軟體工程師 Brad Kotsopolous
Nearmap 於 2007 年於澳洲伯斯創設,已自小型新創公司成長為數位影像處理的領導業者。該公司專精於由景觀空拍建立 2D 和 3D 影像,這是廣泛諸多行業的寶貴資源。對 Nearmap 而言,升級至 Amazon EC2 G4 執行個體的效應為立即且深廣:公司能以 Amazon EC2 G2 執行個體的相同成本執行三倍資料,程序感覺毫不費力,而且利用本已使用的 AWS 工具,整合感覺無縫順暢。
「客戶仰賴我們提供準確性高的 3D 實境模型,這是從多個涵蓋範圍的多角度航空攝影運算所得。我們每天使用 87 萬個 GPU 核心。我們過去在 Amazon EC2 G2 執行個體上執行此管道,現在換成使用 Amazon EC2 G4 執行個體,減少了 67% 成本。」
視覺系統總監 John Corbett
Untold Studios 部署各種 AWS 虛擬工作站組態 (包括 G4 執行個體),特色為具有 NVIDIA T4 GPU 和 RTX 技術,已針對 VFX 和動畫工作流程優化。 有擴大的執行個體選項可供選擇之下,Untold Studios 能更正確地將虛擬機器類型與特定工作負載搭配,對創意和經濟皆有助益。
「G4 對我們的工作形態有重大影響。我們能以一行程式碼將整個工作站機群升級,使得美工人員工作速度加快,處處都能創意提升。」
Untold Studios 技術總監 Sam Reid
產品詳細資訊
執行個體大小 | GPU | vCPU | 記憶體 (GiB) | 執行個體儲存體 (GB) | 網路頻寬 (Gbps) | EBS 頻寬 (Gbps) | 隨需價格/小時* | 1 年預留執行個體實際小時費率* (Linux) | 3 年預留執行個體實際小時費率* (Linux) | |
G4dn |
||||||||||
單一 GPU VM | g4dn.xlarge | 1 | 4 | 16 | 1 x 125 NVMe SSD | 最多 25 | 最多 3.5 | 0.526 USD | 0.316 USD | 0.210 USD |
g4dn.2xlarge | 1 | 8 | 32 | 1 x 225 NVMe SSD | 最多 25 | 最多 3.5 | 0.752 USD | 0.452 USD | 0.300 USD | |
g4dn.4xlarge | 1 | 16 | 64 | 1 x 225 NVMe SSD | 最多 25 | 4.75 | 1.204 USD | 0.722 USD | 0.482 USD | |
g4dn.8xlarge | 1 | 32 | 128 | 1 x 900 NVMe SSD | 50 | 9.5 | 2,176 USD | 1.306 USD | 0.870 USD | |
g4dn.16xlarge | 1 | 64 | 256 | 1 x 900 NVMe SSD | 50 | 9.5 | 4.352 USD | 2.612 USD | 1.740 USD | |
多個 GPU VM | g4dn.12xlarge | 4 | 48 | 192 | 1 x 900 NVMe SSD | 50 | 9.5 | 3.912 USD | 2.348 USD | 1.564 USD |
g4dn.metal | 8 | 96 | 384 | 2 x 900 NVMe SSD | 100 | 19 | 7.824 USD | 4.694 USD | 3.130 USD | |
G4ad |
||||||||||
單一 GPU VM | g4ad.xlarge | 1 | 4 | 16 | 1 x 150 NVMe SSD | 最多 10 | 最多 3 | 0.379 USD | 0.227 USD | 0.178 USD |
g4ad.2xlarge | 1 | 8 | 32 | 1 x 300 NVMe SSD | 最多 10 | 最多 3 | 0.541 USD | 0.325 USD | 0.254 USD | |
g4ad.4xlarge | 1 | 16 | 64 | 1 x 600 NVMe SSD | 最多 10 | 最多 3 | 0.867 USD | 0.520 USD | 0.405 USD | |
多個 GPU VM | g4ad.8xlarge | 2 | 32 | 128 | 1 x 1200 NVMe SSD | 15 | 3 | 1.734 USD | 1.040 USD | 0.810 USD |
g4ad.16xlarge | 4 | 64 | 256 | 1 x 2400 NVMe SSD | 25 | 6 | 3.468 USD | 2.081 USD | 1.619 USD |
*所示價格是針對美國東部 (維吉尼亞北部) AWS 區域。1 年期和 3 年期預留執行個體的價格適用於「部分預付」付款選項,沒有「部分預付」選項的執行個體則適用於「無預付」。
開始使用 G4dn 執行個體
使用 AWS 的預先建置 AMI 和容器
使用 Amazon 深度學習 AMI 或 Deep Learning Containers,您可快速啟動已預先安裝常用深度學習架構和介面 (例如 TensorFlow、PyTorch 和 MXNet) 的 Amazon EC2 執行個體,以訓練複雜的自訂 AI 模型、試驗新的演算法,或學習新的技能和技術。如需進一步了解,請造訪 Amazon 深度學習 AMI 產品頁面或 AWS Deep Learning Containers 產品頁面。
NVIDIA RTX Virtual Workstation AMI 支援為視覺化應用程式執行高達每 GPU 四台 4K 顯示器。NVIDIA Gaming AMI 能以 60 FPS 轉譯影片,並支援每 GPU 執行一台 4K 顯示器。
開始使用 G4ad 執行個體
使用 AWS 預先建置的 AMI
AMD Radeon Pro Software for Enterprise 驅動程式能為虛擬工作站、遊戲串流、轉譯和其他圖形應用程式提供高效能圖形。為能迅速開始使用,您可利用 AWS 提供的 AMI,其中已預先安裝 AMD Radeon Pro Software for Enterprise。這些 AMI 可在 AMD Radeon Pro Marketplace 取得。
進一步了解其他 Amazon EC2 執行個體類型