Amazon EC2 G4 執行個體

機器學習推論與圖形密集型應用程式所適用,業界最經濟實惠的 GPU 執行個體

Amazon EC2 G4 執行個體是業界最經濟實惠且多用途的 GPU 執行個體,適用於部署機器學習模型,例如影像分類、物體偵測和語音辨識,也適用於圖形密集型應用程式,例如遠端圖形工作站、遊戲串流和圖形轉譯。G4 執行個體有 NVIDIA GPU (G4dn) 或 AMD GPU (G4ad) 可供選擇。

G4dn 執行個體特別具備 NVIDIA T4 GPU 和自訂 Intel Cascade Lake CPU,已針對機器學習推論和小規模訓練優化。這些執行個體也讓圖形密集型應用程式具有高效能,包括遠端工作站、遊戲串流和圖形轉譯。這些執行個體也非常適合偏好使用 NVIDIA 軟體 (例如 RTX Virtual Workstation) 和例如 CUDA、CuDNN 和 NVENC 等程式庫的客戶。

G4ad 執行個體特別採用最新 AMD Radeon Pro V520 GPU 和第 2 代 AMD EPYC 處理器。這些執行個體可為圖形應用程式提供最佳雲端價格效能,包括遠端工作站、遊戲串流和圖形轉譯。 與相當的執行個體比較,在於圖形密集型應用程式的價格效能可勝出高達 45%。

全新 Amazon EC2 G4ad 執行個體 (1:59)

Amazon EC2 G4dn 執行個體

G4dn 執行個體採用 NVIDIA T4 GPU 技術,是機器學習推論和小規模訓練的最低成本 GPU 型雲端執行個體。此外也能發揮高效能,對於使用 NVIDIA 程式庫例如 CUDA、CuDNN 和 NVENC,針對 NVIDIA GPU 優化的圖形應用程式而言,是經濟實惠的解決方案。可提供高達 8 個 NVIDIA T4 GPU、96 個 vCPU、100 Gbps 聯網,和 1.8 TB 的本機 NVMe 型 SSD 儲存,亦可作為裸機執行個體使用。

優勢

提高效能,降低機器學習推論成本

G4dn 執行個體配備 NVIDIA T4 GPU,能有比 CPU 更強高達 40 倍的低延遲輸送量,因此能即時服務更多請求。此外,G4dn 執行個體已針對機器學習推論的經濟實惠優化,在機器學習計劃中可佔高達 90% 的整體營運成本。

經濟實惠的小規模訓練

對訓練時間較不敏感的企業或機構,其小規模/入門級機器學習訓練任務若選擇 G4dn 執行個體,也相當實用。G4dn 執行個體能發揮高達 65 TFLOP 的 FP16 效能,對小規模訓練任務而言是出色的解決方案。

賦與圖形密集型應用程式的高效能

比起上一代 G3 執行個體,G4dn 執行個體有更強至 1.8 倍的圖形效能,及高達 2 倍的影像轉碼能力。客戶能設定可存取 NVIDIA RTX Workstations 的虛擬工作站,不需額外費用。

特色

採用 NVIDIA T4 GPU 技術

NVIDIA T4 GPU 能為多元的雲端工作負載加速,包括深度學習訓練和推論以及圖形。基於新 NVIDIA Turing 架構,T4 GPU 有多重精準 Turing Tensor Cores 和新的 RT Cores。有機器學習 (ML) 多重精準運算能力的 Turing Tensor Core 技術,能使效能突破性地從 FP32 至 FP16 至 INT8,以及 INT4 的精準。與 CPU 相較,對於訓練能提高多達 9.3 倍的效能,推論方面高達 36 倍。

高效能聯網與儲存

對於要求高輸送量的應用程式,G4dn 執行個體可提供高達 100 Gbps 的聯網能力。G4dn 執行個體也支援 Elastic Fabric Adapter (EFA),可讓客戶大規模執行需要高層級節點內通訊的應用程式。 這些執行個體可提供高達 1.8 TB 的 NVMe 型 SSD 儲存,對於需要快速存取存放於本機的資料的應用程式相當適合。

RTX 與遊戲驅動程式

G4dn 執行個體可為客戶提供 NVIDIA RTX 和 Gaming 驅動程式,不需額外費用。RTX 驅動程式可用以為廣泛的視覺密集工作流程提供高品質的虛擬工作站。Gaming 驅動程式能為遊戲開發提供無人能及的圖形與運算支援。

Amazon EC2 G4ad 執行個體

G4ad 執行個體採用 AMD Radeon Pro V520 GPU 技術,為雲端中的圖形密集型應用程式提供最優價格效能。對於採用產業標準 API (例如 OpenGL、DirectX 和 Vulkan) 的圖形應用程式,例如遠端圖形工作站、遊戲串流和轉譯,與 G4dn 執行個體相比,這些執行個體能有高達 45% 的更佳價格效能,而 G4dn 執行個體已為雲端成本最低的執行個體。可提供多達 4 個 AMD Radeon Pro V520 GPU、64 個 vCPU、25 Gbps 聯網,及 2.4 TB 的本機 NVMe 型 SSD 儲存。

優勢

圖形密集型應用程式的效能最高且成本最低的執行個體

G4ad 執行個體是雲端中圖形密集型應用程式成本最低的執行個體。對於採用產業標準 API (例如 OpenGL、DirectX 和 Vulkan) 的圖形應用程式,例如遠端圖形工作站、遊戲串流和轉譯,與相當的執行個體相比,可提供高達 45% 的更佳價格效能,包括圖形效能更強 40%。

以雲端最低成本簡化對虛擬工作站的管理

G4ad 執行個體可讓客戶在幾分鐘內設定具有高效能模擬、轉譯和設計能力的虛擬工作站,允許客戶迅速擴展。 客戶能使用 AMD Radeon Pro Software for Enterprise 和高效能的遠端顯示傳輸協定 NICE DCV,採用 G4ad 執行個體不需額外費用,即可管理其每 GPU 支援多達兩台 4K 監視器的虛擬工作站環境。

第三方應用程式的可靠性

AMD 專業圖形解決方案包含廣泛的獨立軟體開發廠商 (ISV) 應用程式測試與認證程序,名為 Day Zero Certification Program。如此可更確保開發人員自驅動程式發行當日起即可利用最新的 AMD Radeon Pro Software for Enterprise 功能,並兼具認證軟體的可靠性。

特色

採用 AMD Radeon Pro V520 GPU 技術

AMD Radeon Pro V520 GPU 可提供例如虛擬工作站、電腦成像 (CGI)、遊戲串流和數位內容創作 (DCC) 的圖形高效能加速。這些 GPU 建置在 AMD 的 RDNA 架構之上,具備建立高品質工作站和遊戲體驗所需的效率超高、低延遲又高 CPU 至 GPU 頻寬。圖形管道已經提升的 RDNA 架構旨在以每時脈更高的效能之下,加快為您的遊戲執行轉譯。

本地執行個體儲存體

G4ad 執行個體提供高達 2.4 TB 的本機 NVMe 儲存以進行快速資料存取,讓客戶能針對電影、遊戲和 AR/VR 體驗,高效建立相片般逼真且高解析度的 3D 內容。

專業級圖形驅動程式

G4ad 執行個體可提供專業級圖形驅動程式,不需額外費用。這些驅動程式能用以為遊戲開發所適用的廣泛視覺密集工作流程和無人能及的圖形與運算支援,提供最佳虛擬工作站體驗 。

客戶案例

Ubitus 是為建置雲端遊戲技術領路的創新公司。透過其平台,使用者能以可連線至寬頻網路的任意裝置享受 AAA 遊戲體驗,包括智慧型手機、平板電腦、遊戲機、智慧型電視和電腦。

「Ubitus has 利用 AWS 的 GPU 功能與 IO Interactive 合作,發行雲端版 Hitman 3 至高度便攜的遊戲裝置。 Amazon EC2 G4ad 執行個體推出時,我們能絲毫未改程式碼之下讓每個執行個體多容納高達 50% 的並行串流,達到成本最佳化的效果。成本結構降低,使我們能為全球玩家推出更多遊戲,例如 Hitman 3。」

Ubitus 執行長 Wesley Kuo

「Land F/X 利用 GPU 加速協助設計專業人員,同時最大化其效能與成本比。Land F/X 於開發時期即已使用 G4dn 執行個體,隨著 G4ad 推出,也能迅速遷移其用量,使得轉譯上獲得 67% 的效能提升,同時與先前使用 GPU 相比節省了 25%。」

Land F/X 執行長/開發人員 Jeremiah Farmer

Duolingo 是免費語言教育平台,創下線上學習語言最熱門的途徑。Duolingo 的語言學習科學家、機器學習工程師和 AI 專家使用超過 3 億學習者的資料,持續提高該平台的效用。

「隨著我們的機器學習 (ML) 和研究團隊成長,我們決定更新現有的 Amazon ECS 運算基礎設施,以支援 Amazon EC2 P3 和 G4 GPU 型執行個體類型,更加擴展我們的開發模型。Amazon 針對 GPU 執行個體的 ECS 優化 AMI 協助我們極快地將新叢集啟動執行,也發現與 P2 執行個體相比,G4 執行個體使得機器學習 (ML) 的訓練速度加倍,成本節約了 33%,同時 P3 執行個體則使效能成為四倍,並且節省成本 15%。整體來看,G4 執行個體適合我們的一般使用案例,因為能在成本與效能之間達到良好平衡;對於特定工作負載而言增加速度很重要時,P3 執行個體是理想的選擇。」

Duolingo 人員營運工程師 Max Blaze

「Blacknut 是領先的獨立雲端遊戲服務,透過 500 多種影片遊戲型錄,可在任何裝置上為公眾帶來「即點即玩」體驗。為了完成我們提供低延遲、快速載入時間和流暢遊戲體驗的使命,我們需要盡可能地靠近玩家。憑藉 EC2 G4dn 執行個體,我們可以為玩家提供每場遊戲 10 秒或更短的平均載入時間,從而保證積極的整體遊戲體驗。我們還可以在不到 2 個月的時間內向新市場推出我們的解決方案,而這種回應能力讓我們自 2020 年以來,每個月都能部署新的全球合作夥伴,包括 Telecom Italia、Swisscom、POST、Drei Austria 和泰國的 Ais。我們的服務現已在 40 多個市場推出。」 

Blacknut 技術長 Pascal Manchon

2018 年,Snap Inc.(Snap) 這家以 Snapchat 簡訊應用程式知名的公司有了巧妙的新點子:建立一系列動畫影片,其中由各使用者的 Bitmoji 這種個性化卡通虛擬化身 (Snapchat 的招牌功能) 演出。每一週,Bitmoji TV 會首播新劇集,內容為傻氣的專業設計腳本加動畫的 3 至 8 分鐘影片,其中的明星為使用者及好友的 Bitmoji,劇情從擊退殭屍到比賽低重力 “Moonlympics” (月球奧林匹克),五花八門。 使用 Amazon EC2 G4 執行個體,Snap 能建立趣味又大方的個人化娛樂,轉譯速度快到足供數百萬人同時享受,又能維持低運算成本。

「使用 Amazon EC2 G4 執行個體與 Amazon EC2 G3 執行個體相較,我們以高 10% 的成本獲得 50% 的提振。」

Snap Inc. 軟體工程師 Brad Kotsopolous

閱讀案例研究 »

Nearmap 於 2007 年於澳洲伯斯創設,已自小型新創公司成長為數位影像處理的領導業者。該公司專精於由景觀空拍建立 2D 和 3D 影像,這是廣泛諸多行業的寶貴資源。對 Nearmap 而言,升級至 Amazon EC2 G4 執行個體的效應為立即且深廣:公司能以 Amazon EC2 G2 執行個體的相同成本執行三倍資料,程序感覺毫不費力,而且利用本已使用的 AWS 工具,整合感覺無縫順暢。

「客戶仰賴我們提供準確性高的 3D 實境模型,這是從多個涵蓋範圍的多角度航空攝影運算所得。我們每天使用 87 萬個 GPU 核心。我們過去在 Amazon EC2 G2 執行個體上執行此管道,現在換成使用 Amazon EC2 G4 執行個體,減少了 67% 成本。」

視覺系統總監 John Corbett

閱讀案例研究 »

Untold

Untold Studios 部署各種 AWS 虛擬工作站組態 (包括 G4 執行個體),特色為具有 NVIDIA T4 GPU 和 RTX 技術,已針對 VFX 和動畫工作流程優化。 有擴大的執行個體選項可供選擇之下,Untold Studios 能更正確地將虛擬機器類型與特定工作負載搭配,對創意和經濟皆有助益。

「G4 對我們的工作形態有重大影響。我們能以一行程式碼將整個工作站機群升級,使得美工人員工作速度加快,處處都能創意提升。」 

Untold Studios 技術總監 Sam Reid

Hive

工作站最初是部署 Amazon Elastic Compute Cloud (Amazon EC2) G3 執行個體。不過,等到 Amazon EC2 G4 執行個體—其採用 NVIDIA T4 Tensor Core GPU (NVIDIA 最新一代 GPU) 和 NVIDIA RTX 技術,此為高效能模擬、轉譯和設計的最新技術—開始問世,Hive VFX 也能輕鬆迅速地升級。

「從 G3 升級至 G4 執行個體相當簡易而且迅速,美工人員能夠存取新一代 NVIDIA GPU,享有最新電腦圖形和效能。我們從 G4 執行個體獲得的工作站效能甚至遠高於一些規模最大的工作室,而且也超乎我們所需。」

Hive VFX 創辦人 Bernie Kimbacher

Doritos 的 Super Bowl 2020 廣告表現出 75 歲演員 Sam Elliott 與 21 歲饒舌歌手 Lil Nas X 之間的一場的舞技比拼,之所以能夠做到這樣的競爭,是因為利用一家名為 Humen (Sway 幕後的母公司) 的新創公司所開發的人工智慧技術。這家小公司之所以能贏得與巨型公司 Doritos 為 Super Bowl 宣傳活動的合作關係,又能推出 Sway 這款 App Store 排行榜冠軍應用程式,是因為得到 Amazon Web Services (AWS) 的助力。為承載 Super Bowl 期間圖形密集型應用程式的龐大工作負載,Humen 使用 Amazon Elastic Compute Cloud (Amazon EC2) G4 執行個體—收到超級優的效果。

「使用 Amazon EC2 G4 執行個體,我在大約 6 個月內讓 Sway 能夠處理 Super Bowl 的規模。」

Humen 工程師 Jesse Myers

閱讀使用案例 »

The Molecule
「視覺效果軟體越來越倚賴 GPU 的能力,而需要的時候是迫切需要,但並非每天都需要。身為小企業,我們負擔不起買跑車開去雜貨店的採購方式,無法購買非日常使用性的東西。我們也不能因為獨特需求,為一個專案購買 10 件之多。但使用 G4 執行個體,我們能夠存取一個機群的 GPU 功能賽車,比我們有能力購買的更好、更快,又不必為無需使用的時間付出額外成本。美工人員很開心能夠使用賽車,我們也很高興能在不再需要時退回!」

The Molecule 總經理 Chris Healer

PureWeb
「在 PureWeb,我們努力為企業即時串流互動內容提供世界最佳平台。當 Geneva International Motor Show 由於 COVID-19 取消時,Volkswagen 與我們接洽創新解決方案的事宜,以便為了因應這此取消,為客戶提供虛擬展示間體驗。經過與 AWS 以及我們的創意公司合作夥伴密切合作,我們僅以三週內的時間,即以 Unity Game Engine 設立虛擬展示間複本,使用 Amazon EC2 G4dn 執行個體在我們的平台上執行。於是,數千位使用者能在家中欣賞 Volkswagen 在 Geneva Motor Show 中的席位。以專案在時間與技術上的限制,我們很有把握,AWS 是唯一能勝任的雲端供應商,提供穩定、可擴展、經濟實惠且真正全球化的使用者體驗。」

PureWeb 資深軟體架構師 Chris Jarabek

產品詳細資訊

  執行個體大小 GPU vCPU 記憶體 (GiB) 執行個體儲存體 (GB) 網路頻寬 (Gbps) EBS 頻寬 (Gbps) 隨需價格/小時* 1 年預留執行個體實際小時費率* (Linux) 3 年預留執行個體實際小時費率* (Linux)

G4dn

單一 GPU VM g4dn.xlarge 1 4 16 1 x 125 NVMe SSD 最多 25 最多 3.5 0.526 USD 0.316 USD 0.210 USD
g4dn.2xlarge 1 8 32 1 x 225 NVMe SSD 最多 25 最多 3.5 0.752 USD 0.452 USD 0.300 USD
g4dn.4xlarge 1 16 64 1 x 225 NVMe SSD 最多 25 4.75 1.204 USD 0.722 USD 0.482 USD
g4dn.8xlarge 1 32 128 1 x 900 NVMe SSD 50 9.5 2,176 USD 1.306 USD 0.870 USD
g4dn.16xlarge 1 64 256 1 x 900 NVMe SSD 50 9.5 4.352 USD 2.612 USD 1.740 USD
                     
多個 GPU VM g4dn.12xlarge 4 48 192 1 x 900 NVMe SSD 50 9.5 3.912 USD 2.348 USD 1.564 USD
g4dn.metal 8 96 384 2 x 900 NVMe SSD 100 19 7.824 USD 4.694 USD 3.130 USD

G4ad

單一 GPU VM g4ad.xlarge 1 4 16 1 x 150 NVMe SSD 最多 10 最多 3 0.379 USD 0.227 USD 0.178 USD
g4ad.2xlarge 1 8 32 1 x 300 NVMe SSD 最多 10 最多 3 0.541 USD 0.325 USD 0.254 USD
g4ad.4xlarge 1 16 64 1 x 600 NVMe SSD 最多 10 最多 3 0.867 USD 0.520 USD 0.405 USD
                     
多個 GPU VM g4ad.8xlarge 2 32 128 1 x 1200 NVMe SSD 15 3 1.734 USD 1.040 USD 0.810 USD
g4ad.16xlarge 4 64 256 1 x 2400 NVMe SSD 25 6 3.468 USD 2.081 USD 1.619 USD

*所示價格是針對美國東部 (維吉尼亞北部) AWS 區域。1 年期和 3 年期預留執行個體的價格適用於「部分預付」付款選項,沒有「部分預付」選項的執行個體則適用於「無預付」。

開始使用 G4dn 執行個體

使用 AWS 的預先建置 AMI 和容器

使用 Amazon 深度學習 AMI 或 Deep Learning Containers,您可快速啟動已預先安裝常用深度學習架構和介面 (例如 TensorFlow、PyTorch 和 MXNet) 的 Amazon EC2 執行個體,以訓練複雜的自訂 AI 模型、試驗新的演算法,或學習新的技能和技術。如需進一步了解,請造訪 Amazon 深度學習 AMI 產品頁面AWS Deep Learning Containers 產品頁面

NVIDIA RTX Virtual Workstation AMI 支援為視覺化應用程式執行高達每 GPU 四台 4K 顯示器。NVIDIA Gaming AMI 能以 60 FPS 轉譯影片,並支援每 GPU 執行一台 4K 顯示器。

以 NVIDIA 驅動程式建置您的自訂 AMI

對於在深度學習、資料科學和 HPC 中常見的高度密集運算工作負載,NVIDIA Data Center 驅動程式能帶來最佳效能。

NVIDIA RTX 驅動程式可用以啟用 NVIDIA RTX Virtual Workstation 軟體。RTX vWS 可支援每 GPU 高達四台 4K 顯示器。NVIDIA Gaming 驅動程式能支援世界最進階的繪圖卡、遊戲解決方案和遊戲技術。此驅動程式可支援每 GPU 一台 4K 顯示器。

如需了解如何將這些驅動程式安裝至您的執行個體,請參閱以下 LinuxWindows 的連結。

開始使用 G4ad 執行個體

使用 AWS 預先建置的 AMI

AMD Radeon Pro Software for Enterprise 驅動程式能為虛擬工作站、遊戲串流、轉譯和其他圖形應用程式提供高效能圖形。為能迅速開始使用,您可利用 AWS 提供的 AMI,其中已預先安裝 AMD Radeon Pro Software for Enterprise。這些 AMI 可在 AMD Radeon Pro Marketplace 取得。

以 AMD 驅動程式建置您的自訂 AMI

AMD Radeon Pro Software for Enterprise 驅動程式可用以設定執行個體,處理強大且可靠專業級圖形。佈建有這些驅動程式的工作站能支援多達兩台 4K 顯示器。

如需了解如何將這些驅動程式安裝至您的執行個體以建置自訂 AMI,請參閱以下 LinuxWindows 的連結。

資源

AWS 運算部落格

深入了解全新 Amazon EC2 G4ad 執行個體

閱讀部落格 »

AMD 部落格

終極指南:設定 Amazon EC2 G4ad 執行個體

閱讀部落格 »

AMD 部落格

以 AMD 為基礎的 Amazon EC2 G4ad 執行個體可加速雲端中的遊戲引擎工作流程

閱讀部落格 »

AMD 部落格

使用 Autodesk® Inventor® 和 Amazon EC2 G4ad 執行個體,隨時隨地存取您的資料和設計

閱讀部落格 »

AMD 部落格

終極指南:設定 Amazon EC2 G4ad 執行個體

閱讀部落格 »

AWS 入門

Step 1 - Sign up for an AWS account

註冊 AWS 帳戶

立即存取 AWS 免費方案

利用 10 分鐘教學了解

跟著 簡單的教學課程一同探索並學習。

開始使用 AWS 進行建置

運用逐步操作指南開始建置,協助您啟動 AWS 專案

進一步了解其他 Amazon EC2 執行個體類型

按一下這裡可進一步了解
準備好開始使用了嗎?
註冊
還有其他問題嗎?
聯絡我們