加速執行大數據應用程式及 PB 級資料分析,內部部署解決方案的成本則可減少一半以上。
使用最新的開源架構建置應用程式,並提供在自訂 Amazon EC2 叢集、Amazon EKS、AWS Outposts 或 Amazon EMR Serverless 上執行的選項。
透過 Spark、Hive 和 Presto 的效能優化和開源 API 相容版本,獲得洞察的時間最多可縮短 2 倍。
使用 EMR Notebooks 和 EMR Studio 中熟悉的開源工具輕鬆開發、視覺化和調試您的應用程式。
運作方式
Amazon EMR 是領先業界的雲端大數據解決方案,用於使用開放原始碼架構 (如 Apache Spark、Apache Hive 和 Presto) 來進行 PB 級資料處理、互動式分析和機器學習。
隆重推出 Amazon EMR Serverless
Amazon EMR Serverless 是 Amazon EMR 中的一個新選項,它讓資料工程師和分析師能夠以輕鬆且具成本效益的方式,在無須調整、操作、最佳化、保護或管理叢集的情況下,便能執行 Apache Spark、Hive 或 Presto 等使用開放原始碼大數據架構所建置的應用程式。
隆重推出 Amazon EMR Serverless
Amazon EMR Serverless 是 Amazon EMR 中的一個新選項,它讓資料工程師和分析師能夠以輕鬆且具成本效益的方式,在無須調整、操作、最佳化、保護或管理叢集的情況下,便能執行 Apache Spark、Hive 或 Presto 等使用開放原始碼大數據架構所建置的應用程式。EMR Serverless 可按您的應用程式需求向上或向下擴展運算和記憶體資源,而您只需為應用程式使用的資源付費。
使用案例
執行大數據分析
使用統計演算法和預測模型執行大規模資料處理和假設分析,以發現隱藏的模式、相關性、市場趨勢和客戶偏好。
建置可擴展的 Data Pipeline
從各種來源擷取資料、大規模處理,然後提供給應用程式和使用者兩者使用。
處理即時資料串流
即時分析串流資料來源的事件,以建立長期執行、高可用性和容錯的串流 Data Pipeline。
加速資料科學和機器學習 (ML) 採用
使用開源機器學習 (ML) 架構,例如:Apache Spark MLlib、TensorFlow 與 Apache MXNet 來分析資料。連接到 Amazon SageMaker Studio 以進行大規模模型訓練、分析和報告。
如何開始使用
探索 Amazon EMR 的定價
按秒付費,可選擇在 Amazon EC2、Amazon EKS、AWS Outposts 或 Amazon EMR Serverless 上執行 EMR 叢集。