AWS Glue 的優勢
運作方式
AWS Glue 是一種無伺服器、可擴展的資料整合服務,可讓您更輕鬆地探索、準備、移動和整合來自多個來源的資料,以進行分析、機器學習 (ML) 和應用程式開發。
-
資料整合引擎選項
-
事件驅動的 ETL
-
AWS Glue Data Catalog
-
無程式碼 ETL 任務
-
管理和監控資料品質
-
資料準備
-
資料整合引擎選項
-
在 AWS Glue 中選擇您偏好的資料整合引擎,來為您的使用者和工作負載提供支援。
-
事件驅動的 ETL
-
AWS Glue 可在新資料到達時執行擷取、轉換和載入 (ETL) 任務。例如,您可以設定 AWS Glue 在 Amazon Simple Storage Service (S3) 上的新資料變得可用時立即開始執行您的 ETL 任務。
-
AWS Glue Data Catalog
-
您可以使用資料型錄快速探索和搜尋多個 AWS 資料集,而無需移動資料。資料編入型錄之後,即可使用 Amazon Athena、Amazon EMR 和 Amazon Redshift Spectrum 搜尋和查詢。
-
無程式碼 ETL 任務
-
AWS Glue Studio 讓您可以更輕鬆地以視覺化方式建立、執行和監控 AWS Glue ETL 任務。您可以建置 ETL 任務,該任務可使用拖放編輯器移動和轉換資料,而 AWS Glue 可自動產生程式碼。
-
管理和監控資料品質
-
AWS Glue Data Quality 可自動建立、管理和監控資料品質規則,以協助確保跨資料湖和管道的高品質資料。
-
資料準備
-
藉助 AWS Glue DataBrew,您可以探索和試驗直接來自資料湖、資料倉儲和資料庫的資料,包括 Amazon S3、Amazon Redshift、AWS Lake Formation、Amazon Aurora 和 Amazon Relational Database Service (RDS)。您可以從 DataBrew 中 250 多個預先建置的轉換中進行選擇,以自動化資料準備任務,例如篩選異常、標準化格式和更正無效值。
此外,AWS Glue Studio 還提供資料準備工具,可讓您透過互動式的點按式視覺化介面來準備資料,而無需編寫程式碼。
使用案例
支援多種不同的處理架構和工作負載
簡化 ETL 管道開發
以互動方式探索、試驗及處理資料
有效探索資料
最新消息
開始使用 AWS Glue
找到今天所需的資訊了嗎?
讓我們知道,以便我們改善頁面內容的品質。