AWS 資料湖

打破資料孤島並在 Amazon S3 資料湖中實現大規模分析

概觀

AWS 資料湖可協助您打破資料孤島,最大限度地增強端對端資料洞察。 以 Amazon Simple Storage Service (Amazon S3) 做為您的資料湖基礎,您可以利用 AWS 分析服務來支援您的資料需求,從資料擷取、移動和儲存,到大數據分析、串流分析、商業智慧、機器學習 (ML) 等,所有這些都具有最佳的價格效能比。AWS 上執行超過 100 萬個資料湖。

Amazon S3 是建置資料湖的最佳場所,因為它具有無與倫比的持久性、可用性、可擴展性、安全性、合規性和稽核功能。藉助 AWS Lake Formation,您可以在幾天而非數月內建置安全的資料湖。AWS Glue 隨後支援在資料湖與您的專用資料和分析服務之間進行無縫資料移動。

釋放資料的全部潛力

使用在 Amazon S3 上建置的資料湖,為您的現代資料策略奠定最佳基礎。

使用 AWS 資料湖的優勢

由於 Amazon S3 可經濟高效地進行擴展,幾乎沒有限制,因此您可以存放任何來源的所有資料,並釋放其價值。
藉助可用於分析的所有資料,組織可加速創新,例如探索節省成本或個人化的新機會。ML 和預測分析可存取更廣泛的資料連續體。
藉助專門建置的 AWS 分析服務,您可以使用最適合任務的工具快速擷取資料洞察,並透過最佳化,提供滿足您需求的最佳效能、規模和成本。
AWS 分析服務具有最適合雲端中資料分析的無伺服器選項,易於使用、管理和管控。

使用 Amazon S3 和 Amazon DataZone 對資料湖進行資料管控

有效的資料管控是確保資料完整性和可靠性的關鍵。了解為什麼資料湖對組織很重要、AWS 資料治理模式,以及可協助管控資料湖的各種服務。  

AWS 資料湖的基本支柱

在 Amazon S3 上建置資料湖之後,您可以使用原生 AWS 服務執行大數據分析、人工智慧 (AI)、機器學習 (ML)、高效能運算 (HPC) 和媒體資料處理應用程式,從非結構化資料集獲得洞見。在與 AWS Lake Formation 和 AWS Glue 結合使用時,可透過端對端資料整合和集中化、類似資料庫的許可和治理,來輕鬆簡化資料湖的建立和管理。Glue、Amazon EMR 和 Amazon Athena 等 AWS 分析解決方案可讓您輕鬆地直接查詢資料湖。

您可以使用 AWS Glue,即時或批次匯入任意數量的資料。資料可從多個來源收集,並以其原始格式移入資料湖,AWS 分析服務也可用於直接查詢您的資料湖。藉助 AWS Glue 等資料整合、探索、準備和轉換工具,您可以進行擴展,同時節省定義資料結構、架構和轉換的時間。

藉助資料湖中的一系列資料來源和格式,能夠爬取、編目、索引和保護資料對於確保使用者存取至關重要。AWS Glue 提供了一個精簡的集中式資料型錄,因此,您可以更好地了解資料湖中的資料。AWS Lake Formation 讓您可以集中資料治理和安全性,以便您放心地部署資料。

您組織中的不同使用者 (例如資料科學家、資料開發人員和業務分析師) 可透過其選擇的專用 AWS 分析工具和架構,來輕鬆存取資料。您可以輕鬆、快速地執行分析,而無須將資料移動至單獨的分析系統。

AWS 資料湖可讓您利用最全面的 AI 和 ML 服務集加速創新。透過在資料湖上啟用 ML,您可以做出準確的預測,從資料中獲得更深入的洞察,減少營運開銷並改善客戶體驗。

管控資料湖中的資料

使用 AWS 集中管理和擴展精細資料存取權限。