取得針對操作資料庫、資料湖、資料倉儲和數千個第三方資料集之複雜、可擴展資料執行即時預測分析的整合式洞察。
聯合查詢:使用 Amazon Redshift 中的全新聯合查詢功能,您可以連到操作的關聯式資料庫。查詢一個或多個 Amazon Relational Database Service (RDS)、Aurora PostgreSQL、RDS MySQL 和 Aurora MySQL 資料庫中的即時資料,無需移動資料即可即時掌握完整的業務營運狀況。您可以聯結來自 Redshift 資料倉儲的資料、資料湖中的資料,還可聯結操作存放區的資料,以便做出更佳的資料驅動決策。Amazon Redshift 提供最佳化功能,降低透過網路移動的資料,並使用大規模平行資料處理作為輔助,以進行高效能的查詢。進一步了解。
資料共用:Amazon Redshift 資料共用可讓您將 Amazon Redshift 在單一叢集中提供的易用性、效能和成本優勢擴展至多叢集部署,同時能夠共用資料。資料共享可跨 Redshift 叢集實現即時、精細和快速資料存取,而無需對其複製或移動。資料共享可即時存取資料,以便您的使用者在資料倉儲中更新時,始終能看到最新且一致的資訊。您可以在相同或不同的 AWS 帳戶中以及跨區域,與 Redshift 叢集安全地共享即時資料。進一步了解。
適用於 Amazon Redshift 的 AWS Data Exchange:從您自己的 Redshift 叢集查詢 Amazon Redshift 資料集,而無須擷取、轉換和載入 (ETL) 資料。您可以在 AWS Data Exchange 中訂閱 Redshift 雲端資料倉儲產品。一旦供應商進行更新,訂閱用戶就能看到變更。如果您是資料提供者,則會在訂閱開始時自動授予存取權,並在訂閱結束時撤銷存取權;付款到期時會自動產生發票,並透過 AWS 收取付款。您可以透過單一訂閱授權存取平面檔案、Amazon Redshift 中的資料,以及透過 API 交付的資料。進一步了解。
Redshift ML:Redshift ML 可讓資料分析師、資料科學家、商業智慧專業人員和開發人員使用 SQL 輕鬆地建立、訓練和部署 Amazon SageMaker 模型。藉助 Redshift ML,您可以使用 SQL 陳述式根據 Amazon Redshift 中的資料建立和訓練 Amazon SageMaker 模型,然後直接在查詢和報告中使用這些模型進行客戶流失偵測、財務預測、個人化和風險評分等預測。進一步了解。
適用於 Apache Spark 的 Amazon Redshift 整合:此功能可讓您輕鬆地根據 Amazon Redshift 資料建置和執行 Apache Spark 應用程式,讓客戶能為更廣泛的分析和機器學習解決方案開放資料倉儲。透過適用於 Apache Spark 的 Amazon Redshift 整合,使用 AWS 分析和 ML 服務 (例如 Amazon EMR、AWS Glue、Amazon Athena Spark 和 Amazon SageMaker) 的開發人員可以在幾秒鐘內開始使用,並輕鬆建立可從 Amazon Redshift 資料倉儲讀取和寫入的 Apache Spark 應用程式,而不會影響應用程式效能或資料的交易一致性。適用於 Apache Spark 的 Amazon Redshift 整合也可讓您更輕鬆地監控和疑難排解 Apache Spark 應用程式與 Amazon Redshift 一起使用時的效能問題。
Amazon Aurora Zero-ETL to Amazon Redshift:這是 Amazon Aurora 和 Amazon Redshift 之間的無程式碼整合,可讓 Amazon Aurora 客戶在 PB 級的交易資料上使用 Amazon Redshift 進行近乎即時的分析和機器學習。在將交易資料寫入 Amazon Aurora 的幾秒鐘內,Amazon Aurora Zero-ETL to Amazon Redshift 就能順暢地在 Amazon Redshift 中使用資料,讓客戶無需建立和維護執行擷取、轉換和載入 (ETL) 操作的複雜資料管道。此整合可降低營運負擔和成本,並讓客戶專注於改善應用程式。透過近乎即時的交易資料存取,客戶能利用 Amazon Redshift 的分析和機器學習功能,從交易和其他資料衍生洞察,有效地回應關鍵的時間敏感事件。
串流擷取:資料工程師、資料分析師和大數據開發人員正在使用即時串流引擎來改善客戶回應速度。透過 Amazon Redshift 中的全新串流擷取功能,您可以使用 SQL (結構化查詢語言) 連線至 Amazon Kinesis Data Streams 及 Amazon Managed Streaming for Apache Kafka (MSK),並直接擷取資料。Amazon Redshift 串流擷取也可讓您直接在串流之上建立具體化視觀表,讓您輕鬆建立和管理下游管道。具體化視觀表也可以包含做為 ELT (擷取載入轉換) 管道部分之一的 SQL 轉換。您可以手動重新整理定義的具體化視觀表,以查詢最新的串流資料。這種方法可讓您使用熟悉的現有工具執行串流資料的下游處理和轉換,而無需額外費用。
從您的資料湖進行查詢並匯入和匯出資料:沒有其他雲端資料倉儲可以用如此簡單的方式查詢資料,並以各種開放格式將資料寫回您的資料湖。您可以查詢 Parquet、ORC、JSON、Avro、CSV 等開放檔案格式,並使用熟悉的 ANSI SQL 在 Amazon S3 進行更直接的查詢。要將資料匯出您的資料湖,只需在 SQL 程式碼使用 Amazon Redshift UNLOAD 命令,並將 Parquet 指定為檔案格式,Amazon Redshift 就能自動設定資料格式,然後將資料移至 S3。這可讓您靈活地將經常存取的高度結構化的資料和半結構化資料存放在 Amazon Redshift 資料倉儲中,同時在 Amazon S3 中保留 EB 規模的結構化、半結構化和非結構化資料。將資料從 Amazon Redshift 匯回資料湖可讓您使用 Amazon Athena、Amazon EMR 和 Amazon SageMaker 等 AWS 服務來進一步分析資料。
AWS 服務整合:與 AWS 服務、資料庫和機器學習服務的原生整合可讓您輕鬆處理完整的分析工作流程,而不會造成摩擦。例如,AWS Lake Formation 是能在幾天內輕鬆設定安全資料湖的服務。AWS Glue 可以將資料擷取、轉換和載入 (ETL) 到 Amazon Redshift。要擷取、轉換串流資料,並將其載入 Amazon Redshift 以進行近乎即時分析,Amazon Kinesis Data Firehose 是最簡單的方法。您可以使用 Amazon EMR 透過 Hadoop/Spark 處理資料,並將輸出載入至 Amazon Redshift 用於商業智慧和分析。Amazon QuickSight 是第一個採用按工作階段付費定價的商業智慧服務,可用於建立 Redshift 資料的報告、視覺化和儀表板。您可以使用 Amazon Redshift 準備資料,以便利用 Amazon SageMaker 執行機器學習 (ML) 工作負載。若要加速遷移至 Amazon Redshift,您可以使用 AWS Schema Conversion Tool 和 AWS Database Migration Service (DMS)。Amazon Redshift 還與 Amazon Key Management Service (KMS) 和 Amazon CloudWatch 深度整合,以實現安全性、監控和合規。您還可以使用 Lambda 使用者定義函數 (UDF),從 SQL 查詢中叫用 Lambda 函數,就像在 Amazon Redshift 中叫用 UDF 一樣。可以撰寫 Lambda UDF 以整合 AWS 合作夥伴服務並存取其他熱門的 AWS 服務,例如 Amazon DynamoDB 和 Amazon SageMaker。
合作夥伴主控台整合:可透過以下方式,在幾分鐘內加速資料採用並形成極具價值的商業洞見:在 Amazon Redshift 主控台中整合精選的合作夥伴解決方案。使用這些解決方案,您可以將來自 Salesforce、Google Analytics、Facebook Ads、Slack、Jira、Splunk 和 Marketo 之類應用程式中的資料高效、簡化地帶入 Redshift 資料倉儲。這還可讓您加入這些不同的資料集並進行分析,以形成可行的洞察。
從 Amazon S3 自動複製:Amazon Redshift 支援自動複製,以簡化和自動從 Amazon S3 載入資料,減少建立自訂解決方案或管理第三方服務的時間和精力。透過此功能,Amazon Redshift 可自動化檔案擷取並處理持續的資料載入步驟,讓您不再需要手動和重複執行複製程序。自動複製支援可讓業務營運使用者和資料分析師輕鬆地在沒有任何資料工程知識的情況下輕鬆建立擷取規則,並設定他們希望從 Amazon S3 載入的資料位置。新資料落入指定的 Amazon S3 資料夾時,擷取程序會根據使用者定義的組態自動觸發。Redshift 複製命令支援所有檔案格式,包括 CSV、JSON、Parquet 和 Avro。
原生支援進階分析:Amazon Redshift 支援標準純量資料類型,例如 NUMBER、VARCHAR 和 DATETIME,同時為以下進階分析處理提供原生支援:
- 空間資料處理:Amazon Redshift 提供一種 GEOMETRY 多態資料類型,可支援多種幾何形狀,例如點、線串和多邊形。Amazon Redshift 還提供空間 SQL 函數來建構幾何形狀,以及匯入、匯出、存取和處理空間資料。您可以將 GEOMETRY 欄新增至 Redshift 表格,並編寫跨越空間和非空間資料的 SQL 查詢。此功能可讓您儲存、擷取和處理空間資料,並透過將空間資料整合至分析查詢中,無縫地增強商業洞察。使用 Amazon Redshift 的無縫查詢資料湖的功能,您也可以將外部表格整合至空間查詢,輕鬆地將空間處理延伸到資料湖。如需詳細資訊,請參閱文件。
- HyperLogLog 草圖:HyperLogLog 是一種新型的演算法,可以有效估計資料集中不同值的近似數量。HLL 草圖是一種建構模組,用於封裝有關資料集中不同值的資訊。對於在大型資料集上運算近似基數 (平均相對誤差為 0.01–0.6%) 的查詢,可使用 HLL 實現顯著的效能優勢。Amazon Redshift 提供了一流的資料類型 HLLSKETCH 和關聯的 SQL 函數,以產生、保留和結合 HyperLogLog 草圖。Amazon Redshift 的 HyperLogLog 功能使用偏差更正技術,同時以少量記憶體提供高準確度。如需詳細資訊,請參閱文件。
- DATE 與 TIME 資料類型:Amazon Redshift 提供了 DATE、TIME、TIMETZ、TIMESTAMP 和 TIMESTAMPTZ 等多種資料類型來原生儲存和處理資料/時間資料。TIME 和 TIMESTAMP 類型儲存不帶時區資訊的時間資料,而 TIMETZ 和 TIMESTAMPTZ 類型儲存包含時區資訊的時間資料。可以使用各種日期/時間 SQL 函數來處理 Redshift 查詢中的日期和時間值。如需詳細資訊,請參閱文件。
- 半結構化資料處理:Amazon Redshift SUPER 資料類型將 JSON 和其他半結構化資料原生儲存在 Redshift 表格中,同時使用 PartiQL 查詢語言無縫處理半結構化資料。SUPER 資料類型本質上是無結構的,可儲存可能包含 Redshift 純量值、巢狀陣列和巢狀結構的巢狀值。PartiQL 是 SQL 的擴展,並提供強大的查詢功能,如物件和陣列導覽、陣列的展開、動態輸入和無結構描述語意。這就能夠實現將傳統的結構化 SQL 資料與半結構化的 SUPER 資料相結合的進階分析,同時提供卓越的效能、靈活性和易用性。如需詳細資訊,請參閱文件。
- 與第三方工具整合:有許多選項可增強 Amazon Redshift,可透過業界最先進的工具和與專家合作載入、轉換和視覺化資料。我們擁有數量龐大的合作夥伴清單,這些合作夥伴都已通過認證其解決方案可搭配 Amazon Redshift 使用。
- 透過資料整合合作夥伴載入和轉換資料。
- 透過商業智慧合作夥伴分析資料,並在整個組織內分享洞察。
- 透過系統整合與諮詢夥伴建構並實作分析平台。
- 使用查詢和資料模型建立合作夥伴的工具及公用程式來查詢、探索和建立資料模型。