為何需要 Amazon Redshift ML?
Amazon Redshift ML 讓資料分析師和資料庫開發人員可以在 Amazon Redshift 資料倉儲中使用熟悉的 SQL 命令輕鬆建立、訓練和套用機器學習模型。藉助 Redshift ML,您可以利用全受管的機器學習服務 Amazon SageMaker,而無需學習新工具或語言。您可透過 SQL 陳述式利用您的 Redshift 資料,建立和訓練 Amazon SageMaker 機器學習模型,然後使用模型進行預測。例如,您可以使用 Redshift 中的客戶保留資料來訓練客戶流失偵測模型,然後將該模型套用到您行銷團隊的儀表板,從而讓該團隊能夠向有流失風險的客戶提供激勵。Redshift ML 讓模型在您的 Redshift 資料倉儲中作為 SQL 函數提供,因此您可以輕鬆地直接套用到您的查詢和報告中。
無需機器學習經驗
由於 Redshift ML 讓您能夠使用標準 SQL,因此您可以輕鬆提高分析資料新使用案例的工作效率。Redshift ML 在 Redshift 和 Amazon SageMaker 之間提供簡單、最佳化且安全的整合,並支援在 Redshift 叢集內進行推論,從而可以輕鬆地在查詢和應用程式中,使用以 ML 為基礎的模型產生的預測。無需管理單獨的推論模型端點,訓練資料透過加密得到端對端保護。
使用標準 SQL 對 Redshift 資料套用機器學習
首先,在 Redshift 中使用 CREATE MODEL SQL 命令,並透過資料表或 SELECT 表達式指定訓練資料。然後,Redshift ML 會在 Redshift 資料倉儲中編譯和匯入經過訓練的模型,並準備一個可以立即用於 SQL 查詢的 SQL 推論函數。Redshift ML 會自動處理訓練和部署模型所需的所有步驟。
使用 Amazon Redshift 進行預測分析
藉助 Redshift ML,您可以將詐騙偵測、風險評分和流失預測等預測直接嵌入到查詢和報告中。使用 SQL 函數將 ML 模型套用於查詢、報告和儀表板中的資料。例如,您可以定期對資料倉儲中的新客戶資料執行「客戶流失」SQL 函數,來預測有流失風險的客戶,並將相關資訊提供給銷售和行銷團隊,以便他們採取預防措施,例如向這些客戶提供優惠以留住他們。
使用自有模型 (BYOM)
Redshift ML 支援使用 BYOM 進行本機或遠端推論。您可以將在 Redshift 外部訓練的模型與 Amazon SageMaker 結合使用,以在 Amazon Redshift 本機進行資料庫內推論。您可以匯入 SageMaker Autopilot,並直接使用在 Amazon SageMaker 中訓練的模型進行本機推論。或者,您可以叫用部署在遠端 SageMaker 端點中的遠端自訂 ML 模型。您可以使用任何接受和返回文字或 CSV 的 SageMaker ML 模型進行遠端推論。
使用 Amazon SageMaker 在 Amazon Redshift 中進行預測分析
運作方式
客戶成功案例
「藉助 Amazon Redshift,我們將營運成本降低了 20%。這與我們之前的堆疊相比是一大進步。」
Magellan Rx Management 資訊技術副總裁 Vinesh Kolpe
「Jobcase 有多個模型正在使用 Amazon Redshift ML 進行生產。每個模型直接在我們的 Redshift 資料倉儲上執行,在幾分鐘內進行數十億次預測,從而無需建立資料管道。藉助 Redshift ML,我們的建模架構已經發展到可以將幾種不同的電子郵件範本類型的會員和會員參與率提高 5-10%,並且沒有推論成本。」
Jobcase 最佳化和分析執行副總裁 Mike Griffin
「在 Rackspace Technology,我們協助公司提升他們的 AI/ML 營運。我們對新的 Amazon Redshift ML 功能的推出感到興奮,因為這將讓我們共同的 Redshift 客戶更容易透過熟悉的 SQL 介面在他們的 Redshift 上使用 ML。與 Amazon SageMaker 的無縫整合將讓資料分析師能夠以新的方式使用資料,並將為整個組織提供更多洞見。」
Rackspace Technology 資料解決方案總經理 Nihar Gupta