什麼是線上分析處理?

線上分析處理 (OLAP) 是可用來從不同角度分析業務資料的軟體技術。組織會從多個資料來源 (例如網站、應用程式、智慧型電錶和內部系統) 收集和儲存資料。OLAP 將這些資料合併並分組為類別,以便為策略規劃提供可行的見解。例如,零售商會儲存其銷售之所有產品的相關資料,例如顏色、大小、成本和位置。零售商也會在不同的系統中收集客戶採購資料,例如訂購的料號名稱與銷售總額。OLAP 結合資料集來回答問題,例如哪些顏色產品較受歡迎,或產品佈置如何影響銷售。

為什麼 OLAP 很重要?

線上分析處理 (OLAP) 可協助組織處理不斷增長的數位資訊量並從中受益。OLAP 的一些優點包括以下內容。

更快地制定決策

企業使用 OLAP 制定快速且準確的決策,以在快節奏的經濟中保持競爭力。對多個關聯式資料庫執行分析查詢非常耗時,因為電腦系統會搜尋多個資料表。另一方面,OLAP 系統會預先計算和整合資料,因此業務分析師可以在需要時更快地產生報告。

非技術性使用者支援

OLAP 系統使非技術性業務使用者更容易進行複雜的資料分析。企業使用者可以建立複雜的分析計算並產生報告,而不必學習如何操作資料庫。

整合式資料檢視

OLAP 為行銷、財務,生產及其他業務部門提供統一的平台。管理者和決策者可以看到更廣闊的前景並有效地解決問題。他們可以執行假設分析,這顯示了一個部門所採取的決策對業務的其他領域產生的影響。

什麼是 OLAP 架構?

線上分析處理 (OLAP) 系統透過在兩個以上的維度或類別中呈現資訊來儲存多維資料。二維資料包含欄和列,但多維資料具有多種特徵。例如,產品銷售的多維資料可能包含下列維度:

  • 產品類型
  • 位置
  • 時間

資料工程師構建由以下元素組成的多維 OLAP 系統。 

資料倉儲

資料倉儲會從不同來源收集資訊,包括應用程式、檔案和資料庫。它使用各種工具處理資訊,以便資料準備好用於分析目的。例如,資料倉儲可能會從關聯式資料庫收集資訊,該資料庫會將資料儲存在含有列和欄的資料表中。 

ETL 工具

擷取、轉換和載入 (ETL) 工具是資料庫程序,可自動擷取、變更和準備資料,以符合分析用途的格式。資料倉儲使用 ETL 來轉換和標準化來自各種來源的資訊,然後再將其提供給 OLAP 工具。

OLAP 伺服器

OLAP 伺服器是為 OLAP 系統提供支援的基礎機器。它使用 ETL 工具來轉換關聯式資料庫中的資訊,並為 OLAP 操作做好準備。 

OLAP 資料庫

OLAP 資料庫是連線至資料倉儲的獨立資料庫。資料工程師有時會使用 OLAP 資料庫,以防止資料倉儲因為 OLAP 分析而負擔過重。他們還使用 OLAP 資料庫,以便更輕鬆地建立 OLAP 資料模型。

OLAP 立方體

資料立方體是表示多元資訊陣列的模型。雖然將其可視化為三維資料模型更容易,但大多數資料立方體具有三個以上的維度。OLAP 立方體或超立方體是 OLAP 系統中資料立方體的術語。OLAP 立方體是固定的,因為一旦建立模型,就無法變更維度和基礎資料。例如,如果您將倉儲維度新增至具有產品、位置和時間維度的立方體,就必須重新建立整個立方體。 

OLAP 分析工具

業務分析師使用 OLAP 工具與 OLAP 立方體進行互動。它們執行切片、切割和旋轉等操作,以深入瞭解 OLAP 立方體中的特定資訊。 

OLAP 如何工作?

OLAP 如何工作?

線上分析處理 (OLAP) 系統的運作方式是使用下列步驟收集、組織、彙總和分析資料: 

  1. OLAP 伺服器會從多個資料來源收集資料,包括關聯式資料庫和資料倉儲。
  2. 然後,擷取、轉換和載入 (ETL) 工具會根據指定的維度數目,在 OLAP 立方體中清理、彙總、預先計算和儲存資料。
  3. 業務分析師使用 OLAP 工具,從 OLAP 立方體的多維資料中查詢和產生報告。

OLAP 使用多維表達式 (MDX) 來查詢 OLAP 立方體。MDX 是一個查詢,類似於 SQL,它提供了一組用於操作資料庫的指令。

OLAP 的類型有哪些?

線上分析處理 (OLAP) 系統以三種主要方式運作。

MOLAP

多維線上分析處理 (MOLAP) 涉及建立資料立方體,該立方體可從資料倉儲中呈現多維資料。MOLAP 系統將預先計算的資料儲存在超立方體中。資料工程師會使用 MOLAP,因為這種類型的 OLAP 技術可提供快速分析。 

ROLAP

關聯式線上分析處理 (ROLAP) 可讓資料工程師對關聯式資料庫執行多維資料分析,而不是使用資料立方體。換句話說,資料工程師使用 SQL 查詢,根據所需的維度來搜尋和擷取特定資訊。ROLAP 適用於分析廣泛和詳細的資料。但是,與 MOLAP 相比,ROLAP 具有較慢的查詢效能。 

HOLAP

混合式線上分析處理 (HOLAP) 結合了 MOLAP 和 ROLAP,提供兩種架構的最佳效能。HOLAP 允許資料工程師快速從資料立方體中擷取分析結果,並從關聯式資料庫中提取詳細資訊。 

什麼是 OLAP 中的資料建模?

資料建模是資料倉儲或線上分析處理 (OLAP) 資料庫中的資料呈現。資料建模在關聯式線上分析處理 (ROLAP) 中非常重要,因為它可以直接從關聯式資料庫中分析資料。它將多維資料儲存為星型或雪花型結構。 

星型結構

星型結構由一個事實表和多個維度表組成。事實表是包含與業務程序相關之數值的資料表,而維度表則包含描述事實表中每個屬性的值。事實表指的是具有外部索引鍵 (也就是與維度表中各個資訊相關聯的唯一識別碼) 的維度表。 

在星型結構中,事實表會連接到多個維度表,因此資料模型看起來像星形。以下是產品銷售事實表的範例: 

  • 產品 ID
  • 位置 ID
  • 銷售人員 ID
  • 銷售金額

產品 ID 指示資料庫系統從產品維度表中擷取資訊,如下所示:

  • 產品 ID
  • 產品名稱
  • 產品類型
  • 產品成本

同樣,位置 ID 指向位置維度表,其中可能包含下列項目:

  • 位置 ID
  • 國家
  • 城市

銷售人員表可能如下所示:

  • 銷售人員 ID
  • 名字
  • 姓氏
  • 電子郵件

雪花型結構

雪花型結構是星型結構的延伸。某些維度表可能會產生一個或多個次要維度表。當維度表放在一起時,形狀像雪花一樣。 

例如,產品維度表可能包含下列欄位:

  • 產品 ID
  • 產品名稱
  • 產品類型 ID
  • 產品成本

產品類型 ID 連接到另一個維度表,如下列範例所示:

  • 產品類型 ID
  • 類型名稱
  • 版本
  • 變體 

什麼是 OLAP 操作?

業務分析師使用多維度線上分析處理 (MOLAP) 立方體來執行數個基本的分析操作。 

彙總

在彙總中,線上分析處理 (OLAP) 系統會彙總特定屬性的資料。換句話說,它顯示較不詳細的資料。例如,您可能會根據紐約、加利福尼亞、倫敦和東京來查看產品銷售情況。彙總操作將提供基於國家/地區的銷售資料檢視,例如美國、英國和日本。 

深入研究

深入研究與匯總操作相反。業務分析師在概念層次結構中向下移動,並擷取所需的詳細資訊。例如,他們可以從按年份檢視銷售資料,轉變為按月份進行可視化。

切片

資料工程師使用切片操作,從 OLAP 立方體中建立二維檢視。例如,MOLAP 立方體會根據產品、城市和月份對資料進行排序。透過對立方體切片,資料工程師可以建立一個由特定月份的產品和城市組成的類似試算表的資料表。 

切割

資料工程師使用切割操作,從 OLAP 立方體中建立一個較小的子立方體。他們確定所需的尺寸,並從原始的超立方體中構建一個較小的立方體。

旋轉

旋轉操作指的是沿著其中一個維度旋轉 OLAP 立方體,從而對多維資料模型有不同的了解。例如,三維 OLAP 立方體在各自軸上具有下列維度:

  • X 軸 - 產品 
  • Y 軸 - 位置
  • Z 軸 - 時間

經過旋轉後,OLAP 立方體具有下列組態:

  • X 軸 - 位置
  • Y 軸 - 時間
  • Z 軸 - 產品

OLAP 與其他資料分析方法相比如何?

資料挖掘

資料挖掘是一種分析技術,可處理大量歷史資料,以尋找模式和深入分析。業務分析師使用資料挖掘工具來發現資料中的關係,並準確預測未來趨勢。

OLAP 和資料挖掘

線上分析處理 (OLAP) 是一種資料庫分析技術,涉及查詢、擷取和研究匯總資料。另一方面,資料挖掘涉及深入研究未處理的資料。例如,行銷人員可以使用資料挖掘工具,從每個網站訪問記錄中分析使用者行為。然後,他們可能會使用 OLAP 軟體從各種角度檢查這些行為,例如持續時間、裝置、國家/地區、語言和瀏覽器類型。 

OLTP

線上交易處理 (OLTP) 是一種資料技術,可以快速且可靠地將資訊儲存在資料庫中。資料工程師使用 OLTP 工具將交易資料 (例如財務記錄、服務訂閱和客戶意見回饋) 儲存在關聯式資料庫中。OLTP 系統涉及建立、更新和刪除關係表中的記錄。 

OLAP 和 OLTP

OLTP 非常適合在資料庫中處理和儲存多個事務流。但是,它無法從資料庫中執行複雜查詢。因此,業務分析師會使用 OLAP 系統來分析多維資料。例如,資料科學家會將 OLTP 資料庫連接至雲端 OLAP 立方體,以便對歷史資料執行運算密集型查詢。

AWS 如何幫助 OLAP?

AWS 資料庫提供各種受管雲端資料庫,協助組織儲存和執行線上分析處理 (OLAP) 操作。資料分析師使用 AWS 資料庫建立符合其組織需求的安全資料庫。由於經濟實惠和可擴展性,組織將其業務資料遷移到 AWS 資料庫。 

  • Amazon Redshift 是專為線上分析處理而設計的雲端資料倉儲。
  • Amazon Relational Database Service (Amazon RDS) 是具有 OLAP 功能的關聯式資料庫。資料工程師將 Amazon RDS 與 Oracle OLAP 搭配使用,在維度立方體上執行複雜查詢。
  • Amazon Aurora 是一個與 MySQL 和 PostgreSQL 相容的雲端關聯式資料庫。它針對執行複雜的 OLAP 工作負載進行了優化。


立即建立 AWS 帳戶,開始使用 OLAP on AWS。

線上分析處理後續步驟

查看額外的產品相關資源
進一步了解分析服務 
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
開始在主控台進行建置

開始在 AWS 管理主控台使用 AWS 進行建置。

登入