什麼是資料分析?

資料分析將原始資料轉換為可行的洞察。它包括一系列工具、技術和程序,用於透過使用資料來發現趨勢和解決問題。資料分析可以塑造業務流程、改進決策並促進業務增長。

為什麼資料分析很重要?

資料分析可協助公司獲得更大可視性,並且更深入地了解其程序和服務。這可讓他們詳細洞察客戶體驗和客戶問題。透過將範式轉移到資料之外,以將洞察與動作相聯繫,公司可建立個人化的客戶體驗、建置相關的數位產品、最佳化營運,並提高員工生產力。

什麼是大數據分析?

大數據是指大量不同的資料集,包括結構化、非結構化和半結構化資料,以高速和大量方式持續產生。大數據通常以 TB 或 PB 衡量。1 PB 等於 1,000,000 GB。從這個角度來看,假設一部高清電影包含約 4 GB 的資料。1 PB 相當於 250,000 部電影。大型資料集從數百、數千到數百萬 PB 不等。

大數據分析即在大量資料集中尋找模式、趨勢和關係的程序。這些複雜的分析需要支援大規模的特定工具和技術、運算能力和資料儲存。

大數據分析如何運作?

大數據分析遵循五個步驟來分析任何大型資料集: 

  1. 資料收集
  2. 資料儲存體
  3. 資料處理
  4. 資料清除
  5. 資料分析

資料收集

這包括識別資料來源並從中收集資料。資料收集遵循 ETL 或 ELT 程序。

ETL – 提取、轉換、載入

在 ETL 中,產生的資料首先轉換為標準格式,然後載入儲存。

ELT – 提取、載入、轉換

在 ELT 中,資料首先被載入儲存,然後轉換為所需的格式。

資料儲存體

根據資料的複雜性,可以將資料移至雲端資料倉儲或資料湖等儲存。商業智慧工具可在需要時存取。

比較資料湖與資料倉儲

資料倉儲是經過最佳化的資料庫,能夠分析來自交易處理系統以及商業應用程式中的關聯式資料。預先定義資料結構與結構模式,以最佳化快速搜尋和報告。資料經過清除、豐富和轉換,可用作使用者可信任的「單一來源」。資料範例包括客戶檔案和產品資訊。

資料湖有所差異,因為它可以存放結構化和非結構化資料,而無需任何進一步處理。擷取資料時未定義資料或結構模式的結構;這意味著您無需精心設計即可存放所有資料,這在資料的未來用途未知時尤其有用。資料範例包括社交媒體內容、IoT 裝置資料,以及行動應用程式的非關聯式資料。

組織通常需要資料湖和資料倉儲來進行資料分析。AWS Lake FormationAmazon Redshift 可滿足您的資料需求。

資料處理

資料放置後,必須對其進行轉換和整理,以便從分析查詢中取得準確的結果。存在不同的資料處理選項可執行此操作。方法的選擇取決於可用於資料處理的運算和分析資源。

集中式處理 

所有處理都發生在託管所有資料的專用中央伺服器上。

分散式處理 

資料分佈並存放在不同的伺服器上。

批次處理 

資料片段會隨著時間的推移而累積分批處理。

即時處理

資料經持續處理,運算任務會在幾秒內完成。 

資料清除

資料清除涉及清除任何錯誤,如重複、不一致、冗餘或錯誤格式。  它還用於篩選掉任何不需要的資料以進行分析。

資料分析

這是將原始資料轉換為可行洞察的步驟。以下是四種類型的資料分析:

1.描述性分析

資料科學家分析資料,以了解資料環境中發生了什麼或正在發生什麼。其特點為資料視覺化,如圓餅圖、長條圖、折線圖、表格或是產生的敘述。

2.診斷性分析

診斷性分析是藉由深入或詳細的資料分析程序,以瞭解發生某事的原因。其特點為例如深入研究、資料探索、資料採礦和關聯性等技術。在上述每一項技術中,均使用多個資料操作和轉換來分析原始資料。

3.預測分析

預測性分析使用歷史資料對未來趨勢做出準確預測。其特點為採用各項技術,如機器學習、預測、模式匹配,以及預測性建模。在上述每一項技術中,電腦都經過訓練,可以對資料中的因果關係進行逆向工程。

4.規範性分析

規範性分析將預測性資料提升至下一個層級。它不僅會預測可能發生的事情,還可以針對該結果建議最佳的回應方式。還可以分析不同選擇的潛在影響並建議最佳行動方案。其特點是具有圖形分析、模擬、複雜事件處理、神經網路和推薦引擎。

有哪些不同的資料分析技術?

許多運算技術用於資料分析。以下是一些最常見的技術:

自然語言處理

自然語言處理是一種用於使電腦理解並回應口頭和書面人類語言的技術。資料分析師使用這項技術來處理口述筆記、語音命令和聊天訊息等資料。

文字挖掘

資料分析師使用文字挖掘來識別電子郵件、推文、研究和部落格文章等文字資料的趨勢。它可用於對新聞內容、客戶意見回饋和用戶端電子郵件進行排序。

感應器資料分析

感應器資料分析是指檢查不同感應器產生的資料。它用於機器產生資料的預測性機器維護、貨運追蹤和其他商業程序。

異常分析

異常分析或異常偵測可識別偏離其餘資料的資料點和事件。

資料分析是否可以自動化?

是,資料分析師可以自動化和最佳化程序。自動化資料分析是指使用電腦系統執行分析任務,而很少或沒有人為乾預的實務。這些機制的複雜性各異;其範圍從簡單的指令碼或程式碼行,到執行資料建模、特徵探索和統計分析的資料分析工具。

例如,網路安全公司可能會使用自動化,從大量 Web 活動中收集資料,進行進一步分析,然後使用資料視覺化來展示結果並支援商業決策。

資料分析是否可以外包?

是,公司可以引入外部資源來協助分析資料。外包資料分析讓管理和執行團隊能夠專注於商業的其他核心營運。專門的商業分析團隊是各自領域的專家;他們了解最新的資料分析技術,並且是資料管理方面的專家。這意味著他們可以更有效地執行資料分析、識別模式,並成功預測未來趨勢。然而,知識轉移和資料機密性可能會給外包帶來商業挑戰。

資料分析可改善客戶洞察

可以對如下各種客戶資料來源的資料集進行資料分析:

• 第三方客戶問卷調查
• 客戶購買日誌
• 社交媒體活動
• 電腦 Cookie
• 網站或應用程式統計資料

分析可揭示隱藏的資訊,如客戶偏好、網站上的熱門頁面、客戶瀏覽的時長、客戶意見回饋,以及與網站表單的互動。這讓企業能夠有效地回應客戶需求,並提高客戶滿意度。

案例研究:Nextdoor 如何使用資料分析來改善客戶體驗

Nextdoor 是可信任連線以及實用資訊、商品和服務交換的芳鄰中心。利用當地社群的力量,Nextdoor 協助人們過上更快樂、更有意義的生活。Nextdoor 使用 Amazon 分析解決方案,來衡量客戶參與度及其建議的有效性。資料分析讓他們能夠協助客戶建立更好的聯繫,並即時檢視更多相關內容。

資料分析可為有效的行銷活動提供資訊

資料分析消除了行銷、產品開發、內容建立和客戶服務中的猜測。它讓公司能夠推出目標內容,並透過分析即時資料對其進行微調。資料分析還提供有關行銷活動如何執行的寶貴洞察。定位、訊息和創意都可以根據即時分析進行調整。分析可最佳化行銷,以實現更多轉化並減少廣告浪費。

案例研究:Zynga 如何使用資料分析來加強行銷活動

Zynga 是世界上最成功的手機遊戲公司之一,其熱門遊戲包括 Words With Friends、Zynga Poker 和 FarmVille。全球超過 10 億玩家安裝了這些遊戲。Zynga 的營收來自應用程式內購買,因此,他們透過使用 Amazon Managed Service for Apache Flink 分析即時的遊戲內玩家行為,以規劃更有效的遊戲內行銷活動。

資料分析提高營運效率

資料分析可協助公司精簡其程序、減少損失並增加營收。預測性維護計畫、最佳化員工名冊和高效的供應鏈管理,可以成倍地改善業務績效。

案例研究:BT Group 如何使用資料分析來精簡營運

BT Group 是英國領先的電訊和網路公司,為 180 個國家/地區的客戶提供服務。BT Group 的網路支援團隊已使用 Amazon Managed Service for Apache Flink,取得了在英國透過其網路進行呼叫的即時檢視。網路支援工程師和故障分析員使用該系統來發現、回應並成功解決網路中的問題。

案例研究:Flutter 如何使用資料分析來加速遊戲營運

Flutter Entertainment 是全球最大的線上體育和遊戲提供商之一。其使命是以安全、負責任和永續發展的方式,為超過 1,400 萬客戶帶來娛樂。在過去幾年,Flutter 從大多數來源系統中獲取越來越多的資料。容量和延遲相結合帶來了持續挑戰。Amazon Redshift 協助 Flutter 擴展,以滿足不斷增長的需求和一致的最終使用者體驗。

資料分析為產品開發提供資訊

組織使用資料分析來識別和優先考慮產品開發的新功能。他們可以分析客戶需求,在更短時間內交付更多功能,並更快地推出新產品。

案例研究:GE 如何使用資料分析來加速產品交付

GE Digital 是 General Electric 的子公司。GE Digital 在多個不同的垂直領域擁有許多軟體產品和服務。一種產品稱為 Proficy Manufacturing Data Cloud。Amazon Redshift 讓他們能夠極大地改善資料轉換和資料延遲,以便其能夠向客戶提供更多功能。 

資料分析支援資料操作的擴展

資料分析在遷移、準備、報告和整合等多個資料任務中引入了自動化。其消除了人工效率低下的問題,並減少完成資料操作所需的時間和工時。這可支援擴展,並讓您快速擴展新想法。

案例研究:FactSet 如何使用資料分析來精簡客戶整合程序

FactSet 的使命是成為領先的內容和分析開放平台。移動資料涉及大型程序、用戶端的許多不同團隊成員,以及 FactSet 端的許多個人。任何時候出現問題,都很難弄清楚資料移動程序的哪一環節出錯。Amazon Redshift 協助精簡程序,讓 FactSet 的客戶能夠更快地擴展,並帶來更多資料以滿足其需求。

如何在業務中使用資料分析?

企業從多個面向客戶的內部渠道獲取統計資訊、定量資料和資訊。但是,找到關鍵洞察需要仔細分析驚人的資料量。這並非小事。參考一些範例,了解資料分析和資料科學可如何為企業新增價值。

資料分析可改善客戶洞察

可以對如下各種客戶資料來源的資料集進行資料分析:

  • 第三方客戶問卷調查
  • 客戶購買日誌
  • 社交媒體活動
  • 電腦 Cookie
  • 網站或應用程式統計資料

分析可揭示隱藏的資訊,如客戶偏好、網站上的熱門頁面、客戶瀏覽的時長、客戶意見回饋,以及與網站表單的互動。這讓企業能夠有效地回應客戶需求,並提高客戶滿意度。

案例研究:Nextdoor 如何使用資料分析來改善客戶體驗

Nextdoor 是可信任連線以及實用資訊、商品和服務交換的芳鄰中心。利用當地社群的力量,Nextdoor 協助人們過上更快樂、更有意義的生活。 Nextdoor 使用 Amazon 分析解決方案,來衡量客戶參與度及其建議的有效性。資料分析讓他們能夠協助客戶建立更好的聯繫,並即時檢視更多相關內容。

資料分析可為有效的行銷活動提供資訊 

資料分析消除了行銷、產品開發、內容建立和客戶服務中的猜測。它讓公司能夠推出目標內容,並透過分析即時資料對其進行微調。 資料分析還提供有關行銷活動如何執行的寶貴洞察。定位、訊息和創意都可以根據即時分析進行調整。分析可最佳化行銷,以實現更多轉化並減少廣告浪費。

案例研究:Zynga 如何使用資料分析來加強行銷活動

Zynga 是世界上最成功的手機遊戲公司之一,其熱門遊戲包括 Words With FriendsZynga PokerFarmVille。全球超過 10 億玩家安裝了這些遊戲。 Zynga 的營收來自應用程式內購買,因此,他們透過使用 Amazon Managed Service for Apache Flink 分析即時的遊戲內玩家行為,以規劃更有效的遊戲內行銷活動。

資料分析提高營運效率

資料分析可協助公司精簡其程序、減少損失並增加營收。預測性維護計畫、最佳化員工名冊和高效的供應鏈管理,可以成倍地改善業務績效。

案例研究:BT Group 如何使用資料分析來精簡營運

BT Group 是英國領先的電訊和網路公司,為 180 個國家/地區的客戶提供服務。BT Group 的網路支援團隊已使用 Amazon Managed Service for Apache Flink,取得了在英國透過其網路進行呼叫的即時檢視。網路支援工程師和故障分析員使用該系統來發現、回應並成功解決網路中的問題。

案例研究:Flutter 如何使用資料分析來加速遊戲營運

Flutter Entertainment 是全球最大的線上體育和遊戲提供商之一。其使命是以安全、負責任和永續發展的方式,為超過 1,400 萬客戶帶來娛樂。在過去幾年,Flutter 從大多數來源系統中獲取越來越多的資料。容量和延遲相結合帶來了持續挑戰。Amazon Redshift 協助 Flutter 擴展,以滿足不斷增長的需求和一致的最終使用者體驗。

資料分析為產品開發提供資訊

組織使用資料分析來識別和優先考慮產品開發的新功能。他們可以分析客戶需求,在更短時間內交付更多功能,並更快地推出新產品。

案例研究:GE 如何使用資料分析來加速產品交付

GE Digital 是 General Electric 的子公司。GE Digital 在多個不同的垂直領域擁有許多軟體產品和服務。一種產品稱為 Proficy Manufacturing Data Cloud。

Amazon Redshift 讓他們能夠極大地改善資料轉換和資料延遲,以便其能夠向客戶提供更多功能。

資料分析支援資料操作的擴展

資料分析在遷移、準備、報告和整合等多個資料任務中引入了自動化。其消除了人工效率低下的問題,並減少完成資料操作所需的時間和工時。這可支援擴展,並讓您快速擴展新想法。

案例研究:FactSet 如何使用資料分析來精簡客戶整合程序

FactSet 的使命是成為領先的內容和分析開放平台。移動資料涉及大型程序、用戶端的許多不同團隊成員,以及 FactSet 端的許多個人。任何時候出現問題,都很難弄清楚資料移動程序的哪一環節出錯。Amazon Redshift 協助精簡程序,讓 FactSet 的客戶能夠更快地擴展,並帶來更多資料以滿足其需求。

AWS 如何協助進行資料分析?

AWS 提供全面、安全、可擴展且經濟高效的資料分析服務。AWS 分析服務可滿足所有資料分析需求,並且可讓各種規模和產業的組織利用資料重塑業務。AWS 提供具有最佳價格效能比的專用服務:資料移動、資料儲存、資料湖、大數據分析、機器學習,以及介於兩者之間的一切服務。 

  • Amazon Kinesis Data Analytics 是使用 Apache Flink 即時轉換和分析串流資料的精簡方法。其提供篩選、彙整和轉換串流資料的內建功能來進行進階分析。
  • Amazon Redshift 讓您可以跨資料倉儲、營運資料庫和資料湖,查詢並組合 EB 級結構化和半結構化資料。
  • Amazon QuickSight 是為雲端建置的可擴展、無伺服器、可嵌入、採用機器學習技術的商業智慧 (BI) 服務。使用 QuickSight,您可以輕鬆地建立和發佈包含採用機器學習技術的洞見的互動式 BI 儀表板。
  • Amazon OpenSearch Service 可輕鬆執行互動式日誌分析、即時應用程式監控、網站搜尋以及其他動作。

您可以使用下列方法與我們一起開始您的數位轉型之旅:

  • AWS 資料實驗室 – 客戶與 AWS 技術資源之間的聯合工程合作,以加速資料和分析計畫。 
  • AWS D2E 計畫 – 與 AWS 建立合作夥伴關係,使移動更快、更精確、範圍更廣。

註冊免費帳戶,或聯絡我們,以進一步了解資訊。

 

AWS 上的後續步驟

查看額外的產品相關資源
檢視免費的分析服務 
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
開始在主控台進行建置

開始在 AWS 管理主控台使用 AWS 進行建置。

登入