什麼是結構化資料?

結構化資料是具有標準化格式的資料,可讓軟體和人類有效存取。其通常為由直欄和橫列構成的表格,能夠清楚定義資料屬性。電腦可以有效處理結構化資料 (因其定量本質) 以提供深入見解。例如,包含直欄 (名稱、地址和電話號碼) 的結構化客戶資料表可以提供深入見解,像是客戶總數和附客戶人數最大值的地區。相比之下,非結構化資料 (例如社交媒體文章清單) 在分析上較具挑戰性。

結構化資料有哪些特徵?

以下是結構化資料的一些特徵和範例。

可定義的屬性

結構化資料的所有資料值都具有相同的屬性。  例如,每條預訂記錄都可以具有以下屬性:預訂名稱、活動名稱、活動日期和預訂金額。

關聯式屬性

結構化資料表具有將不同資料集連結在一起的公共值。例如,您可以使用客戶 ID預訂 ID 欄位,將客戶資料與預訂資料建立關聯。因此,您可以方便地將結構化資料存放在關聯式資料庫中。

閱讀有關關聯式資料庫的內容 »

定量資料

結構化資料非常適合數學分析。例如,您可以計算和測量屬性的頻率,並對數位資料執行數學運算。

儲存

您可以將結構化資料存放在關聯式資料庫中,並使用結構化查詢語言 (SQL) 對其進行管理。SQL 可讓您定義稱為結構描述的資料模型,您可以在該模型下為您的資料確定預設規則,例如欄位、格式和值。然後,您可以將結構化資料存放在資料倉儲,或採用其他關聯式資料庫技術。

結構化資料範例

以下是結構化資料系統的範例:

  • Excel 檔案
  • SQL 資料庫
  • 銷售點資料
  • Web 表單結果
  • 搜尋引擎最佳化 (SEO) 標籤
  • 產品目錄
  • 庫存控制
  • 預訂系統

結構化資料有哪些優勢?

使用結構化資料具有若干優勢。

易於使用

任何人都可以快速理解和存取結構化資料。更新和修改結構化資料等操作非常簡單。儲存是高效的,因為可以針對資料值配置固定長度的儲存單元。

可擴展性

結構化資料依演算法擴展。隨著資料量的增加,您可以增加儲存和處理能力。處理結構化資料的現代系統可擴展至數千 TB 的資料。 

分析

機器學習演算法可分析結構化資料,並識別商業智慧的常見模式。您可以使用結構化查詢語言 (SQL) 產生報告,以及修改和維護資料。結構化資料對於大數據分析也很有用。

結構化資料有哪些挑戰?

雖然將結構化資料用於業務有諸多優勢,但也存在一些挑戰。

用途有限

預先定義的結構是一項優勢,但也可能是一個挑戰。結構化資料只能用於其預期用途。例如,預訂資料可為您提供有關預訂系統財務和預訂受歡迎程度的資訊。但它無法透露哪些行銷活動在沒有進一步修改的情況下,更有效地帶來了更多預訂。如果您需要額外的洞察,則必須將行銷活動相關資料新增至您的預訂中。

缺乏靈活性

隨著環境的變化和新的關係或需求的出現,變更結構化資料的結構描述可能成本高昂且資源密集。

結構化資料與非結構化資料有何不同?

非結構化資料是沒有固定資料模型的資訊,或者尚未以預先定義方式排序的資料。以下是非結構化資料的常見範例:

  • 文字檔案
  • 影片檔案
  • 報告
  • 電子郵件
  • 映像

企業正在以指數級速率建立資料,而絕大多數資料 (80-90% 之間) 為非結構化資料。由於它是定性資料,因此需要不同的技術和策略才能進行有效分析。例如,您將非結構化資料存放在 NoSQL 資料庫和資料湖中。

結構化資料與非結構化資料之間存在許多關鍵差異。

易於分析

結構化資料其中一項優勢是,人員和電腦程式都能分析資訊。企業可以使用眾多工具來分析其結構化資料,這些工具擅長提供洞察和商業智慧。分析沒有預先定義資料模型的資料要困難得多,而且市場上能夠做到這一點的成熟工具要少得多。

可搜尋性

結構化資料易於搜尋,因為它遵循許多預先定義的規則。相比之下,非結構化資料缺乏使用傳統資料挖掘技術獲得業務洞察所需的順序。搜尋和分析非結構化資料需要高水準的專業知識和進階分析工具,例如自然語言處理和文字挖掘。

儲存

鑑於絕大多數資料為非結構化資料,企業需要更多資金、空間和資源來儲存。相比之下,結構化資料的儲存程序更為精簡。結構化和非結構化資料通常存放在不同的環境中,例如資料倉儲資料湖

資料倉儲

結構化資料通常存放在資料倉儲中,這可充當企業資料的中央儲存庫。資料倉儲從多個結構化來源中提取資料,包括資料庫和交易系統。其主要用於資料儲存,但也被企業用於分析資料和開發商業智慧。其還可支援數百個業務使用者的大規模資料分析。

閱讀有關資料倉儲的內容 »

資料湖

資料湖是用於存放原始非結構化資料的中央儲存庫。資料湖能夠大規模存放非結構化資料。對於每天產生大量資料的許多現代企業來說,它們是必不可少的。資料湖可存放業務應用程式的關聯式資料,以及行動應用程式、物聯網 (IoT) 裝置和社交媒體的非關聯式資料。

閱讀有關資料湖的內容 »

結構化、半結構化與非結構化資料之間有何不同?

半結構化資料介於結構化資料與非結構化資料之間。半結構化資料不能被視為完全結構化資料,因為它缺少特定的關聯式或表格資料模型。儘管如此,它確實包含可分析的中繼資料,例如標籤和其他標記。 

相較於非結構化資料,半結構化資料被認為更容易從中獲取資訊和洞察。不過,它不像結構化資料那樣具有資訊的完整性,以及對預先定義資料模型的遵守。 

以下是半結構化資料的常見範例:

  • JSON
  • XML
  • Web 檔案
  • 電子郵件
  • 壓縮檔案

AWS 如何協助處理結構化資料?

您可以使用 Amazon Relational Database Service (Amazon RDS),在幾秒鐘內設定、操作和擴展關聯式資料庫。它是受管服務的集合,可以使用 AWS Outposts 在內部部署進行管理。包含以下服務:

您可以建置 Web 和行動應用程式,移至受管資料庫,提高現有資料庫的效率,並擺脫舊式資料庫的束縛。

以下是您可以使用 Amazon RDS 執行的其他操作:

  • 無須重新架構應用程式即可遷移
  • 花更少的時間管理資料庫
  • 削減資本和營運支出
  • 專注創新

立即開始 AWS 免費試用,加入數百家使用 Amazon RDS 的企業客戶行列。

結構化資料後續步驟

查看額外的產品相關資源
檢視雲端中資料庫服務的免費優惠 
註冊免費帳戶

立即存取 AWS 免費方案。

註冊 
開始在主控台進行建置

開始在 AWS 管理主控台進行建置。

登入