什麼是資料存放區?
資料存放區是一個數位儲存庫,可儲存和保護電腦系統中的資訊。資料存放區可以是網路連線儲存、分散式雲端儲存、實體硬碟或虛擬儲存。其可儲存結構化資料 (例如資訊表) 和非結構化資料 (例如電子郵件、影像和影片)。組織會使用資料存放區來保留、共享和管理跨業務單位的資訊。
為什麼資料存放區很重要?
您可以使用資料存放區,在電腦系統中可靠地儲存資訊並防止資料遺失。電腦系統可將資訊存放在持久性儲存裝置上。持久性儲存為非揮發性,這意味著即使在裝置電源關閉之後,儲存裝置仍會保留資料。這樣可確保電腦系統再次開啟電源之後,可以存取相同的資料。
企業使用資料存放區來管理、分類和精簡資料,以進行操作、分析、報告和資料保留的,這對於合規非常重要。資料存放區有多個使用案例,例如應用程式建立和取用的資料、資料封存、資料分析和災難復原。
由於資料需求的複雜性,公司使用不同類型的資料儲存基礎設施,來提供可存取性、冗餘、治理和透明度。例如,組織使用 Amazon Elastic File System (Amazon EFS) 作為無伺服器檔案系統,使用 Amazon Simple Storage Service (Amazon S3) 作為物件儲存。
與資料存放區相關的術語有哪些?
在資料儲存的關聯內容中,幾個術語經常互換使用,但含義略有不同。以下是我們給出的一些範例。
資料庫
資料庫是一個有組織的儲存系統。大多數資料庫都以關聯式資料庫架構為基礎。關聯式資料庫管理系統 (RDBMS) 可讓使用者將資料存放在與特定資料點關聯的資料表中。組織使用資料庫來存放交易資料,例如會計、銷售和管理日誌。
資料存放區與資料庫的比較
關於資料存放區的討論涉及存放和擷取資訊的不同方法。資料庫是一種可讓應用程式輕鬆存放、共用和擷取資料的方法。與檔案系統不同,資料庫遵循關於資料在資料庫中如何整理、格式化和存放的特定規則。
資料倉儲
資料倉儲是從各種來源獲取業務相關資訊的廣泛集合。公司使用資料倉儲來支援商業智慧和各種分析。業務分析師和資料科學家從資料倉儲中獲得可行的洞察。
資料存放區與資料倉儲的比較
資料存放區是一個總稱,包括用於存放和擷取資訊的不同硬體、技術、格式和架構。資料倉儲是一種特定類型的資料存放區,用於整合企業的分析資料。例如,GE Renewable Energy 使用 AWS Redshift 獲取對其所收集資料的新洞察。
資料存放區如何運作?
實體資料儲存是資料存放區背後的底層技術。您能夠以檔案、表格或區塊等特定格式,在裝置讀取和寫入資訊。該裝置可以在本機、遠端或雲端。大型資料存放區通常分佈在不同地理位置的多個實體裝置上。軟體系統和服務可抽象化資料存放區的底層操作。
我們在下面給出了一些實體裝置的範例。不同類型的資料儲存裝置可提供不同程度的安全性和冗餘。
快閃和固態硬碟 (SSD)
固態硬碟 (SSD) 是一種半導體技術,可在快閃晶片中寫入和讀取資料。在成為硬碟 (HDD) 的替代品之前,快閃儲存技術已在筆式硬碟中商用。相較於 HDD,實體 SSD 沒有活動部件,這意味著它具有更快的效能和更長的使用壽命。
混合儲存陣列
混合儲存陣列是一種實體儲存設定,由 SSD 和 HDD 組成。雖然 SSD 提供低延遲操作,但其單位儲存成本比 HDD 高得多。因此,組織使用混合儲存陣列來平衡效能、容量和成本。
RAID
RAID 是指獨立磁碟的冗餘陣列。它是一種將相同的資料保存在 SSD 上多個位置的技術。
資料儲存有哪些不同的格式?
資料儲存旨在處理和整理不同格式的資料。
檔案儲存
檔案儲存可在檔案和資料夾自上而下的階層中整理存放的資訊。電腦使用檔案儲存,讓使用者能夠輕鬆地存放、搜尋和擷取資訊。您可以使用檔案儲存系統,存放和整理幾乎任何類型的資料。雖然檔案儲存易於使用,但由於其緊密連接的架構,很難橫向擴展。
區塊儲存
區塊儲存將資料分成多個大小均勻的區段,稱為區塊。區塊儲存系統可將不同的資料區塊存放在不同的實體裝置上。當使用者請求特定資料時,它將擷取並重新組合這些片段。它使用映射系統,根據區塊中繼資料來定位請求的資料。中繼資料是協助使用者或應用程式,在儲存中尋找特定資訊的附加資訊。
物件儲存
物件儲存將非結構化資料存放在可擴展、獨立式儲存庫中,該儲存庫可託管在不同的伺服器上。屬於物件的每個資料區塊都在其中繼資料中進行描述。例如,物件可存放社交媒體內容、影片、電子郵件和音訊檔案。應用程式使用特定的中繼資料屬性 (例如影片解析度、持續時間和位置),以在物件儲存中搜尋資訊。
資料儲存有哪些不同的類型?
資料存放區有幾種不同的類型,每種都具有獨特的設定和特性。
直連式儲存
直連式儲存 (DAS) 由實體連接至電腦的儲存裝置組成。例如,DAS 設定將硬碟、光碟或快閃磁碟機連接至電腦。在 DAS 上建立備份複本相當簡單,但與其他電腦共用資料則很困難。
網路附接儲存
網路附接儲存裝置 (NAS) 是一種檔案專用儲存裝置,能讓應用程式和使用者透過網路持續存取檔案,進而更有效率的協作。NAS 裝置是一種特定的伺服器,僅負責資料儲存和檔案共用。這類裝置可提供私有網路快速、安全且可靠的儲存服務。
儲存區域網路
儲存區域網路 (SAN) 是一種高速資料儲存基礎設施,其使用不同類型的儲存媒體和協定。企業使用 SAN 可輕鬆且經濟地擴展區塊儲存。SAN 使用儲存虛擬化,向多個裝置隱藏基礎設施的複雜性。
雲端儲存
雲端儲存是由雲端服務供應商託管和管理的分散式儲存基礎設施。相較於內部部署儲存,它更具可擴展性、靈活性和雲端存取性。例如,使用者可連線至 AWS 雲端儲存服務,前提是具有網際網路連線並且獲准存取資料。此外,雲端儲存還具有成本效益,因為使用者只需為使用的容量付費。
混合雲端儲存
混合雲端儲存允許公司在內部部署和雲端儲存服務之間分隔資料。混合雲端儲存可協助公司從舊式架構,遷移至成本更低、更安全的雲端環境。
AWS 如何協助滿足您的資料存放需求?
AWS 提供幾十種雲端儲存服務,來滿足您的資料儲存需求。此外,您可以選擇在 Amazon Elastic Compute Cloud (Amazon EC2) 執行個體上託管任何您想要儲存的內容。若要選擇最適合您需求的 AWS 雲端儲存服務,您需要:
- 將您的系統劃分為工作負載。
- 識別最適合特定工作負載的資料儲存機制,而不是整個系統的單一資料存放區。
- 透過將成本和效能進一步最佳化,尋找最適合您的資料存放區服務。
例如,Amazon Relational Database Service (Amazon RDS) 是希望設定和擴展關聯式資料庫的組織的熱門選擇。它為應用程式提供高可用性雲端資料存放區,用於存放持久性操作資料。Amazon RDS 提供一種自我管理的資料庫佈建解決方案,可將開發人員從繁瑣的儲存基礎設施設定中解放出來。
立即註冊 AWS 帳戶,開始使用 AWS 上的資料存放區。