極限儲存方案讓1T空間儲存100T資料

2021-12-20 23:40:27 字數 1137 閱讀 4857

下面將介紹一種海量資料的儲存方案,在適當的場合下使用該方案,可以大大節約儲存空間。

舉個最簡單的例子,比如有一張表,它有4個字段: 使用者註冊日期, 編號,姓名,位址

該錶5月1日的記錄如下:當我們全量同步這張表的時候,則5月1日的分割槽中存在8條記錄

該錶5月2日的記錄如下:當我們全量同步這張表的時候,則5月2日的分割槽中存在10條記錄

該錶5月3日的記錄如下:當我們全量同步這張表的時候,則5月3日的分割槽中存在12條記錄

資料倉儲中的資料,存放的是反應歷史變化情況的快照資料,一般一旦資料進入資料倉儲,都會保留相當長的一段時間。因此當一些大表,而且每天增長量又相當大的情況下,傳統的儲存方式就會占用相當大的儲存空間。(我們不能只保留最近乙份全量資料,把之前的都刪除,這樣就不能反應歷史情況了。

)就比如上面這個例子中,5月1號的資料存放了8條記錄;5月2號的資料存放了10條記錄,5月3號的資料,存放了12條記錄,而且隨著時間的推移,每天的全量資料將不斷的增加。

為了解決這個儲存問題,於是就引發了乙個思考:如何才能節約儲存空間,而又能反應資料的歷史情況?

我們看一下上面3天的記錄數,其實一共就是從編號001到012的12個人的記錄,其中張三和王五因為搬家變更了一次位址。如果我們給記錄加上乙個生命期的概念,那麼就能達到既節約儲存空間,又能反應資料歷史變化情況的效果了。

如上圖,如果將資料儲存成以上形式。那麼總記錄條數減少到了14條。

而真實的表,欄位要遠遠比上面例子中的多,每天的記錄也遠遠比例子中的多,所以使用該儲存優化方案帶來的效果將非常明顯。

如果要查詢5月2號分割槽的資料,sql也非常容易寫:

select * from table where begin_date<=』2011-05-02』 and end_date>=』2011-05-02』;

重複儲存是最大的浪費,極限儲存方案就是為了解決因為重複儲存造成儲存空間浪費的問題的。

極限儲存的適用場景:

針對很大很大的表

業務上不允許刪除歷史快照資訊。

表的資料變化較小(表資料肯定是有變化的,但是表的資料相對比較穩定,不變的資料較多),如使用者表,商品表,成交表,訂單表等等等等。

極限儲存的乙個總體思想就是通過給表記錄設定生命週期的方式,減少重複儲存的那些記錄。所以當滿足以上場景的情況下,表越大,極限儲存帶來的效果越是明顯。

挑戰高分極限1 解答題

高中數學挑戰高分極限 上篇解答題 第1章 函式 第1節 函式的性質 函式綜合題通常是指函式的定義域 對應法則 可以是解析式 也可以是影象或 單調性 奇偶性 週期性等內容的綜合考查。涉及到的具體函式主要有正比例函式 反比例函式 一次函式 二次函式 冪函式 指數函式 對數函式 三角函式以及它們的和函式與...

儲存測試方案

netapp netapp fas2200 全新的 fas2220 和 fas2240 提供了功能更加強大的系統,可以適合任何預算 netapp 虛擬儲存分層可提高效能和效率 能夠騰出資源 時間和資金 能夠靈活滿足不斷增長的業務需求 專注於您的業務而非技術 採用功能更為強大的新 system man...

EMC Iomega網路儲存讓檔案共享及管理更容易

關鍵詞 emc 艾美加儲存雲中小企業 摘要 iomega 艾美加 nas是基於區域網或廣域網的儲存裝置,取代以前的u盤 行動硬碟及郵件傳輸方式,成為新一代儲存解決方案承載者,提供更安全 功能更強大的儲存解決方案。emc iomega網路儲存讓檔案共享及管理更容易 雖然u盤和可攜式行動硬碟攜帶方便,且...