你看啊,數(shù)據就像水一樣,可以奔流不息,也可以寧靜安閑,可以熱情活躍,也可以冷若冰霜,可以飄于云端,也可以降下“暴雨”(如果沒做好防范,就會出現(xiàn)災 難)。水常常自發(fā)尋求相應的地勢空間注入,數(shù)據也會在硬盤上尋求填充空間。水會順流而下,沿途支流不斷匯集壯大,最后百川歸海。同樣地,數(shù)據流也會源源不 斷注入數(shù)據池(或叫存儲池)、數(shù)據湖,于是有了信息海洋。對了,數(shù)據和水都可以存放在桶或容器里方便攜帶,只是此“桶”非彼“桶”,此“容器”非彼“容 器”。
動態(tài)時 熱情奔放
靜態(tài)時 冷寂寧靜
學過地理的都知道,自然界里的水在順流而下時,上游淤積物也跟著沖刷下來,為保證水質,就得人為進行過濾。這就好比數(shù)據在源源不斷存入的同時,為保證高可用以及業(yè)務連續(xù)性,就得考慮做備份保護,以應對來自物理層面或邏輯層面的各種安全威脅。
當然,只保證水質是遠遠不夠的。對于水資源的管理、開發(fā)和利用還可以做得更多。我們可以建造高低不一的設施來控制水流,比如水壩,可以關閘蓄水防洪,也可以 開閘放水發(fā)電。同樣地,我們可以采用不同的管理軟件來管理數(shù)據。要實現(xiàn)數(shù)據中心里的“水資源”的貯存和管理,我們得采用很多不同的技術。數(shù)據中心包括服務 器、存儲、網絡以及各種管理組件,針對不同層次的“水資源”,得相應采取不同技術來應對。
水壩<.……>數(shù)據中心
要實現(xiàn)數(shù)據的有效管理,如果只是一味阻止更多數(shù)據的產生和存儲是行不通的。還是先看看更高效的科學用水方法吧:循環(huán)利用、優(yōu)化用水習慣、節(jié)約現(xiàn)有水資源同時 尋找新水源。由此可見,要實現(xiàn)數(shù)據存儲性能優(yōu)化,比起阻止更多數(shù)據的產生和存儲,更應該積極尋找新方法減少諸如“數(shù)據腳印”(data footprint)的影響。
支幾招實現(xiàn) DFR(data footprint reduction,減少數(shù)據腳印)的思路:
1存檔:包括活躍數(shù)據和非活躍數(shù)據
2備份及數(shù)據保護:例如重新考量數(shù)據是否保留、數(shù)據使用頻率、全部備份還是部分備份
3清理、壓縮和碎片整理
4重復數(shù)據刪除及某些數(shù)據管理(清理、刪除)
5存儲分層,精簡配置,節(jié)約空間快照
6RAID,復制及糾刪碼等技術配置的再訪問
如今企業(yè)用戶越來越注意到“水”里暗藏的“能量”或“礦物質”的價值,當海量數(shù)據不斷被收集、存儲、分析,他們對不同的“海水”里到底會挖掘出什么滿心期待。
我想關于水和數(shù)據之間的關聯(lián)一定還有很多。既然對水資源的管理、保護、存儲和利用從古到今就是人類文明的大課題,自然也積累了很多寶貴經驗,如能從中借鑒啟發(fā),打開新時代數(shù)據存儲的新思路,未嘗不是一種新視角。