重復(fù)數(shù)據(jù)刪除技術(shù)明顯是對磁盤對磁盤備份技術(shù)的挑戰(zhàn)。上千的公司已給其備份環(huán)境實施了某種形式的重復(fù)數(shù)據(jù)刪除技術(shù),并感到運行良好。重復(fù)數(shù)據(jù)刪除技 術(shù)可實現(xiàn)動態(tài)數(shù)據(jù)精簡,使公司實現(xiàn)在一個小型磁盤上保留備份數(shù)據(jù)的多個連續(xù)復(fù)本。隨著越來越多的完整備份數(shù)據(jù)被發(fā)送到系統(tǒng),精簡比例進一步優(yōu)化,這些復(fù)本 已可支持磁盤數(shù)據(jù)恢復(fù)。一個重復(fù)數(shù)據(jù)刪除系統(tǒng)(通常是一個設(shè)備或用途導(dǎo)向的存儲陣列)事實上僅僅是將磁帶庫擴容。其可提供時長為幾周的備份數(shù)據(jù)on- site復(fù)本,也有的可延長到幾個月,但是更長時間的則無法實現(xiàn)。
但是在實現(xiàn)了大部分的數(shù)據(jù)恢復(fù)需求之后,這些舊備份數(shù)據(jù)該用來做什么呢?
1,將其恢復(fù),轉(zhuǎn)移到冗余文件夾中,再將那些數(shù)據(jù)集轉(zhuǎn)移到正式的檔案文件中嗎?
2,把這些數(shù)據(jù)刪除?因為這些文件已經(jīng)完成了最初的使命——支持幾周或幾個月的數(shù)據(jù)恢復(fù)。
3,或者是,將這些數(shù)據(jù)保留?
對于大多數(shù)企業(yè),答案是將這些數(shù)據(jù)保留,采用備份系統(tǒng)來管理一個檔案文件。盡管重復(fù)數(shù)據(jù)刪除技術(shù)使這種處理方式很具吸引力,采用備份系統(tǒng)長期存 儲數(shù)據(jù)存在如下缺點:數(shù)據(jù)安全、數(shù)據(jù)恢復(fù)和數(shù)據(jù)銷毀問題。
我們真正需要的是一個關(guān)注歸檔(archive-focused)的存儲系統(tǒng),比如那些來自Permabit,仍可以壓縮或復(fù)制數(shù)據(jù),但是也可 保留長期數(shù)據(jù)。備份和重復(fù)刪除的數(shù)據(jù)不提供數(shù)據(jù)加密,其未被鎖定以確保數(shù)據(jù)未經(jīng)更改,數(shù)據(jù)無法通過文件或EMAIL的恢復(fù)來讀取,也無法在必要時被銷毀。
加密
必須對數(shù)據(jù)加以安全防護,這意味著應(yīng)避免不必要的或無意識的數(shù)據(jù)存取。這通常意味著必須對數(shù)據(jù)加密。但重復(fù)數(shù)據(jù)無法加密,除非存儲器平臺將其整 合,這是因為分別加密確立了數(shù)據(jù)的唯一性,而唯一的無復(fù)本數(shù)據(jù)則不存在需要去除的重復(fù)數(shù)據(jù)。因此永久保存的備份數(shù)據(jù)是不能加密。
鎖定
除了給數(shù)據(jù)提供避免意外刪除或毀壞的保護,還有其他需要關(guān)注的問題。因為有調(diào)整和從規(guī)的需求,當前,IT管理人員必須使數(shù)據(jù)可用于法律發(fā)現(xiàn)。這 意味著數(shù)據(jù)可用于支持一個未了訴訟。但法律也需要確保這一數(shù)據(jù)在用于支持某一未了訴訟(例如監(jiān)管鏈)前未經(jīng)更改。驗證監(jiān)管鏈未經(jīng)更改的唯一方法是:將數(shù)據(jù) 轉(zhuǎn)移到一個WORM數(shù)據(jù)流中。不幸的是,大多數(shù)重復(fù)數(shù)據(jù)備份系統(tǒng)也不提供WORM功能。
恢復(fù)
正如上面提到的,數(shù)據(jù)存儲的新需求是構(gòu)造特定數(shù)據(jù)以響應(yīng)法律發(fā)現(xiàn)行為。存儲系統(tǒng)必須恢復(fù)指定時段內(nèi)任何有問題的文件;否則就要交罰金。其次,歷 史數(shù)據(jù)應(yīng)該可用于業(yè)務(wù)領(lǐng)域(例如趨勢分析和客戶預(yù)測程序),實現(xiàn)業(yè)務(wù)收益最優(yōu)化。同樣,數(shù)據(jù)歸檔之后,以前的一個項目或許需要重啟或重新研究。關(guān)鍵在于, 如果數(shù)據(jù)值得在最初就保留,則其應(yīng)該是可讀取并便于訪問的,而且不是備份軟件的專有格式(在未來的幾年中會發(fā)生改變)。
因為備份系統(tǒng)的目的是改進備份有效性,配置了重復(fù)數(shù)據(jù)刪除技術(shù)的備份系統(tǒng)將所有備份工作存儲在一起,通常是上千或幾十萬的文件,同時每一次恢復(fù) 都必須對所需文件進行重建。這與磁盤檔案(單一終端用戶訪問共享文件和復(fù)制其所需的文件不同)的功能不同。從管理員的角度看,采用備份系統(tǒng)進行長期存儲的 結(jié)果是搜索所需文件需要額外時間(從冗繁的文件中找出相關(guān)文件)。
現(xiàn)在的組織中,郵件系統(tǒng)事實上是一個歸檔系統(tǒng)。在資源不確定的情況下,由于郵件系統(tǒng)是按時間順序排列,因此被用于進行數(shù)據(jù)查詢。一些人甚至采用 郵件來存儲附件,這樣就不需要將其復(fù)制到共享文件中。當考慮到采用一個有重復(fù)數(shù)據(jù)刪除功能的備份系統(tǒng)來長期存儲郵件時,存取和恢復(fù)成為問題的關(guān)鍵。
由于郵件系統(tǒng)是一個大型數(shù)據(jù)庫,因此備份系統(tǒng)威脅著郵件系統(tǒng)(以Exchange為例)。將每一信息都作為獨立記錄進行存儲,并將指示器引到現(xiàn) 有的文件附件。其備份過程類似數(shù)據(jù)庫,但是存儲的數(shù)據(jù)信息量更大。進行消息級(Message-level)存儲需要一個特殊的模塊,并且還需要進行一個 更慢的備份過程,以將數(shù)據(jù)準備好進行小顆粒精確恢復(fù)。
實現(xiàn)數(shù)據(jù)使用最優(yōu)化、減少備份循環(huán)的方法是實施郵件歸檔解決方案。這一解決方案用于發(fā)送獨立文件類型檔案中的信息和附件。如果配置了 Permabit Enterprise Archive或類似的檔案級解決方案,歸檔系統(tǒng)就成為了保存信息的唯一倉庫。這樣不僅效率提高,而且實現(xiàn)了對保留數(shù)據(jù)的管理。
銷毀
采用備份系統(tǒng)管理歸檔系統(tǒng)帶來了另一問題。實現(xiàn)一個數(shù)據(jù)集的從規(guī)和法律審慎意味著不僅僅要給法庭提供文件,也意味著可訪問文件的所有復(fù)本,這樣 他們即可適時銷毀文件。必須確保需要銷毀的文件已完全銷毀——文件及其復(fù)本均已徹底銷毀。
運行重復(fù)數(shù)據(jù)刪除技術(shù)的備份系統(tǒng)會有很多備份文件復(fù)本。而這些文件或許僅物理存在于一個位置。但由于文件是初次保存,因此仍在虛擬擴展到很多備 份中。眾多的冗余文件、虛擬復(fù)本,這使得重復(fù)數(shù)據(jù)刪除率在最初驚人地高。為了確保所有復(fù)本均已銷毀,每一項備份工作(以及工作涉及的文件)都必須在文件銷 毀之前找到,并全部銷毀。
采用備份結(jié)構(gòu)進行長期存儲出現(xiàn)的另一個問題是隔離。由于備份任務(wù)都是整體寫入存儲系統(tǒng),需要刪除的候選文件必須從備份任務(wù)的整體中隔離出來。這 意味著必須將備份任務(wù)恢復(fù),之后才能刪除文件。一旦文件被刪除,必須將備份任務(wù)另存,以保存剩余文件。這是一個復(fù)雜的程序,
總結(jié):
備份軟件最初的設(shè)計目的是進行數(shù)據(jù)備份,其次是進行數(shù)據(jù)恢復(fù)。備份系統(tǒng)假定數(shù)據(jù)是可存取、可更改的,并且不用于長期管理這些數(shù)據(jù)集合。當重復(fù)數(shù) 據(jù)刪除技術(shù)(數(shù)據(jù)被長期存儲)被用于備份系統(tǒng),就帶來了一些問題。
在這些系統(tǒng)里,當數(shù)據(jù)老化移出或越過了其更改、恢復(fù)的界限,則應(yīng)該在其成為候選刪除文件之前從備份系統(tǒng)中移出。對于已不屬于備份循環(huán)系統(tǒng)的數(shù) 據(jù),應(yīng)將其存儲在用途導(dǎo)向的歸檔存儲系統(tǒng)(采用軟件來長期管理應(yīng)用軟件和多代技術(shù)的數(shù)據(jù)集)。這些系統(tǒng)可提供長期存儲所需的三種技術(shù):數(shù)據(jù)安全,數(shù)據(jù)存取 和數(shù)據(jù)銷毀。