菲尼克斯 不論是基於企業自身的利益考量或是因應政府法規遵循的要求,近年來企業對於長期保存資料的需求越來越高。 但究竟要使用哪種方式來長期保存資料?資料備份 (data backup) 和資料歸檔 (data archive) 究竟有何差別?可以用備份出來的資料做為長期保存之用嗎?有很多的企業用戶經常都被這兩種企業儲存技術所搞混,也無法說出備份和歸檔之間的差別。 在開始討論備份和歸檔的區別之前,我們應該先說明一下「備份」和「歸檔」這兩個詞彙一些普遍被接受的定義;在此筆者使用「普遍被接受」這個用語,是因為在資訊技術上,很多用詞是沒有絕對的。 資料備份,指的是一份原始資料的複製,它是用來做為資料保護的手段之一,當原始資料因為某種原因遺失或損毀時,備份的資料可以拿來做為資料復原之用;所以資料備份的目的是為了災難復原。 資料歸檔,指的是對一些已經不再、或者是很少被存取的資料,把它從原始的儲存位置移出到其他成本較低的儲存上,並且釋放出原有的儲存空間;所以資料歸檔的目的是為了資料的長期保存以為未來參考之用。 從以上的定義看來,資料備份和資料歸檔因為目的不同而使得這兩種儲存技術存在著根本上的差異。 首先,傳統上備份會以循序的方式把資料「拷貝」到循序存取的媒體,如磁帶上,雖然現在幾乎絕大部份的備份軟體都已經支援使用磁碟儲存做為備份目的,不過,備份軟體依然是以循序的方式寫出資料,這是為了確保不論使用磁碟或磁帶為目的,資料有一致的輸出格式。
而歸檔則是把原始資料「移置」到較低層級的儲存,同時為了加快資料未來提取時的速度,歸檔軟體會以不同於純粹循序的方式來存放資料,並且記錄每一個被歸檔物件的中介資料 (Metadata)。 其次,備份通常會有許多份不同時點、不同等級的資料拷貝來保護資料,因此當要復原一份原始資料時,必須要擁有不同版本的資料拷貝,例如可能要使用最近的一個全備份資料,再加上數個週備份與日備份的資料,才能完成資料的復原。而歸檔是資料儲存位置的移轉,因此在系統中該份(或是為了安全考量而有二至三份的)資料拷貝,是某一時點的完整資料。 第三,備份保護的層級是「檔案」,備份軟體會針對檔案本身的變動狀況來複製資料的內容,以為回復之用,通常這樣的資料複製是以「每日一次」的方式來執行的。歸檔的標的則各有不同,例如,針對電子郵件附件的歸檔系統會即時監控郵件伺服器,並依據事先設定的規則將郵件的附件「移置」到歸檔儲存中,並且在原始的郵件中留下一個指標,指引郵件伺服器到歸檔儲存中去提取資料。
最後,傳統的備份軟體只會有對於備份規則,備份工作和資料映像的關鍵字搜尋功能。而歸檔軟體應該要提供檔案內容、類別或擁有者等條件的檢索搜尋能力。 因此,備份資料並不適合做為歸檔使用。 舉個例子,如果使用者跟你說他想要七年前的一個日期某一封電子郵件裡的附件。首先你得要有七年前的備份資料,通常備份策略不會要求保留這麼長的時間。其次,你要有足夠的磁碟儲存空間來暫存這些回復的資料。
第三,你要決定用哪些備份來回存資料,是要用當年稍晚於該日期的全備份?還是用稍早於該日期的全備份,再加上必要的差異量備份? 不論最終你決定使用哪一個方法,都可以明確的瞭解傳統的備份方式並不適用於資料歸檔。 隨著儲存技術的演進和使用者需求的改變,備份和歸檔這兩者的界限越來越不明顯,也有更多的備份軟體宣稱同時具有資料歸檔的能力。資料去重複化 (Data Deduplication) 和內容定址儲存 (Content Addressable Storage) 等技術,幫助歸檔作業在維護「單一資料」(Single instance) 上更方便也更安全。 不過,企業用戶仍然必須瞭解資料備份和資料歸檔兩者的不同點,才能避免錯用功能與浪費儲存空間,並且確保在需要時可以及時的獲得資料。請記住:備份是為了短期的資料保護、復原之用,歸檔是則為了長期的資料保存參考用。 (全篇完)
本文摘錄自 企業儲存觀察室 http://www.zdnet.com.tw/enterprise/column/phoenix/0,2003032776,20144803-1,00.htm