智慧財產權宣告

本站所有的內容均由本人所原創,受中華民國之智慧財產權相關法律保障。如需轉載、引用或連結,請參考這裡的說明

2008年7月15日

資料備份難在哪裡?

就在遙遠的今年年初,有位朋友留言問我有關儲存裝置好壞的問題,我答應他要寫一篇文,詳細交代相關細節。這位朋友用的是匿名,不過一看就知道是自己同學,還給我裝 fans......,看在她非常死忠支持本所的份上,當時我留言答應她寫一篇這樣的東西。那怎麼會拖到半年多呢?所長未免太會混了吧?

其實這裡面有個大秘密......不是啦!事實上我在今年的 4/23 就已經完稿了,可是為了賺稿費,所以投到 ZDNet Taiwan 去了。根據協議,得等到出刊後一日,我才能放到部落格,所以就等著他們刊登。沒想到,我其他的文太有話題性,這一篇就一直被壓著,為了稿費我也就沒辦法履行諾言。直到最近,終於被分成三天來刊登,我也終於能夠對這位同學有交代了。

雖然本文沒有按照同學期望,明說哪一種儲存媒體最好,但是文中已經很明顯的暗示了,請自行斟酌參詳,不懂就多看幾遍,正常人應該都看的懂......

(有興趣幫我衝流量的可看這裡。)

------------------進入本文的分隔線-----------------

自從數位檔案進入人們的生活後,備份就是很多人「剪不斷,理還亂」的噩夢。電腦玩個幾年的朋友,應該都會為了日益增多的檔案而煩惱。三不五時就得增加幾顆硬碟來應付,若還要備份,就得花更多錢購買各式各樣的儲存媒體。不過有些人會認為自己的設備精良,可靠度又高,資料安全不會有問題。偏偏「天有不測風雲,電腦有旦夕毀壞的可能」,等到資料救不回來再「搥心肝」是常見的戲碼!所以想讓珍貴資料(如兒女的成長照片)忠心耿耿的跟著自己,備份是一個省不得的電腦管理工作。

很多人對於備份的概念僅止於把檔案複製一份到其他儲存媒體內,等到電腦發生災難時,再把它們複製回來就好。這樣的觀點不能算錯,只是把儲存時間拉長,就會發現這樣的備份跟沒做也差不了多少。

撇開成本的因素,若希望備份能在夠長的時間內(兒女的照片和影片,起碼也得保存個一、二十年吧?)發揮備份效果,有三點是必須考量的:一、哪種儲存媒體的容量夠大,不需要裝設一大堆儲存媒體?(減少搜尋和回復的時間);二、哪種儲存媒體能保存很久且資料一定能讀出來?二、什麼樣的備份策略最為省時省力?這三點要求其實很人性,但要做到卻很困難,底下逐個來分析,了解一下到底是難在什麼地方。

首先先來看看目前常見的儲存媒體及其優劣:

1. 硬碟:主要是指傳統的機械式硬碟,包括電腦的內接和外接硬碟。硬碟最大的優勢就是容量夠大(目前已經有1TB的產品了),存取的速度快,單位容量的成本低,是目前儲存媒體的主力。不過它卻蠻脆弱的,一個不小心就會損壞內部的碟片,主因是它的機械結構不容許過大的震盪、搖晃或碰撞,尤其是運作中(雖然有些硬碟已經加入了防震設施,不過效果還是相當有限)。從各廠的保固看來,最多也只提供五年,不難想像它絕對不可能讓資料安全無虞的放個廿年。

2. NAND Flash Memory,通常以拇指碟和各種類型儲存卡的型態現身(基本上 SSD 硬碟該歸類於此,不過目前的價格還不是那麼可人,請大家暫時忘記它)。它的缺點是單位容量的成本高,優點則是存取速度快,外型輕薄容易攜帶,且蠻耐摔的(起碼不像硬碟那麼脆弱,不過這個摔,只是一般高度不小心掉到地上,不是死命用力的摔),不少廠商對這一類儲存媒體都提供終身保固,和最長只有五年保固的硬碟相比,可以肯定它的可靠性較佳。只是多數廠商所說的「終身」不是指使用者的壽命,而是拇指碟的產品生命週期(少數指的是「消費者停止使用該產品為止」,詳見各家廠商的說明),這個期間如果出了有限責任條款範圍內的硬體問題,廠商願意負責。而且各大廠計算「終身」的標準通常不是年,而是存取的次數(平均最少十萬次)。這樣到底能用幾年?我的經驗是七、八年沒問題,不過這也視個人使用習慣和存取頻率而定。

3. 光碟片:包括 CD、MO、DVD 和即將普及的藍光 DVD。不同類型的光碟片容量當然不同,從 640MB(正常尺寸的 CD)到 27G(以單層藍光 DVD 為準)都有,不過存取的速度普遍都算慢。它的最大問題是有多種因素會影響資料能否讀取。一是刮痕,光碟片上的刮痕過大,會影響雷射光的反射;二是塗料的脫落或變質都會讓雷射光無法反射(有些光碟曝曬過久或放個一、二年就無法讀取,原因就是塗料變質);三是光碟片本身不能扭曲變形或破裂;四是讀取資料的光碟機可能挑片。所以光碟片能保存多久?有些片子說可以放個十年、廿年的,但是放那麼久之後是否還能讀出來,沒人敢保證。

另外還有種儲存媒體叫磁帶,外觀像以前的錄音帶,容量隨帶子的長度而定,通常只有企業會採用。不過它的存取速度很慢,找起資料是慢的讓人發瘋。不能讀取的主因除了帶子上的磁粉會隨時間脫落之外,就是發霉,而發霉往往比磁粉脫落還早且不定期發生。

圖1:磁帶的內部,儲存的容量端視帶子的長度而定。

從以上的說明中不難發現,沒有一項產品的壽命是消費者所期望得那麼久,可靠性也不是想像的那麼高。如果真要挑選,在我的經驗裡,NANAD Flash Memory 之類的產品是比較好的選擇,如果還要加上容量和成本的因素,那麼硬碟還是目前的首選。

所以資料想要保存久一點,每隔三、五年,大概就得將備份轉移到新的儲存媒體,目前只有透過不斷的備份和轉移,才能達到長久儲存資料的目的。

好吧!就算儲存媒體的問題解決了,資料也能讀取出來,但可不代表能拿出來用(例如開啟、檢視、編輯和應用),這個才是更令人頭痛的問題。能不能拿出來用,主要的影響因素有二個,一是作業系統的變更而導致原本的應用軟體無法使用;另外就是檔案格式不被未來的電腦所支援。
作業系統的變更包括版本的更新和更換其他作業系統,更新版本方面,最常遇到的問題就是不支援舊版的應用程式,萬一備份的檔案非特定的應用軟體不可,那麼換了作業系統就等於宣判這些資料死刑,像 Windows XP 就不支援 DOS 版的程式。

至於更換其他作業系統,更可能會因為檔案系統的問題而讓備份變成白工,例如先前 Linux 還不認識 NTFS 檔案系統時,如果接上一顆以 NTFS 格式化的硬碟,裡面的檔案當然不可能能被讀出來,更別說拿來用了(即使該檔案的格式能在 Linux 底下用)。

至於檔案格式的變更,那更是家常便飯。最常見的就是商業軟體公司所推出的特定封閉格式,一旦該公司不想再支援舊格式或者銷售的軟體不再是主流,甚至是公司倒閉,都會讓使用者過去所保存的檔案變成孤兒。

那該怎麼辦?可能的話,檔案儲存時採用國際標準組織所制訂的格式且為世界所通用的會比較好。通常國際標準組織訂定的格式,都有主流大廠的參與,該種格式一定會相容於各廠的主流產品。而其他廠商或開發者,通常會基於開發成本低和推廣容易的因素而採用這些格式(畢竟自行制訂標準的成本和風險太高),因此這一類的檔案格式通用性相對較高,比較不怕找不到可用的工具。

另一個解決方案就是採用自由軟體界所推動的開放格式。開放格式的主要著眼點在於:未來要是沒有相關的應用軟體可以開啟或檢視檔案的時候,還有機會透過檢視原始碼來設法還原原貌(文字部分可以直接看到純文字內容),不過使用者也要有檢視原始碼的能力才行!

此外還有一個方法,就是每逢檔案格式世代交替的時候,適時的轉換檔案格式,不過轉換的結果很難保證,包括是否能完整保留內容和版面。(有時候這也是不得不的選擇...)

至於備份策略,個人和企業的考量會有所不同,相同的是都得先擬定備份範圍、方式、頻率和資料保存的年限等等,這些都是採購相關備份軟硬體的關鍵,也決定備份管理工作的負擔是輕是重。例如備份的範圍若僅限於自行建置的資料而不包含系統,需要的容量就可以小一些;備份的方式若選擇增量備份而不是每次全部重來一遍,備份時間自然就能省一些;備份的頻率若是每天或每週,就可採用批次的方式自動備份,減少人工處理的麻煩;資料按照影響範圍和時間而制訂保存年限,可讓管理軟體自動刪除而避免資料無限增加。

對於個人而言,多數人的考量只針對單機,所以只要按照個人的喜好和產生檔案的速度來決定備份範圍和頻率即可。設備方面,可選擇容量較大的拇指碟(4~8 GB)儲存最重要的資料,然後利用USB外接幾顆硬碟多做幾份完整備份就夠了。在軟體方面,最簡單地就是選擇具有比對功能的檔案管理軟體(如 Total Commander),如此就能輕鬆做到增量備份。若是本錢夠,也可以考慮使用簡易的 SAN(區域網路儲存裝置,和主機組成簡易區網即可)及其相關軟體,來進行資料的備份與管理工作。

要是覺得這些還不夠,或許也可以選擇網路硬碟來備份,如最近出現的 SkyDrive(這種服務很多,這裡隨便舉個例)。這種作法等於是把一份資料存放在特定廠商那邊,勉強可以說是個人的簡易異地備份。(具有機密性和個人隱私的檔案建議不要放上去比較好,因為這種服務通常是不保證資料安全的)

這種作法的著眼點在於多一種不同型式的備份就多一份安全,其次是只要能上網的地方就能存取資料,不必隨身帶著磁碟到處跑。況且國際大廠的產品,在安全性和防禦惡意程式的能力方面,理論上應該高過個人,放在這裡的資料說不定比放在自個兒身邊還安全......。當然,這種服務也有限制,例如不是每種檔案格式都能上去(避免上傳惡意程式);儲存空間也有限(免費的,就別要求太多啦!),不太可能把自己的所有東西都弄上去。

圖2:SkyDrive 的基本功能和一般網路硬碟沒什麼兩樣,不過有一項便於 Windows Live Messenger用戶 的東西,就是透過共用資料夾可以和線上的朋友分享檔案(可指定特定的人),如此要分享出遊之類的照片就簡單多了。

如果是企業,除了類似個人單機的考量之外,還得考慮在內部區域網路環境下如何做好備份,以及是否有備援系統和能不能迅速復原等。目前有不少解決方案可以選擇,例如 NAS、SAN、DAS 或 iSCSI 等,這些解決方案不但容量龐大(採用多顆硬碟),也有相關備援裝置,同時還有相關的管理軟體能夠設定各種備份方式。至於哪一種比較好,除了預算的考量之外,也得根據企業的屬性而定。

所以備份絕對不是複製一份完全相同的檔案就好,還得注意很多不容易解決的細節。考慮的越周全,資料當然越安全,不過負擔也越重,就看資料在大家心目中的份量啦!

祝大家備份愉快!

沒有留言:

張貼留言

email 圖片:http://services.nexodyne.com/email/