[點(diǎn)晴永久免費(fèi)OA]如何長時間保存重要數(shù)據(jù)?
我大學(xué)畢業(yè)時把所有資料刻錄成幾張 DVD,才幾年就發(fā)現(xiàn)讀取不了了,而我老爸讀大學(xué)時候的筆記本,幾十年后仍然保存完好。 我前幾年保存在移動硬盤里的照片,因?yàn)榘峒視r摔了一次,完全毀壞了,但是我家里小時候的相冊卻能幾十年沒有事情。 所以今天數(shù)據(jù)存儲固然比過去更加方便,但是可靠性卻大為降低。硬件壞了你還可以花錢再買,數(shù)據(jù)丟了,你就再也無力回天了。 數(shù)據(jù)對我來講是最寶貴的東西,無數(shù)血與淚的教訓(xùn)后,讓我開始深入思考,怎么樣才能讓我的數(shù)據(jù)長期安全的保存幾十年甚至終身?
光碟是最廉價最受歡迎的介質(zhì),他們本來設(shè)計(jì)壽命是 10-20 年的,而一般情況你不要指望你光盤上的東西五年后還能正常讀出來。 即便一些號稱長期保存百年以上的光盤,壽命也會由于我們各種不當(dāng)行為大大降低,比如,沒法按要求的條件保存(放桌面上被陽光暴曬變形),不小心刮花光盤,在盤面上留下指紋或者手上的油脂,這些都會促進(jìn)光盤表面化學(xué)成分變質(zhì),最終導(dǎo)致你的數(shù)據(jù)損壞。
這兩年 HDD/SSD 技術(shù)進(jìn)步很快,成本越來越低。8T 的 HDD 差不多只 1000 元人名幣的成本,1T 的 SSD 也從過去的好幾千元降價到 600 多了。HDD/SSD 都能組成陣列,用虛擬邏輯卷的形式跨越物理大小的限制,為你提供超大規(guī)模的連續(xù)存儲空間。 然而當(dāng)你想要維護(hù)更大規(guī)模的盤陣時,你基礎(chǔ)硬件設(shè)施的成本會大幅上升,4 路陣列和 8 路 16 路的成本完全不一樣。同時更新?lián)Q代快,我過去保存的幾塊 IDE/SATA 接口的硬盤,今天我已經(jīng)沒有任何可用的設(shè)備來讀取他們了。 遺憾的是,不管是 HDD 還是 SSD 他們都不能長期可靠的保存數(shù)據(jù),每年有 1% 的概率由于磁場變化造成 HDD 數(shù)據(jù)損壞,這個概率如果放到 5 年,就變成了 4.9%。 而 SSD 的壽命比 HDD 更短,同時他們還會受到溫度的影響,如果長期處在 40 度以上的工作溫度,二者的壽命都會減半。
Raid 能在你一塊硬盤損壞時照樣幫你保證數(shù)據(jù)不丟失,這也是常用方案之一,但是 Raid 就萬無一失了么?并非如此,因?yàn)橛脖P設(shè)計(jì)壽命相同,一起買來的同一個品牌的硬盤,經(jīng)常要壞就幾塊一起壞,我就試過兩塊 Raid1 在不到 24 小時的時間里先后壞掉。 同時民用電源各種不穩(wěn)定,燒電器的經(jīng)歷大家都有過吧?由于 Raid 下面幾塊盤都是接在一起,如果碰到電源問題,一個擊穿,就全部都壞掉了。
云存儲是成本最高的選項(xiàng),最便宜的百度云 1TB 的大小每年要 200 元。然而把數(shù)據(jù)交給云服務(wù)商是風(fēng)險最大的事情,百度會隨意掃描你的照片,我同事曾經(jīng)傳了個身份證掃描件到百度盤上,然后馬上刪除了,結(jié)果第二天百度盤就給他推薦「證件錢包」服務(wù)。我另外一個同事好幾 T 的視頻放在百度上,全部被替換成「凈網(wǎng)公告」: 再者網(wǎng)齡稍微長點(diǎn)的人都有共識,網(wǎng)絡(luò)服務(wù)是不可靠的,不管是過去的各種免費(fèi)空間還是幾年前的各種網(wǎng)盤,說關(guān)閉就關(guān)閉了,有的給你備份一下,有的連備份機(jī)會都沒有,一紙通知,說關(guān)就關(guān)。你很可能一段時間沒登陸網(wǎng)盤,沒留意到通知,而再登陸時就發(fā)現(xiàn)數(shù)據(jù)沒了。 所以網(wǎng)盤只適合保存一些,臨時的,非關(guān)鍵數(shù)據(jù),比如電影這些,看完一遍丟了也就丟了,而關(guān)鍵數(shù)據(jù)想要長期保存的話,網(wǎng)盤是風(fēng)險最大的地方。
U 盤或者移動硬盤的出現(xiàn)讓我們比過去方便很多,但一般 U 盤都是有擦寫壽命的,壽命往往比 HDD/SSD 更短,同時容易攜帶也就意味著容易損壞,物理損壞,或者因?yàn)樘×?,放在哪里就忘記了,「丟 U 盤」想必大家都試過。家里有小孩更是,我的幾張 SD 卡,被我兒子當(dāng)積木玩了兩天,就再也讀不出來了。 除去物理損壞外,各種使用不小心(比如頻繁插拔,忘記安全彈出),也容易造成 U 盤/移動硬盤的損害。盡管你很小心的用你的u盤,結(jié)果拿給家人搞點(diǎn)啥,幾下可能就用壞了。
各種辦法嘗試了好多年以后,我開始思考,一些國家檔案館動輒保存上百年的資料,他們是如何做到的呢?再這些過程中,物理紙張可能老化,損壞,丟失,連墨跡也都可能淡化。他們的保存方法有什么值得借鑒的地方么? 然后我花了一個多星期的時間調(diào)研傳統(tǒng)檔案管理的各種:方法,制度,原則。研究完后受到了不少啟發(fā)…… 想要長期保存數(shù)據(jù),其實(shí)是一個成本問題,你愿意花多少錢和精力來做這件事情,決定預(yù)算以后,你不能依靠某一種單獨(dú)的媒介來想著存進(jìn)去就一勞永逸,而應(yīng)該設(shè)計(jì)屬于你自己的備份流程,靠流程來保證數(shù)據(jù)安全,比如下面幾個點(diǎn)供你選擇參考: 第一:明確可靠性等級,即數(shù)據(jù)分級,核心數(shù)據(jù),重要數(shù)據(jù),普通數(shù)據(jù),可丟失數(shù)據(jù)。不同層次的數(shù)據(jù)對可靠性的要求是不一樣的,對應(yīng)的方法也不一樣。 第二:格式轉(zhuǎn)存,特別對于媒體數(shù)據(jù),有損圖片:JPG->BPG 基本能夠清晰度不變但是尺寸變?yōu)樵瓉?1/3,無損圖片:PNG->FLIF,基本又能減少一半,如果你是 BMP/TGA 等老格式,直接轉(zhuǎn)為 FLIF/BPG,馬上讓你空間縮小十倍。音視頻數(shù)據(jù)也可以用更先進(jìn)的編碼器進(jìn)行轉(zhuǎn)存,這樣你的空間占用至少能省一半出來。但是不要用一些太偏門的格式,避免幾年后沒有合適的程序讀取。 第三:使用好一點(diǎn)的介質(zhì),都是 DVD-R,便宜的有 1-2 元一張,貴的有 80-100 元一張,區(qū)別就是質(zhì)量,硬盤也分監(jiān)控盤,企業(yè)盤還是消費(fèi)盤。如果手頭不是那么緊張,盡量使用質(zhì)量好點(diǎn)的介質(zhì)來保存你的數(shù)據(jù)。 第四:定期轉(zhuǎn)存,不管放什么介質(zhì)里,都需要定期檢查,修復(fù),活動介質(zhì)可以靠一些自動腳本來轉(zhuǎn)存,非活動介質(zhì)需要手動進(jìn)行。 第五:重要數(shù)據(jù)至少存三分,熱數(shù)據(jù)(工作集),備份,備份的備份。 第六:備份方案根據(jù)數(shù)據(jù)重要度進(jìn)行區(qū)分,哪些數(shù)據(jù)只需要 Raid 備份,哪些數(shù)據(jù)除了 Raid 外,還需要定時冷備到另外一塊物理硬盤?哪些數(shù)據(jù)還需要定期刻錄光碟? 第七:盡量地理上多地冗余,即便家里地震了也可以從異地恢復(fù)出來。 第八:盡量把文件直接放在文件系統(tǒng)上面,而不是再弄一個打包文件把一堆文件打了包再存,當(dāng)介質(zhì)發(fā)生故障時,打包文件很難恢復(fù),而直接放在文件系統(tǒng)上的文件相對容易恢復(fù)一些。 該文章在 2022/8/12 8:39:00 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |