SAN環(huán)境下數據備份和遠程容災技術(shù)研究論文
摘 要:針對目前的備份技術(shù)存在的問(wèn)題,提出將多種數據備份技術(shù)、備份技術(shù)和容災技術(shù)相互結合運用于數據保護中。通過(guò)多種備份技術(shù)的結合運用,可以達到減小數據備份窗口、縮短備份數據恢復時(shí)間的目的。通過(guò)把容災技術(shù)和快照技術(shù)的結合運用,可以最大程度地避免用戶(hù)的物理錯誤和邏輯錯誤。
關(guān)鍵詞:SAN;LAN-Free;快照;備份技術(shù);容災技術(shù)
中圖分類(lèi)號:TP309 文獻標識碼:A 文章編號:
1.引言
近年來(lái),數據已經(jīng)成為企業(yè)內IT系統架構的核心和關(guān)鍵。一方面,數據的存儲架構必須滿(mǎn)足海量數據存儲發(fā)展的要求,以SAN(Storage Area Network)為代表的存儲結構已經(jīng)成為主流的存儲架構。另一方面,客戶(hù)對數據的安全性提出了更高的要求,因此數據備份技術(shù)和容災技術(shù)已經(jīng)成為數據保護的主要手段和方法。 一般將備份技術(shù)應用在對本地數據的保護上,而對于數據和應用的異地保護,通常使用容災技術(shù)。實(shí)際上這兩種技術(shù)不是彼此矛盾的,完全可以通過(guò)備份、容災結合系統實(shí)現兩種技術(shù)的完美結合。本文通過(guò)設計BADR(Backup & Disaster Recovery)系統,實(shí)現容災技術(shù)和備份技術(shù)的完美結合。
2.系統概述
本系統主要考慮數據的安全性和完整性,同時(shí)結合備份技術(shù)和容災軟件而設計。由于這套系統既有備份的功能,又有容災的功能,故將這套系統定義為BADR系統。
BADR系統從功能上說(shuō)有兩部分組成,一部分是系統備份,通過(guò)設計備份策略、編寫(xiě)備份腳本程序,實(shí)現數據的本地備份和異地備份。備份策略主要包括數據庫的全備份和增量備份。通過(guò)備份腳本,確保離線(xiàn)的數據保存在磁帶機中。該系統的另外一部分是容災功能,可以在本地生成生產(chǎn)卷的快照(或克。,通過(guò)編寫(xiě)的同步腳本實(shí)現快照(或克。⿵谋镜氐疆惖氐膫鬏。BADR系統既可以保護一段時(shí)間內的數據,又可以保護某一個(gè)時(shí)間點(diǎn)的數據。BADR系統的示意圖如圖1所示。
圖1 BADR系統拓撲圖
BADR系統邏輯層次上從低到高依次為存儲層、基于存儲的軟件、光纖交換層、主機卷管理器層、數據層和應用層。下面依次說(shuō)明各層實(shí)現的功能。
存儲層:由兩個(gè)磁盤(pán)陣列系統組成,存儲層存放系統的核心數據,是整個(gè)系統的基礎;
基于存儲的軟件:這一層由多個(gè)內嵌存儲的軟件構成,其中包括生成快照和克隆的軟件;
光纖交換層:由光纖交換機、主機HBA卡等組成,這層主要擔任數據的傳輸的任務(wù);
主機卷管理器:這層負責組織、管理主機硬盤(pán)的容量空間;
數據層:主要存放所有數據,包括數據庫的數據,操作系統的數據;
應用層:在本系統中主要指主機端運行的數據庫,
系統由SAN網(wǎng)絡(luò )、以太網(wǎng)絡(luò )組成。SAN網(wǎng)絡(luò )由磁盤(pán)陣列系統、磁帶庫和兩臺光纖交換機組成。把兩臺磁盤(pán)陣列系統稱(chēng)為磁盤(pán)陣列A和磁盤(pán)陣列B,磁盤(pán)陣列A作為本地設備,磁盤(pán)陣列B和磁帶庫作為異地設備。在系統中把磁盤(pán)陣列A稱(chēng)為生產(chǎn)端,把磁盤(pán)陣列B稱(chēng)為備份端。在以太網(wǎng)絡(luò )上,連接多臺服務(wù)器(包括Window服務(wù)器、Unix服務(wù)器)。在備份客戶(hù)端安裝數據庫,數據庫的容量達到200G。這些服務(wù)器充當生產(chǎn)主機和備份客戶(hù)端。
在磁盤(pán)陣列上安裝快照軟件和容災軟件,由快照軟件生成生產(chǎn)卷的快照,由容災軟件完成在兩臺磁盤(pán)存儲設備之間卷級別的數據復制。兩端數據的一致性通過(guò)卷級別的數據復制得到了保證。磁帶庫連接到SAN網(wǎng)絡(luò ),用來(lái)備份在磁盤(pán)陣列生成的快照。在備份服務(wù)器安裝備份軟件的服務(wù)器端,通過(guò)備份服務(wù)器端管理所有的備份作業(yè)和磁帶庫。
系統的主要實(shí)現通過(guò)磁盤(pán)快照技術(shù)、SAN備份技術(shù)和容災技術(shù)。系統完成的主要功能有:
。1)通過(guò)備份軟件對服務(wù)器運行的'數據庫做全備份,將該全備份集備份到磁帶機上;對數據庫在盤(pán)陣上的數據源Lun做快照,然后使用備份軟件將快照備份到磁帶機上。
計算并對比兩種方法的時(shí)間。為了驗證備份的完整性,分別測試將磁帶機上數據庫的全備份和快照Restore到原數據庫,測算兩種方法所用的時(shí)間。
。2)通過(guò)利用容災軟件,將磁盤(pán)陣列A的快照鏡像到磁盤(pán)陣列B中。通過(guò)將該Lun綁定到主機端,來(lái)確認兩端數據的完整性。
。3)使用容災軟件,將磁盤(pán)陣列A的生產(chǎn)卷的克隆鏡像到磁盤(pán)陣列B中。通過(guò)將該Lun綁定到主機端,來(lái)確認兩端數據的完整性。
3. BADR系統的模塊設計
BDAR系統由三個(gè)模塊組成,即:快照備份模塊、鏡像快照模塊和鏡像克隆模塊。
快照備份模塊實(shí)現兩種備份技術(shù)的組合應用。首先使用基于LAN-Free的磁帶備份技術(shù)對客戶(hù)端的數據庫作全備份,隨后使用磁帶機上的全備份集對數據庫做Restore;第二組中先對數據庫的數據源Lun做快照,然后利用LAN-Free備份技術(shù)將該快照備份到磁帶庫中,隨后Restore該快照到生產(chǎn)機上運行的數據庫中,使用數據庫的回滾功能(Rollback)恢復數據庫到某個(gè)時(shí)間點(diǎn)。
鏡像快照模塊實(shí)現容災技術(shù)和快照技術(shù)的結合應用。在磁盤(pán)陣列A端對某個(gè)被鏡像的Lun做的快照,可以通過(guò)容災軟件鏡像到磁盤(pán)陣列B端。這樣就保存了源端的Lun的某個(gè)狀態(tài)。當然也可以使用LAN-Free技術(shù)把這個(gè)快照備份到磁帶機上?煺站哂袛祿啃〉奶攸c(diǎn),一般快照只有源卷的20%大小,這樣通過(guò)容災軟件傳送的話(huà),傳送的數據量不大。本地模擬環(huán)境下傳送20M的快照數據用時(shí)大約5分鐘。在數據被容災軟件復制到異地后,通過(guò)備份軟件備份該快照的鏡像到磁帶機。容災軟件具有反向同步功能,即把原來(lái)的備份端提升為生產(chǎn)端,從新的生產(chǎn)端向原來(lái)的生產(chǎn)端實(shí)時(shí)復制。當生產(chǎn)端出現故障后,可以先把快照使用Lan-free技術(shù)恢復到備份端盤(pán)陣,再使用容災軟件復制回生產(chǎn)端。這種數據保護方式的最大好處是在在生產(chǎn)端出現故障時(shí),由于有生產(chǎn)端的快照存放在異地,可以使用這個(gè)快照恢復生產(chǎn)端數據到生成快照的時(shí)間點(diǎn)?煺毡蝗轂能浖R像,也可以對該鏡像進(jìn)行備份。這樣做帶來(lái)的好處是備份過(guò)的快照又完全可以恢復到磁盤(pán)陣列B上,通過(guò)容災軟件還可以還原回生產(chǎn)端,也就是磁盤(pán)陣列A上。
鏡像克隆模塊將生產(chǎn)卷的克隆通過(guò)容災軟件鏡像到備份端,然后再通過(guò)備份軟件備份到磁帶機上。這種技術(shù)是對生產(chǎn)卷的整個(gè)卷做了實(shí)時(shí)復制。由于克隆數據量要遠大于快照,所以傳送耗時(shí)要長(cháng)。此外,克隆所需的空間是和源卷一樣大小。容災軟件可以進(jìn)行增量拷貝,就是把數據的改變量也同步到備份端的盤(pán)陣空間上。這樣通過(guò)容災技術(shù),在備份端的磁盤(pán)空間總是保存最新的生產(chǎn)端數據卷狀態(tài)。
如果空間允許,可以保留生產(chǎn)卷的兩個(gè)副本,即本地的克隆卷通過(guò)容災軟件復制到備份端磁盤(pán)空間的鏡像卷和本地克隆卷的鏡像卷。盡管占用較多的空間,但是對于關(guān)鍵應用和關(guān)鍵數據來(lái)說(shuō),以空間的代價(jià)帶來(lái)數據的安全也是值得的。
在數據備份和恢復過(guò)程中,如果結合使用盤(pán)陣的快照技術(shù)和LAN-Free技術(shù),可以明顯提高備份速度。相對單純使用LAN-Free備份,這種兩種技術(shù)結合使用帶來(lái)的好處是顯而易見(jiàn)的。它能明顯提高備份速度,大大降低備份窗口的大小。在進(jìn)行數據恢復時(shí),時(shí)間也可以明顯縮短。
將快照技術(shù)和容災技術(shù)結合使用,可以保證在生產(chǎn)端出現問(wèn)題時(shí),利用已經(jīng)備份在備份端磁帶庫中的生產(chǎn)卷快照,迅速恢復生產(chǎn)卷數據的狀態(tài)。
4.BADR系統實(shí)現
系統實(shí)現主要通過(guò)兩個(gè)軟件工具,即RMAN備份腳本和CLI軟件工具。RMAN是數據庫提供的備份標準接口,通過(guò)編寫(xiě)RMAN工具來(lái)完成快照的備份和恢復;CLI軟件工具是磁盤(pán)陣列提供的軟件接口工具,通過(guò)CLI編寫(xiě)程序完成快照的生成和啟動(dòng)過(guò)程。下圖是系統實(shí)現的框圖:
圖2 系統實(shí)現框圖
利用RMAN進(jìn)行備份恢復的條件是:
。1)建立一個(gè)recovery_catalog,存放RMAN使用和維護的目標數據庫的信息,RMAN使用這些信息去決定如何執行備份和恢復的請求。
。2)目標數據庫必須是在archivelog模式下運行。只有這樣,日志才能歸檔,而RMAN正是利用歸檔日志進(jìn)行數據恢復,所以這是一個(gè)必備條件。同時(shí)archivelog模式也是數據庫在線(xiàn)備份的必備條件。
。3)RMAN備份中,如果采用磁帶機備份,需要安裝第三方介質(zhì)管理庫(MML);謴凸芾砥鞅4嬖赗MAN中注冊的全部數據庫的記錄。當RMAN被用來(lái)啟動(dòng)備份或恢復數據庫時(shí),它將目標數據庫與恢復目錄中可用的數據庫ID進(jìn)行驗證。如果條件一致,RMAN對目標數據庫至少建立兩個(gè)通道,其中一個(gè)通道只是對目標數據庫的一個(gè)遠程調用,使用PL/SQL接口來(lái)執行備份與恢復操作。
使用備份軟件對數據庫做全備份,見(jiàn)圖3。
圖3 數據庫全備份
如上圖所示,數據庫在備份軟件的控制下,備份到EXB-220磁帶機中。備份方式采用數據庫全備份方式,數據庫容量約為200GB,完成備份所需時(shí)間為兩個(gè)小時(shí)。
參考文獻:
[1] 楊浩讕,黃開(kāi)莉.存儲區域網(wǎng)技術(shù)研究[J].北京:通信技術(shù),2005,51(43):94-96
[2]Richard Barder.Paul Massiglia.存儲區域網(wǎng)絡(luò )精華-深入理解SAN[M].舒繼武譯,北京:電子工業(yè)出版社,2005年:204
【SAN環(huán)境下數據備份和遠程容災技術(shù)研究論文】相關(guān)文章:
云計算環(huán)境下大規模數據處理技術(shù)研究論文11-07
分析論文:云計算環(huán)境下大數據06-26
云計算環(huán)境下的分布存儲技術(shù)研究論文11-06
大數據環(huán)境下的知識管理論文文12-11
數據庫安全技術(shù)研究與用法的論文11-07