貴州興義天生橋發(fā)電一廠是隸屬于中國南方電網(wǎng)公司旗下的,主要從事水力發(fā)電的大型發(fā)電企業(yè)。隨著電力信息化建設進程的加快,天生橋發(fā)電一廠的MIS系統(tǒng)、生產(chǎn)控制系統(tǒng)、OA系統(tǒng)等核心系統(tǒng)的發(fā)展,催發(fā)了建立高性能、高可靠性、高安全性的數(shù)據(jù)中心的需求,以滿足不斷發(fā)展的IT系統(tǒng)的建設需求。
存儲系統(tǒng)現(xiàn)狀以及拓展要求:
存儲系統(tǒng)是貴州省興義天生橋發(fā)電一廠IT系統(tǒng)中的重要組成部分,目前整個信息系統(tǒng)缺乏一套強健的存儲系統(tǒng)做支撐。MIS數(shù)據(jù)庫采用了一臺低端的SCSI陣列作為存儲系統(tǒng),生產(chǎn)控制系統(tǒng)和OA系統(tǒng)的數(shù)據(jù)都放置在服務器本地硬盤上,整套系統(tǒng)沒有對重要數(shù)據(jù)作任何的備份。在這種現(xiàn)狀下,首先無法滿足未來對急速增長存儲容量的需求,同時暴露出了多種安全隱患,比如數(shù)據(jù)安全性能非常差重要數(shù)據(jù)缺乏可靠的備份、容災和恢復措施,不能應對基礎設施災難(比如:機房電力故障、火災、磁盤陣列硬件故障等)和軟災難(比如:人為操作失誤、系統(tǒng)軟件BUG、病毒、黑客等)的中的任何一種。遇到災難時,丟失的數(shù)據(jù)量無法得到保證,業(yè)務中斷時間也無法得到保證。另外由于服務器本身的技術(shù)條件的限制,操作系統(tǒng)容易發(fā)生崩潰,導致業(yè)務長時間中斷,無法迅速恢復。
在充分研究清楚貴州省興義天生橋發(fā)電一廠現(xiàn)狀之后,H3C按照專業(yè)標準建造了安全、可靠、高效存儲系統(tǒng)。此系統(tǒng)具有高可靠性,可應對不同類型災難,保證發(fā)生災難性事件的時候數(shù)據(jù)丟失量在10分鐘以內(nèi),業(yè)務中斷時間在10分鐘以內(nèi)。對MIS系統(tǒng)的Windows操作系統(tǒng)進行實時保護,系統(tǒng)發(fā)生崩潰以后,5分鐘內(nèi)就可以恢復操作系統(tǒng),所有軟件都無需重裝。另外此存儲系統(tǒng)著眼未來,有著高可擴展,性能、容量和功能可以根據(jù)后期的需要平滑擴展。另外系統(tǒng)還采用開放的、標準化的技術(shù)體系,支持異構(gòu)主機平臺及存儲平臺的整合和管理,為電廠解決了后顧之憂。
該方案具體描述如下:
1. 將生產(chǎn)控制系統(tǒng)服務器和OA服務器通過千兆交換機和H3C的IX1000相連,由一臺IX1000為這6臺服務器提供高性能的在線存儲服務。
2. 同時另一臺IX1000為MIS數(shù)據(jù)庫服務器提供實時數(shù)據(jù)保護服務,在MIS服務器上配置DiskSafe系統(tǒng)備份與恢復軟件,把MIS服務器上的所有磁盤分區(qū)(包括Windows操作系統(tǒng))都實時備份到IX1000中,MIS服務器的在線存儲業(yè)務還由原有的SCSI陣列提供。3. 在IX1000中還配置了TimeMark連續(xù)時間點數(shù)據(jù)保護功能軟件,對IX1000中的數(shù)據(jù)按照事先設定的策略進行連續(xù)時間點保護,保存多個時間點版本的數(shù)據(jù)(255個版本),當在線存儲系統(tǒng)出現(xiàn)故障或人為操作失誤、病毒等漸變式災難的時候可以通過TimeView時間點視圖模塊打開不同版本的數(shù)據(jù)進行檢查,可以把數(shù)據(jù)恢復到發(fā)生錯誤之前最近的時間點。
4. 此外,為了保證數(shù)據(jù)庫數(shù)據(jù)的完整性和一致性,在裝有Oracle 數(shù)據(jù)庫的MIS服務器上配置了數(shù)據(jù)庫快照代理SnapShot Agent,確保任何一個時間點版本的數(shù)據(jù)都可以把數(shù)據(jù)正常啟動起來。
科學利用資源,專業(yè)穩(wěn)定產(chǎn)品技術(shù)為為存儲系統(tǒng)帶來9大優(yōu)勢:
1. 實現(xiàn)數(shù)據(jù)集中,消除信息孤島:貴州省興義天生橋發(fā)電一廠把原分別存儲于多臺服務器上的數(shù)據(jù)統(tǒng)一集中到存儲系統(tǒng)中,來統(tǒng)一為應用系統(tǒng)提供存儲服務,可以有效的提高整套系統(tǒng)的存儲利用率,簡化管理和維護的工作量,消除信息孤島。
2. 可以實現(xiàn)實時數(shù)據(jù)備份:MIS服務器上的數(shù)據(jù)和操作系統(tǒng)通過DiskSafe系統(tǒng)備份與恢復軟件實時備份到IX1000,整個備份過程都不需要停止業(yè)務,可以實現(xiàn)數(shù)據(jù)零丟失。
3. 可以應對軟災難:通過TimeMark時間點標記等功能實現(xiàn)了對軟災難(如:人為操作錯誤、應用自身錯誤、系統(tǒng)溢出、病毒侵襲及黑客入侵等)的防護,保證在發(fā)生軟災難的時候可以恢復到前面標記過的任何一個時間點。
4. WINDOWS操作系統(tǒng)的備份與恢復:將Windows服務器硬盤故障和軟災難引起的宕機時間從幾天降低到幾分鐘,可支持遠程啟動,實現(xiàn)最優(yōu)的RPO及RTO。
5. 數(shù)據(jù)快速恢復和保證業(yè)務連續(xù)性:如果MIS服務器出現(xiàn)故障,數(shù)據(jù)發(fā)生丟失,可以通過DiskSafe系統(tǒng)備份與恢復軟件把備份在IX1000上的數(shù)據(jù)快速恢復過來。當帶寬允許的條件下,MIS服務器甚至可以直接訪問IX1000上的數(shù)據(jù)。
6. 持續(xù)數(shù)據(jù)保護效果比磁帶庫備份更好:使用傳統(tǒng)的磁帶庫備份一般一天只能做1次備份,而采用持續(xù)數(shù)據(jù)保護每天都可以按照用戶設定的策略對數(shù)據(jù)進行時間點備份,并且備份過程對應用基本沒有影響。使用磁帶庫備份經(jīng)常遇到磁帶失效和恢復失效等問題,而采用持續(xù)數(shù)據(jù)保護則不會出現(xiàn)類似的問題,并且用戶可以實現(xiàn)可視化的恢復,用戶可用選擇將數(shù)據(jù)恢復到前面?zhèn)浞葸^的任何一個時間點的狀態(tài)。
7. 能感知各種數(shù)據(jù)庫等應用,確保備份過程中的數(shù)據(jù)完整性:IX1000支持豐富的主機快照代理,可以確保對在線數(shù)據(jù)庫等應用進行實時備份過程中的數(shù)據(jù)的完整性,一旦出現(xiàn)災難,遠程容災系統(tǒng)中的數(shù)據(jù)完全可用,不需要人工恢復數(shù)據(jù)完整性。
8. 容災備份一體化解決方案:該方案中把容災備份的IX1000放置到10KM以為的廠區(qū),就實現(xiàn)了遠程容災,無須對現(xiàn)有的網(wǎng)絡進行升級改造或增加裸光纖投資。降低了用戶的專線投資和業(yè)務運營成本。
9. 管理簡單、方便:由于整個系統(tǒng)采用了開放的、符合國際標準的IP技術(shù)實現(xiàn),技術(shù)的普及性比較高,管理人員不需要再學習封閉的技術(shù)和標準。整個系統(tǒng)的管理和使用界面都是基于JAVA的圖形式、向?qū)浇缑妫芾砗褪褂梅浅:唵巍⒎奖恪?/p>
總結(jié):
該系統(tǒng)從2007年4月上線運行至今,一直非常穩(wěn)定,得到了用戶的高度評價。興義天生橋發(fā)電一廠信息中心李主任說:“在采用H3C的容災備份存儲解決方案以前,一直擔心數(shù)據(jù)的安全性,現(xiàn)在采用了H3C的CDP連續(xù)數(shù)據(jù)保護和遠程容災解決方案,心里總算踏實了”。