服務器的安全性能要求非常高,這主要體現(xiàn)在RAS性能上。RAS性能指的是機器的可靠性(Reliability)、可用性(Availability)和可服務性 (Serviceability)。RAS能力主要看幾個方面:System 級別的RAS特性、CPU RAS特性、內(nèi)存RAS特性、I/O RAS特性等。可以看出,RAS性能是個綜合性指標,對于不同行業(yè)用戶而言,其對RAS性能的要求是不盡相同的。
CPU和內(nèi)存的RAS性能尤其重要
服務器內(nèi)存的RAS特性最為關鍵,因為服務器的所有計算機幾乎都是跑在內(nèi)存中的,內(nèi)存的好壞決定了服務器是否能正常工作??梢哉f程序不是寄存在服務器上,而是寄生在內(nèi)存中的。根據(jù) Google 與一些機構的合作研究表明,內(nèi)存錯誤率其實比想象中的要高(refer),內(nèi)存也因為老化等原因會出現(xiàn)性能降低,這是個很有參考價值的信息。據(jù)寶德客服人 員反映,有些寶德服務器也連續(xù)跑了五年而從沒有停過機,直到設備更新時查看工作記錄才發(fā)現(xiàn),程序運行起來后就從來沒停過機。現(xiàn)在許多X86服務器銷的賣點宣傳也多集中在內(nèi)存上,比如內(nèi)存的 ECC 特性,Spare Row、Chip Kill、Single Device Data Correction (SDDC)等,其中Chip Kill是IBM的專利技術,主要用在高端服務器上。
CPU處理器的RAS性能也非常關鍵。英特爾早 先推出的Xeon 7500系列處理器,將Xeon平臺的可靠性、可用性和可維護性(RAS)帶到新的高度,將原本只為RISC架構專屬的諸如機器校驗架構(Machine Check Architecture,MCA)等特性的移植,也使Xeon 7500平臺在面向高端關鍵性業(yè)務應用時底氣更足。Xeon 7500的推出,是Intel志在關鍵應用市場一展身手的重要一步。
最近英特爾更是推出了Xeon E7、XeonE5系列處理器,繼承了許多大型機開發(fā)中驗證過的RAS技術。通過所有CPU電路間的錯誤檢測和恢復機制,避免CPU錯誤帶來的系統(tǒng)故障。并可保證CPU內(nèi)部的數(shù)據(jù)傳輸和存儲的隨機錯誤通過ECC 數(shù)據(jù)糾正處理和指令重試技術恢復。即使不可恢復的錯誤發(fā)生時,CPU也不會停止,只會繼續(xù)記錄所有的錯誤信息,因此任何錯誤原因都能迅速檢測出來。Xeon E7以英特爾上一代Xeon 7500為基礎,建立了面向諸多高端計算應用,包括商業(yè)智能、實時數(shù)據(jù)分析和虛擬化的全新標準。這些全新的處理器還提供高級安全特性,可確保更好的數(shù)據(jù)完整性,以鞏固數(shù)據(jù)中心的安全防線。
RAS能力在不同行業(yè)側重點也有不同
RAS能力是評判服務器的重要標準,但是由于RAS能力提升了服務器的制造成本,所以行業(yè)應用中,用戶只關心自己最需要的那些RAS指標,而不是面面俱到地要求服務器各方面的RAS性能都非常拔尖。
可靠性(Reliability)在行業(yè)中的應用主要是雙機熱備份。雖然安騰小型機、 高端服務器如PR4840R也有很高的穩(wěn)定性,但是在一些關鍵應用中,還是有用戶喜歡用雙機熱備的方式。雙機熱備份就是一臺主機為工作機,另一臺主機為備 份機,在系統(tǒng)正常情況下,工作機為信息系統(tǒng)提供支持,備份機監(jiān)視工作機的運行情況,工作機也同時監(jiān)視備份機是否正常,有時備份機因某種原因出現(xiàn)異常,工作 機可盡早通知系統(tǒng)管理工作人員解決,確保下一次切換的可靠性。當工作機出現(xiàn)異常,不能支持信息系統(tǒng)運營時,備份機主動接管工作機的工作,繼續(xù)支持信息的運 營,從而保證信息系統(tǒng)能夠不間斷地運行。當工作機經(jīng)過維修恢復正常后,它會將其先前的工作自動抓回,恢復以前正常時的工作狀態(tài)。
金融、電力、醫(yī)療等行業(yè),因為對計算可靠性要求非常高,所以習慣采用這種雙機熱備的方式。
可用性(Availability)是指系統(tǒng)被請求使用時可能迅速反饋并被正確操作的可能性。行業(yè)應用中的許多關鍵業(yè)務是不能在運行中出現(xiàn)間斷的,包括商業(yè)智能分析、業(yè)務流程處理(交易處理和ERP等)、核心數(shù)據(jù)庫等,特別是政府、國防、安全、電信、金融、交通、醫(yī)療等關系到國民生計的企業(yè)和機構所運行的這類應用。
關鍵業(yè)務的特性決定了其應用的運行一旦出現(xiàn)意外中斷就會造成極大的、甚至是無法彌補的不良影響及損失,這就對支持它的IT平臺,特別是承載它的 服務器提出了非常嚴格的要求。比如亞馬遜在幾年前停機一分鐘損失可達5萬美元,現(xiàn)在停機一分鐘損失則可達幾十萬美元計。在一些金融證券交易中,更是一雇刻 千金。雙備份可以迅速恢復系統(tǒng)性能。另外還有多子星系統(tǒng),滿足多節(jié)點服務需求等。另外許多應用可以提供方案遠程管理,虛擬化應用等,提高可用性。
在高鐵運營管理中用到一種SSI標準刀片服務器,有6個計算刀片和14個存儲刀片,集成度高,非常適合于分散狀況下的高鐵運營管理。整個解決方案采用PR6000M刀片服務器與寶德的雙機熱備軟件。兩臺刀片服務器與一套雙機熱備軟件組成雙機熱備系統(tǒng),兩臺服務器通過心跳線相連,兩臺服務器構成主從工作模式,為前端應用服務器提供不間斷的后臺支持,在一臺服務器出現(xiàn)故障時,另一臺服務器承擔全部工作負荷,直至故障服務器被修復。一臺刀片服務器就集中多個子系統(tǒng),還進行雙機熱備,真正解決了集中管理與安全穩(wěn)定的問題。
可維護性(Serviceability)對于要處理的數(shù)據(jù)量非常巨大,而又要求實時、動態(tài)和效率時,其承載平臺要有非常出色且易于擴展的高性能處理能力。比如內(nèi)存的擴充和硬盤的擴充,如寶德的模塊化服務器,存儲服務器等。
例如某銀行的核心業(yè)務數(shù)據(jù)庫要求確保24*7小時不宕機。為此將核心業(yè)務數(shù)據(jù)庫部署在寶德PR6850N服務器雙機系統(tǒng)上,該服務器為6U四路服務器,擁有超過20項RAS特性,在同城兩個機房的兩臺GS8810FD磁盤陳 列上,將核心交易系統(tǒng)及外圍系統(tǒng)業(yè)務布置在虛擬機上。兩臺PR6850N部署的虛擬機可以互相接管,實現(xiàn)業(yè)務不中斷,同時虛擬機部署到存儲上實現(xiàn)整個虛擬 機連同業(yè)務和數(shù)據(jù)庫的備份;同城的異地機房存儲設備間的鏡像,完成了業(yè)務邏輯層的容災。該方案不僅實現(xiàn)了比原有小型機更高的可擴展性。
需要提醒大家注意的是,服務器的RAS 能力實際上是需要提升成本來實現(xiàn)的,所以用戶在服務器選型的時候需要考慮實際需求和性價比,還是應該按照自己的行業(yè)需求來選擇自己的服務器。例如做為托管 的服務器只要穩(wěn)定運行即可,并不需要太高的性能。而影視藝術、教育和科研類應用,主要希望運算性能更強,并不一定需要考慮雙機熱備。而除法院系統(tǒng)外,其他 系統(tǒng)要求視頻數(shù)據(jù)實時備份也比較少。


