巡檢在數(shù)據(jù)中心的作用
基礎(chǔ)設(shè)施是整個(gè)數(shù)據(jù)中心重要的組成部分,也是日常運(yùn)行維護(hù)的關(guān)鍵。按照《數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)行維護(hù)標(biāo)準(zhǔn)》(GB/T 51314-2018),運(yùn)行工作主要包括日常巡檢、啟停控制、參數(shù)設(shè)置、狀態(tài)監(jiān)控和優(yōu)化調(diào)節(jié),運(yùn)行的主要目的是確保生產(chǎn)工作的安全穩(wěn)定、保證質(zhì)量以及性能調(diào)優(yōu);維護(hù)工作主要包括預(yù)防性維護(hù)、預(yù)測(cè)性維護(hù)和維修,維護(hù)的主要目的是提高系統(tǒng)可靠性、排除隱患以及延長(zhǎng)設(shè)施的生命周期。其中,巡檢是發(fā)現(xiàn)生產(chǎn)安全隱患的重要途徑。
巡檢周期:巡檢屬于運(yùn)行工作的一部分,通常情況下,數(shù)據(jù)中心各專業(yè)每天都要開(kāi)展4次以上的現(xiàn)場(chǎng)巡檢,每周至少開(kāi)展一次全專業(yè)聯(lián)合巡檢,每月至少開(kāi)展一次園區(qū)級(jí)的深度隱患巡檢巡查工作。同時(shí),在重要節(jié)假日前、重大會(huì)議前、可預(yù)測(cè)的自然災(zāi)害發(fā)生前、上級(jí)電力系統(tǒng)檢修前等特殊時(shí)期,還需要開(kāi)展有針對(duì)性、特定范圍的專項(xiàng)巡檢工作。
巡檢內(nèi)容:數(shù)據(jù)中心常規(guī)巡檢范圍覆蓋園區(qū)、電纜隧道、樓內(nèi)各機(jī)房等區(qū)域,除了需要觀察、記錄系統(tǒng)的運(yùn)行環(huán)境和運(yùn)行參數(shù)之外,通常還需要重點(diǎn)關(guān)注以下幾個(gè)方面:第一,蓄電池、儲(chǔ)油區(qū)、防疫酒精等數(shù)據(jù)中心重大危險(xiǎn)源的狀況;第二,數(shù)據(jù)中心核心關(guān)鍵設(shè)施的運(yùn)行狀況;第三,功率超限、環(huán)境升溫等運(yùn)行數(shù)據(jù)的異常情況;第四,備品備件、應(yīng)急工器具、應(yīng)急物資等應(yīng)急設(shè)施的齊全良好情況。
人與機(jī)器人在巡檢中的作用
現(xiàn)階段,數(shù)據(jù)中心巡檢工作基本是以運(yùn)維人員的現(xiàn)場(chǎng)巡檢與平臺(tái)運(yùn)行數(shù)據(jù)分析相結(jié)合的方式開(kāi)展。通過(guò)人的視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)、味覺(jué)、觸覺(jué)對(duì)現(xiàn)場(chǎng)環(huán)境信息進(jìn)行采集,結(jié)合平臺(tái)各系統(tǒng)的運(yùn)行數(shù)據(jù),再根據(jù)經(jīng)驗(yàn)進(jìn)行綜合判斷,確定系統(tǒng)是否處于正常運(yùn)行狀態(tài)。如發(fā)現(xiàn)系統(tǒng)運(yùn)行存在安全隱患或處于異常狀態(tài)等情況,將找到問(wèn)題所在并及時(shí)處理。人體各感官在巡檢中的主要作用和感知方式如圖1所示。

圖1 人體各感官在巡檢中的主要作用和感知方式
視覺(jué)
視覺(jué)是指通過(guò)觀察,發(fā)現(xiàn)外界事物的明暗、顏色、數(shù)值、痕跡。
在數(shù)據(jù)中心巡檢中,主要通過(guò)視覺(jué)采集來(lái)判斷有無(wú):打火、冒煙、跑氣、冒水、滴液、漏液等現(xiàn)象,告警指示、開(kāi)關(guān)、連接等狀態(tài)數(shù)據(jù)變化,溫度、電流、負(fù)載等運(yùn)行數(shù)據(jù)變化,著火、煙霧等環(huán)境數(shù)據(jù)變化,蓄電池排酸、漏水等痕跡數(shù)據(jù)變化。
其中,狀態(tài)數(shù)據(jù)和運(yùn)行數(shù)據(jù)的數(shù)值已基本實(shí)現(xiàn)標(biāo)準(zhǔn)化和數(shù)字化,前端采集、處理和后臺(tái)分析均可通過(guò)圖像識(shí)別等技術(shù)由巡檢機(jī)器人替代人工實(shí)現(xiàn);但環(huán)境數(shù)據(jù)和痕跡數(shù)據(jù)由于采集和判斷都相對(duì)復(fù)雜,即使有相應(yīng)傳感器,也會(huì)因?yàn)閿?shù)量、質(zhì)量和精準(zhǔn)度等原因無(wú)法做出準(zhǔn)確的分析,有可能出現(xiàn)誤判或漏判,因此短時(shí)間內(nèi)難以用巡檢機(jī)器人替代人工。
聽(tīng)覺(jué)
聽(tīng)覺(jué)是指在聲波作用下產(chǎn)生的對(duì)聲音特性的感覺(jué),主要包括振幅和頻率。
在數(shù)據(jù)中心巡檢中,主要通過(guò)聽(tīng)覺(jué)采集來(lái)判斷風(fēng)扇等設(shè)備聲音大小是否異常、水泵和皮帶等聲音狀態(tài)是否正常、水泵內(nèi)是否含氣或雜質(zhì)而產(chǎn)生異響、泵體是否由于不平衡產(chǎn)生噪聲和共振等,往往需要通過(guò)經(jīng)驗(yàn)進(jìn)行判斷并給出結(jié)論。
現(xiàn)階段,聲音振幅和頻率等數(shù)據(jù)已實(shí)現(xiàn)標(biāo)準(zhǔn)化和數(shù)字化,但對(duì)不同廠家、品牌、型號(hào)的冷機(jī)、水泵等設(shè)備在不同工況下的聲音指標(biāo)缺少標(biāo)準(zhǔn)化的數(shù)據(jù),設(shè)備的異常數(shù)據(jù)缺少個(gè)性化和專業(yè)性的分類分析,在嘈雜的環(huán)境中采集到聲音數(shù)據(jù)無(wú)法進(jìn)行精準(zhǔn)的分析處理,無(wú)法判斷其運(yùn)行狀態(tài)是否正常。
嗅覺(jué)
嗅覺(jué)是指對(duì)外部氣味的感覺(jué)。
在數(shù)據(jù)中心巡檢中,主要通過(guò)嗅覺(jué)對(duì)運(yùn)行環(huán)境的氣體味道、氣體濃度、刺激性等進(jìn)行檢查,判斷是否存在由于蓄電池爬酸和漏液、制冷劑泄漏、下水道反味、煙火等引起的生產(chǎn)和環(huán)境異常情況。
數(shù)據(jù)中心雖然已通過(guò)動(dòng)環(huán)和極早期火災(zāi)報(bào)警等系統(tǒng),實(shí)現(xiàn)了對(duì)有害氣體、氫氣、硫化物、PM2.5、潔凈度的檢測(cè),但是每個(gè)模塊通常只能檢測(cè)單項(xiàng)內(nèi)容,且需要保持一定的檢測(cè)時(shí)間,因此在集成度和精確度等問(wèn)題解決之前,巡檢機(jī)器人尚無(wú)法大規(guī)模應(yīng)用。
味覺(jué)
味覺(jué)是指對(duì)味道的感覺(jué)。
在數(shù)據(jù)中心巡檢中,通常將嗅覺(jué)和味覺(jué)結(jié)合在一起,利用兩者互相作用進(jìn)行綜合判斷,以此作為嗅覺(jué)的輔助。
觸覺(jué)
觸覺(jué)是指皮膚接觸外部刺激產(chǎn)生的感覺(jué)。
在數(shù)據(jù)中心巡檢中,主要通過(guò)觸覺(jué)對(duì)環(huán)境的溫度和濕度、電氣設(shè)備的運(yùn)行溫度、數(shù)據(jù)機(jī)房?jī)?nèi)氣流組織循環(huán)等運(yùn)行狀態(tài)、變化進(jìn)行檢查。
觸覺(jué)一般不會(huì)直接發(fā)現(xiàn)故障或問(wèn)題,但是會(huì)發(fā)現(xiàn)異常和隱患,需要進(jìn)一步綜合分析和判斷。巡檢機(jī)器人可以很好地完成對(duì)環(huán)境溫濕度以及設(shè)備表面溫度的掃描檢測(cè),特別是對(duì)蓄電池溫度的檢測(cè),比人工巡檢要準(zhǔn)確很多。
第六感
人類的第六感,可以理解為對(duì)各感官采集的數(shù)據(jù)進(jìn)行綜合分析,并結(jié)合經(jīng)驗(yàn)給出相應(yīng)的判斷。由于模型不容易建立,因此不太容易實(shí)現(xiàn)標(biāo)準(zhǔn)化。
在數(shù)據(jù)中心巡檢中,主要利用綜合分析和經(jīng)驗(yàn)判斷,發(fā)現(xiàn)更深層次的隱患和潛在的問(wèn)題,并做出早期處置,防患于未然。
機(jī)器人替代人工的可行性分析
巡檢機(jī)器人可以通過(guò)模擬人的幾種感官,分別從視覺(jué)識(shí)別、傳感器識(shí)別、熱成像識(shí)別、聲音識(shí)別等角度開(kāi)展巡檢工作。從巡檢機(jī)器人的特點(diǎn)看,以下幾方面工作可以很好地替代人工:已數(shù)字化的采集核對(duì)等數(shù)據(jù)檢查、已模型化的數(shù)據(jù)分析與判斷、重復(fù)性強(qiáng)或耗時(shí)耗力的標(biāo)準(zhǔn)化檢查項(xiàng)目、人員不方便進(jìn)入的高風(fēng)險(xiǎn)檢查區(qū)域、常規(guī)化的現(xiàn)場(chǎng)巡查工作。
巡檢方面
數(shù)據(jù)中心巡檢機(jī)器人通過(guò)視覺(jué)識(shí)別、聲音識(shí)別、傳感器識(shí)別、熱成像識(shí)別等技術(shù),實(shí)現(xiàn)對(duì)視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)、味覺(jué)和觸覺(jué)的模擬,并可以對(duì)開(kāi)關(guān)、指示燈等運(yùn)行數(shù)據(jù)以及聲音、潔凈度等環(huán)境數(shù)據(jù)進(jìn)行采集。但是,這部分?jǐn)?shù)據(jù)實(shí)際上都可以通過(guò)DCIM(Data Center Infrastructure Management,數(shù)據(jù)中心基礎(chǔ)設(shè)施管理)、動(dòng)環(huán)、BA(Building Automation,暖通空調(diào)自動(dòng)控制)等系統(tǒng)進(jìn)行監(jiān)測(cè)和采集,現(xiàn)場(chǎng)巡檢更多是對(duì)這些數(shù)據(jù)的復(fù)核和確認(rèn)。
在數(shù)據(jù)中心巡檢中,人體各感官的重要性以及近階段機(jī)器人對(duì)人工的可替代情況總結(jié)如表1所示。

處置方面
巡檢最主要的目的是發(fā)現(xiàn)系統(tǒng)運(yùn)行、環(huán)境等存在的問(wèn)題或隱患,在其轉(zhuǎn)化為故障或事件前將其處理,現(xiàn)場(chǎng)第一時(shí)間的判斷和處置尤為重要。在生產(chǎn)過(guò)程中,很多經(jīng)驗(yàn)豐富的人對(duì)問(wèn)題、隱患的判斷,實(shí)質(zhì)上是多維度綜合分析的結(jié)果,思考過(guò)程和分析依據(jù)很難進(jìn)行量化并形成標(biāo)準(zhǔn)模型,因此巡檢機(jī)器人在現(xiàn)場(chǎng)即使已經(jīng)采集到了相關(guān)信息,依然無(wú)法通過(guò)綜合評(píng)判提出預(yù)警并立即解決,巡檢的效果也會(huì)大打折扣。
數(shù)據(jù)中心運(yùn)行維護(hù)的各項(xiàng)指標(biāo)雖然已基本實(shí)現(xiàn)標(biāo)準(zhǔn)化,但是依然有部分內(nèi)容需要結(jié)合現(xiàn)場(chǎng)情況進(jìn)行判定,機(jī)器人在數(shù)據(jù)處理等方面具有很大優(yōu)勢(shì),但由于缺少更靈活的機(jī)制和模型,依然無(wú)法體現(xiàn)其巡檢的價(jià)值。
在現(xiàn)場(chǎng)處置方面,平臺(tái)類的系統(tǒng)性操作、動(dòng)環(huán)和BA系統(tǒng)的性能調(diào)優(yōu)等,機(jī)器人都要比人處理得快速和準(zhǔn)確;但大部分EOP(Emergency Operating Procedure,應(yīng)急操作流程)類應(yīng)急操作,以及分合閘、并機(jī)切換等硬件類操作,由于安全性等原因,必須人員到現(xiàn)場(chǎng)處理,因此針對(duì)此類操作問(wèn)題,人工巡檢在處置方面要比機(jī)器人巡檢更具有及時(shí)性。
在數(shù)據(jù)中心巡檢中,人與機(jī)器人在數(shù)據(jù)中心處置方面的對(duì)比見(jiàn)表2。

巡檢機(jī)器人在數(shù)據(jù)中心的發(fā)展
在數(shù)據(jù)中心內(nèi),基礎(chǔ)設(shè)施巡檢機(jī)器人相比IT巡檢機(jī)器人發(fā)展得要緩慢一些,除去對(duì)外宣傳等因素,現(xiàn)階段真正大規(guī)模應(yīng)用的并不多,更多是作為人工巡檢的輔助或者作為試點(diǎn)在測(cè)試,實(shí)現(xiàn)的功能也基本以數(shù)據(jù)采集和對(duì)比為主,離完全替代人工、減少維護(hù)人員和降低維護(hù)成本還有很大的差距。
雖然如此,數(shù)據(jù)中心巡檢的智能化和無(wú)人化是大勢(shì)所趨,不但可以將運(yùn)維人員從常規(guī)、耗時(shí)耗力的人工巡檢中解放出來(lái),降低巡檢頻次和強(qiáng)度;還可以促進(jìn)運(yùn)維基礎(chǔ)設(shè)施向智能化方向快速發(fā)展,提高運(yùn)維的自動(dòng)化和智能化管理水平。數(shù)據(jù)中心巡檢機(jī)器人需要向以下4個(gè)方面發(fā)展。
基礎(chǔ)數(shù)據(jù)完全數(shù)字化和關(guān)聯(lián)化
數(shù)據(jù)中心作為數(shù)字化建設(shè)的基石,是各行業(yè)數(shù)字化的重要前置條件,并為新型基礎(chǔ)設(shè)施建設(shè)起到支撐作用。但在數(shù)據(jù)中心內(nèi)部,卻由于精細(xì)化程度等原因,并沒(méi)有實(shí)現(xiàn)所有基礎(chǔ)數(shù)據(jù)的數(shù)字化。同時(shí),也由于生產(chǎn)系統(tǒng)種類繁多、接口復(fù)雜等原因,沒(méi)有實(shí)現(xiàn)各系統(tǒng)、設(shè)備之間全部數(shù)據(jù)的關(guān)聯(lián)和同步,對(duì)巡檢機(jī)器人的數(shù)據(jù)分析和處理精度產(chǎn)生一定影響,因此需要先完成全面數(shù)據(jù)的數(shù)字化和關(guān)聯(lián)。
運(yùn)維工作全面標(biāo)準(zhǔn)化和模型化
不同數(shù)據(jù)中心雖然所處的地理位置、氣候條件不同,所采用的制冷模式、供配電方式不同,規(guī)劃建設(shè)等級(jí)不同,但在整體框架和運(yùn)維結(jié)構(gòu)上是一致的,因此可以用標(biāo)準(zhǔn)化的運(yùn)維規(guī)則加上個(gè)性化的調(diào)整進(jìn)行管理。同時(shí),為實(shí)現(xiàn)更安全的生產(chǎn)、更低的成本,可以結(jié)合實(shí)際,建立和完善人員模型、成本模型、用戶模型等;也可以結(jié)合經(jīng)驗(yàn),建立和完善各種隱患排查、故障處理等模型,實(shí)現(xiàn)巡檢機(jī)器人現(xiàn)場(chǎng)采集數(shù)據(jù)后的綜合分析和實(shí)時(shí)處理,實(shí)現(xiàn)巡檢的價(jià)值。
傳感器技術(shù)高速發(fā)展
數(shù)據(jù)中心巡檢機(jī)器人在視覺(jué)傳感器等技術(shù)和精確度等方面相對(duì)較高,應(yīng)用較多,但在聽(tīng)覺(jué)和嗅覺(jué)傳感器等方面還存在精確度不足、標(biāo)準(zhǔn)化缺失等問(wèn)題導(dǎo)致無(wú)法放心應(yīng)用。同時(shí),關(guān)鍵零部件成本的高低也決定了巡檢機(jī)器人生產(chǎn)成本能否進(jìn)一步下降、能否規(guī)模化普及。
人工智能技術(shù)快速應(yīng)用
巡檢機(jī)器人除了在路線規(guī)劃、避障、控制等方面需要利用人工智能進(jìn)行技術(shù)積累和優(yōu)化外,在圖像數(shù)據(jù)處理、音頻數(shù)據(jù)處理、綜合分析與決策等方面也需要用到人工智能技術(shù)。一方面結(jié)合標(biāo)準(zhǔn)化的數(shù)據(jù)進(jìn)行深度學(xué)習(xí),另一方面結(jié)合模型化的場(chǎng)景進(jìn)行廣度拓展,提高巡檢機(jī)器人現(xiàn)場(chǎng)安全預(yù)警的及時(shí)性,實(shí)現(xiàn)可替代人工的能力。換一個(gè)角度來(lái)說(shuō),人工智能在每一個(gè)領(lǐng)域的突破和發(fā)展,都會(huì)對(duì)智能巡檢機(jī)器人核心功能、數(shù)據(jù)管理、隱患與預(yù)警等起到推動(dòng)作用。
數(shù)據(jù)中心基礎(chǔ)設(shè)施巡檢最重要的價(jià)值就是發(fā)現(xiàn)系統(tǒng)、環(huán)境的隱患和問(wèn)題,并及時(shí)處理,數(shù)據(jù)采集的精度不夠、分析處理能力不足都將是致命的。因此,在現(xiàn)階段數(shù)據(jù)中心巡檢機(jī)器人還無(wú)法完全替代人工實(shí)現(xiàn)規(guī)模化應(yīng)用,但“責(zé)任心強(qiáng)”、受外界影響小、可持續(xù)工作等特點(diǎn),使其成為基礎(chǔ)設(shè)施人工巡檢的很好補(bǔ)充。隨著數(shù)據(jù)中心全面標(biāo)準(zhǔn)化、模型化,以及傳感器精度、人工智能技術(shù)的提升,有充分的理由相信,數(shù)據(jù)中心巡檢機(jī)器人最終將得到更多的應(yīng)用,也將推動(dòng)數(shù)據(jù)中心運(yùn)維向著無(wú)人化、智能化的方向高速發(fā)展。


