疫情防控形勢(shì)嚴(yán)峻復(fù)雜,企業(yè)都積極響應(yīng)政府要求落實(shí)居家辦公,面對(duì)瞬息萬(wàn)變的疫情,我們除了做好防護(hù)外,必須有所準(zhǔn)備,必須適應(yīng)。
“作為一名運(yùn)維從業(yè)者,必須要講講疫情為運(yùn)維工作帶來(lái)了哪些變化!”
01 疫情給運(yùn)維工作帶來(lái)的變化
首先就是人員精簡(jiǎn),在疫情期間,為了避免聚集性疫情,大部分?jǐn)?shù)據(jù)中心都采用AB崗輪班制、核心崗最小化辦公或是現(xiàn)場(chǎng)封閉辦公、居家協(xié)同,到崗率從原先的100%精簡(jiǎn)到50%,甚至不到10%。
其次需求驟增,大眾的辦公、醫(yī)療、生活等各行各業(yè)都離不開(kāi)“線上”,離不開(kāi)網(wǎng)絡(luò),舉個(gè)例子,6月2日,美團(tuán)發(fā)布2022年第一季度業(yè)績(jī),美團(tuán)外賣營(yíng)收同比增長(zhǎng)至242億元,支撐數(shù)字背后除了外賣小哥和商家,大概就是大量的服務(wù)器和網(wǎng)絡(luò)數(shù)據(jù)了吧,服務(wù)器計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源的需求急劇上升,運(yùn)維工程師不僅要維持?jǐn)?shù)據(jù)中心正常運(yùn)行還要提高可用性,以便給急需的網(wǎng)絡(luò)和計(jì)算提供服務(wù),并對(duì)停電或極端天氣事件等各種災(zāi)難有明確的應(yīng)急預(yù)案。
在如此艱難環(huán)境下,無(wú)論主設(shè)備與備用設(shè)備是萬(wàn)萬(wàn)不可出現(xiàn)故障的,這無(wú)疑為運(yùn)維帶來(lái)了前所未有的挑戰(zhàn),數(shù)據(jù)中心管理者更是“壓力山大”。我們迫切需要方案解決以上問(wèn)題,人員精簡(jiǎn)是防疫的重要措施,那么我們只能考慮一下,如何提高運(yùn)維工程師的工作效率了,且運(yùn)維工程師的精力是有限的,那么我們勢(shì)必要借助一些管理工具。
02 如何應(yīng)對(duì)以上變化?
應(yīng)急方案
例如本次北京疫情,某數(shù)據(jù)中心借助nVisual網(wǎng)絡(luò)基礎(chǔ)設(shè)施管理軟件實(shí)現(xiàn)遠(yuǎn)程查看機(jī)房情況,網(wǎng)絡(luò)部的同事在居家辦公時(shí)發(fā)現(xiàn)業(yè)務(wù)異常后通過(guò)工單告知現(xiàn)場(chǎng)運(yùn)維部同事實(shí)現(xiàn)遠(yuǎn)程配合排障。
不僅如此,nVisual網(wǎng)絡(luò)基礎(chǔ)設(shè)施管理平臺(tái)利用可視化的方式清晰的記錄設(shè)備與線纜、設(shè)備與設(shè)備之間的鏈路連接關(guān)系,并將數(shù)據(jù)中心全部設(shè)備以及線纜資料實(shí)現(xiàn)與對(duì)應(yīng)設(shè)備線纜關(guān)聯(lián),建立了可視化的數(shù)據(jù)庫(kù)。包括但不限于紙質(zhì)資料、圖像資料、字段信息(如設(shè)備IP地址、維保時(shí)間、負(fù)責(zé)人信息、配置OID、承載業(yè)務(wù)...)等。代替人工實(shí)現(xiàn)運(yùn)維管理(包括事件管理、問(wèn)題管理、變更管理、維護(hù)管理、故障管理、場(chǎng)地配置管理、設(shè)備生命周期管理、應(yīng)急管理、質(zhì)量管理、成本管理和安全管理等等)。
疫情當(dāng)下,在日常作業(yè)中因?yàn)橛辛艘陨闲畔ⅲ?strong style="background-repeat: no-repeat;">知道重點(diǎn)業(yè)務(wù)由哪些設(shè)備承載,就可以實(shí)現(xiàn)重點(diǎn)業(yè)務(wù)重點(diǎn)保障、重點(diǎn)設(shè)備重點(diǎn)巡檢,從而減少重大事故發(fā)生的幾率,也規(guī)避有限人力資源浪費(fèi)。
并且在發(fā)生故障時(shí),有跡可循,循到的資料也能輕松看懂并掌握,利用現(xiàn)有數(shù)據(jù)以及歷史故障記錄等信息實(shí)現(xiàn)快速排障。居家辦公的同事也可通過(guò)VPN遠(yuǎn)程訪問(wèn)nVisual了解數(shù)據(jù)中心現(xiàn)場(chǎng)情況,配合高效處理,減少企業(yè)損失。
數(shù)據(jù)量的增加,不可避免新需求增加,當(dāng)數(shù)據(jù)中心需要新設(shè)備上架時(shí),通過(guò)nVisual內(nèi)嵌的智能引導(dǎo)工具,即可實(shí)現(xiàn)傻瓜式作業(yè),人只需要配合手動(dòng)上架即可,規(guī)劃其合理性、最優(yōu)最短路徑、配置線纜類型等工作都可由軟件代替。
通過(guò)以上手段提高突發(fā)疫情情況下,有限的運(yùn)維工程師工作效率,讓其時(shí)間集中于有意義的保障工作,而不是把時(shí)間浪費(fèi)在四處抓瞎、多部門(mén)通信協(xié)同之下,要知道,在金融行業(yè),一旦出現(xiàn)故障,損失可是以秒而計(jì)的。
長(zhǎng)遠(yuǎn)之計(jì)
以上只是疫情突發(fā)的臨時(shí)保障措施,疫情來(lái)勢(shì)洶洶是沒(méi)有預(yù)警的,企業(yè)唯一能做的,就是提前做好準(zhǔn)備,這樣當(dāng)突發(fā)情況從天而降時(shí),才能保障業(yè)務(wù)通暢、安全、平穩(wěn)。
在整個(gè)數(shù)據(jù)中心生命周期中,數(shù)據(jù)中心運(yùn)維管理是歷時(shí)最長(zhǎng)的一個(gè)階段。運(yùn)維管理是數(shù)據(jù)中心保障業(yè)務(wù)的重中之重,以前企業(yè)或是數(shù)據(jù)中心管理者總是將此重任寄望于“人”,但是人是不可控的、是有極限的、人與人之間也是有差異化的、能力也是參差不齊的,單純依靠老師傅的切身經(jīng)驗(yàn)口口相傳,不如建立一套規(guī)范化、流程化的運(yùn)維體系,將網(wǎng)絡(luò)基礎(chǔ)設(shè)施這樣寶貴的資源數(shù)據(jù)記錄在可控的服務(wù)器之中,這樣就算疫情中在數(shù)據(jù)中心內(nèi)部是新來(lái)的運(yùn)維工程師,對(duì)目前數(shù)據(jù)中心情況不清晰,他也可以通過(guò)歷史資料、設(shè)備信息快速掌握數(shù)據(jù)中心資源信息,快速投入到工作之中為企業(yè)帶來(lái)價(jià)值。而不是由企業(yè)花費(fèi)大量的時(shí)間,占用老員工工作時(shí)間用來(lái)“口口相傳”。
隨著互聯(lián)網(wǎng)發(fā)展的不斷深入和互聯(lián)網(wǎng)應(yīng)用的不斷多元化,互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模呈指數(shù)級(jí)增長(zhǎng),對(duì)互聯(lián)網(wǎng)數(shù)據(jù)中心的需求也將呈現(xiàn)指數(shù)級(jí)的增長(zhǎng)。為滿足當(dāng)前互聯(lián)網(wǎng)基礎(chǔ)設(shè)施的需求,數(shù)據(jù)中心還將不斷進(jìn)行擴(kuò)建,數(shù)據(jù)中心規(guī)模仍將保持上升的態(tài)勢(shì),這就對(duì)數(shù)據(jù)中心建設(shè)規(guī)模、承載業(yè)務(wù)以及存儲(chǔ)與計(jì)算等技術(shù)提出了更高的要求,我們不應(yīng)該再以老思路加上非常難維護(hù)的單機(jī)excel表格來(lái)管理我們的數(shù)據(jù)中心了,網(wǎng)絡(luò)基礎(chǔ)設(shè)施少說(shuō)成百上千,端口、鏈路成千上萬(wàn),人海戰(zhàn)術(shù)能保障excel和CAD圖紙上數(shù)據(jù)三五年的準(zhǔn)確性,十幾年呢?幾十年呢?要知道我國(guó)通信技術(shù)日新月異,一個(gè)數(shù)據(jù)中心的投入使用可遠(yuǎn)不止三五年。相信在此次疫情之中,應(yīng)當(dāng)有不少運(yùn)維工程師為了找尋故障點(diǎn)、調(diào)取資料等事情撓破了頭,打遍了電話吧...
小結(jié)
目前,一切生產(chǎn)生活在平穩(wěn)有序的恢復(fù)之中,企業(yè)數(shù)據(jù)中心管理者絕不可掉以輕心,勢(shì)必要從中吸取經(jīng)驗(yàn),防患于未然,數(shù)據(jù)中心事故基本都是“不鳴則已,一鳴驚人”,安全生產(chǎn),防大于治,選用nVisual網(wǎng)絡(luò)基礎(chǔ)設(shè)施管理平臺(tái)為企業(yè)的業(yè)務(wù)運(yùn)行澆筑起“銅墻鐵壁”亦是大有裨益。