托電信息化發(fā)展歷經(jīng)八年,從只有一個(gè)OA辦公系統(tǒng)、數(shù)十臺(tái)終端到如今擁有包括小型機(jī)在內(nèi)的服務(wù)器五十余臺(tái)、交換機(jī)等網(wǎng)絡(luò)設(shè)備百余臺(tái)、終端上千臺(tái)。信息化工作的重點(diǎn)已經(jīng)從信息系統(tǒng)建設(shè)向運(yùn)維管理和系統(tǒng)應(yīng)用的深度整合等轉(zhuǎn)移。
目前,信息中心每天的工作量,多數(shù)都屬于運(yùn)維管理的范疇。信息中心從機(jī)組四期工程結(jié)束后就著手開(kāi)始運(yùn)維管理方面的建設(shè)工作,幾年間相繼上了藍(lán)帶思科桌面管理系統(tǒng)、東華的IT運(yùn)維系統(tǒng)、青鳥(niǎo)桌面管理系統(tǒng)。但運(yùn)維工作整體并不盡如人意,原因是多方面的,個(gè)人認(rèn)為主要有以下幾點(diǎn):
1.運(yùn)維管理的理念需要逐步成熟的過(guò)程。
2.受到與運(yùn)維相關(guān)的信息技術(shù)發(fā)展制約。
3.現(xiàn)有運(yùn)維相關(guān)的產(chǎn)品有各自的側(cè)重或局限性。
信息中心正在實(shí)施的兩個(gè)項(xiàng)目NETIQ和機(jī)房環(huán)境監(jiān)測(cè)系統(tǒng)為我們提供了一個(gè)契機(jī),我們可以建設(shè)一個(gè)真正適合自己的網(wǎng)絡(luò)運(yùn)維管理系統(tǒng),這個(gè)時(shí)機(jī)已經(jīng)基本成熟。
一、運(yùn)維管理系統(tǒng)建設(shè)的可行性
信息中心運(yùn)維工作主要來(lái)自網(wǎng)絡(luò)設(shè)備、系統(tǒng)應(yīng)用、機(jī)房設(shè)備、終端。NETIQ服務(wù)器監(jiān)控系統(tǒng)可以對(duì)服務(wù)器、數(shù)據(jù)庫(kù)進(jìn)行集中監(jiān)控管理。機(jī)房環(huán)境監(jiān)測(cè)系統(tǒng)可以對(duì)機(jī)房溫濕度、空調(diào)、UPS等指標(biāo)進(jìn)行集中監(jiān)控管理。終端管理方面,可以考慮購(gòu)置更好的產(chǎn)品加上二次開(kāi)發(fā)或者在現(xiàn)有桌面管理系統(tǒng)的基礎(chǔ)上進(jìn)行二次開(kāi)發(fā)。相對(duì)于以上,網(wǎng)絡(luò)設(shè)備的管理使用SNMP基本可以滿(mǎn)足運(yùn)維需求,NETIQ可以實(shí)現(xiàn),也可以在運(yùn)維管理中心開(kāi)發(fā)相應(yīng)的管理模塊。這些系統(tǒng)的建設(shè),本身就是具有針對(duì)性的綜合管理系統(tǒng),而且可以為運(yùn)維管理中心系統(tǒng)提供運(yùn)維信息的采集平臺(tái),是運(yùn)維管理系統(tǒng)建設(shè)的基礎(chǔ)。
二、運(yùn)維管理系統(tǒng)的構(gòu)想
運(yùn)維管理系統(tǒng)由運(yùn)維管理系統(tǒng)群和運(yùn)維管理中心兩部分組成。運(yùn)維管理系統(tǒng)群包括網(wǎng)絡(luò)設(shè)備管理模塊、NETIQ系統(tǒng)、機(jī)房環(huán)境監(jiān)測(cè)系統(tǒng)、終端管理系統(tǒng),運(yùn)維系統(tǒng)群為運(yùn)維管理中心提供運(yùn)維信息采集平臺(tái)。運(yùn)維信息采集包括網(wǎng)絡(luò)設(shè)備運(yùn)維信息采集、服務(wù)器組運(yùn)維信息采集、機(jī)房環(huán)境運(yùn)維信息采集、終端運(yùn)維信息采集。
運(yùn)維管理中心主要包括以下幾個(gè)部分:運(yùn)維任務(wù)的生成、運(yùn)維任務(wù)的處理、完成確認(rèn)、知識(shí)庫(kù)、運(yùn)維統(tǒng)計(jì)分析、運(yùn)維報(bào)告、績(jī)效評(píng)價(jià)、違規(guī)處理、維護(hù)商管理、應(yīng)急預(yù)案管理、系統(tǒng)權(quán)限等。
㈠
生成運(yùn)維任務(wù)
運(yùn)維任務(wù)的生成有兩個(gè)途徑,一個(gè)是從信息采集獲得,另外可以手動(dòng)生成。運(yùn)維任務(wù)分為運(yùn)行管理任務(wù)和維護(hù)管理任務(wù)兩類(lèi),運(yùn)行任務(wù)管理是指系統(tǒng)、設(shè)備在正常運(yùn)行狀態(tài)下的監(jiān)控管理或操作,主要包括定期巡檢任務(wù)、正常的配置操作、補(bǔ)丁管理、用戶(hù)管理、升級(jí)操作等,巡檢任務(wù)由系統(tǒng)按規(guī)定自動(dòng)生成,包括信息中心人員的日常巡檢和維護(hù)商的定期巡檢。維護(hù)管理任務(wù)是指當(dāng)設(shè)備、系統(tǒng)出現(xiàn)異常或故障時(shí)的處理過(guò)程。運(yùn)維任務(wù)的生成包括的信息有:設(shè)備或系統(tǒng)名稱(chēng)、IP地址、報(bào)警信息、時(shí)間、運(yùn)維編碼等等,由終端直接發(fā)起的運(yùn)維信息應(yīng)該包含聯(lián)系人的姓名、電話(huà)等,以便于運(yùn)維人員接手任務(wù)后與發(fā)起人主動(dòng)取得聯(lián)系。生成的運(yùn)維任務(wù)包括網(wǎng)絡(luò)設(shè)備、應(yīng)用系統(tǒng)、機(jī)房操作、終端運(yùn)維等幾種任務(wù)。運(yùn)行管理和維護(hù)管理并沒(méi)有嚴(yán)格的界限,往往是你中有我我中有你。
㈡運(yùn)維任務(wù)的處理
運(yùn)維任務(wù)生成后,由管理人員按照各自的職責(zé)分工,領(lǐng)取相應(yīng)的運(yùn)維任務(wù)進(jìn)行處理,運(yùn)維任務(wù)處理過(guò)程及信息分類(lèi):
|
運(yùn)維類(lèi)別 |
網(wǎng)絡(luò)設(shè)備包括:交換機(jī)、路由器、防火墻、VPN設(shè)備、行為管理設(shè)備、其他 |
|
應(yīng)用系統(tǒng)包括:操作系統(tǒng)、應(yīng)用服務(wù)、數(shù)據(jù)庫(kù)、接口、其他 |
|
|
機(jī)房運(yùn)維包括服務(wù)器、網(wǎng)絡(luò)設(shè)備、空調(diào)系統(tǒng)、供電系統(tǒng)、消防系統(tǒng)、環(huán)境監(jiān)控系統(tǒng) |
|
|
終端運(yùn)維包括:終端、外設(shè) |
|
|
運(yùn)維內(nèi)容 |
網(wǎng)絡(luò)設(shè)備包括配置操作:增加 、更改、刪除,其他操作:版本升級(jí)、設(shè)備更換、其他 |
|
應(yīng)用系統(tǒng)包括:配置變更、軟件安裝、升級(jí)、用戶(hù)管理、數(shù)據(jù)管理、日志管理、補(bǔ)丁管理、策略管理、其他 |
|
|
機(jī)房運(yùn)維包括具體的設(shè)備信息 |
|
|
終端運(yùn)維包括:電腦硬件、操作系統(tǒng)、應(yīng)用程序、打印機(jī)、其他 |
|
|
處理過(guò)程 |
|
|
處理結(jié)果 |
|
|
原因分析 |
|
|
影響情況 |
對(duì)用戶(hù)的影響情況(時(shí)間范圍) |
運(yùn)維任務(wù)在處理過(guò)程中包含以下幾個(gè)狀態(tài),分別是:
等待處理: 等待運(yùn)維人員接手
執(zhí)行狀態(tài):運(yùn)維人員正在處理任務(wù)
掛起狀態(tài):運(yùn)維過(guò)程中出現(xiàn)其他急需辦理的事物或其他原因暫停執(zhí)行
提交狀態(tài):任務(wù)處理完畢,等待完成確認(rèn)
完成狀態(tài):一個(gè)任務(wù)完全結(jié)束后的狀態(tài)
駁回狀態(tài):任務(wù)處理過(guò)程中信息有待補(bǔ)充等原因被駁回。
當(dāng)任務(wù)處理人員發(fā)現(xiàn)需要維護(hù)商來(lái)處理的時(shí)候,將任務(wù)轉(zhuǎn)給維護(hù)商,由維護(hù)商接手任務(wù),相關(guān)人員配合共同完成運(yùn)維任務(wù)并填寫(xiě)相應(yīng)的記錄,最后由運(yùn)維人員給予維護(hù)商相應(yīng)的評(píng)價(jià)。
㈢運(yùn)維任務(wù)的完成確認(rèn)
對(duì)已經(jīng)完成并提交的運(yùn)維任務(wù)進(jìn)行確認(rèn)、評(píng)價(jià),對(duì)于運(yùn)維內(nèi)容是否放入知識(shí)庫(kù)給予確認(rèn),對(duì)于運(yùn)維過(guò)程中存在的違規(guī)情況根據(jù)相關(guān)規(guī)定給予處罰確定等。
㈣運(yùn)維統(tǒng)計(jì)分析
當(dāng)某些問(wèn)題經(jīng)常出現(xiàn)的時(shí)候,信息中心必須運(yùn)用統(tǒng)計(jì)分析對(duì)設(shè)備、系統(tǒng)產(chǎn)生的問(wèn)題或故障協(xié)同相關(guān)維護(hù)商,進(jìn)行深入分析,找出原因,解決問(wèn)題。另外運(yùn)用統(tǒng)計(jì)分析可以為今后的運(yùn)維工作提供指導(dǎo)方向,制定下一步運(yùn)維計(jì)劃。
㈤運(yùn)維報(bào)告
通過(guò)運(yùn)維管理中心,對(duì)運(yùn)維數(shù)據(jù)有選擇的篩選、匯總,定期生成信息系統(tǒng)運(yùn)維報(bào)告,以便于工作總結(jié)、分析、計(jì)劃。運(yùn)維報(bào)告應(yīng)具有針對(duì)性,例如呈送公司領(lǐng)導(dǎo)的、呈送各部門(mén)的以及信息中心的整體報(bào)告。
㈥知識(shí)庫(kù)
知識(shí)庫(kù)的信息積累來(lái)自于運(yùn)維管理系統(tǒng)和平時(shí)的手工錄入,應(yīng)做好信息的分類(lèi)、查詢(xún)功能。當(dāng)運(yùn)維任務(wù)生成后,系統(tǒng)會(huì)把相關(guān)的信息在知識(shí)庫(kù)中進(jìn)行檢索,并把結(jié)果顯示在任務(wù)中,供運(yùn)維人員參考。
㈦績(jī)效評(píng)價(jià)
運(yùn)維系統(tǒng)內(nèi)的各方包括終端用戶(hù)、維護(hù)商、運(yùn)維人員都是可以評(píng)價(jià)的對(duì)象。終端用戶(hù)可以給打印機(jī)維護(hù)商評(píng)價(jià);也可以給信息中心運(yùn)維人員給予評(píng)價(jià);維護(hù)商可以給維護(hù)人員評(píng)價(jià);運(yùn)維人員可以給維護(hù)商的工作給予評(píng)價(jià);運(yùn)維人員可以對(duì)終端用戶(hù)使用計(jì)算機(jī)的情況給予評(píng)價(jià)。
㈧違規(guī)處理
對(duì)于運(yùn)維過(guò)程中發(fā)現(xiàn)違反信息系統(tǒng)相關(guān)制度的行為應(yīng)予以必要的處理。需要做兩方面工作:涉及這個(gè)內(nèi)容的制度條款應(yīng)該拿到系統(tǒng)中來(lái),處理的方式方法有待確定;對(duì)于違規(guī)行為,在運(yùn)維處理過(guò)程中應(yīng)該做相應(yīng)的證據(jù)記錄。
㈨維護(hù)商的管理
對(duì)維護(hù)商的信息集中管理,運(yùn)維工作予以記錄、評(píng)價(jià),運(yùn)維合同的到期提醒等,如何對(duì)維護(hù)商產(chǎn)生實(shí)際的約束力,發(fā)揮其在運(yùn)維工作中應(yīng)有的作用,是我們需要考慮的問(wèn)題。
(十)應(yīng)急預(yù)案管理
當(dāng)設(shè)備或系統(tǒng)的故障達(dá)到規(guī)定程度時(shí),啟動(dòng)應(yīng)急預(yù)案,并對(duì)整個(gè)處理過(guò)程實(shí)現(xiàn)系統(tǒng)化管理,以及預(yù)案的演練等其他工作進(jìn)行記錄。
三、終端管理系統(tǒng)
目前通行的終端管理系統(tǒng)所包含的功能主要有:硬件信息的提取(CPU、內(nèi)存、硬盤(pán)等)、操作系統(tǒng)基本信息(操作系統(tǒng)版本、安裝的應(yīng)用程序等)、軟件分發(fā)、補(bǔ)丁管理、外設(shè)管理、遠(yuǎn)程管理、主機(jī)防護(hù)等。有的產(chǎn)品還具有接入認(rèn)證、內(nèi)外網(wǎng)隔離、硬盤(pán)加密、網(wǎng)絡(luò)行為管理等功能。360安全套件在終端健康狀況、插件管理、實(shí)時(shí)防護(hù)、木馬查殺、垃圾清理等方面做的比較好。瑞星網(wǎng)絡(luò)版則是著重防病毒。將這些軟件的功能加以綜合利用,建設(shè)終端管理系統(tǒng)(組),為運(yùn)維管理中心提供數(shù)據(jù)。
廠區(qū)終端使用最多的是OFFICE辦公軟件和瀏覽器,出現(xiàn)問(wèn)題最多的是瀏覽器,所以應(yīng)當(dāng)把對(duì)瀏覽器的運(yùn)維作為終端運(yùn)維的重點(diǎn)之一。此外終端管理系統(tǒng)收集的終端硬件信息可以與信息中心現(xiàn)有的資產(chǎn)管理系統(tǒng)建立聯(lián)系,可以實(shí)現(xiàn)較為準(zhǔn)確的資產(chǎn)定位,協(xié)同各部門(mén)信息員及時(shí)掌握資產(chǎn)的變動(dòng)情況。
客戶(hù)端的二次開(kāi)發(fā)要求:客戶(hù)端既屬于終端管理系統(tǒng),又可以和運(yùn)維管理中心通信,同時(shí)可以對(duì)于我們所需的現(xiàn)有產(chǎn)品沒(méi)有涉及到的進(jìn)程或指標(biāo)進(jìn)行監(jiān)測(cè)。
1、實(shí)時(shí)交互性
當(dāng)運(yùn)維人員需要遠(yuǎn)程維護(hù)時(shí)與終端用戶(hù)進(jìn)行詢(xún)問(wèn)、控制申請(qǐng)等信息交互,當(dāng)運(yùn)維任務(wù)結(jié)束后,終端用戶(hù)可以給維護(hù)人員以相應(yīng)的評(píng)價(jià)。運(yùn)維管理中心收集到的終端健康情況也可以發(fā)送到目的終端,給使用者以相關(guān)的提醒。
2、人性化
終端使用人提交運(yùn)維申請(qǐng)后,可以看到運(yùn)維管理中心當(dāng)前的運(yùn)維狀況,誰(shuí)接手了自己提交的申請(qǐng),自己排在第幾位等信息。客戶(hù)端運(yùn)行應(yīng)盡量避免對(duì)終端用戶(hù)的正常工作形成干擾,如果能做到讓使用者感覺(jué)舒服又實(shí)用那是最好了。
3、資源占用率
客戶(hù)端運(yùn)行時(shí),進(jìn)程的大小,CPU占用率可以參考較為成熟的軟件如360及瑞星運(yùn)行時(shí)的情況。
4、定制化安裝
對(duì)于信息中心維護(hù)范圍內(nèi)和維護(hù)范圍外的終端,應(yīng)該采取不同的安裝策略。比如對(duì)維護(hù)范圍外采用接入認(rèn)證、監(jiān)控健康狀態(tài)、信息提醒等,但不啟用維護(hù)功能。用戶(hù)在安裝客戶(hù)端時(shí),填寫(xiě)相應(yīng)的信息以便系統(tǒng)管理。
四、運(yùn)維系統(tǒng)建設(shè)工作重點(diǎn)
1.運(yùn)維管理中心的開(kāi)發(fā)
2.終端管理系統(tǒng)的建設(shè)
3.NETIQ系統(tǒng)所涉及監(jiān)測(cè)指標(biāo)的調(diào)整,與運(yùn)維管理中心的接口準(zhǔn)備
4.機(jī)房環(huán)境監(jiān)測(cè)系統(tǒng)所涉及監(jiān)測(cè)指標(biāo)的調(diào)整,與運(yùn)維管理中心的接口準(zhǔn)備
5.對(duì)于特定應(yīng)用系統(tǒng)的運(yùn)行監(jiān)測(cè),NETIQ能否開(kāi)發(fā)出對(duì)應(yīng)的監(jiān)測(cè)服務(wù)模塊,或者應(yīng)用系統(tǒng)的商可以開(kāi)發(fā)出對(duì)自身運(yùn)行狀況的監(jiān)測(cè)功能。
6. 與運(yùn)維工作相關(guān)制度的完善、建立。
五、總結(jié)
綜上所述,運(yùn)維管理系統(tǒng)由多個(gè)子系統(tǒng)組成,我們應(yīng)該看到它的復(fù)雜性。如何讓整個(gè)系統(tǒng)協(xié)調(diào)運(yùn)作,如何挖掘、調(diào)整、發(fā)揮運(yùn)維系統(tǒng)的功能,提高運(yùn)維工作效率,不是一朝一夕的事情。運(yùn)維管理系統(tǒng)體現(xiàn)的是管理理念,相關(guān)制度的落實(shí)是整個(gè)運(yùn)維工作好壞的關(guān)鍵,也是運(yùn)維管理系統(tǒng)成功的關(guān)鍵。


