做好系統(tǒng)和應用維護勢在必行
如何做好IT系統(tǒng)的運行維護是IT領域的熱點問題. 隨著信息化技術的蓬勃發(fā)展,信息化建設的深入,運維管理的難度也越來越大。 如何管理好IT系統(tǒng),保證其可用、安全、可靠、高效地運行,提高用戶滿意度、降低運維服務成本、保證系統(tǒng)能夠在遇到突發(fā)事件時快速地解決。是當下嚴峻而又現實的問題。
作為運維服務提供者,無論是管理人員還是運維人員,經常會遇到這樣的情景:
夢深時分,急促的鈴聲響起,電話接通,在電話的另一頭,有人急切地說道:“一位公司領導反映,公司的網站登錄不了,郵件無法正常發(fā)送,首頁顯示空白”,一般這種情況下,你會要求現場人員嘗試恢復服務,但現場人員往往不能獨立解決,此時你需要協(xié)調技術專家去出面搞定這個問題,但如果問題棘手呢,那此時就需要綜合各方高人進行會診。通過逐一詢問運維組的檢查情況,細致了解了包括防火墻、入侵監(jiān)測、操作系統(tǒng)、數據庫的設置、Web服務器以及自身的運行情況后,系統(tǒng)問題仍然無法定位。
就在你準備放棄的時候,打算采取應急方案的時候,正常的界面又忽然顯示了,只是很快,但刷新后又重復出現非正常。他們的聯(lián)系在哪里,問題在哪里,你得找出根本原因。
經過多番種種努力,你忽然想到一點,昨天客戶好像提過要對硬件做升級,如果所料不錯的話,應該是昨天晚上就進行了,但因為某種原因,升級并沒有成功,客戶的操作步驟也沒提前通知,具體操作如何誰也不清楚。這時候你會給客戶打電話匯報情況,并要求客戶方安排人員來解決,
終于在多方人員的努力下,系統(tǒng)恢復正常運行,大家一起舒了一口長氣,同時開始抱怨“怎么能這樣?他們也太過分了,居然進行升級都不跟我們打個招呼,明天一定得好好的跟他們領導反映”。
以上的情景我相信絕大多數運維服務提供者都能遇到,并且不止一次兩次。為什么會產生這些問題呢?如果在此次事件中,整個系統(tǒng)有了變更管理環(huán)節(jié),當客戶進行升級,就必須通過變更管理的審核和批準,否則是無法進行相應操作的,也自然不會出現應用無法訪問的問題,這對運營維護好IT系統(tǒng)以及提供完善的IT服務有著重要的意義。
系統(tǒng)與應用維護都有哪些困難
l 服務器操作系統(tǒng)
操作系統(tǒng)是服務器運行的軟件基礎,其重要性不用說大家都明白。如果使用Windows xp或Windows 2000 Server作為操作系統(tǒng),維護起來還是比較容易的,只要按時打好補丁,定時查看日志就可以。但如果是LINUX和UNIX操作系統(tǒng)的話,需要對運維人員的技術有相當高的要求,需要具備一定的專業(yè)知識。
l 服務器上的應用維護
服務器上的應用軟件是企業(yè)的核心數據,是企業(yè)最重要的數據之一,如果數據丟失或者服務異常終止對于企業(yè)來說所造成的損失是不可估量的,企業(yè)的應用已經成了企業(yè)生存和發(fā)展的重要組成部分。當企業(yè)應用的規(guī)模越來越大時,應用也隨之越來越多,如何快速有效的對這些關鍵應用進行監(jiān)控就成為了迫切的問題。
l 7*24小時服務周期
除了上述二點列出的技術上的困難之外,還有一個重要的問題就是企業(yè)的服務器以及上面所運行的應用都是實時性很高的業(yè)務,必須得保證7*24小時不間斷提供服務,單純的靠人工維護的話實時性太差,管理員不可能一天二十四小時盯著服務器,所以在現實情況中,經常出現服務器宕機或者服務器上的應用不能訪問,運維人員往往無法第一時間知曉,而是由實際使用服務器或使用應用的人去通知,此時業(yè)務可能已經停止了很長時間,這對于企業(yè)來說無疑是很大的損失,從而造成對IT運維人員的滿意度下降。
系統(tǒng)和應用誰來維護,誰來管理
所謂系統(tǒng)和應用維護就是指能夠面對并處理IT系統(tǒng)涉及到計算機所出現的各種故障,說白了就是軟硬兼施。故障從系統(tǒng)級到應用級,從網絡到硬件設備。
在系統(tǒng)和應用維護中,人的因素至關重要。因為我們都知道人可以解決問題,但人又同樣會帶來問題,比如一個資深的運維人員離崗后,問題再次發(fā)生時就很難快速響應,即使交接人技術很強卻也無法獲取到前人的運維經驗。這使得系統(tǒng)和應用維護管理的不穩(wěn)定因素日益增多,如何減少由人員變更導致得系統(tǒng)和應用維護管理的難度加大,是擺在我們眼前而必須解決的問題。
維護管理軟件的產生,使得人在運維管理中所起到的作用被量化和標準化。通過運維管理軟件,所有IT設備都可以被監(jiān)控管理。設備遇到問題,會自動分類報警,無論是系統(tǒng)自動報警還是使用人工故障上報,工程師只要按照系統(tǒng)相關知識庫的知識,一步一步操作下去就可以,因此,對于工程師來說,不需要很高的技術水平,就可以進行維護支持。
為了發(fā)揮IT系統(tǒng)的最大作用,系統(tǒng)和應用不僅僅需要人的運維,更需要有合適的維護管理軟件來支撐,幫助企業(yè)實現IT運維自動化,標準化。
通常情況下,維護管理軟件應主動告訴我們應該關注什么內容,指導我們如何去進行管理,問題出在哪里,該從什么角度入手分析,主動定位問題的位置等等。它至少應具備以下幾個方面的特點:
a) 提供綜合的一體化管理平臺:整合網絡、主機、應用、服務等各層面 IT 資源的、統(tǒng)一的IT 服務管理信息視圖。
b) 提供直觀的管理呈現方式:統(tǒng)一的監(jiān)控資源視圖。
c) 提供多種發(fā)現問題和準確定位的管理機制:能夠準確、快速地定位故障產生的根本原因。
d) 提供統(tǒng)計報告和分析圖表,方便公司領導層做出決策。
e) 保障業(yè)務系統(tǒng)的穩(wěn)定運行:從業(yè)務角度切入,以業(yè)務為導向,通過對整個業(yè)務系統(tǒng)的關注,從而達到保障業(yè)務系統(tǒng)穩(wěn)定運行和透明化管理的目的。
簡單易用的維護管理軟件的優(yōu)勢
簡單易用最主要的標準,就是無需深厚技術背景,也可以輕松做好系統(tǒng)和應用維護管理。
“哪怕是一個只有基礎技術能力的人,也能做專業(yè)IT維護”,這是我們維護管理軟件應該幫助用戶達到的運維水平。
n 監(jiān)控信息統(tǒng)一展現
面向業(yè)務監(jiān)控和統(tǒng)一portal展現,整合第三方監(jiān)控系統(tǒng),提供覆蓋網絡、系統(tǒng)及應用服務等全方位監(jiān)控的統(tǒng)一頁面展現。統(tǒng)一告警平臺匯總、壓縮和關聯(lián)各種設備或服務的告警信息,實現統(tǒng)一監(jiān)控和展現。
可針對不同角色的管理人員,提供各取所需的不同內容。比如為部門經理提供實時的服務儀表盤Dashboard,輔助IT決策,為運維人員提供資源可用性與性能指標,確定資源狀態(tài)。
n 網絡拓撲圖
日常的運維工作中,系統(tǒng)維護管理人員對網絡的監(jiān)控只是單點地針對設備,無法對整體進行有效的監(jiān)控。網絡拓撲圖應提供網絡資源實時監(jiān)控功能,能夠實時展現網絡所有設備各個部分工作狀態(tài)變化,能真實地體現網絡中的物理運行狀態(tài)。能夠支持自動發(fā)現網絡拓撲,也支持手工繪制各種網絡拓撲,使網絡管理員能夠更加集中、方便和有效的管理企業(yè)的網絡資源。
n 可視化管理
可視化管理用于對企業(yè)的各種系統(tǒng)、應用、數據庫等資源進行實時的性能監(jiān)控和診斷的軟件產品,它是個實時系統(tǒng)狀態(tài)監(jiān)控軟件,在前端交互界面上主要采用Flash 技術,生動形象的展現系統(tǒng)各個部分的狀態(tài)變化。
n 快速監(jiān)控
一款強大的網絡資源監(jiān)控軟件,應能快捷易用,使用戶能夠快速上手。不但可以快速發(fā)現資源,而且可以立即開始監(jiān)控,使用戶可以立即查看所有資源的狀態(tài)、可用性、性能指標取值、報警信息等等。
n Dashboard
服務Dashboard(業(yè)務服務管理儀表盤),提供對IT 基礎架構的全面管理,并且能把IT 服務和相關用戶串聯(lián)連一起,提供直觀的可視化界面。一旦發(fā)生問題,系統(tǒng)管理員能很快通知受影響的客戶并及時了解服務故障嚴重程度。前端交互界面采用Flash 展現,為用戶提供完整的信息視圖和工作平臺。
總結
一個真正綜合而全面的IT運行維護管理軟件,才是用戶的最終選擇。它必須從用戶角度出發(fā),對業(yè)務/應用服務,及其背后的IT基礎架構(路由器、交換機、服務器等)進行全面監(jiān)控;提供保障業(yè)務的服務質量,不僅能在服務可用性、響應時間等方面提供良好的服務保證,還能在服務中斷時,及時發(fā)出通知并解決問題。
酷點KoolPoint是針對企業(yè)的 IT 支持和管理部門提供的一款強大的監(jiān)控軟件,幫助用戶解決 IT 支持與管理過程中的難題,提高IT 服務水平和效率的產品。
因為有酷點KoolPoint,無需技術你也可以輕松運維!
更多產品信息,請登陸http://www.mochabsm.com,或撥打全國咨詢熱線400-611-5522。





