[故障現(xiàn)象]
網(wǎng)絡(luò)結(jié)構(gòu)的不合理或者網(wǎng)絡(luò)設(shè)備位置的架設(shè)不當(dāng),都會在用戶訪問網(wǎng)絡(luò)過程中引起莫名奇妙的故障,而這些結(jié)構(gòu)上的問題又都發(fā)生得比較隱蔽,從而給網(wǎng)絡(luò)管理員查找和解決這類問題帶來很多的困難。下面就介紹一例因為網(wǎng)絡(luò)中雙路由器配置不當(dāng),造成路由地址競爭故障的解決過程。
筆者所在公司使用2Mb/s帶寬的DDN專線接入Internet,其中網(wǎng)絡(luò)設(shè)備的具體連接方式為:使用一臺CISCO 2511路由器,通過路由器上的串行口與基帶MODEM相連,再通過專線將基帶MODEM的RJ-11接口連接到電信局端。由于平時接入Internet的大多數(shù)用戶僅僅使用瀏覽網(wǎng)頁和收發(fā)郵件功能,而且能夠接入Internet的用戶數(shù)量也不多。因此,在該帶寬下,用戶訪問Internet的速率比較快??墒?,在一次例行電源檢修停電并來電后,筆者所在的網(wǎng)絡(luò)部門接到多起用戶投訴,普遍反映接入Internet的速率變慢,經(jīng)常出現(xiàn)打不開網(wǎng)頁的現(xiàn)象,并且有的時候需要多次刷新方能打開網(wǎng)頁,即便能夠打開網(wǎng)頁,也會出現(xiàn)有的圖片不能打開或網(wǎng)頁只能打開一半等現(xiàn)象。另外,郵件的收發(fā)也已經(jīng)基本上不能進(jìn)行,郵件客戶端軟件收發(fā)郵件時,經(jīng)常出現(xiàn)服務(wù)器連接超時的提示。
診斷過程
接到用戶投訴后,筆者打開瀏覽器上網(wǎng)瀏覽,發(fā)現(xiàn)筆者的計算機(jī)上同樣出現(xiàn)用戶描述的故障,因此可以排除用戶系統(tǒng)或設(shè)置不當(dāng)產(chǎn)生的問題。于是,筆者打電話給公司的網(wǎng)絡(luò)提供商——數(shù)據(jù)局的服務(wù)電話詢問,被告知該網(wǎng)絡(luò)提供商那里網(wǎng)絡(luò)訪問一切正常,看來也不是電信局端網(wǎng)絡(luò)出現(xiàn)了問題。
接下來,筆者懷疑公司所使用的路由器出現(xiàn)死機(jī)故障,因此重新啟動該路由器,當(dāng)路由器重新啟動的,發(fā)現(xiàn)故障依舊存在。由于從日常管理經(jīng)驗上來看,接入Internet的速率變慢,還有可能是黑客或病毒攻擊所致,于是筆者緊接著檢查防火墻和網(wǎng)絡(luò)防病毒服務(wù)器的工作日志,也沒有發(fā)現(xiàn)可疑之處,因此,可以排除該故障是因為這類問題所致。
幾種測試方法使用后,問題還沒有解決,診斷一度陷入了僵局,一時間筆者想不到造成該問題的其他原因。
經(jīng)過短暫休息后,重新開始該問題的診斷,通過在計算機(jī)上執(zhí)行tracert命令,檢查訪問遠(yuǎn)程主機(jī)的路由情況,發(fā)現(xiàn)用戶數(shù)據(jù)包路由到公司接入DDN專線的路由器上,出現(xiàn)中斷現(xiàn)象,于是開始懷疑該路由器存在問題,筆者使用筆記本電腦通過路由器的Console口登錄到該路由器中,在特權(quán)用戶模式下,使用Show running—config命令,查看該路由器的當(dāng)前運行配置,仔細(xì)比較后,并未發(fā)現(xiàn)路由器當(dāng)前配置存在問題,且路由狀態(tài)正常。
然后,使用Show history 命令查看路由器的歷史記錄,發(fā)現(xiàn)最近沒有任何人改變過其配置。接下來,在該路由器上,通過ping命令和Traceroute命令,ping遠(yuǎn)程網(wǎng)絡(luò)地址并跟蹤路由調(diào)試,測試結(jié)果一切正常,看來發(fā)生網(wǎng)絡(luò)阻塞的故障原因很可能是路由器的硬件出現(xiàn)問題造成的。
這時筆者想起來公司還有一臺閑置路由器,該路由器以前曾經(jīng)是為公司的另一條Internet出口使用,后由于這條鏈路取消,因此該設(shè)備一直閑置。由于兩個路由器的型號一樣,都是CISCO2511路由器,因此可以將其拿來替換出現(xiàn)故障的路由器試試。
于是,筆者從網(wǎng)絡(luò)設(shè)備機(jī)架上找到該路由器,結(jié)果驚奇的發(fā)現(xiàn)該路由器處于加電狀態(tài),通過Console口登錄到該路由器中,查看該路由器的當(dāng)前運行配置,竟然發(fā)現(xiàn)該路由器配置與出現(xiàn)問題的配置一模一樣,看來Internet出口阻塞的問題是因為兩臺路由器的IP地址競爭引起的。
于是,筆者首先將該路由器斷電,等待幾分鐘后,再在本地計算機(jī)上打開瀏覽器,訪問Internet上的相應(yīng)網(wǎng)址,發(fā)現(xiàn)阻塞故障消除,且訪問速度很快。接下來收發(fā)電子郵件,發(fā)現(xiàn)已經(jīng)能夠正常使用,至此故障完全解決。
事后分析原因,得知當(dāng)日停電結(jié)束后,操作人員為網(wǎng)絡(luò)設(shè)備和服務(wù)器加電時,錯誤地將閑置的路由器一并接通電源,由于該路由器在以前對網(wǎng)絡(luò)操作人員培訓(xùn)時,曾作為實驗路由器,將其配置成與正在使用路由器的IP地址相同。因此,這兩臺路由器同時加電后,網(wǎng)絡(luò)中就出現(xiàn)了配置相同的兩臺路由器,造成路由器的IP地址競爭,從而出現(xiàn)Internet出口堵塞的故障。
排除心得
路由地址競爭可以引發(fā)嚴(yán)重的路由瓶頸問題,致使用戶數(shù)據(jù)包將無法向正確的路由器轉(zhuǎn)發(fā),從而造成Internet出口堵塞。同樣,路由器與服務(wù)器、交換器等地址競爭也同樣會引起嚴(yán)重的帶寬平衡問題,造成網(wǎng)絡(luò)訪問故障,這點在路由器的配置和使用中尤其需要注意到。
發(fā)生該故障后,吸取問題診斷過程的教訓(xùn),筆者所在公司購置了網(wǎng)絡(luò)管理軟件,通過網(wǎng)絡(luò)管理軟件自動生成的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖,網(wǎng)絡(luò)管理員可以實時監(jiān)視網(wǎng)絡(luò)結(jié)構(gòu)是否發(fā)生變化,及時找到因為網(wǎng)絡(luò)結(jié)構(gòu)發(fā)生變化而造成網(wǎng)絡(luò)故障的原因,并根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)圖對其進(jìn)行調(diào)整。
另外,使用高檔的網(wǎng)絡(luò)測試儀(例如Fluke F683企業(yè)級網(wǎng)絡(luò)測試儀),也可以檢測出網(wǎng)絡(luò)中的雙路由器IP地址重設(shè)錯誤??傊?,工欲善其事,必先利其器。對于這類隱蔽性的網(wǎng)絡(luò)故障,如果沒有好的網(wǎng)絡(luò)工具,是很難發(fā)現(xiàn)其根源的。


