設計一個較大規模的計算機網絡,除了在技術先進性和高效靈活性方面考慮以外,還要考慮網絡故障管理方面的問題。在網絡拓撲設計方面,要求網絡層次簡潔清晰,主干和接入之間、各個子系統之間界限分明;在可靠性設計方面,應考慮冗余設計,其中包括鏈路冗余、設備冗余、部件冗余等;在網絡設備選用要求方面,網絡設備必須支持通用的網絡管理協議和網絡管理技術,如SNMP、RMON和端口鏡像等功能;在網絡故障分析和定位的實施方法方面,要求有確定網絡故障的分析定位流程。網絡故障管理系統在設計上應該掌握以下原則。
1.分層檢查網絡故障的定位分析原則
網絡故障的分層檢查包括物理層、鏈路層、網絡層、傳輸層及上層應用等。
物理層主要是指綜合布線系統,包括骨干光纖系統及樓層雙絞線系統,此外還包括各個連接節點等。物理層的故障主要表現在線路及節點的物理連接方式是否正確,設備的物理連接方式是否正確,設備的配置及操作是否正確等方面。
數據鏈路層的故障查找和排除,需要檢查路由器的配置,檢查連接端口的工作狀況。鏈路層故障分析內容包括:數據鏈路層的運行狀況,流量狀況;鏈路層數據包的丟包,重發及包碰撞情況;網絡計算機設備的鏈路層驅動程序的加載等。
網絡層故障分析包括各種網絡設備的網絡層協議的加載,網絡層地址和網絡層路由的設置等。在進行網絡層故障分析時,首先應檢查路由器接口的IP地址配置,然后可以沿著從源到目標的路徑,查看路由器路由表。如果路由沒有在路由表中出現,應該檢查是否已經輸入適當的靜態路由、默認路由或者動態路由。發現問題后,可以手工配置一些丟失的路由,或者排除一些動態路由選擇過程的故障,包括RIP或者IGRPl路由協議出現的故障等。
傳輸層分析主要包括上層應用或協議在網絡層協議上的捆綁狀況等內容。
應用層分析包括服務器CPU運行狀況,系統核心進程的運行狀況,系統資源使用情況,應用程序對系統資源的占用和調度,以及系統管理等方面的內容。
2.分段檢查網絡故障的定位分析原則
網絡故障的分段檢查包括用戶端、接入設備、主干交換設備、中繼設備等之間的鏈路連通及相應端口的狀態檢查。
鏈路連通檢查的內容,包括物理線路的介質類型、物理線路的連通、物理線路的質量(線路的距離、衰耗、終端設備的電氣特性等)、物理線路的最大數據承載能力和收發線路的對應等。
相應端口狀態檢查的內容,包括兩端設備對應的端口類型的統一性檢查、速率匹配檢查、雙工設置檢查、收/發時鐘的時鐘源檢查、數據收/發的線路接通情況檢查和數據流控制與擁塞控制檢查等。DTE和DCE之間的連接檢查還包括停止位、端口類型的轉換等參數的設置檢查。
3.采用縱向和橫向逐級分析的原則
縱向分析為從下到上按物理層、數據鏈路層、網絡層、傳輸層、應用層等應用的次序分析故障原因。橫向分析為從端到端按數據終端設備、網絡接入設備、網絡主干設備、網絡中繼設備、網絡主干設備、網絡接入設備、數據終端設備的次序分析故障原因。