下面讓我們看一下四種網絡監控類型,以及特定的機制和協議,它們可提供企業所需的適當級別的可見性。

可用性監控
可用性監控是網絡團隊了解設備是否正常運行的最簡單方法。有些可用性監控工具不只是監控設備是完全在線還是離線。特定的接口狀態通知和網絡設備硬件檢查通常屬于這一類。
監控網絡可用性的常用協議示例包括:
Internet控制消息協議(ICMP)。ICMPping是一種簡單的驗證測試,用于顯示設備是否可在網絡訪問。
簡單網絡管理協議(SNMP)。SNMP監控設備和接口狀態。
事件日志(syslog)。當上行鏈路、接口或路由變得不可用時,Syslog收集服務器可以觸發警報。
配置監控
對于管理使用本地配置文件的傳統網絡組件的人來說,配置監控檢查非常重要。從性能和IT安全的角度來看,自動化工具必不可少,這些工具可以比較相似配置的設備是否存在不準確性。
這些工具通常采用設備配置文件的命令行輸出,并將其與網絡上執行類似任務的其他文件進行比較。網絡團隊可以調查配置之間的差異,以確保所有網絡組件都設置為相同的操作。
配置監控的主要功能包括:
實時監控網絡配置更改以及誰做出的更改;
發生未經授權更改時,自動回滾配置;
網絡設備之間的配置比較,以發現配置錯誤。
性能監控
雖然網絡可用性監控與性能監控有些重疊,但兩者之間存在明顯差異。
可用性監控更關注構成網絡基礎設施的組件的運行狀態,性能監控也是如此,但更加強調最終用戶的性能體驗。因此,性能監控更側重于網絡利用率、延遲和次優路徑選擇。
性能監控協議的示例包括:
SNMP。這會在接口、交換機CPU和內存過度使用時發送警報。
事件日志(系統日志)。當利用率達到特定閾值或發生意外的路由更改時,系統日志會觸發警報。
基于流的監控。這提供了對特定網絡流對話和每個流消耗的帶寬量的可視性。
數據包捕獲分析。這提供對網絡對話的深度分析,這些對話通常會顯示底層傳輸問題,這是上層監控工具無法識別的。
流式遙測。這是對實時網絡運行狀況和性能數據的收集和分析,用于快速識別和解決復雜問題。
云基礎設施監控
在很多情況下,對于私有云和公共云實例,企業可以部署在企業網絡相同類型的網絡監控工具。但是,很多云服務提供商提供自己的內置網絡監控工具套件。雖然這些云監控工具通常免費,但這些工具通常無法集成到企業正在使用的其他第三方工具中。
企業必須權衡利弊,考慮管理多個分布式網絡監控服務,還是花費更多時間和精力將監控集中到少數工具。部署這些工具的要求可能更高,但它們有助于提供企業網絡和云端的全面可見性。
現代網絡監控的改進
網絡監控方面的幾項顯著進步可幫助減輕ITOps員工的管理和支持負擔。例如,很多網絡架構可完全通過集中式云門戶進行配置和管理。在很多情況下,中央控制平面預先構建了無數網絡監控工具和警報功能,這意味著不再需要單獨的第三方工具。
受COVID-19疫情影響,廣受歡迎的其他改進是硬件或軟件代理,可用于監控在家辦公員工和微型分支機構的網絡性能。這些硬件以及基于軟件的工具使ITOps員工能夠監控遠程用戶的網絡性能,無論他們在哪里工作。
最后,在網絡監控工具中使用AI和機器學習有助于消除很多手動流程,并加快識別和修復網絡相關問題的速度。無論是性能還是安全相關,事實證明,人工智能在發現問題、確定根本原因以及在某些情況下自動修復網絡事件方面具有重要價值。