国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關(guān)注微信公眾號

從算法到智能,智能運(yùn)維的實踐之路
2020-06-05   網(wǎng)絡(luò)安全和運(yùn)維

  隨著企業(yè)數(shù)字化轉(zhuǎn)型的不斷深入,利用AI技術(shù)改善運(yùn)維和IT服務(wù)水平成為當(dāng)前運(yùn)維管理的主要關(guān)注方向。在此過程中逐漸產(chǎn)生了不同的發(fā)展策略:圍繞著AI的平臺化智能運(yùn)維發(fā)展模式、場景化智能運(yùn)維發(fā)展模式以及自建智能運(yùn)維發(fā)展模式。
 
  不同發(fā)展策略的智能運(yùn)維發(fā)展方向是一致的,即通過大數(shù)據(jù)和人工智能技術(shù)對運(yùn)維管理進(jìn)行賦能:
 
  結(jié)合現(xiàn)有監(jiān)控手段,增強(qiáng)數(shù)據(jù)分析,進(jìn)一步提高監(jiān)控的能力;
 
  通過資源的有效配置節(jié)省運(yùn)維成本;
 
  通過多數(shù)據(jù)源分析增強(qiáng)排查問題的能力,有效縮短故障恢復(fù)時間;
 
  通過預(yù)警并結(jié)合自動化工具,有效提高運(yùn)維效率甚至自愈能力。
 
  目前智能運(yùn)維尚處在弱人工智能階段,人機(jī)協(xié)作的方式將促進(jìn)智能運(yùn)維的發(fā)展,人教會AI去學(xué)習(xí),AI實現(xiàn)對數(shù)據(jù)的智能分析,提高運(yùn)維人員的運(yùn)營能力。
 
  建設(shè)智能運(yùn)維的算法挑戰(zhàn)
 
  雖然這幾年人工智能在人臉識別、智能駕駛等領(lǐng)域得到了大量應(yīng)用,但是AI仍然面臨著計算效能、安全、可解釋性等諸多挑戰(zhàn)。相比于其他AI落地場景,智能運(yùn)維所亟需解決的問題具有一定的獨(dú)特性:
 
  1.心態(tài)的轉(zhuǎn)變:智能運(yùn)維是運(yùn)維發(fā)展的方向,而且是一個長期的過程——從經(jīng)驗主義到數(shù)據(jù)驅(qū)動,再回歸到業(yè)務(wù)驅(qū)動的過程。經(jīng)驗是結(jié)合了數(shù)據(jù)、知識、業(yè)務(wù)等長時間學(xué)習(xí)的結(jié)果,而AI主要依靠歷史指標(biāo)或者文本數(shù)據(jù),對歷史數(shù)據(jù)進(jìn)行預(yù)測,從而對未來趨勢做出判斷。對于想達(dá)到的目標(biāo),需要考慮現(xiàn)有的信息是否充足,還需要結(jié)合業(yè)務(wù)場景進(jìn)行具體模型的不斷優(yōu)化。
 
  2.工程化算法的欠缺:由于缺乏標(biāo)準(zhǔn)的運(yùn)維數(shù)據(jù)集,學(xué)術(shù)界針對運(yùn)維的算法還比較少,工程化的算法尤其欠缺。同時算法在不同數(shù)據(jù)集上的泛化能力也決定了算法能否在真實場景應(yīng)用的關(guān)鍵。
 
  3.缺乏有效的標(biāo)簽體系:以異常定義為例,由于不同業(yè)務(wù)部門對數(shù)據(jù)需求存在巨大區(qū)別,同時對異常的容忍程度也有不同定義,因此現(xiàn)有的泛化模型難以滿足用戶的實際需求。
 
  4.數(shù)據(jù)的多樣化和變更頻繁:運(yùn)維場景存在大量變更行為,因此需要考慮Concept-shift(如:促銷中的變更)前后對算法結(jié)果的影響。
 
  5.唯一性:很多異常和故障的特征是唯一的,很難通過歷史數(shù)據(jù)的學(xué)習(xí)得到,因此需要結(jié)合業(yè)務(wù)屬性和其它數(shù)據(jù)進(jìn)行有效學(xué)習(xí)。
 
  6.算法失效帶來的災(zāi)難:AI的應(yīng)用需要明確目標(biāo)和不確定性。工業(yè)化算法的準(zhǔn)確性在85%以上可以用,但是需要考慮不準(zhǔn)確情景的影響。算法很多時候需要考慮準(zhǔn)確和召回的集合(F-score),而很多場景對算法的準(zhǔn)確性有更高要求,因此對算法結(jié)果的評估將有助于進(jìn)一步完善模型。
 
  提升智能運(yùn)維關(guān)鍵能力
 
  面對上述算法落地挑戰(zhàn),需要對運(yùn)維場景進(jìn)行剖析,將學(xué)術(shù)界的算法和業(yè)界的場景有效的融合統(tǒng)一,再通過業(yè)界的工程實現(xiàn)能力進(jìn)行有效的組合。對于每個場景的實現(xiàn),都不僅僅是一個或多個算法。在智能運(yùn)維的落地的過程中,一般會構(gòu)建四個智能分析能力集合:
 
  智能告警能力
 
  及時有效的告警是運(yùn)維的基礎(chǔ)。智能運(yùn)維常常利用異常檢測來實現(xiàn)智能告警,但是異常檢測主要是找出數(shù)據(jù)的異常,而告警是業(yè)務(wù)驅(qū)動的,因此在設(shè)計告警條件時,需要集合異常檢測和業(yè)務(wù)的特性進(jìn)行告警。
 
  智能診斷能力
 
  當(dāng)關(guān)鍵業(yè)務(wù)指標(biāo)發(fā)生異常時,快速給出問題的根本原因的能力。在運(yùn)維過程中,根因很可能是唯一的,不能通過歷史學(xué)習(xí)的方式構(gòu)建,需要一個系統(tǒng)性設(shè)計,構(gòu)建完善的運(yùn)維分析庫,通過有效的學(xué)習(xí)對故障進(jìn)行快速定位。
 
  智能預(yù)警能力
 
  通過基于歷史數(shù)據(jù)的有效學(xué)習(xí),對未來可能的故障進(jìn)行有效預(yù)測是減少損失的重要手段。故障的類型很多,針對不同類型的預(yù)測需要不同的算法模型。當(dāng)故障發(fā)生時,配合資源優(yōu)化算法,自動化的對任務(wù)進(jìn)行編排,從而有效、及時預(yù)測故障的發(fā)生。
 
  智能服務(wù)管理能力
 
  智能服務(wù)管理能力將利用人工智能技術(shù),與新一代ITSM進(jìn)行融合。通過知識庫的構(gòu)建,利用文本相似度,對歷史上發(fā)生的故障工單進(jìn)行匹配,及時有效的提供故障的解決方案,大大提升了故障的處理效率,結(jié)合自動化的工具,快速給出請求回復(fù),減少運(yùn)維人員的時間浪費(fèi)。
 
  注重算法的魯棒性、自適應(yīng)性、可解釋性、泛化能力等,通過構(gòu)建專業(yè)運(yùn)維數(shù)據(jù)庫以及智能分析方面的4個關(guān)鍵能力,將為企業(yè)智能運(yùn)維體系化建設(shè)提供有力支撐,落地從運(yùn)維的監(jiān)控預(yù)警、告警、診斷分析、事件管理和知識推薦的全鏈路智能系統(tǒng)。
 
  發(fā)展與展望

 
  隨著AIOps應(yīng)用不斷的深入,智能運(yùn)維將會在縱向和橫向不斷延伸。橫向上,智能運(yùn)維應(yīng)用場景將會從ITOM向ITOA、ITSM和ITBM發(fā)展,覆蓋更多的運(yùn)維領(lǐng)域。縱向上,隨著運(yùn)維數(shù)據(jù)成熟度以及AI能力的提升,智能運(yùn)維將從機(jī)器學(xué)習(xí)向深度學(xué)習(xí)、增強(qiáng)學(xué)習(xí)甚至向元學(xué)習(xí)能力延伸。這種縱橫能力的覆蓋,將實現(xiàn)AI對整個運(yùn)維場景的可見、可控、可分析、可管理。

熱詞搜索:智能運(yùn)維

上一篇:如何高效管理您的AWS成本?
下一篇:DeepFlow助力金融云實現(xiàn)高效、智能的虛擬網(wǎng)絡(luò)監(jiān)控運(yùn)維

分享到: 收藏
主站蜘蛛池模板: 杭锦后旗| 玛纳斯县| 泾阳县| 和顺县| 湟中县| 西和县| 景宁| 崇仁县| 北川| 克拉玛依市| 阿巴嘎旗| 房山区| 绵竹市| 宜城市| 贡山| 准格尔旗| 江门市| 通州市| 沙雅县| 长春市| 紫阳县| 博湖县| 禹州市| 罗平县| 南京市| 田阳县| 仁寿县| 额济纳旗| 格尔木市| 南涧| 潼南县| 博兴县| 甘孜| 昔阳县| 白河县| 民和| 西藏| 西乡县| 新余市| 麻江县| 赤峰市|