作者:Rick Vanover,Veeam 產品戰略高級總監;David Russell,Veeam企業戰略副總裁
新冠疫情爆發以來,IT部門加深了對網絡安全的共同關注,他們采取更周密的保護措施,以應付攻擊者竊取數據和其發動的難以計數的勒索軟件攻擊。在這個過程中,許多人可能忽略了其他威脅,而這些威脅可能造成像網絡攻擊一樣嚴重的危害。
人為錯誤依然是導致數據丟失的最普遍原因。研究表明,企業因誤刪和意外覆蓋而丟失的數據量幾乎是惡意攻擊的五倍。意外的配置、應用和用戶管理錯誤同樣會導致系統崩潰、數據刪除,并引起代價高昂的停機事件。
自然災害正在成為一個越來越嚴重的問題。過去兩年,美國遭遇了有史以來最頻繁的熱帶風暴襲擊,專家預計氣候變化造成的破壞將越來越嚴重。近期,僅颶風“艾達”對企業、消費者和社區造成的財物損失就接近1億美元。
提高對網絡攻擊的關注是必要的,但為了應對我們目前面臨的真實威脅形勢,組織需要調整災難恢復(DR)策略的優先級。他們需要實施員工培訓,在災難恢復流程中實現功能的自動化,并確保災難恢復策略和流程能夠隨時應對威脅業務連續性的意外突發事件。
如果不這樣做,運營將受到影響。一項研究表明,發生災難性數據丟失的企業,94%未能生存下來,43%再也沒有恢復經營,而51%在兩年內關門歇業。根據《Veeam2021數據保護報告》顯示,那些得以維持經營的企業在收入和產能方面的損失每小時高達84,650美元。而且他們承受的損失還不止于此:他們會受到外部影響,包括喪失客戶信心、品牌受損等;還會受到內部影響,例如員工士氣低落,資源分散;此外的第三方因素、訴訟和法規可能對公司估值產生嚴重影響。
員工培訓是一個很好的開始,疫情期間未對員工實施新一輪網絡安全培訓的任何組織都應將此作為首要任務。員工培訓應該包括常規的最佳做法,例如遵循事件通知程序,選擇高強度密碼以避免釣魚攻擊等。
但是培訓也應該延伸到IT操作員。遵循一系列最佳實踐可以減少配置錯誤,這包括創建單一配置源,提供便于跟蹤配置更改的方法,以及對所有服務使用DNS服務名。由于不可能對所有可能的條件進行測試,因此應用錯誤將不可避免。但定期檢查和升級測試流程可以改善工作效果,減少日常操作中因粗心導致的錯誤。
后疫情時代應將自動化作為首要任務,它不僅可以減少日常流程中的人為錯誤,還讓員工有更多時間處理更具有戰略意義的高級任務,對于IT和其他工作人員都是如此。過去兩年,許多組織加大了對自動化技術的投資,他們應該繼續增加投資,以提高產能和實現更高水平的安全性。
特別是,自動化的災難恢復流程可以節省時間,提高整體響應速度。如今的應用和數據集規模比以往任何時候都更大、更復雜、更分散,相互之間的依賴程度也更高,即便成功恢復單個應用也需要大量工作,恢復整個網站的難度可想而知,這讓恢復流程的編排成為不可或缺的工具。
考慮到嚴峻的威脅形勢,現在組織必須更密切地關注災難恢復計劃和程序,確保在必要時能夠快速實施。以下是一些建議:
?檢查細節:有一份最新的、符合公司具體業務需求的有效計劃是至關重要的。疫情爆發以來,需求可能已經發生變化,如果您在過去一年多的時間里沒有重新審視你的計劃,那么這應是當前的首要工作。
?審查文檔:系統恢復期間,便于執行的綜合文檔可以節省時間,消解壓力。創建文檔需要大量時間,因此應持續進行審查,這個工作最好由文檔的使用者負責。
?更新身份訪問權限:在服務消費轉變過程中,身份驗證完成后可能已經產生了漏洞。系統停機時,在講究時效性的窗口期,要確保授權恰當的人員執行關鍵系統功能。
?重新評估DR/恢復力計劃:隨著越來越多地使用外部設備,組織應評估計劃的合理性,以便提供端到端保護,在員工到設備終端之間建立保護機制。
?加大測試力度:對每個應用進行單獨測試,確保滿足關鍵指標要求,主要是恢復時間目標(RTO)和恢復點目標(RPO)。
結論
網絡攻擊呈上升趨勢,組織需要投入大量精力抵御攻擊。但災難來臨的形式不盡相同,當它來臨時,為了確保安全,IT部門應該確保恢復計劃和程序到位,這是企業賴以生存的基礎。