信息安全的檢測(cè)中有一部分是高端安全檢測(cè),高端安全檢測(cè)涉及對(duì)檢測(cè)模式的重新認(rèn)識(shí),這就涉及到大數(shù)據(jù)。
探尋高端檢測(cè)
從檢測(cè)方面來(lái)看,有三個(gè)境界:
第一種是“檢測(cè)足”,屬于簡(jiǎn)單檢測(cè),比如:有閾值限制,超過(guò)了什么值,系統(tǒng)就會(huì)告警;再比如,包過(guò)濾規(guī)則;這些檢測(cè)都相對(duì)簡(jiǎn)單。
第二種是“檢測(cè)腰”,基于單一特征的檢測(cè),比如:漏洞特征、病毒特征、攻擊特征、URL黑白名單等等特征庫(kù)檢測(cè)。單一特征強(qiáng)調(diào)的是可表達(dá)、可處理和可操作性。所謂特征(或者稱(chēng)某種模型),我們使用它的計(jì)算復(fù)雜度要大大低于提煉獲取它的復(fù)雜度。這里比喻成檢測(cè)腰,就是因?yàn)樗幸粋€(gè)收緊計(jì)算復(fù)雜度的作用。傳統(tǒng)安全公司技術(shù)能力的競(jìng)爭(zhēng),主要就是看你能獲取和積累多少特征。
第三種是“檢測(cè)頸”,屬于高端檢測(cè),包括APT檢測(cè)或者宏觀態(tài)勢(shì)感知等。另外,檢測(cè)腰中部分特征的提煉和分析其實(shí)也屬于高端檢測(cè)的范疇。
安全的三種境界
談到高端安全檢測(cè)問(wèn)題,可以簡(jiǎn)單地分為兩類(lèi),一類(lèi)是宏觀安全檢測(cè),典型問(wèn)題就是網(wǎng)絡(luò)宏觀態(tài)勢(shì)感知;一類(lèi)是微觀安全問(wèn)題,典型問(wèn)題就是APT(Advanced Persistent Threat,高級(jí)持續(xù)性威脅)攻擊發(fā)現(xiàn)。
關(guān)于宏觀態(tài)勢(shì)感知,如城域網(wǎng)的網(wǎng)絡(luò)事件態(tài)勢(shì)感知,目前方法還相對(duì)較少。舉個(gè)例子,啟明星辰實(shí)現(xiàn)了一個(gè)地址熵算法。熵是離散度的一種評(píng)價(jià),所謂地址熵就是累積計(jì)算網(wǎng)絡(luò)上的源地址的熵和目的地址的熵,并對(duì)兩條隨時(shí)間變化的地址熵曲線進(jìn)行跟蹤分析。如果目的地址熵突然下降,也就是目的地址突然集中了,由此可以立即判斷出來(lái)可能發(fā)生了分布式拒絕服務(wù)攻擊;如果目的地址熵微升而源地址熵下降,源地址相對(duì)較集中,意味著有網(wǎng)址在密集地向外廣泛地發(fā)包,可以初步判斷可能出現(xiàn)了掃描事件或蠕蟲(chóng)傳播。這兩個(gè)地址熵指標(biāo)就像天氣預(yù)報(bào)中常用的溫度、氣壓等這些衡量指標(biāo)。目前,在城域網(wǎng)監(jiān)控方面這樣特別有效的既簡(jiǎn)單又精妙的算法并不多。
關(guān)于APT攻擊,目前常見(jiàn)的提出的APT應(yīng)對(duì)方法,很多是在APT中的A(高級(jí))上下功夫。也就是如何深入分析隱蔽性很深的惡意代碼和行為。確實(shí),當(dāng)我們拿到一段值得懷疑的代碼和數(shù)據(jù)集,對(duì)其進(jìn)行深入分析是可行的;但是難的就是,從茫茫數(shù)據(jù)中,我怎么能夠確定哪段數(shù)據(jù)值得懷疑并進(jìn)行深入的分析呢?
試解高端檢測(cè)中的大數(shù)據(jù)問(wèn)題
上面提到的這兩種高端信息安全檢測(cè)問(wèn)題,最終都導(dǎo)向了大數(shù)據(jù)方法。
面對(duì)宏觀態(tài)勢(shì)感知和預(yù)測(cè)問(wèn)題,歸結(jié)起來(lái)就是在海量的數(shù)據(jù)中發(fā)現(xiàn)宏觀的波動(dòng)趨勢(shì)。哪怕是細(xì)微的波動(dòng),也是宏觀問(wèn)題。宏觀態(tài)勢(shì)感知和預(yù)測(cè),就是要發(fā)現(xiàn)這些波動(dòng),并且判斷出來(lái)哪些波動(dòng)會(huì)演變成災(zāi)難性的網(wǎng)絡(luò)風(fēng)暴,以便及時(shí)加以遏制。要發(fā)現(xiàn)和描述這樣的態(tài)勢(shì),僅僅靠局部數(shù)據(jù)計(jì)算得出的簡(jiǎn)單統(tǒng)計(jì)指標(biāo)是非常不夠的,即使是地址熵這樣的精妙指標(biāo)也是不夠的。在這方面的研究中,可以類(lèi)比的其他學(xué)科就是天氣預(yù)報(bào)、股票期貨金融品分析預(yù)測(cè)等等。這種分析活動(dòng),自然而然就是大數(shù)據(jù)。
而面對(duì)APT攻擊發(fā)現(xiàn)問(wèn)題,最終也是大數(shù)據(jù)問(wèn)題。
APT的A高級(jí),不僅僅是某些具體攻擊手法隱藏很深,還包括APT攻擊在空間上的不確定性;而APT的P所代表的時(shí)間上的長(zhǎng)期持續(xù)性或者斷續(xù)性,更是APT的檢測(cè)難點(diǎn)。
攻擊的空間拓展變化包括持續(xù)性、蔓延性、傳播性、滲透性等等,這一變化帶來(lái)了安全模式的變化。求檢對(duì)象隱藏在一個(gè)檢測(cè)環(huán)境里,你采集過(guò)來(lái)進(jìn)行檢測(cè)計(jì)算的就是一個(gè)“被檢測(cè)域”。你并不確切地知道你所要找的求檢對(duì)象在哪里;于是檢測(cè)者就希望“被檢測(cè)域”盡可能地多覆蓋求檢對(duì)象,也就是要先擴(kuò)大被檢測(cè)域。被檢測(cè)域變大了數(shù)據(jù)變多了,自然而然就變成了大數(shù)據(jù)問(wèn)題。APT檢測(cè)的出路可能就在大數(shù)據(jù)上。
APT有很大的空間不確定性。APT攻擊走哪條路徑不得而知,這就是信息不對(duì)稱(chēng)。防御者不知道攻擊者從哪條路徑來(lái)進(jìn)行攻擊,這是非常頭疼的事情。但路是防御者的路,攻擊者一定會(huì)通過(guò)防御者的路并靠近防御者,這就是防御者的優(yōu)勢(shì)。我們講從空間角度來(lái)擴(kuò)展被檢測(cè)域,只要擴(kuò)展更多的有效檢測(cè)點(diǎn),總能獲得更高概率來(lái)截獲攻擊路徑。更多的檢測(cè)點(diǎn)、更多樣的檢測(cè)點(diǎn)、更多的數(shù)據(jù),有利于解決APT問(wèn)題。
APT有很大的時(shí)間不確定性。從時(shí)間角度來(lái)擴(kuò)展被檢測(cè)域,一個(gè)最簡(jiǎn)單直接的思維突破就是“存儲(chǔ)”。說(shuō)得更哲理一些,就是“記憶”。比如0-day問(wèn)題,在沒(méi)有特征的時(shí)候是難于檢測(cè)到的。如果用一個(gè)網(wǎng)絡(luò)錄像機(jī)把所有的網(wǎng)絡(luò)流全錄下來(lái),回過(guò)頭來(lái)有了特征之后再檢測(cè),就可能發(fā)現(xiàn)攻擊。有部電影名字叫《源代碼》,其情節(jié)就是這個(gè)感覺(jué)。能夠運(yùn)用存儲(chǔ)、運(yùn)用記憶,形成一個(gè)時(shí)間機(jī)器,反復(fù)的回溯分析,這就是所謂的時(shí)間領(lǐng)域擴(kuò)展。也就是用P來(lái)對(duì)抗APT中的P。
在信息安全檢測(cè)的采集上,可以考慮給被檢測(cè)域數(shù)據(jù)提前打標(biāo)簽,可以稱(chēng)之為輕干擾檢測(cè)(輕破壞檢測(cè))。這可以使其具有某種全息性。這種干擾的不同處理,都是分析目的和過(guò)程對(duì)于前端采集技術(shù)鏈條施加影響。當(dāng)然,這樣很可能會(huì)進(jìn)一步增加檢測(cè)過(guò)程的復(fù)雜程度,也可能讓檢索變得更快捷。
新安全檢測(cè)思路——四階段檢測(cè)
原先我們的安全檢測(cè)都是三步檢測(cè)——采集、分析、關(guān)聯(lián)。而有了上面闡述的“大”思路,就變成了一個(gè)四步檢測(cè)——擴(kuò)大、濃縮、精確、場(chǎng)景。也就是將原先三步中的“采集”,變成了“擴(kuò)大”——擴(kuò)大被檢測(cè)域以便更可能覆蓋求檢對(duì)象,以及“濃縮”——將海量被檢測(cè)域數(shù)據(jù)中的有用數(shù)據(jù)濃縮下來(lái)。
濃縮、篩選、抽樣等等可以理解為分析過(guò)程中的物理處理過(guò)程,所謂物理過(guò)程就是不改變被檢測(cè)域數(shù)據(jù)的原有性質(zhì)和形態(tài),就如同煉鐵過(guò)程中的選礦篩礦。比如渲染+半衰的處理算法:對(duì)于被檢測(cè)域進(jìn)行數(shù)據(jù)分塊,對(duì)數(shù)據(jù)塊的疑似程度進(jìn)行打分渲染;然后再一個(gè)周期中對(duì)所有數(shù)據(jù)塊進(jìn)行半衰式處理;之后在進(jìn)行打分再半衰,低于某一個(gè)閾值的數(shù)據(jù)塊被丟棄。如此循環(huán)下去,留下的數(shù)據(jù)塊集合就是被濃縮的被檢測(cè)域。
精確檢測(cè)就是借助傳統(tǒng)的誤用檢測(cè)和異常檢測(cè)來(lái)進(jìn)一步分析。在這個(gè)階段我常常將之比喻成分析過(guò)程的化學(xué)反應(yīng)。這個(gè)時(shí)候提取出來(lái)的結(jié)論數(shù)據(jù),其數(shù)據(jù)性質(zhì)和形態(tài)都與被檢測(cè)域的數(shù)據(jù)大大不同了。
場(chǎng)景步驟是對(duì)于檢測(cè)結(jié)果的組合性分析。分析出的場(chǎng)景,可能來(lái)自對(duì)于精確檢測(cè)的細(xì)微時(shí)間的組合,也可能來(lái)自于濃縮過(guò)程的提煉。
信息安全與大數(shù)據(jù)
大數(shù)據(jù)通常分為兩類(lèi):一類(lèi)是天然大數(shù)據(jù)問(wèn)題,如基因計(jì)算、礦物勘測(cè)、空間探測(cè)等,這類(lèi)是客觀存在的大數(shù)據(jù)問(wèn)題;還有一類(lèi)是人參與的大數(shù)據(jù)問(wèn)題,如購(gòu)物數(shù)據(jù),社交網(wǎng)絡(luò)數(shù)據(jù)等,這一類(lèi)可以通過(guò)檢測(cè)目的對(duì)這些數(shù)據(jù)進(jìn)行前端影響。安全屬于第二類(lèi)。
大數(shù)據(jù)相關(guān)思維和技術(shù)在安全中的應(yīng)用非常值得期待。(本文作者:?jiǎn)⒚餍浅焦臼紫瘧?zhàn)略官潘柱廷)