国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關(guān)注微信公眾號(hào)

CCERT中文垃圾郵件過濾規(guī)則集
2005-12-30   

1. 什么是 Chinese_rules.cf

是用于業(yè)界廣泛使用的免費(fèi)垃圾郵件過濾系統(tǒng)的中文垃圾郵件過濾規(guī)則集。由于以前沒有中文的過濾規(guī)則集,SpamAssassin對(duì)中文郵件過濾的準(zhǔn)確性不高。CCERT反垃圾郵件研究小組利用CCERT所掌握的最新和豐富的樣本數(shù)據(jù),推出了第一個(gè)基于SpamAssassin的中文垃圾郵件過濾規(guī)則集Chinese_rules.cf。該規(guī)則集每周更新一次,時(shí)效性非常好。
Chinese_rules.cf是在SpamAssassin 官方網(wǎng)站上發(fā)布的第一個(gè)中文垃圾郵件過濾規(guī)則集,也是用Google,Yahoo,百度,MSN搜索“中文垃圾郵件過濾”時(shí)所返回的第一條結(jié)果。

2. Chinese_rules.cf的理論背景

Chinese_rules.cf是郵件內(nèi)容過濾規(guī)則集。目前郵件內(nèi)容過濾技術(shù)可以分為兩種方法:基于規(guī)則和基于統(tǒng)計(jì)的方法?;谝?guī)則的方法就是在郵件內(nèi)容中尋找特定的模式,例如主題包含“免費(fèi)”?;诮y(tǒng)計(jì)的就是使用統(tǒng)計(jì)方法解決郵件的二元分類問題,其中分類機(jī)跟據(jù)垃圾郵件和正常郵件的樣本訓(xùn)練出來。在垃圾郵件過濾技術(shù)中最常用的統(tǒng)計(jì)方法就是貝葉斯準(zhǔn)則。
基于規(guī)則方法的優(yōu)點(diǎn)是規(guī)則可以共享,因此它的推廣性很強(qiáng)。一個(gè)人寫出的規(guī)則可以提供給多個(gè)人,多個(gè)服務(wù)器使用。然而它的缺點(diǎn)就是更新速度慢。因?yàn)橐?guī)則一般都是人工編寫生成,所以新規(guī)則的產(chǎn)生速度跟不上新垃圾郵件出現(xiàn)的速度,換句話說,它的時(shí)效性較差。
基于統(tǒng)計(jì)的方法的優(yōu)點(diǎn)就是分類機(jī)由程序自動(dòng)訓(xùn)練出來,只要及時(shí)更新樣本訓(xùn)練集就可以使分類機(jī)更新的速度跟得上垃圾郵件出現(xiàn)的速度,即它的時(shí)效性很強(qiáng)。然而該方法的缺點(diǎn)就是分類機(jī)不能共享,某個(gè)用戶用自己的郵件樣本集訓(xùn)練出來的分類機(jī)對(duì)其他用戶可能效果不佳,因此該方法的推廣性較差。
Chinese_rules.cf使用基于統(tǒng)計(jì)規(guī)則的新方法,即它所使用的規(guī)則是由統(tǒng)計(jì)方法自動(dòng)生成的。該方法吸取了基于規(guī)則和基于統(tǒng)計(jì)的優(yōu)點(diǎn):因?yàn)樗且环N基于規(guī)則的方法,因此推廣性很強(qiáng),又因?yàn)樗囊?guī)則是由統(tǒng)計(jì)方法自動(dòng)生成的,因此它的時(shí)效性也很強(qiáng)。Chinese_rules.cf和傳統(tǒng)方法比較如表1所示。

表1、Chinese_rules.cf和傳統(tǒng)方法比較

  推廣性 時(shí)效性
基于規(guī)則
基于統(tǒng)計(jì)
Chinese_rules.cf

CCERT反垃圾郵件組自從1998年成立以來,每天都處理大量的垃圾郵件投訴,掌握最新和最豐富的樣本數(shù)據(jù)。Chinese_rules.cf就在此最新和最豐富的樣本數(shù)據(jù)庫的基礎(chǔ)上,通過統(tǒng)計(jì)方法自動(dòng)產(chǎn)生的。

3. Chinese_rules.cf的生成和使用框架

Chinese_rules.cf的生成和使用框架如圖1所示。首先,利用CCERT垃圾郵件處理服務(wù)和用戶反饋信息來維護(hù)一個(gè)最新,最全的垃圾/正常郵件樣本庫,再利用統(tǒng)計(jì)方法,根據(jù)垃圾/正常郵件樣本庫自動(dòng)生成規(guī)則集Chinese_rules.cf。因?yàn)闃颖編焓亲钚碌?,Chinse_rules.cf的時(shí)效性就非常強(qiáng)。CCERT把該規(guī)則集在CCERT主頁上發(fā)布,作為CCERT提供的一種對(duì)外服務(wù)。各地用戶(服務(wù)器)通過CCERT主頁下載Chinese_rules.cf,這樣使Chinese_rules.cf的推廣性很強(qiáng)。

圖1、Chinese_rules.cf 的生成和使用框架

4. Chinese_rules.cf的匹配速度問題

Chinese_rules.cf規(guī)則集一般被控制在500個(gè)規(guī)則左右。這一數(shù)字也許使人對(duì)Chinese_rules.cf的匹配速度有點(diǎn)置疑。仔細(xì)分析和測(cè)試結(jié)果表明Chinese_rules.cf的匹配性能還是比較高的,原因是:一、Chinese_rules.cf的規(guī)則都很簡(jiǎn)單,都是一個(gè)比較短的字符串,中間沒有帶任何一個(gè)通配符,這樣匹配速度比復(fù)雜的規(guī)則要快的多;二、Chinese_rules.cf中有90%是郵件主題的規(guī)則,只有10%是信體的規(guī)則。由于郵件主題往往比較短,因此Chinese_rules.cf的匹配速度會(huì)比較快。
以上是對(duì)性能的理論分析。我們用一臺(tái)普通PC(P4 2.8G CPU),用Chinese_rules.cf (2004 Dec 21的版本) 對(duì)178482封郵件匹配,則結(jié)果是平均匹配一封大小為5.0K的郵件只需要 0.04秒。這個(gè)結(jié)果實(shí)非常好的,因?yàn)槿绻粋€(gè)郵件服務(wù)器的郵件平均大小為5.0K(不算附件),那么只要一臺(tái)普通PC每天就可以處理216萬封郵件。一般的學(xué)生郵件服務(wù)器每天收發(fā)30萬封左右。換句話說,只要在現(xiàn)有的郵件服務(wù)器加上如同上述一臺(tái)PC的處理性能就足以滿足處理垃圾郵件的硬件需求。

5. Chinese_rules.cf 的準(zhǔn)確率

Chinese_rules.cf的每一個(gè)版本都帶有對(duì)準(zhǔn)確率的測(cè)試結(jié)果。當(dāng)前版本的測(cè)試結(jié)果如下:

Chinese_rules.cf,2005 Jan 2


閾值 垃圾郵件查全率
(共16729)
正常郵件誤判率
(共93655)

0.5 95.0% 5.1%
1.0 92.9% 1.6%
1.5 90.4% 0.4%
2.0 87.9% 0.1%
2.5 84.5% 0.0%
3.0 81.1% 0.0%
3.5 76.6% 0.0%
4.0 72.4% 0.0%
4.5 67.0% 0.0%

掃描一封郵件大小為 1932.37 字節(jié)需要 0.03 秒(P4-2.8G CPU)

表2中的結(jié)果就是在測(cè)試規(guī)程中,除了Chinese_rules.cf 以外不使用其他任何規(guī)則。在實(shí)際情況,Chinese_rules.cf一般都會(huì)跟SpamAssassin的缺省規(guī)則同時(shí)使用。因?yàn)镾pamAssassin的缺省規(guī)則中有一部分是描述郵件行為的規(guī)則,對(duì)檢測(cè)中文垃圾郵件起作用,因此實(shí)際的性能會(huì)比以上實(shí)驗(yàn)結(jié)果要好。
注意、 對(duì)于每天處理40萬封郵件以上的郵件服務(wù)器來說,能夠容忍的性能是正常郵件誤判率小于5%的同時(shí),垃圾郵件的檢測(cè)率大于90%。

6. Chinese_rules.cf 的用戶統(tǒng)計(jì)

CCERT于2004年9月7日在網(wǎng)上發(fā)布Chinese_rules.cf。從9月至12月的用戶統(tǒng)計(jì)情況如下。圖2就是用戶查看規(guī)則集的統(tǒng)計(jì)(按IP)??梢钥闯鲆?guī)則集的知名度在直續(xù)上升。

圖2、用戶查看規(guī)則集統(tǒng)計(jì)(按IP)

圖3就是在Unix/Linux服務(wù)器上使用的用戶統(tǒng)計(jì)(安不同IP),其中深灰色表示老客戶,即上個(gè)月已經(jīng)出現(xiàn)的IP。

圖3、用戶使用規(guī)則集統(tǒng)計(jì)(按不同IP)

7. Chinese_rules.cf 的使用方法

下載,把該規(guī)則放在SpamAssassin存放規(guī)則的目錄(一般在/usr/share/spamassassin)。通過wget下載的命令如下:

# wget -N -P /usr/share/spamassassin www.ccert.edu.cn/spam/sa/Chinese_rules.cf

每次更新Chinese_rules.cf都需要重啟加載SpamAssassin規(guī)則的程序。如果你用spamd則通常重啟的方法是:

# ps –ax | grep spamd
察看spamd進(jìn)程的PID,然后
# kill -HUP PID
如果你用mimedefang則要重起mimedefang。假設(shè)mimedefang的重起腳本為 /etc/init.d/init-script, 則命令如下:

# /etc/init.d/init-script restart

CCERT每周更新一次規(guī)則集和相應(yīng)分?jǐn)?shù),更新使用CCERT反垃圾郵件服務(wù)在6個(gè)月內(nèi)處理過的垃圾郵件為樣本。經(jīng)常更新Chinese_rules.cf會(huì)使過濾效果更好。只要把上述下載命令以及重起mimedefang的命令放在crontab中,并定期運(yùn)行就可以完成自動(dòng)更新功能。假如你想一個(gè)月更新一次,那么在root的crontab中應(yīng)該添加一行:

0 0 1 * * wget -N -P /usr/share/spamassassin www.ccert.edu.cn/spam/sa/Chinese_rules.cf; /etc/init.d/init-script restart

更多信息請(qǐng)參見CCERT中文垃圾郵件解決方案


熱詞搜索:

上一篇:利用UBE插件抵制垃圾郵件
下一篇:SMTP安全手冊(cè)—理論基礎(chǔ)

分享到: 收藏
国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区
欧美大色视频| 欧美日韩一区二区在线视频| 韩国三级电影久久久久久| 国产伦精品一区二区三区视频黑人| 欧美日韩在线免费| 国产欧美精品一区aⅴ影院| 狠狠入ady亚洲精品经典电影| 一区视频在线播放| 亚洲深夜影院| 欧美福利精品| 国产亚洲综合精品| 99综合在线| 久久久之久亚州精品露出| 欧美国产日韩一区二区在线观看| 欧美日韩伊人| 亚洲欧洲另类| 久久免费国产精品| 国产伦精品一区二区三区四区免费| 亚洲日本无吗高清不卡| 久久久久久穴| 国产婷婷精品| 欧美一级午夜免费电影| 欧美性大战久久久久久久| 亚洲国产精品小视频| 久久精品国产综合| 国产精品久久久久久久久久尿 | 久久综合色综合88| 久久精品噜噜噜成人av农村| 老司机精品视频网站| 国产精品福利影院| 在线亚洲成人| 欧美激情一区二区三区高清视频| 国产亚洲视频在线观看| 久久成人免费日本黄色| 国产精品成人免费精品自在线观看| 亚洲久久一区二区| 欧美高清视频一区二区三区在线观看| 国产综合自拍| 嫩草成人www欧美| 最近看过的日韩成人| 欧美区二区三区| av成人动漫| 欧美绝品在线观看成人午夜影视 | 国产精品久久久一区二区| 日韩一区二区久久| 欧美揉bbbbb揉bbbbb| 亚洲五月六月| 国产亚洲精品bt天堂精选| 老司机午夜免费精品视频| 亚洲精品中文字幕有码专区| 国产精品白丝av嫩草影院| 午夜精品在线看| 亚洲电影激情视频网站| 欧美日韩国产在线| 久久久水蜜桃av免费网站| 欧美性猛交99久久久久99按摩| av成人动漫| 国产日韩成人精品| 久久久亚洲精品一区二区三区| 在线观看的日韩av| 欧美日本韩国在线| 午夜免费在线观看精品视频| 一区在线观看视频| 欧美日韩一视频区二区| 久久精品国产亚洲aⅴ| 亚洲免费观看高清在线观看| 国产精品乱码一区二区三区| 久热国产精品| 午夜综合激情| 一本大道av伊人久久综合| 久久婷婷国产麻豆91天堂| 国产精品高潮视频| 午夜精品久久久久久久久久久久| 国产专区欧美专区| 欧美日韩国产成人| 久久成人18免费网站| 亚洲精品日韩在线| 国产精品一区二区久久久久| 欧美成黄导航| 久久久久久久尹人综合网亚洲| 亚洲视频精选| 91久久久久久国产精品| 国产午夜一区二区三区| 欧美日韩八区| 女女同性女同一区二区三区91| 性xx色xx综合久久久xx| 国产精品色网| 久久久久久穴| 亚洲欧美日本国产有色| 亚洲国产精品福利| 国模吧视频一区| 国产精品免费在线| 国产精品不卡在线| 欧美日韩精品是欧美日韩精品| 久久久精品国产一区二区三区| 亚洲一区二区在线免费观看| 99精品视频网| 一本一本久久a久久精品综合妖精| 亚洲国产乱码最新视频| 亚洲第一区中文99精品| 在线免费观看日本欧美| 伊人春色精品| 亚洲第一精品在线| 亚洲国产日韩欧美在线99| 亚洲成在线观看| 亚洲精品国产精品国产自| 亚洲人体大胆视频| 一本色道久久加勒比88综合| 一本色道久久88精品综合| 一区二区91| 欧美一区二区三区婷婷月色 | 国产精品中文字幕欧美| 国产精品久久久久久久久搜平片| 国产精品美女久久久久aⅴ国产馆| 国产精品久久久久久久午夜片| 国产精品稀缺呦系列在线| 国产视频综合在线| 亚洲国产天堂久久国产91| 日韩视频一区二区三区在线播放| 一区二区三区精密机械公司| 欧美一级片久久久久久久| 久久国内精品视频| 欧美成熟视频| 国产精品嫩草99av在线| 黄色成人av在线| 亚洲毛片一区二区| 午夜亚洲性色视频| 母乳一区在线观看| 国产精品久久久久久久久久尿| 国产亚洲欧美一区二区三区| 亚洲欧洲午夜| 香蕉久久a毛片| 欧美激情亚洲国产| 国产日韩一区二区| 亚洲美女视频在线观看| 欧美一区二区免费| 欧美极品在线视频| 国产欧美日韩另类视频免费观看| 亚洲第一区在线观看| 亚洲一级影院| 麻豆精品网站| 国产精品区一区二区三区| 亚洲电影免费观看高清完整版在线 | 国产精品久久久久久久9999| 国际精品欧美精品| 在线亚洲精品| 欧美大片一区二区| 韩日在线一区| 欧美影院精品一区| 国产精品久久久久久久久久尿| 亚洲电影网站| 久久精品国产v日韩v亚洲 | 午夜视黄欧洲亚洲| 欧美承认网站| 欲色影视综合吧| 欧美一区二区三区在线观看视频| 欧美美女视频| 91久久综合| 美女脱光内衣内裤视频久久网站| 国产精品网站在线| 中日韩男男gay无套| 欧美久久久久| 亚洲另类在线视频| 欧美高清视频| 亚洲精品乱码久久久久久黑人| 久久综合久久综合九色| 国内偷自视频区视频综合| 午夜精彩视频在线观看不卡| 欧美性天天影院| 亚洲性感美女99在线| 国产精品盗摄久久久| 在线亚洲成人| 国产精品xxxxx| 亚洲视频axxx| 国产精品国产成人国产三级| 亚洲一区二区三区在线播放| 欧美日韩在线免费| 亚洲视频第一页| 国产精品亚洲片夜色在线| 亚洲欧美综合另类中字| 国产午夜精品一区二区三区欧美 | 亚洲黄色影片| 欧美大片在线看| 一本色道久久综合亚洲二区三区| 欧美日韩高清在线| 一区二区三区免费网站| 国产精品国产三级国产普通话99| 午夜国产精品视频| 伊人久久大香线蕉av超碰演员| 蜜桃av噜噜一区二区三区| 亚洲精选久久| 国产精品视频久久久| 久久久久亚洲综合| 亚洲黄色av一区| 欧美色欧美亚洲高清在线视频| 性欧美长视频| 91久久精品美女高潮| 国产精品三级视频| 你懂的视频欧美| 亚洲一级黄色av|