在一些實施CMMI高成熟度的軟件公司中對于過程的性能數(shù)據(jù)進行分析時,常常發(fā)現(xiàn)應(yīng)該具有相關(guān)性的2個變量根據(jù)歷史的數(shù)據(jù)不能證明這種相關(guān)性,或者是應(yīng)該正相關(guān)的數(shù)據(jù)卻分析出了負相關(guān)的結(jié)論,原因何在呢?例如:
我們的經(jīng)驗與常識:
假設(shè)或常識1:高水平的測試人員找出的BUG多, 低水平的測試人員找出的BUG少。
假設(shè)或常識2:高水平的開發(fā)人員犯的錯誤應(yīng)該少,低水平的開發(fā)人員犯的錯誤應(yīng)該多。
我們的實際數(shù)據(jù):
在實踐中常常采用的策略:
策略1:關(guān)鍵的模塊應(yīng)該由高水平的開發(fā)人員進行開發(fā),非關(guān)鍵的模塊由低水平的開發(fā)人員進行開發(fā)。
策略2:高水平的測試人員要測關(guān)鍵的模塊,低水平的測試人員測試非關(guān)鍵的模塊。
如果是這樣,對于測試過程做了度量以后,數(shù)據(jù)無法證明假設(shè)1和2的成立。
這就是問題的癥結(jié)!我們的實際數(shù)據(jù)本身就是有傾向的樣本!而不是隨機的樣本!因為我們采用了策略1和策略2!所以歷史數(shù)據(jù)表明:我們發(fā)現(xiàn)的bug的多少是與開發(fā)人員的水平、測試人員的水平是無關(guān)的。
如果要證明假設(shè)1和2,需要做實驗,即在保證**條件相同的情況下,我們做實驗看測試人員或開發(fā)人員的水平對測試的BUG數(shù)的影響,統(tǒng)計過程的性能數(shù)據(jù)去證明假設(shè)1和假設(shè)2。
所以遇到數(shù)據(jù)中存在不符合常識的結(jié)論時,應(yīng)該仔細剖析一下,看看問題何在。
原文鏈接:http://tech.ccidnet.com/art/302/20120612/3947921_1.html