498)this.style.width=498;" align=no>
轉眼間,AMD與Intel兩大廠商之間GHz頻率之爭都已經成為了歷史?,F在除非是比較同一個系列的處理器相比較,否則頻率速度的高低并不能完全反應CPU的性能。就處理器發(fā)展趨勢來看,處理器乃至整個平臺的性能取決于單個CPU的核心數目,因此我們看到Intel正在積極從雙核心移轉為四核心處理器。(在07年3月20日Intel在中國北京結束了多核應用論壇上,Intel服務器產品市場經理\服務器平臺事業(yè)部——顧凡先生,已經明確表示四核處理將成為07年雙路服務器市場的主流。)
四核心的桌面級處理器Core 2 Extreme QX6700是Intel于2006年11月14日發(fā)布的,同時Intel也發(fā)布了基于研發(fā)代號為Clovertown的Xeon 5355服務器/工作站版本。AMD與Intel不再從處理器壓榨出更高頻率,而是注重轉向設計多核處理器是有許多原因的。其中之一是,更多執(zhí)行核心可以同時承受更多工作負載,前提條件是用戶要使用較新的操作系統(tǒng),以設計有多線程的應用程序(threads-目前大多數新軟件都是如此設計)執(zhí)行。理論上講,單顆CPU內的核心數量增加1倍,也可以獲得雙倍的性能提高;雖然緩存與接口(interface)理論上會限制的效能,但更的多核心設計有助于性能的提高,也比傳統(tǒng)提升頻率的做法要更直接。此外,頻率增加也會大幅增加耗電需求,但增加處理單元時的耗電需求只會穩(wěn)定地以線性提升。
用戶大概會以為雙核心或四核心處理器的體積會比單核心處理器的外觀大很多,事實上則不然。雖然晶體管數目倍數成長,但硅晶元體積并未大幅增加。由于目前的制程技術能以符合經濟效益的方式生產(生產較大的硅晶元產品成本高昂),因此AMD與Intel都有辦法讓處理器核心數加倍而價格基本保持不變;目前多數處理器仍是以90nm制程工藝生產,AMD籍此生產其Opteron雙核心Italy處理器,而英特爾則藉此生產其第一代雙核心Xeon Paxville處理器。
不過,65nm制程的出現使英特爾足以滿懷信心地部署四核心產品。在桌面級市場Intel推出了Core 2 Quad的Kentsfield來滿足需求,而在服務器及工作站領域Intel則推出了Clovertown的Xeon 5300系列處理器,但近期內不會有筆記本的四核處理器推出。雖然AMD在2007年春季之前不會推出四核心Opteron,但計劃會推出名符其實的單裸晶(die)四核心處理器;而英特爾則是將二個雙核心Woodcrest Xeon整合于單一處理器上,打造出一顆四核心處理器。尤于英特爾的設計有其劣勢,某些人稱這種方式為臨時快捷方式(quick-and-dirty),但實際效果卻很顯著;英特爾提供1.6至3.0GHz之間的版本,采用2x 4MB L2緩存及FSB1066或FSB1333MHz。
(其實在測試之前,我們要補充一段內容,這段內容摘自2007年3月20日Intel多核應用論壇的專訪,主要是針對處理器die的封裝問題, Intel的服務器產品市場經理回答道:在我們的計劃中沒有將65納米的四核處理器的2個die合成一個 die,包括在45納米發(fā)布前我們也沒有這個打算。首先用戶不會關心雙核處理器的封裝形式,他們關注的是產品的性能、功耗及價格。在我們出售的四核產品中用戶對我們的產品非常滿意,至于討論怎樣的處理器封裝形式我認為是沒有太多意義的。作為Intel,我們要為用戶考慮,如何可以讓用戶可以用更低的成本獲得更高的投資回報,這是我們要做的事情。另外針對這種將兩個die合成一個die的方式會讓Intel在制造成本方面增加很多的成本,而這些成本也會提高用戶的投資成本,因此我們采用目前的這樣方法是比較經濟的。從技術的層面來看,實現一個die的封裝形式非常簡單,Intel也完全有能力制造這種產品,我們會在Q4推出的45納米產品中增加一些新的技術,對65納米的四核產品不會做改動。)
下面就讓我們來看看四核心Xeon有什么能耐。
498)this.style.width=498;" align=no>
將兩顆雙核Xeon 51xx Woodcrest處理器合并在一起四核Xeon 53xx就這樣誕生了

從左到右依次:Dempsey(3.73-GHz NetBurst雙核心)、Woodcrest(3.0-GHz Core 2雙核心)、Clovertown(3.0-GHz core 2四核心)
一般而言,更多核心所需要的耗電更多的說法是正確的。當CPU負載較高時,所要運作的晶體管數也就更多,因此需要的電力也就更多。然而新款處理器都內建省電機制,AMD稱之為Cool and Quiet(涼又靜)技術,Intel則在桌面市場和移動市場提供SpeedStep技術,在專業(yè)產品中加上DBS(Demand-Based Switching,依需求切換)技術。省電的功能也是用類似的方式運作,這需要主板BIOS 與操作系統(tǒng)及處理器驅動程序的支持。驅動程序會監(jiān)督系統(tǒng)工作的負載,當工作需求低時,會促使處理器降低核心頻率與工作電壓。當操作系統(tǒng)需要更多性能時,頻率就會隨之增加。AMD的Cool and Quiet技術提供多個頻率區(qū)隔,而Intel的SpeedStep技術只有二個頻率等級:最大與SpeedStep速度。作為媒體第三方我們并不偏愛任何一家的技術,其間的優(yōu)勝劣敗得視使用者的特定環(huán)境而定,無論是AMD或Intel處理器用戶,只要確定Cool and Quiet與DBS功能有開啟即可,這會在大型系統(tǒng)環(huán)境中節(jié)省電源,并有助于系統(tǒng)散熱與空調降溫。
在核心數量增加的同時,廠商也會推出更多省電的技巧。處理器可以關閉不用的核心或不使用的緩存區(qū)段;英特爾的 65nm產品多采用閑置時(睡眠模式)不需要電源的省電頻率閘(clock gating),或稱為睡眠晶體管。與雙核心系統(tǒng)相比,四核心計算機在高負載情況下的耗電與熱度更高,不過由于可以享受到的效能增長前所未有,因此這個缺點倒是可以接受,但其間的考慮因素絕對合理。如果系統(tǒng)熱度與耗電增加15∼20%,但一項高需求工作負載的處理時間降低15∼40%,那么計算機可以更快返回低耗電模式,此狀態(tài)下的耗電只比雙核心多出一些,而雙核心會在較高耗電狀態(tài)下保持較長的時間。
Xeon處理器的設計額定功率在65W或80W,而所有四核心Xeon(1.6、1.86與2.33 GHz)也不會超過這個額定功率,只有主頻為3.0 GHz型號需要較高的120W的功耗。
多核心瓶頸
多核瓶頸在于讓高性能裝置發(fā)揮效率,也就是需要一個快速的數據存儲路徑,就快速3D繪圖方案而言,高速繪圖內存是必要的。如果我們再回頭觀察處理器,會發(fā)現接口(interface)是其瓶頸所在,尤其是英特爾架構。目前AMD的所有處理器都已內建DDR或DDR2 內存控制器,也就是說處理器核心要存取數據時,已不需數據路徑;而英特爾方案仍需要將內存控制芯片設計在芯片組中,雖然英特爾已為Xeon平臺提供 Dual Independent Front Side Bus與四信道DDR2內存控制器,但所有核心仍共享數據路徑。(FB-DIMM英文全稱為“Fully Buffered-DIMM”,又稱為全緩沖雙列內存模組的推出也是為緩解內存在數據交換時的不足。)
這個整個問題顯得有點棘手:你可以想象二顆八核心處理器爭奪同一組RAM資源是什么情況嗎?AMD的產品無法這么做,因為每個處理器皆使用本身的內存。是的,如果一顆處理器存取位于另一顆處理器的RAM或L2緩存上的資料,會有一致性的問題出現,但最終的結果還是可以令人接受。此外,未來的操作系統(tǒng)也能察覺實體處理器的存在(Windows Vista Ultimate Edition),因此可以指定執(zhí)行緒或應用程序工作負載給特定處理器,這是有助于激發(fā)工作負載平衡的聰明辦法;這個方法同時適用于Opteron與 Xeon平臺,相對來看AMD方案比較有利。
498)this.style.width=498;" align=no>
兩款雙核處理器
5000系列的意義在于它是英特爾推出第一款雙核心架構的Xeon處理器,在雙核心Paxville推出不久, Intel很快又推出了(Dempsey)90nm雙核心處理器,嚴格地說Dempsey才是Intel推出的第一款雙核產品,但這些產品仍是以 NetBurst架構設計。而最新Core 2微架構設計的Xeon Woodcrest稱為5100,四核心的Xeon Clovertown命名為5300;最后二個數字代表CPU型號與總線速度。請參閱以下表格,找出你平臺適用的Xeon型號。
處理器型號 |
架構 |
快取 |
頻率 |
FSB |
耗電 |
系統(tǒng)類型 |
四核心 |
雙核心 |
HT技術 |
X5355 |
65nm |
8 MB L2 |
2.66 GHz |
FSB1333 |
120W |
DP(桌上型) |
X |
|
|
E5345 |
65nm |
8 MB L2 |
2.33 GHz |
FSB1333 |
80W |
DP(桌上型) |
X |
|
|
E5320 |
65nm |
8 MB L2 |
1.86 GHz |
FSB1066 |
80W |
DP(桌上型) |
X |
|
|
E5310 |
65nm |
8 MB L2 |
1.60 GHz |
FSB1066 |
80W |
DP(桌上型) |
X |
|
|
5160 |
65 nm |
4 MB |
3.0 GHz |
FSB1333 |
80W |
DP(桌上型) |
|
X |
|
5150 |
65 nm |
4 MB |
2.66 GHz |
FSB1333 |
65W |
DP(桌上型) |
|
X |
|
5148 LV |
65 nm |
4 MB |
2.33 GHz |
FSB1333 |
40W |
DP(桌上型) |
|
|
|
5140 |
65 nm |
4 MB |
2.33 GHz |
FSB1333 |
65W |
DP(桌上型) |
|
X |
|
5130 |
65 nm |
4 MB |
2.00 GHz |
FSB1333 |
65W |
DP(桌上型) |
|
X |
|
5120 |
65 nm |
4 MB |
1.87 GHz |
FSB1066 |
65W |
DP(桌上型) |
|
X |
|
5110 |
65 nm |
4 MB |
1.6 GHz |
FSB1066 |
65W |
DP(桌上型) |
|
X |
|
5080 |
65 nm |
2x2 MB |
3.73 GHz |
FSB1066 |
130W |
DP(桌上型) |
|
X |
X |
5063 |
65 nm |
2x2 MB |
3.20 GHz |
FSB1066 |
95W |
DP(桌上型) |
|
X |
X |
5060 |
65 nm |
2x2 MB |
3.20 GHz |
FSB1066 |
130W |
DP(桌上型) |
|
X |
X |
5050 |
65 nm |
2x2 MB |
3.00 GHz |
FSB667 |
95W |
DP(桌上型) |
|
X |
X |
5030 |
65 nm |
2x2 MB |
2.67 GHz |
FSB667 |
95W |
DP(桌上型) |
|
X |
X |
498)this.style.width=498;" align=no>
英特爾結合二顆Woodcrest Xeon 5100處理器,在單一處理器上打造四核心Clovertown。實際上,它是顆“雙”雙核心,二個核心都擁有本身的4MB共享二級緩存。
498)this.style.width=498;" align=no>
Socket 771、FSB1333或FSB1066
所有Xeon 5300系列處理器都是采用目前英特爾服務器產品主流的Socket LGA 771針腳設計,目前有四個版本:FSB1066平臺的1.6與1.86 GHz版本和FSB1333的2.33與3.0 GHz版本,用戶需要購買英特爾的5000芯片組系列,才能支持FSB1066或FSB1333MHz的處理器。英特爾的處理器總線是以四倍數據傳輸率(QDR)技術設計,也就是說每個頻率周期可以傳輸四個數據區(qū)塊(chunk)。有鑒于此,你可以知道 FSB1333是根據333 MHz頻率速度,而FSB1066的速度為266 MHz。我們很高興看到英特爾能針對四核心處理器的性能采用較快的333MHz頻率,從而暫時解決了目前的瓶頸威脅。
Xeon Clovertown架構
如果你對Core 2微架構(新款Xeon采用)的細節(jié)有興趣,我們建議你可以閱讀IDF Spring 2006文件,IDF Spring 2006:英特爾的微架構是否會拉近技術差距?
5000芯片組提供三種版本支持雙核及四核Xeon 5300平臺。5000V定位于廉價的超值版,它的內存容量只支持到32GB內存,其它兩款可支持最高64GB的全緩沖式DDR2內存(DDR2-533或667),無論有無ECC、雙信道或四信道模式。北橋與南橋是通過x4 PCI Express連結,5000系列提供20個PCI Express線道(lane),根據芯片組型號定義不同搭配方式。
早期的E7500新片組與最新5000系列芯片組的主要差別在于后者的Dual Independent Bus(DIB)架構,舊式Xeon平臺上的處理器必須分享可能形成瓶頸所在的FSB(前端總線),現在每個處理器插槽都使用本身的接口。由于頻率速度提升為333MHz,每顆處理器的總線頻率提升為10.66 GB/s,即使在266 MHz的速度,帶寬仍有8.33 GB/s。