2007年,對于國產服務器廠商而言,是舉步維艱的一年,面對市場的強大壓力,國產服務器廠商如何殺出重圍?曙光給了我們答案。
歷軍認為,國產服務器未來必須在體系和技術實現上不斷創新才能占領市場。
![]() |
曙光總裁歷軍:國產服務器"超越競爭"時代來臨 |
6月21日,中國計算機報社執行總編輯劉保華與曙光信息產業股份有限公司總裁歷軍就國產服務器發展進行了一次深入交流,圍繞國產服務器在面臨市場激烈競爭的條件下如何突出重圍,國產服務器未來的發展方向等問題展開了研討。
2007年,國產服務器廠商艱難爬坡,日子并不好過。與此同時,刀片服務器日漸成熟,泛高性能計算在各行各業的廣泛使用又給這一市場帶來了利好消息。面對國際品牌在高中低端和三、四級市場的重壓,以及通信、主板等領域的新闖入者,國產服務器進入關鍵一年。如何制勝?曙光信息產業股份有限公司(以下簡稱“曙光”)給出的答案是不爭一時一地之利,創新與標準并重,搶占至高點。
“蓄水”以求超越
2007年,曙光動作不斷,從以TC2600為代表的雙核、四核刀片服務器的推出到4月份與Intel公司的高調合作,到牽頭成立中國電子標準化協會高性能計算機標準工作委員會,再到采用16個運算核心的“龍芯”處理器的自主知識產權的高性能計算機曙光5000A,曙光總裁歷軍認為,在國內市場競爭國際化的今天,這都是在服務器領域水到渠成之前的“蓄水”。
劉保華:今年上半年曙光推出了新一代的刀片服務器,擁有很多自主知識產權;4月份跟Intel高調合作,牽頭成立了中國電子標準化協會高性能計算機標準工作委員會。動作比較多,與以往有很大的不同,這些動作在曙光未來兩三年的發展中會產生什么樣的影響?
歷軍:這一兩年來,曙光最主要的精力都放在服務器領域的研發上,就是為了練好內功。
在服務器領域,競爭態勢也正在發生變化,一個突出的特點是國際競爭國內化,要和國際、國內的對手競爭,光靠打品牌、炒市場已遠遠不夠,現在用戶都變成了專家。對企業而言,最重要的是要把內功練好,才能在市場上獲得競爭力,讓用戶感受到真正適合他的應用,企業也才能發展壯大。
相對而言,我們在市場上做的事情比較少,因為曙光憋了一股勁,要跨越當前的競爭層次,當你提供的價值遠遠高于市場上以低價取勝的對手時,這個競爭就會上一個臺階。現在,市場競爭已經與當年的情形相去甚遠,不是給用戶講一大堆的高性能,而是要靠你的產品和技術以及建立在這一基礎上的差異化。業界都認為,刀片服務器是未來的發展方向,曙光就是要從頭做起。實踐證明,曙光推出的刀片服務器的競爭力相當強,樣子可能和國際競爭對手差不多,但在很多方面已經超過他們,在另外一些方面旗鼓相當。
可以說,曙光做的這些工作都是在蓄水。對于曙光而言,目前最重要的不是爭取多大的市場份額,而是把這個水池蓄得足足的,然后一下子釋放出去。一直以來,曙光都在布這個局。
劉保華:其實曙光一直在和包括IBM和Sun在內的國外競爭對手合作,相互借鑒,未來曙光如何創新,如何超越?
歷軍:曙光和國內的很多企業一樣,都是后來進來的。國外企業其實也摔過跟頭,才積累了經驗,我們是邊學邊超越。中國的企業要想全面超越這些巨頭需要很長的時間。超越的關鍵在于兩個方面:一個是戰略選擇,另一個是企業的運作水平。當然還有技術、產品和服務等多個方面。
在刀片服務器上,曙光也一直在看。到今天為止,IBM進入刀片服務器領域已經有三四年的時間,投入了大量的資金。其實IBM開始決定研發刀片服務器的時候,曙光就一直在觀察但并沒有輕舉妄動。因為如果那個時候進入對曙光來說,無論是資金還是其他方面挑戰都確實太大。兩年以后刀片相對成熟了,曙光也進來了。
當時IBM的14路刀片服務器研發出來的時候,由于散熱和動力不足,只能插12路,出貨不太好。兩年之后逐步穩定,達到了國際領先的水平。我們就在這個水平上發展,并做了一些適合中國國情的改動。比如在硬盤的熱插拔上,很多國外廠商不支持,對中國用戶來說很不方便,限制了將來的擴展。如果用戶非要擴展,就得買這家國外廠商的板卡,價格很貴,不符合工業標準。同時,只能繼續買同一家公司的產品,也造成了企業對其依賴性太強。
曙光不是這樣。從刀片的角度來說,首先體現了兼容性和工業標準,很多用戶買了曙光的刀片的機箱,將來還可以買聯想或者其他品牌的產品。其次,中國市場對刀片的需求往往有一些特殊性,例如需要刀片里面有千兆網卡接口,國外很多品牌要么不支持,要么擴展起來很貴,大概在2000美元左右。而用曙光的刀片服務器,到中關村只花2000元人民幣買一個PCIE、PCIS就可以插上。
Intel公司也在研發這樣的刀片,對曙光取得的成果和達到的國際水平感到很驚訝。
集群依然是高性能計算的方向
在高性能計算機體系的發展上,曙光是國內為數不多的集群路線的擁躉和堅持者之一。在未來,曙光服務器的發展戰略仍然與集群高度耦合,這不僅基于其對未來發展方向的清晰判斷,更得益于堅持“從牙縫里擠出錢來做研發”的堅定信念,以及多年來的技術、產品和服務能力的積淀。
劉保華:曙光高性能服務器沖擊TOP500強時靠的是集群系統,幾年來也一直在大力發展。現在曙光提出做刀片服務器,技術策略是不是發生了變化?未來在集群系統發展上會怎樣做?
歷軍:目前在高性能計算領域,TOP500強里面300多臺都采用了集群方式。未來三五年的時間里,集群架構依然是HPC的主流,而且應用也會越來越成熟,大量的應用都會在集群平臺上有很好的優化。
坦率地說,集群架構進入的門檻相對較低,但維持的門檻很高,這就是集群系統的一個特點。集群的體系結構天生造成了使用、維護以及應用優化上的復雜性,這也是為什么很多國內同行雖然高調進入,但卻很難往上走的原因,曙光就是要在集群非常精細的地方用功。
去年一年間,曙光一共賣了500套集群,這在管理上就是一個難題。比如國家氣象局全國有36個單位的機器需要維護,曙光就開發了一套軟件把所有的機器全部都管理起來。解決這樣的問題,沒有三五年的功夫根本不可能。另外,應用軟件的調優也非常關鍵,不僅能提高硬件的使用效率,充分發揮技術效益,更能提高用戶的業務效益。可以說,用戶看中的不光是你的產品,更是你的服務,而服務并非一天之功。
所以,集群在未來市場上的長遠發展和曙光的戰略緊緊耦合在一起。
目前來看,還沒有一種架構比集群更好。MPP(基于大規模分布式并行計算機)系統也很好,但的確是太昂貴了,也很專用,要想處理其他的計算需要進行大量的軟件改動,任何一個高性能計算機廠商都不愿意因為這個原因而幫你改寫軟件。MPP在針對一些應用上,性能要遠落后于集群系統。
在未來五年的時間之內,在沒有一個能拿諾貝爾獎的大科學家把新體系重新設計出來之前,集群架構還會存在相當長一段時間,只不過會經過變異和演進。
創新深入芯片級
一直以來,曙光就把發展之路定義在創新之上。隨著高性能計算領域技術、市場等競爭要素的不斷升級,曙光一方面兼容現有的x86體系,一方面把目光放在了具有自主知識產權的芯片體系的設計、研發和創新上。
劉保華:去年,Intel公司研發出具有與超級計算機相似性能的可編程處理器,能夠在指甲蓋大的芯片上做到80個內核,提供萬億次級的計算速度,曙光在這個方面做了哪些準備?
歷軍:其實,半導體技術不僅能做到80核,也能做到100乃至更多的內核,計算速度的提高永遠趕不上人需求發展的速度,今天有80內核的產品出現,明天就有160個內核的需求。舉例來說,目前應用于天氣預報的高性能計算模式能做到的是每兩個平方公里一個隔點,但未來人們一定有這樣的需求,比如落在自家院子里雨水在什么時間下,下多長時間,下多少。應用的需求在逐步增長,計算機是個計算工具而已。
面對這樣的體系結構的變化,我們也有類似的計劃。2008年龍芯就能批量生產。但如果一臺機器到了千萬億級的計算能力,而應用提交上去使用效率只有5%的話,那計算就失去了意義。超級計算機跟現在計算機最大的一個不同就是前者朝專業化方向發展,并不是一臺計算機什么都能做——藥物分析也行,礦產勘察也行,天氣預報也行,氣象預報也行,未來一兩千萬億次的計算能力只做一件事情。專業計算就需要專用CPU。
劉保華:按照曙光的計劃,5000A將在2008年推出,龍芯16核是否代表著曙光在技術上的一個儲備?
歷軍:更準確地說曙光5000A是百萬億級運算速度,密度比4000A提高了,且一部分采用了刀片結構,因此體積比4000A還小;另外一部分則完全采用龍芯16核的CPU和全新的架構,密度、精細化、工藝等方面的問題全部解決了,有較強的擴展性和兼容性。
可以保證的是,曙光5000A出來的時候通用水平和工藝水平都可以達到國際上的領先水平,應用也會非常容易管理。實際上曙光5000A是為下一代曙光6000A做技術儲備。
劉保華:龍芯面臨的最大的挑戰是什么?中國自主研發這種芯片未來的突破口到底在哪?
歷軍:一個是龍芯本身如何定位,第二個是如何把龍芯和現在的應用軟件的適用性做得很好。由于采用的是工業標準, x86體系的機器和軟件的適應性是100%,它貫通了整個產業鏈。龍芯的將來也是如此。
依靠曙光一家公司之力拉通整個產業鏈條幾乎是不可能的任務,我們的辦法是把龍芯進行改進和設計,以適應應用軟件。
其中一個核心問題是如何與現有的通用標準兼容,下一代龍芯是要兼容X86體系的。我們采用的方法是靠硬件隔離、屏蔽兼容性的問題,這必然帶來軟件運行效率的降低。這就需要在指令級的轉換上下功夫,過去指令集的轉換是通過軟件形式,龍芯采用的是硬件的轉換,比如軟件的轉換器,甚至把指令的轉換器集成到芯片內部。
要差異化競爭,中國的企業和國際半導體企業競爭,優勢并不多,需要的是從體系結構上面創新。AMD這么多年走的就是這條路,K7、K8都采用了很好的結構,而不是從主頻上競爭。我們也一樣,不會和別人拼內核數量。
龍芯在體系結構上做了很大的創新,盡管目前的核還比較少,但它最大的優點是功率非常低,而且在核里面進行了多方面的集成,各個核之間以及與CPU外面的交換機制、體系和計算模式也有很大的創新和變化,實現了全局的統一編制。未來仍然有更大的改進空間,基于龍芯的機器可能做到10000或者20000個核,編程更容易,性能也會更好。
這些創新是要在系統廠商強有力的支持下做,如果龍芯出來之后沒有人按照這個體系推廣,就很難發揮效用。
高性能計算機標準不是窄軌鐵路
3月28日,中國電子標準化協會高性能計算機標準工作委員會正式成立,并發布了《刀片式服務器管理模塊技術要求》和《集群操作系統遠程監控技術要求》兩項電子行業標準,并準備逐步將標準覆蓋到操作系統、安全、應用、高性能交換各個領域,從而建立一個比較全面的覆蓋高性能計算主要領域的綜合性標準集。這在國外服務器廠商中引起了很大震動。
劉保華:目前有很多企業作為會員參與到標準工作當中來,但也有很多廠商都在觀望,并不太積極,高標委下一步工作路線圖是怎樣的?
歷軍:7月份高標委的會員就會正式加入。高標委將參照國外慣例做法,分為三類會員:第一類會員是核心會員,可以進行提案、表決;第二類只能提案不能表決;第三類是觀察會員,只能參與旁聽,跨國公司基本屬于這一類。
今年底前我們就可能有一兩個標準成為行業標準,是國家推薦標準,未來進一步成熟的時候上升為國家標準。我們的目標就是在高性能計算這一領域有自己的話語權,尤其是涉及國家安全相關領域、涉及到未來有可能被國外廠商所壟斷的市場,不再重蹈DVD、彩電行業的覆轍。
對曙光來說,目前的工作之一是制定出一些具有國際水準的標準提案,這是必須的。在這些標準的制定過程中,需要注意的是不能做成“窄軌鐵路”,既要有自己核心的東西,又要跟國際在一定程度上接軌,可以相互授權,找到可行的辦法。
記者手記:壞日子 好日子
在與歷軍的交流中,他一方面表現得比較悲觀,另一方面又比較樂觀。
悲觀的是,國產服務器廠商在國外廠商的夾縫中生存。在生產制造方面,國產服務器不再有優勢;與此同時,國外服務器廠商對中國市場更加了解,無論是從產品、價格、渠道還是服務,形成的立體攻勢讓國內廠商倍感壓力,甚至于籍借品牌效應大打價格戰。
樂觀的是,近幾年來,市場上出現了很多“邊打市場,邊研發”的企業。以曙光為例,幾年來堅持把“自己的事情自己做主”作為一個戰略,在兼顧工業標準和高端應用的同時,積累技術、應用上的經驗,不斷朝上走,并通過制定自己的標準來提升競爭力。
在競爭格局變得不再涇渭分明的時候,更多的企業需要重新審視未來之路。
曙光的戰略與企業路線選擇固然與其背景和文化有關,也與其在不同的時間和空間上實現的梯次創新的策略有關。從觀察到學習,從借鑒到自我判斷,從模仿到突破,在體系和技術實現上不斷創新,最終到確立高性能服務器的標準,曙光在自我可以把控的尺度內進行循序漸進的創新,不斷提高競爭的門檻,積累自身能力。
過慣壞日子的人總是勵精圖治,想盡辦法過上好日子,過慣了好日子的人也習慣想象有一天會過上壞日子。我們把后者叫做居安思危。