伺服器CPU市場如此多嬌,勢要Intel折腰?

文章推薦指數: 80 %
投票人數:10人

導讀:在伺服器CPU市場,目前Intel一家獨大,但情勢似乎有變化的趨勢,AMD、高通,以及多家中國廠商都在虎視眈眈,欲挑戰Intel的龍頭地位……

今天,伺服器CPU市場又傳出重磅消息!

AMD宣布,新一代EPYC 7000系列處理器正式面市。

這次一口氣推出了12款新EPYC處理器產品,主打多核心、高性價比。

這是向伺服器霸主英特爾下戰帖嗎?

同時,AMD也公布了EPYC處理器的中文名字。

全新的CPU摒棄了原來「皓龍」的名字變成了「霄龍」,這會不會讓高通的後背出冷汗呢?

在下半年英特爾新款Skylake架構Xeon處理器亮相前,AMD搶先在美國奧斯汀舉行的AMD EPYC Tech Day活動上宣布了推出 EPYC 7000系列處理器這一消息。

這款全新主流1路、2路的x86伺服器CPU,被AMD視為是迎戰英特爾的新秘密武器,12款產品中,最便宜的版本售價不到500美元,最高階的EPYC 7601處理器則要4,200美元,價位正好對應到Intel Xeon E5系列處理器。

AMD表示,新的EPYC系列處理器晶片已可供貨,同時,AMD也宣布包含HPE、Dell EMC、Lenovo、微軟、Supermicro、英業達 、華碩、技嘉 、Wistron、Sugon、H3C、Tyan等在內的12家伺服器硬體廠商,同步推出了搭載AMD EPYC系列處理器的2路或單路伺服器,將陸續在今年第2季上市。

活動現場也展示了搭載 EPYC處理器的最新伺服器硬體。

在伺服器競爭市場始終落後的AMD,為了迎戰英特爾,決定背水一戰,不只採用全新14nm製程技術,更採用CCX(CPU Complex )架構打造超多Zen核心的伺服器級CPU,而在今年3月推出代號為Naples的新一代伺服器處理器,其不只核心數翻倍,擁有高達32核心,還支持更大容量內存及高速I/O。

後來,AMD更以「EPYC」當作正式產品命名,做為處理器系列的全新品牌亮相,誓言要挽回落後頹勢。

這次,AMD推出的EPYC 7000系列,即是該公司首款採用Zen核心架構打造的EPYC系列處理器產品,定位在入門級或中階伺服器,主要做為企業數據中心應用的主流1路、2路的伺服器使用,可以運用在需要更高工作負載效能的高效能運算HPC、超大規模雲端及虛擬化環境部署,也能用於機器學習、大數據分析,以及軟體定義式儲存(SDS)上。

這12款產品中,EPYC 7601、EPYC 7551 、EPYC 7501 這三款處理器型號對應的核心數、線程最高,核心數都達到32核心,64線程;其次則是EPYC 7451與EPYC 7401,擁有24核心、48線程,至於EPYC 7351、EPYC 7301和EPYC 7281,核心數都是16核心、32線程。

上述這些處理器頻率大多介於2.0GHz~3.2GHz之間,在熱設計功耗(TDP)的配置上,最高達到180瓦,其餘則是155/170瓦。

AMD還推出了一款型號為EPYC 7251的處理器,配置有8核心、16線程,頻率為2.1GHz~ 2.9GHz,TDP則為120瓦。

根據AMD最新公布的EPYC價位,採用最高32核心的3款EPYC處理器售價3,400美元起,擁有次高24核心的EPYC 7451與EPYC 7401處理器售價1,850美元起,另外EPYC 7351、EPYC 7301和EPYC 7281這3款售價為650美元起,其中最便宜的EPYC 7251售價為475美元,這幾款CPU型號分別對應到英特爾 Xeon E5 v4處理器系列多個型號,挑戰伺服器龍頭英特爾的意味濃厚。

這次推出的EPYC 7000系列,都可支持最多8通道DDR4或DDR3內存擴充,另外,每顆EPYC處理器皆可支持最大2TB內存,比起英特爾Xeon E5-2699A v4最大內存容量還多出33%,內存帶寬更是Xeon E5的翻倍,EPYC處理器內存總帶寬高達170.7GB/s,且可以允許在最高2666MHz頻率下來運作。

EPYC處理器內還整合了PCI Express 3.0接口,每個插槽可支持多達128通道,以提供高速I/O使用。

AMD還提供了EPYC處理器測試數據,宣稱其效能表現優於英特爾的Xeon E5系列。

依據AMD公布的測試數據結果,當採取SPECint2006進行CPU效能測試時,採用EPYC 7601的伺服器,如果是跟去年推出的Intel Xeon E5-2699A v4相比,在效能測試上可以高出47%;而在另一項浮點運算效能測試上,EPYC 7601也比Xeon E5-2699A v4高出75%之多。

改用STREAM Triad來測試內存讀取效能時,EPYC 7601是Xeon E5-2699A v4的2.5倍。

這次,AMD還特別針對企業級雲端及數據中心應用需求,加強了硬體安全機制,以提高數據安全存取保護。

例如,在EPYC處理器的SOC晶片中,就整合了一個AMD Secure Processor,可以更安全地在硬體上執行OS/內核運作,也能針對韌體更新和數據存取,提供一個安全晶片外 (secure off-chip)的NV儲存,另外也具備有數據加密功能,可用於產生安全密鑰和提供密鑰管理。

另外,AMD在EPYC系列處理器上,還新增SME(Secure Memory Encryption)及SEV(Secure Encrypted Virtualization)這兩個硬體層的內存加密新功能,來提高數據加密保護。

EPYC系列採用了全新Zen微架構,也針對企業級應用提供優化,大幅提高了指令集的兼容能力,能支持所有ISA 工業標準的擴展指令集,包括了AVX、 AVX2 、 BMI1 、 BMI2 、 AES 、 RDRAND 、 SMEP等。

一直以來,AMD伺服器為人所詬病的,就是未建立起成熟的伺服器生態系統,所以,AMD這次推出EPYC的同時,還公布目前已和幾家主要廠商展開合作,包括微軟、VMware 、Xilinx、Mellanox、三星 、Red Hat等大廠。

未來將共同協助AMD加速建立更成熟的EPYC生態系統。

目前,與AMD合作的其他硬體廠商,包括HPE、Dell、EMC、Lenovo、微軟、Supermicro、Inventec 、H3C、技嘉 、Sugon、Tyan 、華碩等。

伺服器市場新手高通欲再創歷史

AMD此次推出EPYC系列,無疑是對行業霸主Intel的強勁挑戰。

而在這一領域,不只有AMD覬覦著Intel的地位,在移動處理器市場做得風生水起的高通(Qualcomm),近幾年也在大力進軍伺服器CPU市場。

去年年底,高通在ARM處理器伺服器SoC供應商之中拔得頭籌,宣布可提供10nm FinFET製程48核心Centriq 2400樣片。

ARM陣營的伺服器CPU市場規模號稱可達數十億美元,但目前還處於嬰兒階段,高通想要複製其在移動處理器市場上的成功,目前來看,難度很大。

高通數據中心事業群總經理Anand Chandrasekher來自於Intel,這說明,高通也會從Intel學習經驗,並看好那些採用自行開發軟體堆疊的網路與電信業大廠,將會是他們第一批大客戶。

在公開場合,高通表示其Centriq 2400系列將內含48個代號為Falkor的客制化64位元核心,並展示該晶片具備執行巨量資料分析軟體的能力──包括Apache Spark和Linux架構的Java語言Hadoop。

高通表示,Centriq 2400系列晶片是單插槽(single-socket)元件,將支援ARM TrustZone安全功能。

不過,Chandrasekher婉拒針對Centriq的價值主張(value proposition)發表意見,也不願透露其運作頻率、功耗與價格;該晶片的客制化Falkor可能是亂序執行(out-of-order)核心,單晶片中還包括乙太網路、加密技術以及PCIe周邊等眾多功能。

高通將會在今年透露更多Centriq的細節,如果高通能成功,將會有與網路巨擘如Facebook或微軟(Microsoft)合作,採用該公司晶片的OCP電路板設計。

1、ARM伺服器市場進展

ARM伺服器市場一直是難以攻破的關卡,包括新創公司Calxeda以及經驗豐富的大廠如Applied Micro、博通(Broadcom)以及惠普(HP)都未能成功。

市場研究機構Moor Insights & Strategy分析師Gina Longoria表示:「來自供應商與客戶的動能目前似乎正在減弱,但產業界仍然渴望能有替代Intel架構的方案。

」她認為,要挑戰Intel的Xeon晶片在伺服器市場之領導地位,至少需要兩年的時間。

高通預期,今年大型數據中心將占據整體伺服器市場營收約兩成,到2020年該比例將增至五成;該公司的目標市場還包括電信業應用的伺服器,Chandrasekher表示,這些伺服器採用數據中心架構執行OpenStack與網路功能虛擬化(Network Functions Virtualization)。

「事實上,10nm製程的Centriq可能有助於讓高通取得在性能與功耗比(performance/watt)上與Xeon分庭抗禮的局面;」Longoria表示:「能與Xeon在性能上有效對抗,到目前為止在ARM陣營沒有任何一家廠商能做到。

Insight64的Brookwood指出,Intel恐怕要到2018年才會有10 nm版本的Xeon。

其他廠商當然也想在伺服器市場分一杯羹。

「包括ARM與OpenPower架構在2017年的市場接受速度看來仍然緩慢;」Tirias Research的Teich表示:「到2018年,IBM的OpenPower核心授權廠商應該會在中國以外市場,推出第一款非IBM Power的SoC,屆時市場上也會出現新一代的ARM伺服器SoC。

實際上,市場上還有一家ARM伺服器SoC競爭廠商,就是Cavium,該公司預計在2018年初推出14 nmThunderX2系列54核心2.6GHz處理器,與Teich所提的時程相符。

分析師Linley Gwennap猜測,中國的大型數據中心會率先採用ARM伺服器。

有一位百度工程師透露,該公司正在測試ARMv8系統。

而高通也準備好搶占商機,該公司在2016年初宣布與中國貴州政府合資成立了一家伺服器晶片設計公司——華芯通,也是該合資公司董事會成員的Chandrasekher表示,他們已經延攬了一位執行長以及各領域的精英,總部在美國感恩節前搬遷至北京。

此外高通已經將Centriq技術轉移給該合資公司,目前後者正在著手開發中國專屬的版本。

2、高通能否再創歷史?

Chandrasekher表示:「從頭開始創造一樣東西是非常有趣的,而在一年之前一切還只是一堆文件;」他對於展開一項大規模的新事物頗具經驗,在任職Intel期間曾率領Centrino晶片開發團隊,引領筆記型電腦內建Wi-Fi風潮。

在這一次情況則有所不同,Chandrasekher的目標客戶並非系統廠商,事實上他也尚未將Centriq晶片樣本提供給任何一家系統廠商,而是先與全球前7大網絡工程師團隊接洽,因為他們都在設計自己的伺服器,甚至是自己打造伺服器晶片。

「大型數據中心都在自己進行設計,而且他們是委託ODM廠商打造設備;」他所指的是富士康(Foxconn)、廣達(Quanta)等業者,而部分ODM廠商甚至像是系統原廠,自己建置了軟體開發與品牌行銷團隊。

此外,Chandrasekher也想利用高通能取得晶圓代工廠最先進位程的優勢,與Intel一較高下;Intel就是在1997年左右開始利用自家的最先進位程來製造伺服器晶片,因此打敗了當時稱霸該領域的幾家RISC架構處理器業者。

還得花幾年的時間才會知道Centriq會不會是Chandrasekher繼Centrino之後的下一個成功案例,還是就像先前其他ARM伺服器晶片一樣鎩羽而歸…

中國芯借勢ARM挑戰Intel

說起伺服器晶片,Intel無疑是目前的行業霸主。

而作為具有龐大市場、且仍具極大發展潛力的中國,在這方面一直是短板,這對於產業、市場發展,甚至是國家安全來說,是個不小的障礙和隱患。

這些年,我國產學研機構和企業也一直在努力,力主研發自主可控、安全的伺服器晶片。

隨著ARM在伺服器領域的滲透,我國的華為、飛騰、華芯通等企業正試圖借勢ARM進軍伺服器CPU市場,以實現對Intel伺服器CPU的替換。

一直以來,ARM在指令集授權上非常謹慎,能獲得ARM 32位指令集授權的IC設計公司屈指可數。

但在ARM 64位指令集授權上,ARM就大方了很多。

ARM為了更快速地推廣64位指令集並建立相應的軟體生態,必然要一改過去對32位指令集授權的謹慎。

ARM選擇了向諸多頗有實力的廠商授權64位指令集,加速生態建設,防止被競爭對手抓住機遇。

趁著ARM推廣ARM 64的東風,我國華為、飛騰、華芯通等企業都獲得了ARM 64指令集授權。

由於ARM的目的是為了快速建立ARM 64的生態和在伺服器領域蠶食Intel的市場份額,因而對國內IC設計公司的指令集授權存在期限限制,到期後就必須重新談判。

如果將來ARM大勢已成,這也許會是一個隱患,一旦ARM在伺服器市場站穩腳跟,對國內廠商的伺服器授權態度恐怕將是另一番情景。

不過,這個隱患還非常遙遠,ARM目前還處於市場開拓期時,與國內IC設計公司的合作也比較友好。

1、華芯通的執著

貴州華芯通半導體技術有限公司成立於2016年的1月17日,是由貴州省政府和美國高通公司合資組建的。

該公司目標非常明確,就是要做中國自主智慧財產權的伺服器晶片。

(1)政府與產業資本組合

目前,無論是從宏觀市場來看,還是產業環境,貴州都是中國大數據產業的重心和排頭兵,最近幾年國內的大數據峰會都是在貴州召開的,其地位的重要性可見一斑。

國內的多家電信運營商也都把數據中心安排在了貴州,貴州政府也希望建立起當地的半導體產業鏈,從IC設計,到相關的製造、封裝,要逐步地完善起來。

而華芯通半導體的成立,則是一個很好的切入點,作為產業鏈上的重要一環,該公司可以在伺服器晶片設計方面,為本地的半導體產業發展起到帶頭作用。

這也正是這家公司成立的意義所在。

對於合作一方的高通而言,經過了這麼多年的耕耘,其在手機晶片市場所取得的戰果有目共睹,與此同時,該公司也急切希望能夠找到新的市場增長點。

縱觀半導體產業發展態勢,雲計算和大數據已經成為最為強有力的驅動力,而數據中心又是雲計算的核心。

因此,高通選擇以數據中心作為主要的新業務增長點,驅動公司不斷向前發展。

從全球來看,如果說美國是第一大市場的話,那麼中國無疑是除美國之外,最大且最具發展潛力的板塊,為了進一步打開中國市場,高通希望在中國找到合適的合作夥伴,把相關業務開展起來,這也就促成了貴州省政府與高通的合作。

(2)與ARM的合作模式

在與ARM的合作方面,華芯通半導體與高通類似,是採用ARM的核心架構授權,在此基礎上重新設計自己的處理器,這在業內是為數不多的,因為大部門公司都是拿ARM的標準Core授權,不需要再加工,直接在此基礎上設計自己的產品。

採用ARM的架構授權,可以極大地提高設計的靈活性,可以針對不同的應用情況,設計出更加高效的晶片。

從長遠來看,這種模式更具有發展潛能,更適合中國國產化伺服器晶片市場的發展。

無處不在的移動設備、物聯網、雲計算和5G網絡部署正成為推動伺服器市場發展和轉型的趨勢應用。

越來越多的,軟體正在成為與硬體無關,適用於多核心向外擴展的架構。

ARM的軟體生態系統正在不斷完善,在現有開源和主流伺服器軟體基礎上提供更多選擇,為多負載情況下更高效低能耗的硬體提供商業案例參考。

結合高效部署和生命周期管理,基於ARM的伺服器現正成為傳統基礎設施的有效替代,並在總體擁有成本上具備優勢。

2、中國伺服器CPU性能如何?

華芯通是我國與高通成立的合資公司,從高通手中獲得了源碼,並基於該源碼設計自己的CPU。

不過,由於華芯通北京研發中心剛剛啟用,正式商用產品問世尚需時日。

相比之下,華為和飛騰已經有產品問世,華為的ARM伺服器CPU集成了32核ARM Cortex A57,採用台積電16nm製造工藝。

也許是因為華為缺乏伺服器CPU設計經驗,這款伺服器CPU的性能相對有限。

以飛騰的FT2000作參照,華為的這款伺服器CPU在製造工藝領先2代的情況下,以FT2000一半的功耗實現了不足FT2000一半的性能。

因此在下面文章的解析中,中國ARM伺服器CPU就以目前性能最強的FT2000為代表進行說明。

根據測試,FT2000的晶片實測成績相對於模擬器成績要稍低一些,在2GHz主頻下,採用GCC4.8編譯器,SPEC2000和SPEC2006的測試成績見表一。

其中SPEC CPU2006全晶片測試分值為定點570,浮點482,單線程測試分值為定點12.4,浮點11.3,雖然在單線程性能上和Intel依舊有不小的差距,但就多線程性能而言,足以與Intel Xeon E5-2695v3晶片相媲美。

▲FTC661 CPU核架構圖

從性能上看,FT2000能夠勝任一些國產中高端伺服器的業務需求。

3、與國外產品對比

雖然AMD依舊把重心放在x86 CPU上,即便高通早就公布了伺服器CPU的規劃,Centriq 2400要到2017年年末才會問世,但並不意味著國外廠商的ARM伺服器CPU是只打雷不下雨。

相對於進入該領域較晚的AMD、Cavium、高通等廠商,APM雖然名聲不顯,但由於在2010年前後就著手開發ARM伺服器CPU,確實做出了性能不錯的ARM伺服器晶片,而且這些產品在數據中心、網際網路伺服器等領域已有了批量的應用。

目前,APM的X-Gene已經發展到了第3代。

X-Gene3集成了32個核心,計劃採用台積電16nm製造工藝,主頻3GHz,最大功耗約為125W。

由於X-Gene3尚未有樣片,所有的性能都是模擬平台的結果,根據經驗,由於矽前模擬平台的局限性,其模擬測試結果與矽後實測都會有一些出入,比如FT2000的模擬器成績為SPEC2006定點672、浮點585,而實測成績為定點570、浮點482。

所以不太適合用X-Gene3的模擬器成績與FT2000的實測成績做比較。

不過,就單核性能而言,X-Gene3明顯是占據優勢的,FT2000的單核與X-Gene2性能相當,X-Gene3相對X-Gene2在分支預測和TLB方面做了改進,性能提升了10%左右,而且X-Gene3的頻率為3GHz,也比FT2000的2GHz高出50%。

4、與Intel的差距

無論是FT2000,還是X-Gene3,雖然在多線程性能上達到了Intel中高端伺服器CPU的性能,但在單線程性能上,還是有不小的差距。

即便主頻控制在2.5GHz,Intel伺服器CPU的SPECint_base2006成績也在25以上,而FT2000的SPECint_base2006隻有12.4,X-Gene3也只有20。

那麼,單線程性能差距還帶來什麼影響呢?

單線程性能相對有限會對計算密集型場景有影響,對於無法並行化、單任務延遲敏感的應用場景力不從心。

比如在IC設計中用到的一些EDA工具軟體,由於並行化做得還不夠好,單線程性能弱的CPU在運行時會比較吃力,跑模擬、綜合、優化等任務花費的時間會較長。

即便全晶片整體性能與Intel的部分伺服器CPU性能相當,但由於單線程性能的不足,在部分應用場合,FT2000是無法達到Intel伺服器的應用效果的。

不過,FT2000的優勢在於並行性能,對於能夠並行化、多任務的應用場景,FT2000能夠取得不錯的應用效果。

比如一些網際網路伺服器,由於任務非常多,而每個任務的運算量不大,卻對CPU吞吐率要求高,這種場景非常適合FT2000。

FT2000與Intel的伺服器CPU的差異有點像當年的power和ultrasparc的技術路線之爭。

power是核數少線程數少,但單線程性能高,類似與現在Intel的CPU。

ultrasparc是核數多線程多,單線程性能差,類似於FT2000。

前者更適合充當高性能伺服器,後者主要是面向網絡的吞吐量高和並發度高的伺服器。

產生這種現象一方面可能是因為以國內的技術實力無法做出可以匹敵Intel單線程性能的CPU,另一方面也可能是在電晶體資源有限的情況下,面向不同應用做了取捨。

有觀點認為,FT2000打平Intel Xeon E5-2695 v3是64核戰14核的結果,言下之意就是國產CPU只能靠堆核心數。

但實際上,簡單堆砌核心並不一定能實現1+1=2。

伺服器晶片的性能很大程度上還要受存儲、互連等部件性能的影響—片上集成的核數越多,對存儲和互連的設計平衡性要求越高。

如果平衡性做得不好,並行性能的擴展性就會直線下降,在此情形下,盲目的堆核心數量未必能獲得想要的效果。

而FT2000整體架構較好地實現了計算資源與存儲和互連資源的平衡設計,所以從單核到多核的性能擴展性表現還不錯。

結語:Intel一家獨大的局面何時能夠改觀?AMD、高通和中國的伺服器CPU廠商們,希望寄托在你們身上,加油!

來源 |iThome,微型計算機

芯師爺獨家整理


請為這篇文章評分?


相關文章 

借勢ARM挑戰Intel?一窺中國芯發展現狀

近年來,隨著ARM在移動端崛起,越來越多的中國IC設計公司加入了ARM陣營,除了華為海思、展訊在手機、平板SoC大展拳腳之外,華為、飛騰、華芯通還試圖借勢ARM進軍伺服器CPU市場,實現對Int...

ARM——移動處理器背後的皇帝

提到晶片商,大家首先會想起誰?英特爾、AMD、蘋果、三星、高通、聯發科、麒麟......實際上,除了英特爾和AMD等少數混「X86圈子」的晶片廠外,其餘廠商都是要看ARM臉色吃飯的。「ARM」的...

手機cpu到底是什麼

提起CPU,大家都知道是中央處理器。但是CPU的性能由什麼決定的?是不是CPU越高手機的性能就越強?這些問題很多人搞不明白。大家都知道,一台電腦性能的強弱很大程度上由CPU和顯卡決定。手機同樣也...

性能更強的SPARC和Power為啥鬥不過x86

相比x86,IBM的Power架構和Sun的SPARC架構都曾有著很明顯的性能優勢。但時至今日,已經接近40歲的x86架構占據了超過90%的伺服器市場。根源來看,是由於封閉系統和企業屬性不符,盲...

為何蘋果和三星不買ARM?

前軟銀(Softbank)提出以天價收購ARM後,這個貌似躲在幕後操控、掌握逾4000億美元智慧型手機市場的「黑手」,突然浮出水面。但是,在大家突然發現這個的神秘存在體,突然就有各種不同的猜想:...