高通進軍伺服器底氣何來?外借三大時勢內蘊三大優勢

文章推薦指數: 80 %
投票人數:10人

在伺服器CPU市場,英特爾架構一枝獨秀,市場份額已連續多年超過90%;POWER和SPARC雖然難挽下滑趨勢,但在關鍵任務領域仍有用武之地;幾乎已經退出歷史舞台的Alpha架構得益於在中國超算「神威·太湖之光」中的大量應用,被注入了一支強心劑。

相比之下,數年前一度被寄予厚望、曾被視為數據中心低功耗變革動力的ARM架構卻似乎慢慢淡出了我們的視線。

然而,這並不代表它將在數據中心偃旗息鼓。

時值2016年收尾和2017年開張之期,高通(Qualcomm)在ARM領域連番發力,讓沉寂許久的ARM伺服器陣營重鳴號角。

2016年11月18日,貴州華芯通半導體技術有限公司北京研發中心正式啟用。

「華芯通」是由貴州省人民政府與高通公司共同出資設立的合資企業,已經獲得ARM v8-A 64位處理器架構授權。

「華芯通」將通過引進、消化吸收、再創新,重點針對高端伺服器晶片指令集CPU微結構、多核互連、SOC等關鍵技術開展攻關,開發適合中國市場的先進伺服器晶片產品。

2016年12月7日,高通宣布全球首款10納米伺服器晶片Qualcomm Centriq 2400開始商用送樣,預計2017下半年進入商用市場。

作為Qualcomm Centriq系列的首款產品,Centriq 2400採用最先進的10納米FinFET製程技術,最高可配置48個內核,其所搭載的Qualcomm Falkor CPU,是高通研發的定製化ARM v8內核,通過高度優化可實現高性能,低功耗,特別針對數據中心最常見的工作負載而設計。

高通如此高調地對伺服器市場「送秋波」、「秀恩愛」,既吸引了從業者的視線,也不免引發疑問:眾所周知,高通是移動晶片領域的頂尖廠商,但緣何它會選擇這個時間點發力ARM伺服器晶片市場呢?

ARM晶片是否還有「搞頭」?

這個疑問的根源,離不開ARM架構在伺服器市場曾有的戲劇性發展經歷。

大概是2010年,在移動端如日中天的ARM陣營表現出了對於伺服器和數據中心的野心。

當時,數據中心能耗瀕臨上限,「大數據」已經露出了爪牙,數據中心迫切地希望找到一種能以較低的功耗來處理大量並行化、輕量化負載的方法,而ARM架構處理器所具備的多內核、高並行、低功耗的特性正好滿足了數據中心的這種新需求。

於是,業內普遍認為,ARM晶片將成為數據中心新的「顛覆者」,前景一片光明。

隨後,Facebook等大型網際網路廠商開始定製ARM伺服器,Marvel、Cavium、Applied Micro Circuits、三星等晶片廠商紛紛加入ARM伺服器晶片的研發,惠普等伺服器廠商開始測試ARM伺服器,而2012年x86伺服器晶片老兵AMD宣布推出64位ARM伺服器晶片,更是為ARM進軍數據中心加上了助燃劑。

當時,分析師們曾經樂觀地預測,到2019年,ARM伺服器晶片出貨量將占到總體市場的20%~25%。

然而,ARM的數據中心之路走得並不如預料中那樣順暢。

2013年底,ARM伺服器領域的先驅Calexda成為「先烈」,為ARM在數據中心的發展前景蒙上一層陰影。

2016年,Applied Micro表示將出售ARM伺服器業務;也有消息稱博通也將結束ARM伺服器計劃;而曾經讓人看好的AMD,又將重心轉回了x86和GPU。

所以,回顧這幾年ARM伺服器晶片的發展歷程,好似「一壺水被迅速燒熱又逐漸冷卻」,這種尷尬局面讓人不得不對ARM伺服器晶片的未來感到困惑。

再回到上面的問題,ARM伺服器晶片還有「搞頭」麼?高通為何在有先驅屢屢失利、甚至成為「先烈」的情況下高調進軍伺服器和數據中心?高通ARM伺服器晶片賴以生存的根基和底氣又在哪裡?

高通在打怎樣的「小算盤」?

高通是一家精明的企業,否則無以成為移動晶片界的龍頭企業。

在我看來,高通選擇在這個時間點高調入局,其根本原因在於看好ARM伺服器晶片市場的復甦趨勢和發展前景。

的確,ARM伺服器市場正在復甦。

儘管經歷了幾年的不溫不火,ARM伺服器晶片卻在近兩年,特別是2016年,迎來了一個重要的轉折點。

過去幾年中,ARM伺服器晶片在市場、技術和生態環境方面尚不成熟,而今,不管是市場、技術還是生態方面,它都面臨著近年來最佳的一個生長環境。

第一,先看市場。

前文提過,ARM的優勢在於多內核、高並行、低功耗,這樣的能力非常適合數據中心的並行化、輕量化負載,如搜索、Web、CDN、冷存儲等。

但由於ARM伺服器晶片發展過慢,而英特爾x86伺服器晶片的能效比也在不斷提升,數據中心對於ARM的需求已經不是那麼強烈。

如今的市場和幾年前已經不可同日而語。

時下,網際網路日趨繁榮,移動終端數量高速增長,物聯網快速發展,雲計算、大數據、移動、社交引領了新一輪的技術革命。

在這些新趨勢中,數據有集中也有分散,不論是貯藏了海量數據的大規模數據中心,還是分散在網絡邊緣的計算節點,都希望將每瓦特性能放在首位,更加注重空間和能耗的節約,用更少的成本從數據的流動中掘金。

同時,人工智慧、深度學習、機器視覺計算等新興應用負載的大熱將異構計算推到了舞台中央,單一的CPU架構已經無法滿足這些應用對於浮點計算能力、並行度、能效等方面的需求,於是,近年來CPU+GPGPU、CPU+FPGA等異構計算方式大行其道,其中,ARM+GPGPU、ARM+FPGA也因更具能效優勢,被視為一種理想的異構計算方式。

在這些新興應用和趨勢中,單純的英特爾架構方案已經不能完全讓大型數據中心的用戶滿意,雖然英特爾CPU的能效比在不斷提升,並且也具備Xeon Phi協處理器方案,但大型網際網路用戶更希望追求極致,將數據中心的能效做到更高。

於是,ARM又迎來了新的機會。

2013年百度在其南京數據中心首次應用ARM伺服器來支撐百度雲服務,將TCO降低了25%,存儲密度提升了70%。

本月初,又有消息稱,ARM將與阿里巴巴集團在數據中心業務方面展開合作,阿里巴巴將在自身數據中心的伺服器上大量採用ARM架構低功耗CPU,以逐步替換英特爾產品。

第二,再看技術。

過去幾年中,ARM伺服器晶片的絕對性能提升並不高,故而ARM伺服器只能被應用於一些輕量化的場景中。

而新近亮相的高通Qualcomm Centriq 2400,則將ARM伺服器晶片的規格提升到了一個新的台階:集成高達48個內核,率先採用10nm工藝(領先於英特爾的14nm),內核經過高度優化,可同時實現高性能與低功耗,專門針對數據中心最常見的工作負載而設計。

雖然高通沒有公布Centriq的進一步細節,但從核心數量和工藝上來推測,Centriq在性能與功耗方面的綜合表現將能夠與英特爾的主流晶片一較高下,且很有可能也領先於AMD即將推出的Zen伺服器晶片。

另一方面,ARM+GPGPU、ARM+FPGA等異構計算技術也在不斷走向成熟,特別是在超算領域。

此前,巴塞隆納超算中心就曾採用ARM+GPGPU的異構方式,富士通計劃建造的百億億次超算也將引入ARM晶片,同樣採用異構計算。

今年10月,英特爾子公司Altera推出了新一代的Stratix 10 FPGA,其中就採用了四核ARM Cortex-A53處理器。

有趣的是,連英特爾都開始重新接受ARM架構,這足以說明ARM技術的誘人之處。

第三,最後看生態。

由於缺少生態系統,特別是軟體生態,ARM這些年來發展得不太順利。

而今,網際網路的繁榮發展帶動了開源生態的發展,也給ARM的軟體生態帶來了利好消息。

對此,Qualcomm產品管理副總裁樂美科(Americo Lemos)曾表示,軟體過去大多是垂直的架構,而現在更多是使用開放原始碼軟體——這對Qualcomm來說是一件好事,因為入門的門檻變得非常低,不必再投資幾十億美金用於搭建軟體架構。

他說:「就像x86系統原來做的那樣。

開放原始碼軟體的普及和應用降低了Qualcomm進入這一領域的門檻。

所以,無論市場、技術還是生態,ARM進軍數據中心已經處於一個「臨界點」,高通在這個時間點高調入局,稱得上是恰逢其時。

高通的底氣何在?

不難預見,未來幾年ARM架構在數據中心將大有用武之地,也將吸引更多的玩家加入,競爭也將趨於激烈。

那麼,對於高通而言,未來能否將在移動市場的優勢延續到伺服器和數據中心領域?我們不妨來簡單分析一下。

Qualcomm負責數據中心技術業務的產品管理副總裁樂美科展示全球首款10納米伺服器晶片Qualcomm Centriq 2400

首先,從產品技術角度來看,高通在ARM技術上有著多年積累,過去一直是對ARM架構利用、對其性能發掘最為充分的廠商之一,有著成熟的生態系統。

高通在製程工藝上一直領先,這是未來高通能夠保持優勢地位的一個重要保障。

此外,高通處理器的集成度一直很高,是SoC技術領域的王者。

比如它能在移動晶片中集成通信模塊、多媒體功能、3D圖形功能和GPS引擎,而據外媒透露,高通伺服器晶片上將集成乙太網、加密和PCIe等功能模塊,也將以SoC的形態出現,這也是當前伺服器晶片的一個重要發展趨勢。

關於高通ARM伺服器晶片的持續創新力,也就是它的研發力量,樂美科曾經在接受中國媒體採訪時表示,高通已經具備研發伺服器晶片的專門團隊,同時也吸引了一批非常優秀的與雲相關的工程師。

此前,高通還曾演示了Qualcomm Centriq 2400 處理器上運行基於 Linux 和 Java 的 Apache Spark 和 Hadoop,對於這兩個當前最為流行的大數據處理平台,看來高通已經早已開始著手準備了。

對於高通進軍伺服器和數據中心市場的優勢,樂美科曾經表現得非常樂觀:「第一,Qualcomm是真正的SoC設計公司,也就是集成晶片設計公司;第二,我們有最領先的製程技術;第三,我們在這個生態系統中也建立了多年的合作關係,能使我們在這個領域取得成功。

樂美科談到的生態系統的關係,其實就是高通的第三大優勢。

早在高通研發ARM架構伺服器晶片之初,它就已經收穫了網際網路數據中心巨頭Facebook的支持,一直在後者的開放計算項目(OCP)中占有一席之地。

2015年時,高通又與Xilinx和Mellanox達成了合作,攜手提升ARM伺服器晶片與FPGA晶片及數據中心連接解決方案之間的兼容性,預計這項協作的成果有望在2018年面市。

在2016年早些時候,高通還與IBM、ARM、Mellanox及Xilinx等廠商共同創建了CCIX聯盟,開始更為積極地參與對數據中心專用加速器晶片的標準定義工作,以求能夠讓自己未來的ARM伺服器晶片能與這些加速器組合為具有強大競爭力的異構計算方案。

雖然高通這幾次出手,還只是它在伺服器生態系統營建方面的部分舉措,但一直關注硬體技術的權威網媒Anandtech已經給出了這樣的評價:「這足以說明高通在非常認真地對待自己的伺服器業務。

高通的最後一個優勢,就是穩穩接上了中國的地氣,抓住了進入中國市場的先機。

中國市場對ARM有著旺盛的需求,在國家自主發展的政策引領下,中國伺服器、HPC等關鍵信息設備亟需實現國產化,開放的ARM架構是一個重點發展的對象。

實現高通這一戰略的關鍵舉措,就是在2016年1月17日高通與貴州省人民政府簽署戰略合作協議並為合資企業「貴州華芯通半導體技術有限公司」揭牌。

根據協議,高通將向華芯通提供伺服器晶片技術許可,並提供設計和技術支持。

前文曾提及貴州華芯通半導體技術有限公司北京研發中心在同年11月18日正式啟用的消息,正是高通和貴州在ARM架構伺服器晶片領域通力合作所取得的一個重要進展。

在移動晶片領域,對於如何藉助中國手機廠商擴大產業生態,高通已經是箇中好手,看來這種經驗同樣有助於高通擴大伺服器晶片的生態。

與中國地方政府成立合資公司,不僅有助於華芯通利用高通的技術優勢,更為靈活地定製開發,更快地推出適合中國市場的伺服器晶片,推動中國自主創新;對於高通來說,面對前景一片大好的中國市場,以這種技術輸出的形式能夠更快地站穩腳跟,做大中國市場的「蛋糕」。

能否撼動英特爾王座?

從Facebook、阿里、百度等大型網際網路公司紛紛對ARM拋出橄欖枝,能夠看出英特爾在數據中心的「王座」已經不再那麼牢靠。

在雲計算、大數據、移動、社交、人工智慧、物聯網所帶來的這場新技術革命中,數據中心正從少數廠商、單一架構、軟硬體緊密耦合引領的創新,走向用戶引領、多方響應、異構共榮、軟體定義硬體的創新。

而高通在其中扮演的,正是一個帶來活力、創造多樣化和更多協作機會的角色。

但是,從唯物辯證法上來看,外因固然重要,內因才是起決定性的因素。

數據中心新趨勢、市場新需求給每一個ARM架構玩家提供的機會都是均等的,能否抓住機會,更多靠的還是自身的修為。

對於ARM伺服器和數據中心領域的「後來者」高通來說,ARM「先驅」和「先烈」們的經驗教訓很值得參考,其一是要加快產品研發的速度,畢竟英特爾也即將在2017年推出10nm製程工藝;其二是要快速建立生態圈,彌補ARM在軟體和應用層面的短板;其三,自然是要找到關鍵的客戶,有了成功案例的刺激和示範作用,才能讓ARM架構伺服器晶片獲得更大的動力和加速度。

未來不遠,一切可期。

2017年將是關鍵的一年,且看高通接下來如何出招。

申耀的科技觀察(微信號:shenyao),由非著名科技媒體人申耀創辦、10萬公里公路自駕經驗老斯基,在各大自媒體平台擁有專欄,致力於科技行業的觀察和思考,在這裡讀懂科技行業,知趨勢,贏未來!


請為這篇文章評分?


相關文章 

ARM揚帆 借力微軟 殺進伺服器市場

在AMD發布32核64線程Naples伺服器處理器平台之後,微軟再度攜手高通開發基於ARM平台的伺服器晶片。一直以來,ARM處理器在移動端使用最為廣泛。雖然性能遠不及桌面x86平台,但功耗表現卻...

高通進攻伺服器市場「受挫」

儘管有谷歌、微軟以及阿里巴巴等廠商「站台」,但高通在伺服器晶片領域大顯身手的野心或許遭到了挫折。近日有消息稱高通計劃放棄開發數據中心伺服器晶片,而放棄意味著關閉這項業務或者為其尋找新的買家。半年...

皓龍A1000再次試水?AMD手機需待何時!

【PConline 雜談】近年來隨著移動終端的崛起,越來越多的上游供應商開始將重心轉向手機處理器市場。今年,以高通、聯發科、三星為首的處理器廠商在移動終端領域展開了激烈的市場爭奪戰,幾乎所有的手...

高通公司推出全球首款10nm伺服器CPU

日前,美國半導體廠商高通公司終於透露了其長期預期的基於ARM架構的伺服器CPU的規範。Centriq 2400系統可以部署64個CPU內核,而不是之前所報告的24個CPU內核,這是行業第一款基於...