ARM——移動處理器背後的皇帝

文章推薦指數: 80 %
投票人數:10人

提到晶片商,大家首先會想起誰?英特爾、AMD、蘋果、三星、高通、聯發科、麒麟......實際上,除了英特爾和AMD等少數混「X86圈子」的晶片廠外,其餘廠商都是要看ARM臉色吃飯的。

「ARM」的兩層含義

「ARM」這個詞彙包含兩層含義(圖2)。

第一層,ARM是「英國晶片設計公司」的縮寫(已於2016年被日本軟銀收購),是一家致力於半導體晶片設計研發的企業。

第二層,ARM是與X86平級的CPU架構,它和X86的差別是改用了RISC(精簡指令集計算機),雖然整體性能不如X86架構特有的CISC(複雜指令集計算機),但卻因主打低成本、低功耗和高效率這三手好牌,恰好迎合了包括智慧型手機在內的諸多移動設備的發展潮流,從而一統非PC領域計算設備的江山。

火速連結:

有關ARM和X86之間的恩怨和異同,感興趣的讀者可以參考本刊2017年第3期《不再甘心移動 ARM染指PC千億市場》這篇文章。

不一樣的運營模式

ARM之所以默默無聞,主要就在於其獨特的運營模式。

作為全球最著名的半導體晶片廠商,英特爾總將晶片的IP設計、IC設計、晶圓製造和封裝測試等環節大包大攬。

反觀ARM公司,其只負責半導體晶片產業鏈中最初的IP設計部分,也就是研發ARM指令集、內核架構、圖形核心和互連架構等,並將它們授權給其他晶片商完成從半導體晶片設計、生產到銷售的其他流程(圖3)。

而ARM的盈利來源,則在於前期的授權費用,以及晶片廠後期銷售時支付的提成費用。

如果套用一句流行的廣告詞,那就是「我們(ARM)不生產晶片,我們只提供一個晶片設計的Idea」。

可以說,作為一家不生產晶片的晶片廠商,ARM卻在全球範圍內支撐起了各種嵌入式設備、智慧型手機、平板電腦、智能穿戴和物聯網設備的運行,只是ARM每年都會從構建上述設備體內的上百億顆處理器中「抽成」,嚴格遵守薄利多銷的運營模式。

有意思的是,隨著時間的推移ARM和X86的邊間也開始變得模糊起來。

比如,ARM現在就開始「入侵」傳統X86架構處理器堅守的高性能計算終端市場了。

首當其衝的就是伺服器,AMD在2014年就發布了首款ARM架構處理器「Opteron A1100」,並於2016年部署到伺服器領域(圖4)。

作為與英特爾平級的X86晶片供應商,AMD的「倒戈」也恰好印證了ARM架構的先天優勢:擁有更高的靈活性,定製能力以及更低的開發費用和功耗。

AMD副總裁Andrew Feldman曾表示,研發完全定製化、採用ARM架構的伺服器晶片目前僅需花費18個月時間並耗資3000萬美元,而研發基於X86架構的伺服器晶片則需要花費3年到4年時間並耗資3億到4億美元,孰優孰略一看便知。

除了伺服器市場,微軟也聯合高通推出了基於ARM架構處理器(驍龍835)打造的Windows 10筆記本(圖5),並主打「永遠在線」特性,而且很快就要與我們正式見面。

對此類設備感興趣的讀者,可參考本刊2018年第一期《Always Connected PC 驍龍牌筆記本欲乘風破浪》這篇文章。

那麼,就我們最關心的手機處理器而言,ARM給蘋果、高通、聯發科和麒麟等晶片商都提供了哪些幫助?

ARM一門四劍客

最早被應用在智慧型手機身上的處理器,來自基於ARMv6指令集設計的ARM11架構,比如第一代iPhone搭載的三星S5L8900、HTC G1搭載的高通MSM7201就都是基於ARM11架構定製。

隨著消費者對智慧型手機性能的期望值越來越高,ARM從ARMv7指令集開始引入全新的「Cortex+X」冠名方式(圖6),讓手機處理器架構的定位和性能變得更加直觀。

ARM Cortex架構系列可謂「能屈能伸」的典範,它能提供非常廣泛的可擴展性能選項,設計人員有機會在多種選項中選擇最適合自身應用的內核,從而獲得更好的能耗比、靈活性和成本控制。

針對不同領域,ARM將旗下的Cortex內核細分為了三大家族:針對開放系統的「Cortex-A」、面向嵌入式系統的「Cortex-R」和主打各種微控制器的「Cortex-M」(圖7)。

同時,ARM還可以提供與Cortex架構配套打包的Mali系列GPU方案,共同構成了ARM旗下的一門「四劍客」。

Cortex-A

Cortex-A系列又稱「應用處理器」(Application Processors),它是面向移動計算,如智慧型手機、平板電腦和伺服器市場定製的高端處理器內核,支持包括Linux、Android、Windows和iOS等系統必須的內存管理單元(MMU),也是與我們接觸最為密切的存在。

ARM Cortex-A存在4個關鍵時間節點(表1)。

第1個節點是Cortex-A9開啟了多核時代的大門,但同時也讓Cortex-A9與高性能、高發熱和高功耗划上了等號;第2個節點是Cortex-A7和Cortex-A15架構與big.LITTLE「大小核」技術的出現,造就了更靈活的「2+2」、「2+4」、「4+4」多核組建方式,可以讓多核處理器更好地在性能和功耗之間取得平衡;

第3個節點是Cortex-A72和Cortex-A53實現了從32bit向64bit的進化;第4個節點則是最新Cortex-A75和Cortex-A55架構的出現(圖8),它們都基於最新的ARMv8.2-A指令集構建,並針對人工智慧(AI)和機器學習(ML)能力進行了特別優化,同時還帶來了TrustZone安全防禦技術、改進的DynamIQ big.LITTLE技術,綜合性能格外搶眼。

Cortex-R

Cortex-R系列又稱「實時處理器」(Real-time Processors),它是面向實時應用領域的處理器內核,如硬碟控制器、汽車傳動系統和無線通訊的基帶控制等。

和A系列相比,R系列內核缺少了對頁表的支持,軟體端看到的地址就是物理地址,軟體運行時間和中斷響應速度都更快更穩定且容易預測。

雖然Cortex-R系列內核不支持完整的Linux和Windows作業系統,但對大量的實時作業系統(RTOS)支持更加完美。

Cortex-M

Cortex-M系列又稱「微控制器處理器」(Microcontroller Processors),它是面向單片機和深度嵌入式系統市場的處理器內核,比如智能電錶這樣的細分市場就是Cortex-M的主攻方向。

Mali系列GPU

智慧型手機自然要具備出色的娛樂動力,所以合理的CPU+GPU搭配方案就顯得尤為重要了(圖9)。

對ARM公司來說,如何讓晶片廠繳納更多的授權費?恩,在授權CPU的同時,再打包一份GPU不就結了?

於是,和高通Adreno、Imagination Technologies PowerVR齊名的ARM Mali嵌入式圖形處理器就誕生了。

隨著Cortex-A系列架構的不斷升級,ARM Mali GPU也經歷了從Mali-200、Mali-400、Mali-T600、Mali-T700、Mali-T800、Mali-G71和Mali-G72的疊代更新(圖10)。

而影響ARM Mali GPU性能的因素有二,其一是GPU版本越新越好,比如Mali-G72肯定就要比Mali-T880強;其二是ARM Mali GPU可以選配不定數量的計算單元,GPU相同時計算單元越多性能越強。

比如集成20個計算單元的Mali-G71MP20(如Exynos 8895)就要比八個計算單元的Mali-G71MP8(如麒麟960)強很多。

總的來說,ARM Cortex架構將我們身邊無數的電子設備串聯了起來,大到汽車中控、智能電視;小到智慧型手機、運動手錶;微到物聯網設備中超低成本的無線傳感器節點,在幾乎所有用電力驅使且具備一定計算能力的小夥伴都是ARM的客戶(圖11)。

小提示

ARM還有面向支付、電子政府、SIM卡等安全市場的SC系列,只是此類產品與普通用戶關聯不大,所以本文就不再涉及了。

ARM靈活的授權方式

ARM的商業模型是「你交錢,我授權」。

但是,根據繳納授權費用預算的多少,以及晶片廠自身的技術實力,ARM還是提供了多種授權方案供客戶選擇(圖12)。

指令集授權

這是ARM提供的最深度授權方式,晶片廠可以僅購買ARM的指令集(如ARMv7、ARMv8),ARM允許晶片廠對指令集進行擴展或縮減,然後由晶片廠自行搞定內核架構、圖形核心和互連架構等一系列研發設計。

蘋果A系列處理器之所以強悍,就是採用了ARM指令集授權然後自研CPU架構的策略,從而獲得了遠超同期公版ARMCortex-A架構的性能。

值得一提的是,高通早期的Krait架構也採用了ARM指令集授權方案,並先後經歷了APQ8064(Krait 200)、驍龍600(Krait 300)、驍龍800/801(Krait 400)和驍龍805(Krait 450)共四代(圖13)。

三星從Exynos 8890開始也通過指令集授權的方式推出了自主架構「貓鼬M1」(Mongoose M1,只限大核部分,小核依舊是ARM公版的Cortex-A53)。

使用層級授權

考慮到很多晶片廠實力有限,所以ARM還提供了類似「交鑰匙」的授權方案,客戶可以根據自己的需要直接挑選公版Cortex-A架構使用。

這種授權可以幫助晶片廠快速搞出產品,只是能自由發揮的空間不大,處理器的類型、工藝標準都是規定好的,同類產品之間很難在CPU性能上拉開差距,性能的強弱完全取決於主頻、GPU模塊和搭配的數據機等外圍晶片。

麒麟、聯發科和小米澎湃系列(圖14),就多以這種使用層級的授權為主。

BoC許可授權

BoC(Built on ARM Cortex Technology)許可介於前面兩種授權之間,AMD允許晶片廠基於公版Cortex-A架構的基礎上進行「半定製化」。

只是ARM仍然擁有並控制IP,但允許獲得BoC授權的晶片廠對指令窗口大小、高速緩存等進行更改,並對晶片廠設計所要求的更改保密。

高通應該是全部經歷三種授權的晶片廠代表。

為了搭上64bit時代的首班車,高通在驍龍810時代採取了使用層級授權,直接套用ARM公版Cortex-A57+A53(圖15),可惜受制於20nm工藝拖累深陷發熱和降頻的漩渦中,也成為了高通歷史上口碑最差的驍龍處理器;在驍龍820時期,高通改用指令集授權方案,推出了自研的64位Kryo CPU核心,在運行效率上超過了同期的公版Cortex-A57,挽回了驍龍810丟失的聲譽。

從驍龍835開始,高通又青睞於BoC許可授權,推出了分別基於Cortex-A73和Cortex-A53公版架構「魔改」而來的四顆大核Kryo 280和四顆小核Kryo 280。

據悉,驍龍845高通還將沿用BoC許可授權,只是將核心換成了由Cortex-A75、A55魔改而來的Kryo 385(圖16)。

小結

手機處理器的強弱很大程度上就取決於內核架構版本,蘋果A系列處理器之所以強大,就是借了自研核心的光。

問題來了,自研核心就一定優於ARM公版架構嗎?有關這個問題,我們將在下個章節中加以解讀。


請為這篇文章評分?


相關文章 

為何蘋果和三星不買ARM?

前軟銀(Softbank)提出以天價收購ARM後,這個貌似躲在幕後操控、掌握逾4000億美元智慧型手機市場的「黑手」,突然浮出水面。但是,在大家突然發現這個的神秘存在體,突然就有各種不同的猜想:...

不再甘心移動 ARM染指PC千億市場

就像英特爾總在努力實現移動夢想一樣,ARM也在窺視千億級別的PC市場。在於微軟的緊密合作下,ARM染指PC已成定局。那麼,ARM是如何實現「虎口拔牙」計劃的呢?背景知識:ARM的歷史ARM(英國...

ARM揚帆 借力微軟 殺進伺服器市場

在AMD發布32核64線程Naples伺服器處理器平台之後,微軟再度攜手高通開發基於ARM平台的伺服器晶片。一直以來,ARM處理器在移動端使用最為廣泛。雖然性能遠不及桌面x86平台,但功耗表現卻...