突破極限 自研架構是成神之路

文章推薦指數: 80 %
投票人數:10人

雖然很不願意承認,但蘋果iPhone 8和iPhone X的確代表了當前智慧型手機領域的最強性能,哪怕是還未量產的高通驍龍845都難以撼動蘋果A11 Bionic處理器的皇者地位。

要知道,A11 Bionic明明只是一顆六核處理器(圖1),它又是憑什麼秒殺一眾八核甚至十核競爭對手的呢?

追本溯源 蘋果之強並非先天

很多人只看到了今天iPhone在性能上的輝煌,認為它天生驕傲。

實際上,早期的iPhone在性能上並沒有領先Android陣營多少,(多核性能)甚至還曾一度落後過。

iPhone也曾隨波逐流

還記得第一代iPhone帶給我們的震撼嗎?超大且支持多點觸控的3.5英寸螢幕、可實現全時連接的2G+Wi-Fi網絡、完整的Web體驗,簡直可以吊打當年的塞班和Windows Mobile系統的任何對手。

要知道,當年塞班手機清一色還都需要用按鍵操作,Windows Mobile手機也需要觸控筆才能談得上體驗。

那麼,當時的iPhone性能很強嗎?

的確很強,iPhone搭載了來自三星旗下的S5L8900處理器(圖2),並集成PowerVR MBX-Lite GPU模塊。

這款晶片基於ARM11架構設計,擁有412MHz的主頻,再加上128MB內存,堪稱無敵配置。

可惜,蘋果第二代iPhone 3G選擇了原地踏步,它的硬體規格不變,只是加入了對新興3G網絡的支持,App Store的誕生則改寫了智慧型手機的玩法。

同一時間,谷歌推出了Android系統,以HTC G1為代表的競爭對手在第一時間就實現了配置上的反超(圖3):搭載高通MSM7201處理器,集成Adreno 130 GPU,內置更大的192MB內存。

也就是從這個時期開始,iPhone和Android手機間的軍備競賽正式拉開了序幕。

2009年,iPhone 3GS攜代號為「蜂鳥」的三星S5PC110處理器來襲,這顆晶片首次嘗鮮AMR最新的Cortex-A8架構,600MHz的主頻,再加上PowerVR SGX535 GPU和256GB內存的組合,將智慧型手機的流暢度發揮到了極致。

另一方面,在App Store中還湧現出了無數好玩的iOS獨占遊戲,至此iPhone遊戲多、更流暢,就成為了果粉抵制Android手機的絕佳理由。

那麼,Android陣營是如何回擊的呢?摩托羅拉推出的Milestone搭載德州儀器OMAP3430處理器(圖4),同樣集成PowerVR SGX535 GPU並內置256MB內存;HTC從G2開始改用高通MSM7200A處理器,集成Adreno 200 GPU,內置288MB內存。

也就是從這個時期開始,讓玩家們認識到手機GPU和系統優化的重要性,因為HTC G2玩遊戲沒有Milestone快,而Milestone又不如iPhone 3GS。

開啟自研CPU之路

面對Android陣營咄咄逼人的進攻態勢,蘋果做出了一個重要決定:通過自主研發CPU,逐漸擺脫來自三星晶片方面的依賴。

於是,從iPhone 4開始,蘋果A系列處理器終於正式與我們見面了。

iPhone 4搭載Apple A4處理器,它基於ARM官方Cortex-A8架構設計,我們可以將它看做是三星S5PC110的定製版(圖5);從iPhone 4s的Apple A5開始,蘋果A系列處理器跨入了雙核時代,由Cortex-A9同步雙核心架構組成,基本與同期Android陣營高端手機的規格持平。

步入2012年後,NVIDIA、三星和高通紛紛祭出了四核處理器,而蘋果卻不願意盲目追隨市場潮流,打算堅持既有產品設計原則的態度。

為了不讓雙核戰四核輸的太難看,蘋果從Apple A6開始,才算進入了真正意義上的自研CPU之路上。

因為,Apple A6不再使用ARM公版的Cortex-A系列架構,而是改用蘋果基於ARMv7s指令集自主研發的「Swift」架構核心(圖6)。

蘋果自研的架構有多強?我們不妨參考一下它與同期Android陣營標杆三星Galaxy S的跑分對比(表1),從Apple A6開始蘋果處理器總能在單核性能上保持絕對的優勢,只是受制於核心數量偏少以及核心調度策略(同一時間點上只有高性能核心或低功耗核心運行)上的先天缺陷,導致蘋果A系列處理器在多核性能上就很難與同期的對手拉開差距。

但是,這已經足夠說明問題了。

蘋果從Apple A6開始,在核心數量少、內存容量低的絕對劣勢下,卻能在CPU跑分層面保持一定的優勢,可見ARM官方Cortex-A架構並沒有挖掘出ARMv7/ARMv8指令集的全部潛力,而這就給了晶片廠商自研架構核心的空間。

到了AppleA11 Bionic時代,更是成就了蘋果處理器秒天秒地的威望,成為了一個似乎無法戰勝的存在(表2)。

蘋果為何鍾情於自研

智慧型手機是一種極為精密的電子設備,它的PCB主板是一個整體,除了處理器晶片外還要涉及到其它器件的布局和走線(圖7)。

此時,如果直接使用高通或三星的處理器,就必須按照對方的晶片規格設計PCB,一旦晶片廠的下一代產品發生較大變化,蘋果方面也會因此而產生不必要的重新設計的成本。

另一方面,蘋果從很早以前就發現,現在根本就沒有廠商在做自己所需要的處理器,蘋果需要比競品更強的性能,計劃通過追求深度無序的執行和廣泛的問題寬度來走向ARM不曾走過之路。

於是,在HTC和摩托羅拉等品牌都在依賴高通提供的處理器時,蘋果就展開了各種收購和組建自己工程師團隊之旅,最終在Apple A4上引入了以早前收購為基礎而開發出的專用晶片組和控制器。

正如前文所述,Apple A6是蘋果自研處理器道路上的關鍵節點,它雖然使用了ARM指令集但卻不再沿用現成的公版設計。

憑藉著資本優勢,蘋果在2013年發布了全球首款64位智慧型手機晶片Apple A7,同時還衍生出了配備更強大圖形處理性能的X變種型號(應用在iPad身上)。

到了A10 Fusion時代,蘋果正式邁入了四核時代,在全新動態電壓頻率調節模式和性能控制器的幫之下,可更有針對性對核心負載進行智能管理,比如做到讓某些核心完全關閉,能耗管控能力遠超Android陣營晶片(圖8)。

蘋果的自研野望

不要以為蘋果只專注於手機處理器的研發,第一代Apple Watch所搭載的也是蘋果自主研發的Apple S1,一顆針對可穿戴設備量身設計的超微型晶片(圖9),隨後的Apple Watch2則升級到了雙核心的Apple S2,擁有2倍於前輩的圖形性能。

在AirPods無線耳機身上,我們還看到了革命性的超低功耗Apple W1晶片(圖10),它解決了普通藍牙耳機的斷續情況,還可提供更好的音質和更低的功耗。

總之,通過A系列處理器的研發經驗積累,蘋果已經奠定好了為旗下產品自主設計硬體「垂直整合」戰略的基礎。

從AppleA11 Bionic開始,蘋果更是拋棄了最緊密合作夥伴 Imagination Technologies,開始定製自主的GPU架構,一旦取得重大的技術突破,蘋果自研的GPU無論是晶片面積還是性能,都能比之前Imagination Technologies提供的GPU內核更適合Apple A系列SoC整體晶片的結構設計。

此外,蘋果還展開了自主研發數據機的計劃,從而擺脫高通和英特爾的掣肘。

可以說,蘋果未來的野望就是將整個SoC內全部模塊的主動權都收集到自己手中,在恰當的時機甚至會將它們應用Mac系列的PC領域,打通Mac OS和iOS系統之間的兼容壁壘,屆時我們使用PC的習慣也將因此而產生質變。

不讓蘋果獨美於前 來自競爭對手的挑戰

細心的讀者不難發現,對手機處理器而言,只要核心架構相同,主頻相近,它們在跑分性能上就很難拉開差距。

為了不讓蘋果A系列處理器獨美於前,以高通和三星為代表的晶片廠紛紛展開了反擊。

高通的BoC戰略

在上個章節我們介紹過,高通旗下的Kryo內核在驍龍820時代就實現了完全自主的定製化,為何從驍龍835身上又改用BoC的半定製化戰略呢?很簡單,高通的每一代處理器,都會根據時間和市場需求來選擇最合適的CPU設計。

通過指令集授權而完全自主定製處理器不太經濟,而高通又覺得ARM big.LITTLE技術已經不符合實際應用環境的需求,所以才促成了基於BoC授權而生的驍龍835(圖11)。

簡單來說,驍龍835和驍龍820一樣都是兩簇核心,分別為四顆Kryo 280(2.45GHz)性能核心和四顆Kryo 280(1.9GHz)效能核心,與ARM官方架構遵循的Big.LITTLE大小核技術不同,這八顆核心均為大核心設計。

高通認為,智慧型手機無時無刻都在與多媒體打交道,哪怕運行微信也會涉及到大量的文字、圖片和視頻處理,而公版Cortex-A53核心連亂序執行都沒有,需要藉助更高的頻率才能滿足微信突發的性能請求。

高不成低不就的LITTLE小核心在處理社交類APP經常面臨吃力不討好的尷尬局面,最終還是需要Big大核心登場。

於是,高通自行設計了驍龍835的內存控制器,保證了I/O性能並加大了二級緩存,可減少讀取內存,在APP加載、網頁瀏覽、VR下能提高20%性能,手機應用中80%的任務可交由1.9GHz的效能核心處理,能耗比遠在傳統big.LITTLE技術之上。

對於即將量產的驍龍845,高通帶來了全新的Kryo 385架構內核,從已知的資料來看它應該是基於ARM最新的Cortex-A75和A55魔改而來,最大的特色就是引入了DyanmIQ技術(圖12)。

和Big.LITTLE相比,DyanmIQ重新定義了多核微架構,允許DynamIQ 任意叢集中核心數量可以從單核到八核不等,並且還支持異構CPU之間的混搭。

有了更靈活分配核心資源的DyanmIQ技術的幫忙,高通才敢在10nm工藝不變的基礎上,將最高主頻從2.45GHz一下子提升到2.8GHz。

據悉,高通在2018年計劃推出更多基於BoC授權的處理器,包括驍龍670、驍龍640和驍龍460(圖13)。

其中,驍龍670將採用四顆Kryo 360 Gold(Cortex-A75公版架構魔改)和四顆Kryo 385 Silver(A55魔改)組成的八核心架構,集成Adreno 620 GPU;驍龍640採用兩顆Kryo 360 Gold和六顆 Kryo 360 Silver(A55魔改)組成的八核心架構,集成Adreno 610 GPU;驍龍460由四顆高頻Kryo 360 Silver和四顆低頻Kryo 360 Silver核心構成(均由A55魔改),集成Adreno 605 GPU。

遺憾的是,從網上曝光的驍龍845性能來看,它的單核/多核性能分別為2422和8351,和公版Cortex-A75的理論性能相似,距離蘋果A11 Bionic單核超4000,多核破萬的成績相比還很遙遠。

希望隨著固件和驅動的優化,等驍龍845正式上市時能給我們帶來性能上的驚喜吧。

三星的自研大核計劃

三星從Exynos 8890開始就學習蘋果展開了自研CPU的旅程,基於ARMv8指令集推出了名為貓鼬(Mongoose)的架構核心。

從Exynos 8890、Exynos 8895到Exynos 9810,貓鼬架構也經歷了不斷升級,即將隨Galaxy S9與我們見面的,就是基於三星第三代自研架構——Mongoose M3設計的Exynos 9810(圖14)。

簡單來說,Exynos 9810基於10nm LPP工藝打造,由四顆Mongoose M3(2.9GHz)和四顆Cortex-A55(1.9GHz)組成的八核心架構,集成ARM Mali-G72MP12 GPU。

據悉,Mongoose M3自研架構的性能極為強悍,在GeekBench 4跑分中單核成績可達4000分,多核性能有望破萬。

如果屬實,Exynos 9810將具備和蘋果A11 Bionic分庭抗禮的實力。

可惜,三星從Exynos 8890時代起自研架構就僅限於大核部分,而小核總是套用ARM公版A53/A55架構。

如果三星可以參考蘋果和高通,將大小核全部換成自研核心(哪怕小核是BoC),相信綜合性能還能再上層樓。

小結

對智慧型手機而言,更高的跑分成績雖然並不具備什麼實際意義,但對於新款手機而言,跑分成績低卻是萬萬不成的,而將CPU架構從公版換成自研,無疑就是一條捷徑。

除了高通和三星,有消息稱華為也開展了自研內核計劃,也許很快就會有相關的晶片與我們見面。

當然,我們也不鼓勵盲目的自研,畢竟研發成本最終是要轉嫁到每一個消費者頭上,而且影響手機實際體驗的,除了CPU部分外還有CP U、ISP、DSP、數據機和AI相關單元(圖15)。

未來手機處理器的競爭將是綜合實力的較量,自研CPU架構只能搶占先機,而最終結果還要受到SoC內的其它單元影響。


請為這篇文章評分?


相關文章