再次成為世界的焦點,看華為如何實力「碾壓」高通與蘋果?

文章推薦指數: 80 %
投票人數:10人

華為消費者業務CEO余承東在2018德國柏林消費電子展(IFA)上發表「The Ultimate Power of Mobile AI」的主題演講,面向全球推出華為最新一代卓越人工智慧手機晶片—麒麟980。

似乎已經好久沒有收聽到國內有哪些重大事件發生了,然而在8月的最後一天,華為似乎帶著不可辜負的使命,讓天朝再次成為世界的焦點!

8月31日晚八點,華為在德國IFA 2018展會上正式揭曉了新一代移動SoC處理器「麒麟980」。

一向自信的余承東直言:「基於多項技術突破和方案創新,麒麟980不僅在性能、能效、移動通信連接等方面領先業界,同時增強了AI運算力及豐富了AI應用場景,將再次引領手機全面進入智慧時代。

不弔任何胃口,余承東直接公布了麒麟980的六個世界第一。

翻譯成中文就是:

全球最早商用的台積電7nm工藝的手機SoC晶片 -

全球首次實現基於ARM Cortex-A76開發的商用CPU架構,最高主頻可達2.6GHz -

全球首款搭載雙核NPU -

全球最新採用Mali-G76 GPU -

全球最先支持LTE Cat.21,峰值下載速率1.4Gbps,達到業內最高 -

支持全球最快LPDDR4X顆粒,主頻最高可達2133MHz,同樣業內最高 -

世界第一個7nm製程工藝SoC。

整個晶片尺寸僅為14mm*14mm,相比業界普遍採用的10nm製造工藝,性能可提升20%,能效提升40%,電晶體密度提升到1.6倍,實現性能與能效的雙重提升。

由台積電代工。

世界第一個ARM A76架構CPU

首次實現了基於Cortex-A76的開發商用,在指甲蓋大小的尺寸上塞進69億個電晶體,與上一代相比單核性能提升75%,能效提升58%。

此外,Kirin CPU子系統推出了Flex-Scheduling智能調度機制,創造性地設計了2超大核(基於Cortex-A76開發)、2大核(基於Cortex-A76開發)、4小核(Cortex-A55)的三檔能效架構,提供了更為精準的調度層次,讓CPU在重載、中載、輕載場景下靈活適配,讓用戶獲得更高性能體驗的同時獲取更長的續航體驗。

世界第一個雙NPU

在雙NPU的移動端算力加持下,麒麟980能做到人臉識別、物體識別、物體檢測、圖像分割、智能翻譯等AI場景,採用更高精度的深度網絡具備更佳的實時性,從而獲得更優體驗。

麒麟980實現每分鐘圖像識別4500張,識別速度相比上一代提升120%。

全新一代的 NPU 設計,在 AI 性能上遠超過現有其他強調 AI 的競爭產品。

世界第一個商用Mali-G76 GPU

與上一代相比性能提升46%,能效提升178%。

麒麟980引入了AI調頻調度技術,能夠實時學習幀率、流暢度和觸屏輸入變化,預測手機任務負載,動態智能感知手機使用過程中存在的性能瓶頸,及時進行調頻調度。

在遊戲場景下,使用AI調頻調度技術預測遊戲每幀負載,預測準確性可以提升30%以上,有效提升了遊戲平均幀率,大幅降低遊戲抖動率,減少遊戲卡頓,為手游用戶帶來操作流暢、不卡頓的優秀遊戲體驗。

世界第一個1.4Gbps Cat.21基帶

在網絡支持方面,麒麟980支持LTE Cat.21,支持業界最高的下行1.4Gbps速率。

此外,麒麟980配套使用手機WiFi晶片Hi1103,率先支持160M帶寬,理論峰值下載速率可達1.7Gbps,是業界同期水平的1.7倍,同時,Hi1103支持業界領先的L1+L5雙頻GPS精準定位,L5頻段下定位精度提升10倍,有效改善手機定位精準度。

世界第一個支持LPDDR4X-2133內存

麒麟980採用的是2大核+2中核+4小核設計,配合2133MHz內存,帶寬提升了20%、延遲降低了22%。

另外,在拍照能力上,麒麟980採用第四代自研ISP,像素吞吐率比上一代提升46%,能夠分區域調節圖像色彩與灰階,支持更多攝像頭,全新HDR色彩還原,能夠分區域調節圖像色彩,實現照片色彩與細節的平衡。

在演講的最後,余承東宣布了HUAWEI Mate 20系列將於10月發布。

作為首個搭載麒麟980晶片的智慧手機。

從麒麟 970 到麒麟 980,最新架構的引進大幅改進能效表現

麒麟 970 這款在 2017 下半年推出的晶片對華為而言極具有戰略意義,其推動的華為產品布局與 AI 應用生態,奪走了許多消費者的眼光,也順勢推動華為的許多產品的銷售。

然而,從麒麟 970 的設計理念中,還是能看出華為為了節省成本而做的努力。

首先,其 CPU 架構採用 4 個Cortex-A73 搭配 4 個 Cortex-A53,是當時的主流高端架構,但是在 GPU 方面,卻只採用了 12 核心的Mali G72,並通過提升運行頻率以強化其性能表現。

這種作法相當簡單粗暴,但是對於降低晶片面積以及 IP 授權成本有一定的效果,只不過還是有些副作用出現,首先,由於頻率較高,將直接挑戰架構和工藝本身的功耗牆,一旦超過邊界極限,那麼功耗和溫度就會直線上升,影響持續性能輸出表現和穩定性,手機也會明顯發熱。

為了控制成本,麒麟晶片通常會使用少核心高頻的手段來取得成本和效能的平衡,但功耗效能上的表現多少都會受到影響。

為了解決這個問題,華為利用軟體優化手段,也就是 GPU-Turbo 手法,針對性的瞄準特定遊戲應用來優化其功耗與性能表現,的確發揮了不錯的效果,就連高通也希望仿效這種作法來改善其硬體的表現,對業界整體而言,華為的確帶起了一波技術革新與示範作用。

而麒麟 970 的另一個重點在於全球首發的 AI 硬體 NPU 設計,其AI算力很強,可以在 1W 功耗下達到4TOPS 的性能表現,不止相關應用的性能與效果超出高通的異構計算,甚至蘋果 NPU 也自嘆不如,而其他的「純軟體模擬 AI 方案」就更不用說了。

而此次在 IFA 大會上發布的麒麟980,採用的是 Cortex-A76。

Cortex-A76 是在今年 6 月才發布,官標的數據方面,基於台積電 7nm 工藝的 3GHz A76 核心比 10nm 2.8GHz 的 A75 核心性能提升 35%、省電40%、機器學習的負載能力提升 4 倍。

在 GeekBench 4 跑分方面,整數和浮點相較於 A73 提升了 90% 和 150%,最終得分提升 35%。

A76 同樣支持 DynamIQ 拓撲特性,官方建議 1+7/2+6 這樣的 Big.little 大小核設計。

通過使用最新核心,麒麟 980 的性能表現也達到驚人的程度,另外在 GPU 部分,同樣也採用了最新的 Mali-G76,其性能密度提升了 30%,節電 30%,用於手機的圖形性能會提高 50%,現在可以支持最高 8K 解析度的螢幕了。

不過由於成本考慮,雖然核心數量只有 10 個,較麒麟 970 少了 2 個,但性能是相當於 20 箇舊版核心。

但值得注意的是,由於必須考慮到成本架構,華為在麒麟 980 的架構設計上依然還是偏重成本控制,所以除了使用最新架構外,核心數量或者是自定核心並沒有太過積極的動作,因此,在同業對手的方案相繼跟上 7nm 腳步後,華為要面對的競爭態勢也將會有所改變。

不過在重點的 AI 單元,華為將繼續使用專用 NPU 的方案,並使用了雙核配置,性能達前代方案的 135%。

而且其設計原生為 7nm 工藝優化,更能適合麒麟 980 的設計方向,而這點也將成為麒麟 980 能否領導未來手機 AI 方案的重要關鍵。

其他 AI 手機方案競爭者

即將引入硬體 NPU 的高通

作為全球最大的手機方案供應商,高通過去通過 Hexagon 與 GPU、CPU 協同工作,達成對主流AI 框架的計算加速能力,雖然在效率上還是明顯落後蘋果與華為的硬體方案,但總是給市場一個交代。

然而,異構計算(Heterogeneous computing)雖然彈性高,且可以有效利用晶片中的不同類型計算架構,但目前 AI 計算方案講求的是更高的能效表現,而在手機等移動終端上,更顯重要,雖然高通的異構計算已經屬於相當高效的技術,但仍與 ASIC 有一定的落差,也因此,在使用針對 AI 加速框架進行性能的評比應用時,高通很明顯要落後採用硬體 NPU 的競爭對手,未來如果 AI 模型往更複雜的方向發展,或者是同時需要執行多種 AI 服務,那麼在發展空間上就可能會明顯不如競爭對手了。

不過,高通也不是不知應變,根據市場傳聞,其在下一代中高端方案驍龍 700 系列中,將引入硬體 NPU 設計,而如果成真,其下一代高端方案,也就是驍龍 855,也將可能沿用同樣的方式。

而目前高通也引進了包含商湯等多家 AI 算法設計公司所設計出來的應用框架,想要快速衝刺相關市場,不過高通目前的 AI 性能還有相當大的改善空間,如果要負載更複雜、多元的 AI 計算,恐怕還是要等到下一世代的 AI 設計問世。

而根據 DT 君得到的信息,高通將在 12 月正式發布新一代的高端 AI 手機方案,按照往例,明年初就可以見到實際終端產品。

三星從抄襲到走出自己的路,Exynos的半軟半硬 AI 亦然

三星作為全球最大的手機廠商,其勢力涵蓋終端、消費、雲端服務、半導體製造與設計等領域,而其中,手機市場是其最重視的一塊,而為了推動其手機市場的布局,三星過去亦步亦趨的追隨包含蘋果與高通的步伐,並將學習到的設計精髓轉化為自有的方案設計。

目前三星主要的晶片來源包含了自行設計的 Exynos 系列、高通的驍龍系列、聯發科的低端 MT 系列,以及展訊的 SC 系列,市場從最高端,到最低等級,可能會被我們直接當作電子垃圾的產品,幾乎都有覆蓋。

目前 Exynos 9810 是三星的主力自產高端產品,今年的 Galaxy S9 系列、Note9 系列都可見到其身影,其採用的 AI 計算方式與高通類似,主要是通過 DSP、GPU 與 CPU 的協同計算,不過三星有個特殊的作法,那就是視覺相關的處理交由硬體,而非異構計算。

目前的 9810 採用脫胎自 Cortex-A75 的 M3 定製架構,並搭配 Cortex-A55 作為小核心,而與華為最大的不同是,三星在 GPU 規模上相當捨得下工本,其 Mali-G72 核心數量配置高達 18 個,比麒麟 970 多出 6 個,雖然晶片成本會較高,但可以在較低的時鐘水頻達到更穩定、更好的效能表現,換言之,能效也更好。

而 9810 中有個 VPU 計算單元,顧名思義,是用來處理視覺方面的計算工作,這個單元應該是硬體設計,但只能用來處理比較固定的功能,三星也未公開發布任何支持該計算單元的可編程或開發套件框架。

而其他的 AI 計算工作就如高通般,是使用異構計算,統 GPU 與 CPU 來達成,這方面可能主要是沿用 Arm 的軟體資源,三星也同樣沒有發布任何相關的開發套件給第三方開發者。

而下一代方案,也就是 Exynos 9820,將會採用 ARM DynamIQ 架構設計,並且將以「2+2+4」三叢集形式打造,其中兩組大核將採用三星第四代自主架構「M4」,第二道兩組大核則以 ARM Cortex-A75 構成 (也可能以 Cortex-A76 取代),而小核部分則將以 4 組 ARM Cortex-A55 構成。

AI 部分則將可能維持 9810 的作法,那就是採用 VPU 硬體處理單元來處理部分視覺計算工作,並搭配既有的異構計算方式來處理標準 AI 計算框架,也就是半軟半硬的方式。

最後,9810 採用的是三星 10nm工藝,而 9820 將可能是三星 7nm 方案首發,但因為三星的 7nm 採用 EUV 技術,目前還在調試中,真正量產最快也要今年底或明年初,這也可能讓 9820 成為最晚推出的次世代 AI 手機晶片方案。

賺走最多錢的手機公司搞 AI——蘋果

蘋果基本的手機晶片布局是每年一款,當然,為了配合如平板電腦或者是手錶等其他終端的產品時程,也會在不特定的時間點發布相關方案。

而蘋果最新的手機晶片是去年發表的 A11 Bionic,內建的硬體 NPU 是最大特色。

而蘋果在其晶片中往往都使用較少的核心,相較對手都已經走到 8 核以上,蘋果 A11 還只是個 6核產品,但其表現出來的性能數據卻遠遠超越所有競爭對手,其原因包括蘋果對其使用的 Arm 架構深度定製化,並捨得為了特定性能目的來堆加更多電晶體,因此其晶片製造成本往往也都比同時期的手機晶片方案更高。

但此策略成功推動手機的銷售,並創造更高的獲利,因此每一代方案蘋果也就更捨得堆料,形成正向發展。

A11 使用的是台積電 10nm 工藝,這也是少數幾次沒有使用到三星代工工藝的蘋果晶片,由於目前蘋果的開發套件中,只開放 GPU 計算能力給開發者,而 GPU 也負擔包括第三方 AI 應用的訓練或推理的工作,對蘋果而言,GPU 的份量也越來越重要,這也是之所以蘋果要推動自有 GPU 架構的發展。

雖然目前所採用的 PowerVR 架構在性能與菜單現上相當出色,該公司也願意配合蘋果進行高度定製工作,但這對於蘋果而言仍遠遠不足,而展望未來蘋果對其 GPU 架構的布局,將可能是個結合繪圖、計算以及推理、訓練的全功能 AI 優化設計,當然,為了能耗表現,推理工作可能還是維持獨立的 NPU 單元來進行。

而未來 A12 將會如何?其實在現階段也只能猜測,唯一能確定的只有使用 7nm 製造工藝這點。

而在架構方面,根據過去的慣例,性能的增長肯定是不能忽略的,畢竟對手也都在積極追趕,今年對手的主流方案都已經在整體性能上有相當大的改善,也拉近了與 A11 的距離,A12 肯定會在CPU 與 GPU 方面進行更深度的改造,不論是增加更多的處理管線,更優化 CPU 或 GPU 內部的流水線設計,亦或者粗暴的堆加核心,都是可能的作法。

至於在關鍵的 AI 硬體單元方面,除了強化效率以外,也可能就規模方面進行擴展,藉以壓制華為或高通等即將面世的下一代 AI 方案。

專注中低端的聯發科

聯發科 2018 年主打的 AI 手機方案 P60,具備 AI 專用計算模塊的APU(AI specialized Processing Unit),基於 DSP 計算架構,而 CPU 則是採用Cortex-A73 搭配 Cortex-A53 的四大四小設計,雖然不是採用最新的 Cortex-A76,但性能表現仍有一定水準,GPU 方案則是使用 Mali-G72 這款相當穩定的 GPU 架構,不過可惜的是,聯發科為了成本考慮,只採用 MP3 配置,並以高頻率運作來補足性能表現,因此在運行遊戲時,可能會對電池壽命產生負面影響。

目前 P60 已經被應用在包含 OPPO 等多款手機產品當中,雖後的小改版產品也已經箭在弦上。

目前,中國前幾大手機廠商都是聯發科的客戶,產品多分布在中低端,包含華為、OPPO、VIVO、小米、魅族,以及其他二三線廠商,基本上都擺脫不了聯發科,畢竟中低端手機中具備成本優勢,產品線完整且技術更新還能跟上市場腳步,且能提供最好技術支持服務的,就屬聯發科了。

而在前兩年,聯發科也打入三星的供應煉,通過使用一定比重的三星晶片代工工藝服務,三星也在其低端手機中採用聯發科的方案作為交換。

聯發科的方案成本相對較低,且過去在包裹 TurnKey 服務方面口碑極好,在中國的支持人力也最廣泛,雖然是 AI 生態的後進者,但是在商湯等 AI 大公司的協助之下,或許第一時間就能夠提出夠成熟的語音與視覺 AI 方案,對客戶而言,聯發科一直都是便宜又大碗的選擇。

對於HUAWEI Mate 20系列將會搭載980晶片你怎麼看?又講會給廣大用戶帶來怎樣的性能體驗呢?


請為這篇文章評分?


相關文章 

Artemis難助華為和聯發科趕超高通和三星

ARM今天宣布與台積電合作製成全球首款10nm工藝晶片,採用全新頂級架構Artemis,考慮到三星和高通已經改用自研的核心,採用這個核心將會是聯發科和華為海思,此前也有業內人士證實這兩家晶片企業...

華為麒麟處理器的發展歷程

華為海思晶片的歷史已經不短了,2004年成立時主要是做一些行業用晶片,用於配套網絡和視頻應用。並沒有進入智慧型手機市場。在2009年,華為推出了一款K3處理器試水智慧型手機,華為晶片真正的為人...

聯發科X30註定落後高通驍龍830!

台媒報導說由於看好聯發科helio X30可能具備超越蘋果A11和高通驍龍830的性能,因此看好它的股價而加倉買入,不過事實是由於ARM的A73核心性能所限註定它無法超越這兩款晶片。

手機芯事第四期:2016買手機就選這些晶片

【PConline 雜談】經過三期的手機芯事,我們已經大體了解到去年手機晶片市場的變化、好晶片的組成要素以及自主公版CPU架構的來龍去脈,但處理器這些領域對於普通消費者來說難免多少有些陌生,不能...

主流手機CPU品牌大盤點

高通驍龍 (Qualcomm Technologies)驍龍處理器是美國高通旗下的一個處理器和數據機品牌,目前主要有驍龍處理器有四個系列:800系列,驍龍600系列,驍龍400系列和驍龍200系...

小米松果V970與華為麒麟970爭鋒?

小米將在本月28日發布其第一款手機晶片V670,這只是一款定位中低端市場的手機處理器,其挑戰高端市場的V970才是更值得關注的晶片,據說將在下半年發布,這將與華為海思的麒麟970正面爭鋒。