華為麒麟970晶片解析:CPU無提升,亮點是集成NPU

文章推薦指數: 80 %
投票人數:10人

不久之前,在「深商名企走進華為」活動中,華為消費者BG CEO、華為終端公司董事長余承東曾透露,以前做海思晶片是一個非常艱難的決定,因為做海思晶片,做得很差,要放棄的話是虧損,要不用它的話,永遠成長不起來,要用它的話競爭力又很差。

然而,華為還是選擇堅持了下來,做到比較差、有點差,後來到慢慢接近一點,再到麒麟950開始慢慢領先,麒麟960領先。

很顯然,從嚴重落後到慢慢領先一路走上來,華為仍在不斷突破。

就在北京時間9月2日晚,在德國柏林的IFA 2017展會上,華為正式發布了新一代移動SoC晶片。

華為余承東表示,麒麟970是華為首款人工智慧移動計算平台,並且是全球首個集成獨立AI人工智慧專用NPU神經網絡處理單元的移動晶片,所採用的是創新的HiAI移動計算架構。

AI加持:全球第一枚集成NPU神經網絡單元的移動晶片

所謂的HiAI移動計算架構,主要有四部分組成,CPU、GPU、ISP/DSP和NPU。

作為全球第一枚集成專用NPU的移動晶片,華為一開場就重點介紹NPU神經網絡單元,聲稱在HiAI架構下AI性能密度大幅由於CPU和GPU,能夠用更少的能耗更快的完成更多任務,大幅提升晶片的運算效率。

更具體來說,在16位浮點數(即FP16)時,麒麟970內置的NPU運算能力達到1.92 TFLOPs,在AI人工智慧深度學習下,所有硬體能夠協調晶片內部的各個組件及手機硬體,如ISP、DSP,保持處理某些特定任務時,提升速度並低功耗運作。

例如有了NPU的加成,在圖像識別任務上,對比Cortex-A73 CPU 性能提升25倍,能效提升50倍之多,拍攝1000張照片僅僅消耗4000mAh電池手機0.19%的電量,圖像識別速度可達到約2000張/分鐘。

相比之下,三星S8使用CPU處理每分鐘僅95張,蘋果iPhone 7 Plus同時使用CPU和GPU,每分鐘也僅能識別487張,華為完勝:

簡而言之,麒麟970有了NPU單元之後,至少在拍照和圖像處理上,比之前單純依賴CPU和GPU要快得多。

而對於競爭對手,麒麟970最直接的就是保持高效率,並且更加的省電。

未來AI獨立單元內置於晶片一定是趨勢,蘋果也在做,只是華為搶先開了個頭,據說拿到了中科院寒武紀授權的AI指令才加速了研發。

當然了,所謂的AI加持提升多少運算處理效率,目前並沒有統一標準進行衡量,只能聽華為官方的舉例來解釋。

無論如何,在AI人工智慧晶片領域,FP16和FP8已經變得越來越重要,因為神經網絡使用十進位數作為計算矩陣的一部分,然而這些浮點數不需要那麼精確,這意味著FP16和FP8比一個完整的32位或64位浮點數更重要。

按照華為的說法,AI晶片能夠以人類的思考方式來理解人類訴求,具備高處理速度,高密度和高能效比,而麒麟970隻是個開始,並超越競爭對手。

余承東表示,麒麟970更快,更強,更聰明,更出色帶來了人工智慧時代下的嶄新體驗,展望智慧型手機的未來,我們正處於一個激動人心的新時代開端,「移動AI=設備AI+雲AI」,未來智能終端將能夠看懂、聽懂,更了解你,能夠思考更懂你,能夠對話以更好的服務你。

CPU無提升令人失望,GPU難得首發了Mali-G72

麒麟970採用的是台積電的10納米工藝製程打造,余承東表示這枚晶片複雜程度集成度非常高,在約100平方毫米的狹小體積內集成了55億個晶管體。

相比之下,競爭對手高通當下最強旗艦晶片驍龍835集成的電晶體數量是31億,而蘋果A10則是33億,暫時不清楚即將登場的A11是多少。

CPU部分,麒麟970與上一代麒麟960一樣為八核心設計,由4個主頻為2.4GHz的Cortex-A73大內核與4個主頻1.8GHz的Cortex-A53內核組成,性能上無變化,畢竟同樣架構頻率,傳聞所說的2.8GHz主頻吊打驍龍835並沒能實現,但跑分上追平驍龍835應該沒問題,並且得益於10納米工藝的進步能效提升20%。

GPU圖形處理器單元部分,華為麒麟970全球首發了ARM的Mali-G72 MP12,12個核心,這是華為首次上兩位數核心的GPU了,圖形處理性能相比960強很多,性能提升幅度達到20%,同時能效還降低了50%。

話說回來,整體看完CPU和GPU,其實麒麟970在功耗方面進步不大,麒麟960高功耗的問題沒有通過10納米得到徹底解決。

因為按照正常晶片的更新換代,必定有性能提升功耗下降的進步,而麒麟970的CPU性能未能得到提升的情況下,也僅降低了20%功耗。

如此來看,加入NPU單元的確是華為本次升級工作的重點了,而不是搶先冒險用上ARM今年早些時候發布的A75和A55架構。

全球領先的4.5G網絡基帶,還支持UFS 2.1

華為還全球首發了「4.5G,Pre 5G」數據機,支持LET Cat 18通信規格,下行峰值速度最高可以達到1.2Gbps,其他參數還包括有4X4 MIMO、5CC CA和256QAM,支持雙卡雙VoLTE。

余承東介紹稱,這一數據機能夠在全球範圍內實現各運營商的高速率組合,華為經過了40萬公里的高鐵測試,因此在高鐵上也能保持穩定的下載速率,再也不用擔心坐高鐵掉網「失聯」。

麒麟970提供雙ISP圖像處理單元和Image DSP信號處理單元,得益於更加強大的算法優化和AI神經網絡輔助下,吞吐量增加25%,支持AI場景識別、人臉追焦、智能運動場景檢測,同時夜拍效果提升。

所以,發布會上余承東展示了搭載麒麟970晶片的設備,在拍照上日常吊打三星的Galaxy S8:

另外,麒麟970集成有最新的i7協處理器,視頻解碼支持4K HDR10格式,內建TEE和inSE安全引擎,擁有更高的安全性集成HiF級硬碟晶片,支持音頻流高達384KHz/32bit母帶級別音質。

需要注意的是,華為官方參數標明,麒麟970不僅最高支持LPDDR4X內存,而且還支持UFS 2.1快閃記憶體儲存,未來推出的麒麟970設備時候是否還混用eMMC快閃記憶體就不清楚了,畢竟上一代麒麟960也支持UFS 2.1。

首發麒麟970,新旗艦Mate 10將於10月16日登場

最後,余承東預告,華為mate 10將全球首發麒麟970處理器,10月16日在德國慕尼黑正式發布。

余承東已經確認,mate 10將是華為首款全面屏設計的智慧型手機,並且由於搭載出色的麒麟970讓更加讓人期待。

關於Mate 10目前可以確認的是,該機子所採用的螢幕來自於JDI,剛好是前段時間正式宣布的全面螢幕,6英寸大小,18:9的螢幕比例,解析度為Quad HD級別的2160×1080像素,採用Pixel Eyes技術。

而在此之前,余承東曾表示,華為新一代旗艦Mate 10的目標是幹掉同一時期的蘋果新一代iPhone,屆時Mate 10綜合實力強大。

除了強大的麒麟970,余承東強調,該旗艦擁有驚艷的全面屏設計、更長的續航、更快的速度以及更出色的雙攝表現,還有不能透露的重磅功能。

講真,在CPU性能上麒麟970應該不是今年最快的晶片,在安卓領域今年最快的應該是未發布的驍龍836,下半年穀歌Pixel 2有望搭載,而蘋果即將發布的A11晶片同樣令人無比期待。


請為這篇文章評分?


相關文章 

麒麟970國產之最

華為麒麟970是華為於2017年9月2日在柏林消費電子展上正式對外發布的新款內置人工智慧(AI)晶片。這款晶片將被用於華為下一代智慧型手機,主要用於抗衡對手蘋果和三星電子公司。