華為最強自研 NPU 問世,麒麟 810「拋棄」寒武紀

文章推薦指數: 80 %
投票人數:10人

整理 | 一一

出品 | AI科技大本營(ID:rgznai100)

責編 | 胡巍巍

「能效高、算子多、精度高」,華為消費者業務手機產品線總裁何剛用一句話總結了自研達文西架構給最新麒麟810晶片帶來的變化。

6 月 21 日,在 HUAWEI Nova 5 系列新品發布會上,最大的亮點之一當屬華為發布的麒麟 810 全新人工智慧手機晶片,這是首款採用華為自研達文西架構的手機 AI 晶片。

去年 10 月,華為推出達文西架構的雲端 AI 晶片昇騰 Ascend 910 和昇騰 Ascend 310 後,首次將達文西架構落地至終端晶片的 NPU,同時這也意味著,他們在 NPU 中拋棄了寒武紀 IP。

最新的麒麟 810 了採用業界最先進的 7nm 工藝製程,相比 8nm 工藝,能效提升 20%,電晶體密度提升 50%,這讓它成為目前全球第三款採用該尖端工藝的手機 SoC 晶片,也是華為繼麒麟980 之後推出的第二款 7nm 手機 SoC 晶片。

近年來,隨著端側AI高速發展,手機廠商對晶片的適配性和靈活性提出更高要求,而華為對此的探索處於一路領跑狀態。

2017年,以麒麟 970 為代表的晶片首次採用獨立NPU神經網絡處理單元,業內也開始探索端側人工智慧應用。

2018 年,麒麟 980 採用雙核 NPU,進一步提升了端側 AI 算力,帶來 AI 人像留色、卡路里識別等豐富的 AI 應用。

此次,最新麒麟 810 再次領跑業界,首度採用華為自研達文西計算架構,再度提升端側 AI 的性能,並且首次將旗艦級的 AI 性能在中高端手機中落地。

達文西架構是華為在 2018 年推出的全新自研AI計算架構,針對 AI 計算特點進行設計。

不同於以往的二維運算模式,達文西架構以高性能 3D Cube 計算引擎為基礎,針對矩陣運算進行加速,大幅提高單位面積下的AI算力,激發端側 AI 的運算潛能。

另外,麒麟 810 晶片具有端側能效業界最優的 AI 運算單元。

根據 ETH Benchmark 測試,麒麟 810 NPU跑分 32280 分,遠超驍龍 710(6556 分)、驍龍730(13908 分)和驍龍 855(25428 分)。

對於麒麟 810 搭載華為自研的達文西架構,最直接的受害者是寒武紀,因為麒麟 970 第一代的 NPU 用的是寒武紀架構,但實際上,華為要在手機 AI 晶片搭載自研架構早在意料之中,只是很多人可能沒想到落地速度來得如此之快。

正如徐直軍此前所說,「寒武紀的(IP)也很好,但是它無法支持我們的全場景,我們需要從雲、到端、到物聯網終端的人工智慧設備,因此我們要創造性地打造一款新的架構。

而達文西架構能夠解決極致的功耗與極致的算力需求。

按照這個勢頭,麒麟 810 應該只是開始,我們有理由相信,無論是 600 系列還是 900 系列,未來也會很快走向全定製化架構,華為移動計算生態將進一步擴大

以下從 CPU,GPU,拍照和通信方面的變化介紹麒麟 810 晶片:

CPU 方面,麒麟 810 採用全新系統級 AI 調頻調度技術,2+6 大小核架構,即搭載兩個基於Cortex-A76開發商用的大核,針對移動終端的使用場景進行深度優化,以及六個 Cortex-A55 小核實現能效升級。

據華為方面介紹,麒麟 810 全新 2+6 能效架構將提供更加精準的調度層次,讓 CPU在 遊戲、購物等重載場景,以及社交、瀏覽網頁等輕載場景下靈活適配,大大降低 CPU 在實際應用場景中的功耗,實現更持久的續航和更流暢的操作體驗。

GPU則升級到 Mali-G52 定製,支持 Kirin Gaming+ 技術,遊戲實力全面升級,通過系統級 AI 調頻調度技術、60fps 高性能及 HD 畫質和 GPU 負載優化全面升級遊戲體驗。

具體而言,AI 調頻調度技術能夠實時學習幀率、流暢度和觸屏輸入變化,預測手機任務負載,動態感知手機使用過程中存在的性能瓶頸,及時進行調頻調度,預測準確性比傳統預測方法提升 30% 以上;GPU 的系列優化技術,可減少重複指令及 GPU 過載,並加快 CPU、GPU 和內存之間的數據傳輸速度;HD 遊戲特效優化可以提升遊戲畫質、清晰度、明暗對比度等,帶給遊戲玩家更接近真實世界的遊戲體驗。

拍照方面,麒麟 810 集成細節增強(DE)模塊,支持最新一代自動白平衡算法(AWB)和 AR特徵點雲計算加速,ISP 性能和算法雙提升,這將解決夜景照片出現的噪點和過曝問題,提升畫面的細節處理能力和降噪效果。

通信方面,麒麟 810 延續旗艦晶片的通信能力,支持雙卡雙 VoLTE,讓手機的雙卡同時保持 4G 在線,將有效防禦偽基站的騷擾,有效降低手機信號回落至 2G 網絡的風險。

此外,麒麟 810 推出自研中間算子格式,算子數量多達 240+,支持Tensor, Vector, Scalar,更多算子、開源框架的支持以及提供更加完備的工具鏈將助力開發者快速轉換集成基於不同AI框架開發出的模型,大幅增強華為 HiAI 的兼容性,易用性,以加速更多 AI 應用落地。

(*本文為 AI科技大本營整理文章,轉載請微信聯繫 1092722531

熱 文推 薦

☞所有的 iPhone 和高端 Android 設備都被破解了!

☞從工地工人轉行到程式設計師,開發價值 500 萬的軟體!| 程式設計師有話說

☞生產環境下 RocketMQ 為什麼不能開啟自動創建主題?

☞研發管理軟體太雜亂?他花了 4 年打造一站式工具!| 人物誌

☞25歲創立加密城堡, 曾經獨角獸創始人社會名流天才黑客是這裡的沙發客, 如今卻無人問津……

☞真正的博士是如何參加AAAI, ICML, ICLR等AI頂會的?

☞Python最搶手、Java最流行、Go最有前途,7000位程式設計師揭秘2019軟體開發現狀

☞這位博士跑贏「地震波」:提前 10 秒預警宜賓地震!

☞17 歲的程式設計師告訴你關於編程的 7 個重要教訓!

☞「是!網際網路從此沒有 BAT!」

點擊閱讀原文,輸入關鍵詞,即可搜索您想要的程序人生文章。


你點的每個「在看」,我都認真當成了喜歡

請為這篇文章評分?


相關文章 

華為AI晶片 全場景覆蓋 人工智慧改變生活

10月10日,華為在上海舉辦新一年的全聯接大會,這屆大會主題是人工智慧(AI)。徐直軍稱,人工智慧技術是IT和通信產業60年發展的總成果,它是一種新的通用目的技術,它將橫跨整個經濟的的多種用途,...