華為發布全球首款移動AI晶片,終端布局已領先蘋果、高通及三星

文章推薦指數: 80 %
投票人數:10人

在本屆德國柏林國際電子消費品展覽會(IFA)上,最大的亮點之一莫過於先前已引起極大關注的華為移動端人工智慧解決方案。

就在剛才,德國當地時間 9 月 2 日下午 2: 00,華為消費者業務 CEO 余承東在 IFA 發表了主題演講,華為移動端AI解決方案終於浮出水面。

DT 君第一時間在會議現場發回了報導。

圖丨海思的麒麟系列晶片已經是華為手機方案的主力,現已披上AI戰袍(圖片來源:DT君)

眾所周知,雲端的 AI 布局已由各大廠商占據山頭,雲里有微軟、谷歌、亞馬遜、百度、騰訊、阿里巴巴等,雲上的天空看起來相當擁擠。

而在終端 AI 部分,相比之下雖然競爭並沒有進入白熱化,但各方勢力也正伺機而動,暗潮洶湧。

當前,從主流移動晶片方案廠商在該領域的動作來看:高通收購了機器學習公司 Scyfer,主要想從軟體應用層面去發掘驍龍平台的計算潛力;蘋果也想藉由推出「神經引擎」(Neural Engine)來爭奪終端 AI 生態,該方案可能是獨立晶片,但具體進展也不得而知;三星雖然低調投資了 AI 晶片設計公司 Graphcore,但作為主要營收來源的半導體業務分掉了三星太多精力,短期內很難有大動作。

可以說,高通、蘋果、三星這三家 AI 終端的主要競爭者目前的 AI 晶片計劃都還處在籌備階段。

圖丨本屆德國柏林國際電子消費品展覽會(IFA)現場(圖片來源:DT君)

但這種局面卻給了另一個競爭者絕好的空窗期,讓來自中國的智慧型手機兼通訊設備大廠華為搶先一步:在德國柏林國際電子消費品展覽會(IFA)上正式推出其最新 AI 晶片「麒麟970」(Kirin 970),並希望通過這枚晶片來布局AI終端生態。

圖丨NPU參數

圖丨余承東在介紹麒麟970

圖丨麒麟系列發展史

圖丨NPU和不同架構組合在處理AI計算性能的差別,可以看到NPU遠高於其他組合

圖丨支持開放API,可以同時取用各種運算組合

圖丨三種主要的應用方向

圖丨三大開發環境

圖丨利用isp和npu做的動態補償,避免模糊

圖丨展示970所有功能整合的圖

華為成全球首家推出AI晶片的手機廠商

華為之所以要推出 AI 晶片,是因為這類晶片與傳統晶片的巨大區別。

首先,傳統晶片在運算時只需要根據指令來調用相應系統進行工作,而 AI 指令之下則包含大量並行計算與建模。

這無疑對處理器的計算能力提出了很高要求。

其次是移動端的數據收集能力,尤其是手機。

優秀的 AI 應用要收集大量的數據來對模型進行訓練,而手機無疑是最好的數據收集工具。

隨著諸如麥克風、攝像頭、重力感應器、定位裝置等越來越多的傳感器加入手機中,一種能實時收集、同步處理、連接協調不同傳感器的「人工智慧」晶片就顯得尤為重要。

2017 年,高端手機方案都先後進入 10nm 時代,整合的運算架構較以往更為強大。

換言之,手機要做到本地端的學習、反饋,其實客觀環境已經相對成熟。

因此,這次華為在 IFA 所公布的晶片將是 AI 終端的重要里程碑,而且比高通和蘋果都搶先了一步。

在此次發布會上,華為宣布麒麟 970 將首次整合 AI 模塊——功能不再僅僅是語音助手,而是全面進入生活、強化用戶體驗。

那麼,除了語音之外,AI 晶片最有可能的應用是什麼?很可能是圖像識別,舉個簡單的例子,目前的自拍軟體在拍攝完成後,需要上傳到雲端,通過通用模型來完成「一鍵美顏」。

但移動端的 AI 晶片則可根據用戶平時的喜好,在照片拍攝完成後(甚至拍攝之前的取景階段)就同步完成照片美化。

除此之外,深度人臉識別、動態圖像處理都將是其應用場景。

圖丨本屆德國柏林國際電子消費品展覽會(IFA)微軟展廳(圖片來源:DT君)

當然,一片在指甲蓋大小的面積上集成了超過 55 億個電晶體的 AI 晶片不可能只用來拍拍照這麼簡單。

目前手機上已經有語音服務、機器視覺識別、圖像處理等智能應用,未來還會增加包含醫療、AR、遊戲 AI 等更多元化的應用類型。

而通過麒麟 970 晶片的布局,除了滿足手機上的 AI 應用,未來也將有機會拓展其他更有潛力的市場,比如自動駕駛。

在今年 2 月份有消息傳出,華為目前正在進行無人車的研究,而合作的對象就是清華大學。

根據了解,雙方合作研發的無人車已經在華為的曼卡科技園進行過了自動駕駛測試,可以完成自動避讓行人、繞行障礙以及自動泊車等操作。

華為官方並未對此消息進行確認。

但如果屬實,加上麒麟 970 在視覺辨識方面的能力獲得大幅強化,那麼被用在汽車上也不過是水到渠成的事情。

圖丨此次發布會華為打出的口號是:你移動端中的新大腦,世界首款移動端移動端AI處理器(圖片來源:DT君)

麒麟970到底是一枚什麼樣的晶片?

麒麟 970 定位在最高端的性能方案,根據目前的信息,該晶片將使用 ARM 的Cortex-A73,以及Mali-G72,可能會搭配定製的運算加速單元,並配合採用ARM 的多媒體加速單元。

原本麒麟系列的 ISP(Image Signal Processor)是採用外購的現有方案,然而從麒麟 950 開始改為自主開發的整合式設計,除強化效能表現外,也能降低占用 PCB 板的面積,讓整體的結構更緊湊。

圖丨麒麟 970的細部架構,NPU是最大亮點(資料來源:華為)

為什麼 CPU 用 ARM 上一代的 Cortex-A73,而不是最新的 Cortex-A75?首先是成本因素,新架構理所當然比較貴,同頻性能增長有限。

Cortex-A73 已經用在麒麟 960 上,性能和功耗都表現一流,且 CPU 在未來移動應用中所扮演的運算角色其實越來越不重要,因此沒必要再換一個功耗更高、尺寸更大、且價格更貴的方案。

其次,Cortex-A75 在結構複雜度方面有所增加,雖強化了性能表現,但是在功耗性能比,也就是每瓦性能方面會稍落後於 Cortex-A73,畢竟主打應用還是手機,功耗其實還是要擺到優先考量地位。

而且,在人工智慧領域,CPU 所占的運算比重只會越來越低。

最後,晶片從開發到量產往往需要一年以上,Cortex-A75 發布不過半年,要定製化時間上也來不及。

圖丨Cortex-A73是ARM能效比最高的產品,新推出的A75也要自嘆不如(資料來源:ARM)

由於本質上仍是手機晶片,所以即便增加了 AI 處理能力,但麒麟 970 在無線連接的性能方面也能夠兼顧。

上一代麒麟 960 領先業界支持 Cat.12,麒麟 970 則是再次搶先支持 Cat.18,頻寬表現達 1.2Gbps,是 5G 正式規格推出前最快的上網速度,硬是強壓高通目前市場上最高階的 X16 以及僅有書面發表的 X20 基頻,不止滿足電信運營商不斷發展的聯網頻寬成長腳步,同時也要降低延遲,讓串流傳輸或關鍵信息能夠得以實時處理,滿足消費者對聯網體驗不斷飆升的嚴苛要求。

但若以標準 Google 生態來看,GPU 仍會是很重要的一部分,包括拍照或者是視覺獲取部分的處理能力強化。

這部分會使用內建 ISP,配合 DSP 以及 GPGPU 來強化整體處理效能。

但有好的架構,也需要有好的製程來搭配,不然性能和功耗表現還是會大打折扣。

麒麟 970 使用台積電 10nm 製程生產,目前台積電的 10nm 製程良品率提升,產能也明顯增加。

另根據供應鏈消息,蘋果採用 A11 處理器的 iPhone8 可能推出日期與產能都會不如預期;而聯發科的 10nm 晶片客戶少,需求極低,其他 10nm 客戶產能需求也有限,對華為而言算天賜良機。

華為 Mobile AI才是麒麟 970的真正重頭戲!

前述標準架構方面的強化是為了配合 Google 在 Android 上的計算加速生態,另外,華為針對自有 Mobile AI 生態布局,打造 NPU 智能計算架構,加上其軟體發展資源與與終端基礎,布局更深層的機器學習應用——而這才是本次麒麟 970 的真正核心訴求。

根據華為透露的 NPU 相關架構信息,以其宣稱的 25 倍於 CPU 性能,且 50 倍的能耗表現的架構數據,大概就是以 ASIC 為基礎,類似寒武紀或者是谷歌的 TPU 計算架構。

這種專用的 AI 類神經加速架構,可在一個指令集的時間同時完成多道神經元分支運算,由於走 ASIC 設計,占晶片面積不大,在台積電 10nm 製程工藝的協助下,直接整合進晶片中也不會對成本或功耗造成太大負擔。

圖丨本地端AI + 雲端AI = 移動AI (圖片來源:DT君)

以華為的 NPU 架構要處理原先設定的自然語言或者是實時處理圖像數據應用自然是十分輕鬆,甚至有點大材小用。

但如果考慮到三五年後的應用,以及包含更廣的 AI 市場,包括汽車、工業、AR/VR 等,此類特製的類神經 ASIC 結構可以在有限的成本增加前提下,達成極高的計算效率成長。

以目前華為主打的手機生態而言,不是只要把先進位程、處理單元塞進核心方案,手機就可以立馬變成超智能助手。

如果沒有應用,再強大的硬體也不過是空殼——華為預計將配合此次的硬體設計,推出一系列包含語音、視覺處理,甚至 AR、VR 等應用,讓消費者能夠在購入手機後,就能直接感受到硬體進化、結合生態所帶來的體驗優化。

NPU只能用在移動生態上嗎?未必!造車?

但手機晶片就一定用在手機上嗎?高通和聯發科都分別把手機晶片換了個招牌與營銷口號就推往汽車或其他應用,華為想要仿效的可能性也完全存在。

前段時間,華為被揭露已經和清華大學合作,秘密研發自動駕駛很長一段時間,如果麒麟 970 在視覺辨識方面的能力獲得大幅強化,那麼被用在汽車上也不過是水到渠成。

而這恐怕才是華為對這款 AI 晶片所布下的真正殺手級應用策略:結合華為/海思在無線射頻上的豐富技術資源與專利,以及手機上的人機互動與智能應用生態,加上自動駕駛汽車需要的視覺識別運算能力,從而打造真正的智能汽車。

雖然華為曾否認要造車,畢竟造車所需要的資源太龐大,但不代表華為不能為業界提供造車所需的人工智慧解決方案,若能滿足造車的應用需求,那麼要進入其他產業應用,門檻就更低了。

競爭對手高通先發後至

作為 AI 晶片的重要玩家之一,高通也是從很早就開始了相關的研究。

高通副總裁 Matt Gob 曾公開宣稱,以其晶片方案為基礎的 AI 生態研究早在十年前就已經開始。

目前,其方案已經支持了終端 AI 的全部功能,以及基本性能需求。

而基於驍龍晶片的 AI 應用已經遍布於個人語音助理、計算機視覺、智慧型手機以及自動駕駛、無人機上,提供各種針對個人使用情景優化的機器學習機制。

圖丨高通認為,AI不只在雲上,在終端上導入更能優化使用者體驗(資料來源:高通)

雖然高通驍龍晶片與競爭對手同樣是基於 ARM 的標準方案開發出來的產品,但高通非常看重晶片本身的綜合計算性能表現,藉助一流的 GPGPU、DSP 架構設計,使其方案可在低功耗的條件限制下提供優於市場競爭對手的系統實時反應能力。

然而與競爭對手相比,高通在 AI 生態上的領先幅度並不大,因為其開發體系在不久之前仍是走封閉路線,直到近幾年才逐步把這些計算能力透過SDK的方式開放給一般開發者。

這表明高通的作法主要是求穩,若開放太多底層資源給第三方開發者,可能會影響到其主要客戶,也就是那些大手機廠的應用競爭力,各手機廠多半都需要些定製化功能來維繫自家產品的競爭力,剝除這些定製化應用,在手機硬體設計同質化越來越高的情況下,市場營銷也會更困難。

但近來,高通也意識到過去為了遷就客戶而放緩了生態發展的腳步存在問題。

為了追趕上發展落差,高通也展開了一系列的舉動,包括併購附屬於阿姆斯特丹大學、聚焦在機器學習技術的 Scyfer 公司。

該公司並非一般產業認知的方案或晶片提供商,而是作為在各種計算架構上的機器學習與AI應用布局研究,並提供技術服務,目前提供服務的領域包括了工業、物聯網、金融與移動計算等等,也因為 Scyfer 公司擅長解決將不同 AI 應用安置到不同計算硬體平台上的技術瓶頸,高通希望借其幫助,一舉擴大驍龍晶片的AI應用生態。

蘋果仍在掙脫束縛,依靠獨立AI晶片追趕

蘋果公司在移動終端擁有絕對的影響力,過去該公司從現成方案使用者轉換成自研,在晶片技術及配合晶片的生態經營上積累了龐大的優勢,而且消費者現在使用蘋果產品,多半不是只為了硬體本身,而是為了與蘋果硬體捆綁的優勢生態。

舉例來說,語音助手概念就是蘋果最早提出,而搭配的許多包含影音、LBS服務,以及各種個性化的設計,讓消費者有被尊重的感覺,讓他們覺得是被手機服務,而不是遷就手機。

然而,對蘋果而言,是個難以克服的難關,著名的蘋果分析師 Gene Munster 曾表示:「AI 不在蘋果的基因里」,蘋果擅長整合市場成熟技術,對新興科技的導入過去一向都偏保守,當初 Siri 的推出其實已經把機器學習的部分精髓導入到蘋果的產品線中,但後來卻沒有持續的突破,以致於被 Google 及其他手機大廠逐漸跟上,甚至原本在產品規劃中的幾個計劃也告中斷,比如說自駕車的開發。

由於終端的機器學習必須和個人數據的管理緊密結合,而這是過去蘋果所不願意碰觸的地方。

隱私的注重讓他們對消費者的個人行為模式的追蹤和學習顯得束手束腳,但缺了這塊,終端的 AI 又將難以達成。

不過,蘋果也在加速追趕落下的 AI 進度。

蘋果公司AI研究主管Ruslan Salakhutdinov

從 2016 年開始,蘋果雇用卡內基梅隆大學的 AI 專家 Ruslan Salakhutdinov,他專長於深度學習或非監督式的自主學習技術,該技術雖同樣屬於機器學習的一部份,但更複雜。

另外,蘋果也開始積極發表 AI 相關論文,這對過去的蘋果而言,是件不可思議的事情。

蘋果也在今年的 WWDC 發表泛用 AI 的機器學習框架 OpenML,可在蘋果的所有設備上將訓練完的學習模型以極高效率整合進 APP 之中。

不過 OpenML 本身不具備建模的能力,其模型必須來自於外來的機器學習工具。

圖丨CoreML的目的很單純,就是把既有機器學習建立的模型快速導入到APP之中(資料來源:蘋果)

Core ML 中提供包含用於高效能圖片、影片分析的 Vison、用於協助自然語言處理的 Fundation 、及讓遊戲開發商可以在遊戲中導入 AI 的 GameplayKit 等三大應用框架。

當然,除了被動使用模型的 OpenML,蘋果也不可能放過終端自建模型這塊更高深、能帶給消費者更好體驗的技術領域。

該公司在前幾個月也被知名媒體 Bloomberg 揭露正在開發一款獨立 AI 晶片,命名為「Neural Engine」(神經引擎)。

神經引擎主要是用來處理臉部以及語音識別的複雜計算加速工作,以及目前正在風頭上的 AR 增強現實功能,降低應用處理器的工作負載。

據報導,該晶片已經被放置於部分 iPhone 原型機上進行測試,而且也不排除會用在其他設備的可能性。

過去幾年, 蘋果 CEO Tim Cook 不斷強調,AI 與 AR 會是蘋果未來重要的兩大發展核心,如果順利的話,2018 年將有可能看到這款晶片或相關功能出現在蘋果產品中。

2017年是人工智慧終端應用元年,華為搶先一步超越同時代方案

人工智慧的發展分好幾個階段,從最早大型計算機時代,到中期的機器人,到目前這個階段,主打結合人類食衣住行。

不得不說,目前的技術發展已經非常接近實用。

要實用就必須考量到所採用方案的特性,有些設備或終端可能需要高端方案,強調性能與實時反應能力,藉以優化用戶體驗;有些更注重成本結構,強調能夠大範圍複製、擴散,並快速建立生態。

華為和高通、蘋果同樣針對了高端 AI 應用,且布局各種應用平台,沒有畫地自限,華為借麒麟 970 的推出搶先兩大廠一步在智慧型手機上有所突破,但後續基於此方案的相關應用成敗還是要看華為能否持續有效的經營生態,並藉由 AI 創造更好的使用體驗。

另外,根據市場分析公司 Tractica 的資料顯示,2015 年基於深度學習項目的硬體支出達到 4.36 億美元。

而據他們估計,到 2024 年這一數字會飆升到 415 億美元,這裡面也包含了雲端與終端的相關硬體。

毫無疑問的是,華為的這次發布會在智慧型手機領域是具有里程碑意義的開端,也標誌著人工智慧將從雲端走向本地端的趨勢已經出現,而預計在未來數年,AI 終端迎來爆發性增長的趨勢也已越來越明顯。


請為這篇文章評分?


相關文章 

從智慧型手機到智慧手機 未來還有多遠?

當前,智慧型手機的發展遇到了瓶頸,性能過剩時代已經來臨,而且功能和體驗的提升也是舉步維艱。手機行業的巨頭們紛紛將眼光瞄向了下一個風口:人工智慧。在5月底的時候,就有媒體曝出蘋果正在開發人工智慧(...

囯產手機中誰家的CPU最好?

經過麒麟950、麒麟960兩代晶片的積累,以及EMUI 5.0的Machine learning智能感知學習機制的前瞻性探索,華為麒麟970直接做到了晶片級的人工智慧方案——首次集成神經元網絡單...