華為全球首款AI移動晶片,NPU疑為寒武紀,源自科大少年班

文章推薦指數: 80 %
投票人數:10人

【中國科大新創校友基金會(ID:USTCIF),全球最活躍的科大校友組織,實時發布科大要聞與校友資訊。

【導讀】9月2日,華為在德國 IFA 2017 現場重磅發布全球首款麒麟 970移動計算平台,引起業界廣泛關注。

華為在發布會現場沒有透露的是:其背後的 AI 晶片來自何方?技術支撐來源於何處?據了解,華為AI晶片為寒武紀(中國科大校友企業寒武紀。

創始人為少年班校友97少陳雲霽、01少陳天石兄弟,技術骨幹有數十名畢業於中國科大
)。

中科院計算所工作人員向新智元披露了一份致華為的賀信,證實華為麒麟970的NPU就是寒武紀的IP。


華為發布 AI 移動計算平台麒麟 970,NPU成焦點

9月2日,在德國IFA 2017舉辦期間,華為正式發布全球首款人工智慧移動計算平台麒麟970。

除了用一系列性能數據大秀肌肉以外,華為消費者 BG CEO 余承東在演講中提出了華為的人工智慧發展戰略:Mobile AI=On Device AI + Cloud AI,即人工智慧在未來終端上的實現必須通過端雲協同。

麒麟970具體參數

余承東表示,這一帶有強大AI計算力的手機端移動計算平台,是業界首顆帶有獨立NPU(Neural Network Processing Unit)專用硬體處理單元的手機晶片。

以下是關於麒麟 970 的一些詳細介紹:

1. 經過十年研發,麒麟970採用了行業高標準的TSMC 10nm工藝,集成了55億個電晶體,功耗降低了20%,並實現了1.2Gbps峰值下載速率。

2. 創新性集成NPU專用硬體處理單元,創新設計了HiAI移動計算架構,其AI性能密度大幅優於CPU和GPU

相較於四個Cortex-A73核心,處理相同AI任務,新的異構計算架構擁有約 50 倍能效和 25 倍性能優勢,圖像識別速度可達到約2000張/分鐘。

3. 麒麟970高性能8核CPU,對比上一代能效提高20%。

率先商用 Mali G72 12-Core GPU,與上一代相比,圖形處理性能提升20%,能效提升50%,可以更長時間支持3D大型遊戲的流暢運行。

另外,華為方面表示,將會把麒麟作為人工智慧移動計算平台開放給更多的開發者和合作夥伴。

麒麟970關鍵架構 NPU 究竟來自何方?

麒麟970的一些關鍵數據:

  • 使用10納米工藝

  • 1平方厘米有55億個電晶體

  • 8核CPU:4個A53(最大功率1.8GHz)+ 4個A73(最大功率2.4 GHz)

  • 12核GPU(Mali G72MP12)

  • LTE Cat. 18 mit bis zu 1.2 GBit/s

  • 雙ISP圖像處理

  • 為移動端AI設計的計算架構 NPU,也即這次麒麟970最受關注、華為宣傳力推的神經網絡處理單元

回顧麒麟970發布現場提供的晶片架構,不難發現麒麟970在AI任務上的超強表現,主要還是得益於異構架構中的NPU。

NPU 峰值性能 1.92 TFLOPs FP16(半精度),直觀一點看,華為內部測試結果,集成了NPU後的麒麟970每分鐘能處理2005張圖像(沒有NPU每分鐘97張圖像)。

憑藉其在性能和能效比上的優秀表現,NPU可謂支撐麒麟970智能計算真正意義上的「大腦」。

那麼這個大腦來自哪裡,就成了不可忽視的問題。

業界普遍猜測,NPU正是頂尖AI晶片企業寒武紀科技去年發布的寒武紀1A處理器(Cambricon-1A Processor)。

根據寒武紀科技公開的宣傳材料,這款處理器是國際上首個商用深度學習處理器產品,擬以IP(智慧財產權)授權的方式進入下游廠商SoC晶片。

如果上述猜測屬實,華為背後的AI賦能者應該就是這家AI晶片領域的新晉獨角獸——寒武紀。

2017年4月,媒體報導稱,寒武紀研發了國際首個深度學習專用處理器晶片(NPU),當時其IP指令集,已擴大範圍授權集成到手機、安防、可穿戴設備等終端晶片中,2016年就已拿到億元訂單。

NPU背後有一個關鍵詞是寒武紀,為什麼這麼說?我們有一封公開信:

來自中科院計算所的賀信,證實華為麒麟970的NPU就是寒武紀的IP

本文發稿前,中國科學院計算技術研究所工作人員向新智元披露如下賀信內容,證實了華為麒麟970的NPU就是寒武紀的IP。

(賀信內容以計算所的正式文件為準,個別地方可能會有修訂)

華為技術有限公司、深圳市海思半導體有限公司:

欣聞貴公司於2017年9月2日在德國柏林正式發布了集成深度學習處理器的新一代手機晶片麒麟970。

這一手機發展歷程中里程碑式的事件,標誌著手機開始進入智能時代。

這是貴公司持續創新取得的豐碩成果,中國科學院計算技術研究所向貴公司全體同仁致以最熱烈的祝賀!

自2011年以來,貴公司和我所開展了深入的合作,組建了「中科院計算所-華為聯合實驗室」。

這種高水平研究所+領導性公司的合作模式,取得了豐碩的成果,在計算和通信技術領域做出了一系列有國際影響力的工作,開闢了一條極具特色的產學研用深度融合的道路。

我所是中國最早從事計算機科學技術研究的綜合性學術機構,被譽為「中國計算機事業的搖籃」,在深度學習處理器領域的學術研究一直處於國際領先水平,得到國內外同行的廣泛認可;我所企業寒武紀公司(Cambricon Technologies)研製並具有自主智慧財產權的「寒武紀1A深度學習處理器」(Cambricon-1A Processor)是國際上首個商用深度學習處理器產品,在人工智慧應用上達到了四核CPU 25倍以上的性能和50倍以上的能效。

此次,麒麟970晶片集成寒武紀1A處理器作為其核心人工智慧處理單元(即余承東總在發布會中所述NPU),實現了手機上本地、實時、高效的智能處理。

作為世界首款集成人工智慧專用處理器的手機晶片,麒麟970將為全世界廣大手機用戶帶來智能時代顛覆性的用戶體驗,引領全世界智慧型手機發展的新潮流。

貴公司秉承積極開創的企業精神,創造了一個又一個手機晶片研發和產品化的奇蹟,為世界通信技術的發展做出了巨大貢獻,是中國信息產業在全球的傑出代表,是值得國內同行尊重和推崇的榜樣。

作為華為的長期合作夥伴,我們為麒麟970的成就感到由衷的驕傲,也為寒武紀公司在智能處理器產品化方面做出的成績深感欣慰。

我們堅信,華為和寒武紀的強強聯合,必將成為世界手機發展史和智能晶片發展史中的里程碑事件,成就中國信息產業的一段佳話。

再次祝賀貴公司的傑出成就。

預祝貴公司在智能時代的計算和通信產業中,為全人類做出更大的貢獻!

中國科學院計算技術研究所

2017年9月

麒麟970是否意味中國AI晶片技術已經走在世界前列 ?

根據騰訊研究院公布的數據,中國人工智慧企業數量已經達到592家,占據全球人工智慧企業總數的23%,僅次於美國。

國內智慧型手機的普及伴隨著行動網路的高速發展,無疑為人工智慧的發展提供了優質的數據資源和多樣的應用場景。

這樣看來,AI晶片企業具有相當可觀的發展空間。

這是否意味著國產晶片迎來了春天?可以一舉在國際晶片行業實現「彎道超車」?

有業界人士認為,頂尖企業之間的戰略合作,完善的智慧財產權保護也是構建AI生態的關鍵因素。

寒武紀在這一點上已經走在了很多國內晶片廠商的前面。

寒武紀CEO陳天石過去在接受採訪時曾經提到,「晶片的成敗,除了本身的效率之外,生態是非常關鍵的環節。

沒有配套的應用和軟體,很難在市場上獲得成功。

這就是為什麼我們提出了國際上首個AI指令集。

只要國產AI指令集立住了,中國主導世界AI產業的機會可能就到來了。

新智元也在麒麟970發布後第一時間聯繫寒武紀科技,但截止本文發稿之時,寒武紀科技尚未作出回應。

華為和寒武紀的合作,將對構建國內企業的AI生態提供了重要的參考價值。

專業人士表示,龍頭企業數量和企業研發能力方面,中美兩國還有一定的差距。

人工智慧可能是實現換道超車的機會,但真要實現起來還需要更多國內企業共同參與、共同努力。

針對此事,新智元了解到,華為公開的說法是:「華為和寒武紀團隊共同面向終端,在 AI 方面進行了聯合開發與優化。

麒麟970創新設計了HiAI移動技術架構,利用最高能效的異構計算架構來最大發揮CPU、GPU、ISP、DSP、NPU的性能。

NPU是麒麟970異構計算的一部分。

華為對麒麟970異構系統中的每個處理器都非常重視,在CPU、GPU、ISP、DSP上都投入了重要力量進行技術開發和探索,投入大量力量進行優化,力求帶來最好的效果。


(左)陳雲霽(97少)和(右)陳天石(01少)

陳雲霽,97少,寒武紀科技創始人;陳天石,01少,寒武紀科技總經理/總裁,智能晶片

陳雲霽與陳天石是中國科大歷史上不多的一對神童親兄弟、人工智慧學界的親兄弟。

2014年3月陳氏兄弟及其法國Inria的合作者在美國召開的國際頂級學術會議ASPLOS上發表的「DianNao:一種小尺度的高吞吐率機器學習加速器」獲得了最佳論文獎。

這不但是大陸科研機構首次在計算機系統和高性能計算領域頂級國際會議上獲得最佳論文獎,也是亞洲首次。

12月,陳氏兄弟及其Inria合作者又推出了DaDianNao神經網絡加速器,榮獲2014年度Micro最佳論文。

這是Micro自1963年創辦以來,美國以外國家首次獲得這個獎項。

2015年,陳天石入選優秀青年基金;陳雲霽入選麻省理工學院著名科技評論雜誌(MIT Tech Review)TR35創新者獎榜單(35 Innovators Under 35 )。

陳雲霽,97少校友。

於1997年進入中國科學技術大學少年班學習,2002年進入中科院計算所跟隨胡偉武研究員碩博連讀,成為國產處理器龍芯研發團隊中最年輕的成員。

2007年博士畢業後,陳雲霽留在了中科院計算所龍芯團隊,在胡老師指導下進行龍芯3號的總體設計,並獲得首屆國家自然科學基金優秀青年科學基金,現在計算機體系結構國家重點實驗室任研究員。

他在包括ISCA、HPCA、MICRO、ASPLOS、ICSE、ISSCC、Hot Chips、IJCAI、FPGA、SPAA、IEEE Micro以及8種IEEE/ACM Trans.在內的學術會議及期刊上發表論文60餘篇。

陳雲霽還獲得了首屆國家自然科學基金「優秀青年基金」、首屆國家萬人計劃「青年拔尖人才」、中國計算機學會青年科學家獎以及中科院青年人才獎,並作為負責人帶領科研團隊獲得了全國「青年文明號」和中央國家機關「青年文明號」的稱號。

陳天石,01少校友。

2005年於中國科學技術大學少年班獲理學學士學位,2010年於中國科學技術大學計算機學院獲工學博士學位。

現任中科院計算所研究員。

研究方向為計算機體系結構、計算智能以及量子計算。

在處理器架構和人工智慧領域深耕十餘年,是國內外學術界享有盛譽的傑出青年科學家,曾獲2015年國家自然科學基金委員會「優青」、Intel青年學者獎、中國計算機學會優秀博士論文獎等榮譽。

在IEEE/ACM Transactions、Theoretical Computer Science、ISCA、HPCA、IJCAI、AAAI、SPAA、DATE等重要期刊和會議上發表論文40餘篇。

曾獲全國百篇優秀博士論文提名獎(2012)、中國計算機學會優秀博士論文獎(2011)、中國科學院優秀博士論文獎(2011)、中國科學院院長獎(2010)、教育部高等學校科學研究優秀成果獎(集體)等榮譽,併入選計算所百星計劃(2011)。

【轉載請註明中國科大新創校友基金會。

了解更多,請移步官方微信(ID:USTCIF)與網站(www.ustcif.org)。


請為這篇文章評分?


相關文章 

中國首款人工智慧手機晶片發布

中國證券網訊 中國華為公司在2017年柏林國際消費電子展上發布了首款用於移動計算的人工智慧晶片——麒麟970。華為參展人員告訴記者,這種手機晶片是與中國科學院計算技術研究所「寒武紀」項目團隊共同...