號稱「民族芯」希望 寒武紀真能叫板英偉達?

文章推薦指數: 80 %
投票人數:10人

今天,市場研究顧問公司Compass Intelligence公布了全球100家AI晶片企業排名,其中,排名第22位的正好是來自中國的中科寒武紀。

前三名為英偉達(Nvidia)、英特爾(Intel)以及恩智浦(NXP)。

在過去一年間,隨著AI晶片話題的逐漸興起、寒武紀AI晶片IP在華為海思麒麟970晶片上的應用,以及最近關於「中國芯」的熱烈討論,讓這家成立僅僅2年的創企蓋上了「民族晶片希望」的光環,各種讚譽不斷,融資和估值也水漲船高。

就在昨天,寒武紀在上海發布了三款從端到雲的晶片產品,分別為一款7nm的處理器IP 1M,以及一款雲端智能晶片MLU100,還有搭載MLU100的雲伺服器板卡,毫不掩飾要叫板英偉達的野心。

那麼,寒武紀晶片目前的市場反響如何?這家成立僅僅2年的創企又是靠什麼獲得一眾資本親睞?在這個日益激烈的市場競爭中,寒武紀想要成為「中國芯」逆襲力量的代表,又還需要邁過幾道坎呢?本文將為你一一解答。

目前國內單一出貨量最多的AI晶片

在某次媒體採訪中,寒武紀執行董事羅韜曾經介紹,寒武紀設立了三條產品線:

1、智能終端處理器IP授權,比如1A、1H、以及昨天推出的1M,可以集成到手機、安防、汽車、可穿戴等終端晶片中。

2、智能雲伺服器晶片,比如昨天發布的MLU100,作為PCIE加速卡插在雲伺服器上;

3、家用智能服務機器人晶片,這條產品線暫時沒有產品發布。

我們先來說說昨天發布的處理器IP Cambricon 1M,這是寒武紀第一條產品線中的第三代IP產品,將採用台積電7nm工藝打造。

據業內人士透露,這款晶片製造代工成本高昂,寒武紀需要投入上億美元規模的資金用於1M的流片,據傳已經簽約打造。

在去年年底的發布會上,寒武紀曾經預告過這款名為「1M」的IP產品,宣稱與1A相比性能提高了10倍以上。

不過那時預告的1M處理器IP主打的是智能駕駛領域,昨天推出的1M則將應用領域拓寬到了智慧型手機、智能音箱、攝像頭、自動駕駛等方面。

此外,根據寒武紀官方數據,1M的int 8(8位運算)效能比高達達5Tops/watt(每瓦5萬億次運算),並且提供了2Tops、4Tops、8Tops三種尺寸的處理器內核,以滿足不同需求。

1M還將支持CNN、RNN、SVM、k-NN等多種深度學習模型與機器學習算法的加速,能夠完成視覺、語音、自然語言處理等任務。

寒武紀的第一代處理器IP:Cambricon 1A可以說是目前最早量產的、出貨量最多的AI晶片IP了。

去年,華為海思的第一款人工智慧手機晶片麒麟970上就集成了寒武紀的1A處理器IP,成為SoC上的NPU神經網絡處理單元。

目前麒麟970已經搭載了在華為Mate 10、P20、榮耀V10這三系列手機產品上,累計出貨量已到了數千萬台。

不過相關人士向智東西透露,華為海思在下半年即將發布的下一代產品(可能是7nm的麒麟980)可能不會採用寒武紀的IP,尚不清楚是自研還是選擇別家。

原因是寒武紀這款IP配套的工具鏈和支持算子不夠成熟,給上層應用的AI開發帶來了難度,某些AI功能(比如直播/短視頻應用中的背景分割)需要數月才能在應用中部署完成。

雲端晶片MLU:現場叫板英偉達

不過,1M並不是昨天寒武紀發布會的主角,寒武紀首款雲端智能晶片Cambricon MLU100才是重點。

同樣是在去年年底的發布會上,寒武紀也曾經預告過這款名為MLU100產品,與它一同出現的還有另一款名為MLU200的雲伺服器處理晶片,前者偏重推理(inference),後者偏重訓練(training)。

不過在昨天的發布會上寒武紀並沒有推出MLU200。

▲寒武紀MLU100參數

▲左:英偉達2016年發布的Tesla P4參數,右:英偉達2017年發布的Tesla V100參數

MLU100給出的參數比較詳細,不過可能是因為不主打訓練,寒武紀並沒有給出32位浮點運算的參數。

寒武紀在發布會現場公布了在R-CNN算法下MLU100與英偉達Tesla V100和英偉達Tesla P4的計算延遲對比,但如果僅從參數上來看,這款晶片對標的主要還是Tesla P4。

Tesla P4是英偉達於2016年推出的GPU,專門面向企業級高性能計算,主打機器學習和雲服務市場;Tesla V100則是英偉達在去年推出的同一系列GPU。

總體來說,MLU100的功耗、純計算峰值性能等方面表現比較優秀,不過內存接口帶寬稍低(MLU100為102.4GB/s,Tesla P4為192GB/s,內存帶寬過小會影響運行時的計算性能),是一款完成度比較高的雲端智能晶片。

一位資深晶片技術高管稱,「雖然稱不上『吊打英偉達』,但也跟英偉達目前的產品處在同一時代。

推出了三款產品後,寒武紀CEO陳天石在昨天發出的一封公開信中這樣說道:「期待與全球範圍內的客戶通力合作,將智能播撒到每一台終端,讓整個地球都變得智能。

創業兩年,寒武紀憑什麼叫板英偉達?

上文提到,寒武紀設立了三條產品線:智能終端處理器IP授權、智能雲伺服器晶片、以及家用智能服務機器人晶片。

據媒體現場報導,陳天石在發布會上表示,「MLU100的功耗僅為是英偉達同類產品的幾分之一,將會樹立新的行業標杆。

那麼,創業兩年的寒武紀憑什麼叫板英偉達呢?

這要從寒武紀的淵源說起。

寒武紀,全名中科寒武紀科技有限公司,是中科院計算所孵化的企業。

寒武紀的公司CEO & 聯合創始人為陳天石,另一位聯合創始人為陳雲霽,他是陳天石的哥哥,兩人都是少年天才,從小考進中科大少年班,二十出頭就博士畢業,在中科院計算所當研究員。

兩位陳博士的導師是胡偉武教授,他是龍芯中科總裁,也被稱為「龍芯之父」。

陳雲霽從2002年開始跟隨胡偉武做龍芯CPU,一干就是12年。

有趣的是,現在寒武紀「三年入侵10億終端」的口號與當年龍芯的宣傳口號非常相似。

龍芯CPU是中國第一代國產CPU,其意義可以上升到國家戰略層面。

根據胡偉武教授介紹,目前使用龍芯CPU晶片客戶有500多家。

隨後在2012年,法國國家信息與自動化研究所(Inria)的Olivier Temam教授第一次提出了AI加速器的概念,接著啟動了Olivier Temam教授與兩位陳博士的合作項目DianNao,這也是寒武紀的技術來源。

在陳天石昨天的公開信中也特別提到了與Inria和Olivier Temam教授的合作。

在2013-2015年期間,DianNao項目一共發布了四篇與AI加速器有關論文,包括:深度學習處理器、多片版本的深度學習處理器、攝像頭智能識別處理器、以及通用機器學習處理器。

這四篇論文採用的都是專用邏輯加速的方向,可以理解為針對特定AI算法邏輯進行加速計算,一旦機器學習的算法邏輯改變時,加速器就有可能無法支持。

為了補足這一點,在隨後的2016年,兩位陳博士推出了神經網絡通用指令集DianNaoYu,這也是寒武紀自主研發的神經網絡專用指令集Cambricon ISA的前身。

我們先來科普一下指令集,指令集是一個編碼集合,指的是用一些代碼表達讀、寫等操作,命令計算機做各種運算的一套命令標準。

神經網絡專用指令集能夠針對AI算法提取更細粒度、更底層的編碼集合,比如針對神經網絡計算任務中的某些高頻操作,可以直接提供硬體指令集編碼;與此同時,減少對AI算法性能影響不大的緩存(Cache)體系,提升晶片的性能功耗比等等。

簡單來說,就是把AI計算中的高層功能板塊(比如卷積)分解成低層功能板塊(比如點乘),讓加速器更加靈活地支持不同類型的神經網絡。

2016年3月,北京中科寒武紀科技有限公司註冊成立,陳天石為公司法人,中科院注資1000萬元作為天使輪啟動資金。

基於DianNao項目技術框架,寒武紀又陸續推出了「寒武紀1號」晶片、寒武紀1A處理器IP等產品。

不過注意,這些晶片都是專用指令集處理器(ASIP),比較適合用於人工智慧算法的加速計算,不能替代CPU作為中控晶片,需要和CPU等硬體協同合作。

目前除了寒武紀之外,國內還有一大批創業公司湧入AI晶片領域,包括深鑒科技、地平線、異構智能等。

他們中既有做專用邏輯加速器(ASIC)的,也有做專用指令集處理器(ASIP)的,前者功耗更低、性能更強、但是不夠靈活泛化;後者更加靈活、能支持多種不同神經網絡,但是在性能功耗比上會受到一定限制。

晶片產業路上的競爭和難題

目前,寒武紀在AI晶片市場遇到的對手已經不只是跟它處在同一起跑線的國內外AI晶片創業公司了,各類晶片巨頭也紛紛入局。

比如在伺服器市場稱霸多年的英特爾、比如在AI時代一騎絕塵的英偉達、比如來勢洶洶的高通與賽靈思、又比如推出人工智慧項目Trillium的ARM(英偉達開源的DLA深度學習加速器項目將集成到Trillium框架中,讓廠商能夠打造自己的AI晶片)。

一款晶片產品光看參數,也許都很漂亮,但是圍繞其打造的生態系統卻不是一朝一夕能夠完成的事情,需要大量的技術、人力、財力投入,以及時間的積累。

簡而言之,晶片設計只是開始,可晶片從設計到落地應用是一條漫長的產業鏈,裡面布滿了「坑」。

至少有這樣幾個關鍵環節:

1、從PPT到流片

從寒武紀本次發布的幾款晶片來看,雲端晶片MLU100選擇了台積電工藝相對成熟的台積電16nm製程工藝,量產應該不成問題。

從現場展示的板卡產品來看,應該已經完成了這個過程。

不過1M處理器IP需要7nm製程工藝,目前市面上還沒有終端SoC晶片使用。

目前全球主流先進的移動終端SoC先進工藝在10nm水平上,下一代有望邁進7nm,但真正有能力做到的也就是蘋果、三星、華為海思這幾家。

如果1M不能和華為繼續IP授權合作,應用落地將會是挺大難題。

2、晶片全產業鏈把控

對於寒武紀這類創業公司來說,與晶片巨頭相比弱勢的往往不是AI技術、或是AI晶片產品設計,而是圍繞晶片所衍生的一系列軟硬體的開發維護,包括指令集定義、晶片微架構設計、晶片整體設計、相應軟體與工具鏈的開發與維護、晶片運行的作業系統、豐富的函數庫、以及應用程度等等。

3、時間與市場的驗證,這款晶片還需要得到大量用戶的認可才能真正在市場中站住腳,一旦大多數人們認可某款晶片架構、某個指令集,那麼用戶遷移成本就很高,這就是為什麼歷史上曾經有多次「x86革命」想取代x86架構,但都因為得不到廣泛的支持最終以失敗告終,英特爾能夠稱霸PC和伺服器市場多年。

傳新輪融資已落地

最後,我們來說說融資和估值。

寒武紀公司CEO & 聯合創始人 & 實際控制人陳天石是5間與「寒武紀」有關的企業的法人,包括:北京中科寒武紀、上海寒武紀半導體、雄安寒武紀科技、上海寒武紀信息科技北京分公司、以及上海涵武信息科技(2015年成立,已註銷);此外,陳天石還是蘇州寒武紀信息科技的股東(天眼查顯示投資比例0.1%)以及上海寒武紀信息科技的經理。

這些企業基本都是北京中科寒武紀的全資子公司。

近日有媒體報導稱寒武紀已經接近完成新一輪融資,融後估值20億美元。

業內人士向智東西透露,寒武紀本輪融資已經接近結束,融資共25億人民幣,融後估值24億美元,國家隊背景基金投資入股。

根據公開數據,在2017年年中,寒武紀完成1億美元A輪融資,估值10億美元,國投創業領投,阿里巴巴、聯想創投、國科投資、中科圖靈、元禾原點和涌鏵投資等參投。

以下是目前北京中科寒武紀的占股名單,其中「國投(上海)科技成果轉化創業投資基金企業」和「北京國科瑞華戰略新興產業投資基金」為2018年1月15日新增的。

結語:「中國芯」的逆襲力量,真的能嗎?

中科寒武紀的學術背景、兩位陳博士的導師背景、以及其背後的一系列政策資本關係,都決定了我們不能僅從市場經濟這個單一的角度去解讀這家公司

寒武紀的一眾合作夥伴們,華為、科大訊飛、中科曙光、聯想等等,都或多或少與寒武紀共享著相同的基因。

在中美貿易關係及中興案例再次刺痛「缺芯」軟肋的當下,中科寒武紀已經成為了我國AI晶片領域一支不可多得的強大力量,與此同時這股力量還在不斷快速發展當中。

不過,在成為「中國芯」逆襲代表之前,本文中提到的這些「坎兒」,還是要逐步邁過,才能穩健發展。


請為這篇文章評分?


相關文章