打造深度學習專用硬體解決方案,AI時代深鑒科技想用DPU取代GPU

文章推薦指數: 80 %
投票人數:10人

2016年OpenPOWER峰會上,世界最大的FPGA製造廠商Xilinx介紹了他們眼中深度學習處理器的新方法。

有趣的是,這項標準中技術的部分大多來自一家中國公司——深鑒科技。

這家成立於2016年3月的初創公司,正在打造深度學習的通用硬體解決方案,並已獲得金沙江創投與高榕資本的天使輪融資。

深鑒科技最早做研究時,這還是一個「冷門」的方向,國內學界也僅有中科院的陳雲霽博士在做類似的研究。

但時至今日,深度學習專屬晶片已經成為一種逐漸被認可的方向。

國內中科院背景的寒武紀科技已經做出深度學習晶片,年內可實現產業化,並已經獲得科大訊飛戰略投資;前百度IDL副院長余凱博士創立了地平線機器人,已經完成多輪融資;矽谷團隊Kneron已經與華為海思、騰訊等建立了合作。

大廠方面,NVIDIA 、 Intel 、高通均已發力機器學習, Google今年I/O大會上也推出了自己的TPU晶片,利用專有硬體實現深度學習及其相關應用,已是大勢所趨。

大趨勢背後是大家共同看中的新市場——萬物智能時代的NVIDIA。

誕生於2006年的深度學習算法已經在工業界發揮作用,未來還將會大規模應用在安防、機器人、無人機、自動駕駛等領域,市場前景巨大。

但現有的GPU採用「讀—算—寫 」這樣的處理流程,只適用於深度學習算法的訓練,在應用層面性能低下且功耗很高。

利用專有硬體實現深度學習及其相關應用,則能高性價比解決性能與功耗的問題。

早在2016年1月,深鑒科技就已經設計出一套基於DPU的一整套深度學習硬體解決方案,包括DPU的晶片架構、DPU編譯器、硬體模塊(訂製的PCB板)三部分。

直接呈現的產品就是硬體模塊,共有嵌入式端和伺服器端兩款,在性能超過同類產品的同時,功耗、售價都大幅下降。

從官方提供的數據來看,嵌入式端的產品在性能超過Nvidia TK1? 的同時,功耗、售價僅為後者的1/4左右。

伺服器端的產品,性能接近Nvidia K40 GPU ,但功耗只有35瓦左右,售價300美元以下,不足後者的1/10。

產品功耗的降低和性能的提升主要依賴於算法上的創新和晶片結構的創新。

深鑒科技的首席科學家韓松一直在研究「深度壓縮」(Deep Compression)技術,可以將神經網絡壓縮數十倍而不影響準確度,可以使用片上存儲來存儲深度學習算法模型,減少內存讀取,從而大幅度減少功耗。

這一研究也得到了學界的認可,已經被選為2016年ICLR兩篇最佳論文之一(另一篇來自AlphaGo開發者谷DeepMind)。

在晶片結構上,深鑒科技重新設計了產品的架構(見下圖)。

針對深度學習計算中的大規模頻繁複用,設計了專門的DPU架構及編譯器。

用戶可以正常通過GPU訓練深度學習模型,並直接將模型編譯到DPU指令集,指令直接下載到DPU上,使得深度學習算法的運行效率提高。

這個剛剛興起的賽道上已經有不少有影響力的選手,但在CEO姚頌看來,深鑒科技與不少競品公司思路上並不相同,後者的產品大都是針對人工智慧的泛通用晶片公司,深鑒科技在著力於打造基於DPU的端到端的深度學習硬體解決方案,除了承載在硬體模塊(訂製的PCB板)上的DPU的晶片架構外,還打造了針對該架構的DPU壓縮編譯工具鏈SDK,而工具鏈裡面的軟硬體協同優化則是深鑒科技的一大優勢。

也正是這樣,深鑒科技不會只做「一家賣晶片的公司」。

現階段,深鑒科技正在打造雲加端的深度學習應用生態,選擇的應用領域都是大體量市場裡具有提升空間的重要玩具愛,以此快速擴大市場占有率。

其中嵌入式端的產品將主要應用在無人機、安防監控、機器人、AR等領域,目前公司已經與一家知名無人機廠商建立了合作,推出搭載嵌入式端產品的無人機將會在今年推出。

伺服器端的產品將主要面向大型網際網路公司的語音處理、圖像處理等。

目前也已經與國內知名網際網路公司展開合作,在兼容對方現有機房的情況下,功耗降低80%,語音識別的準確率提升了5%-7%。

深鑒科技的創始人汪玉博士是清華大學電子工程系副教授,是清華大學的首批終身教職,是ACM FPGA技術委員會亞太地區唯一成員。

CEO姚頌曾發表多篇國際頂級論文。

團隊大多數成員來自清華、斯坦福等著名高校。

目前,已經完成Demo開發、原型製造,也在與晶片大廠接觸。


請為這篇文章評分?


相關文章 

賽靈思收購深鑒科技 水到渠成之事?

2018年7月18日,賽靈思公司正式對外宣布,其已完成對深鑒科技的收購。賽靈思是全球領先的可編程邏輯完整解決方案的供應商,而深鑒科技成立於2016年,是一家提供基於原創的神經網絡深度壓縮技術和D...

一文讀懂深度學習,值得收藏!

今天,中天微宣布與深鑒科技達成一項智慧財產權合作框架協議,雙方將利用各自在嵌入式通用處理器以及深度學習處理方面的技術優勢,合作構建具有中國智慧財產權的人工智慧SoC平台與解決方案。