究竟為何說AI晶片是FPGA的附庸?

文章推薦指數: 80 %
投票人數:10人

央行放水之後,催生出了一大批手握重金的投資機構,而國內優秀的投資標的,特別是高科技領域的標的極為稀缺,AI晶片獲得投資易如反掌,一時間冒出來幾百家AI晶片公司,也給投機分子可乘之機。

作為國內最優秀的AI晶片公司,深鑒科技被以3億美元的價格賣給FPGA巨頭賽靈思。

過去兩年,深鑒科技是國內AI晶片領域冉冉升起的一顆明星。

這家2016年3月成立的初創公司目前已完成三輪融資,投資方包括金沙江創投、螞蟻金服、三星風投、賽靈思、聯發科等知名機構和公司。

據媒體報導,其估值遠超過10億美金。

如今以3億美元賣出,並且據稱核心團隊要鎖定4年內不得離開賽靈思。

難道深鑒科技被賤賣?當然沒有!這是因為中國真正優秀的企業太少,而追逐的資本太多,優秀企業的估值已經到了完全沒有理性的地步。

如果這些企業在美國,估值會萎縮數倍以上。

FPGA已經不是FPGA,更接近於ASIC

不是短期盈利無望,而是長期盈利無望,賣身給FPGA廠家肯定是最明智的選擇。

在大部分人眼裡,FPGA缺乏技術含量,純粹靠專利建立起護城河,FPGA只是個軀殼,算法才是靈魂。

是深鑒讓FPGA獲得靈魂。

果真如此的話,那估值就不是3億美元。

實際上聲稱有能力做機器學習算法的公司據說超過3000家,而大規模生產FPGA的獨立廠家全球僅Xilinx一家。

算法應該說像人的視覺系統,FPGA則是人的大腦和軀殼。

現在的FPGA早已不是當年的簡單地把寄存器和LUT整合在一起的白紙了,而是越來越像ASIC,或者說SoC。

現在的FPGA都包含了複雜的接口資源,收發器資源,存儲器資源,有些則直接加入了多個ARM內核。

單純的FPGA幾乎不存在了。

以深度學習、高性能運算、圖形科學領域最常見的Kintex FPGA來看,國內百度、騰訊、阿里都採用了KU115做計算加速。

這款FPGA集成了大量資源,包括各種片上存儲器,Xilinx的FPGA中主要有分布式RAM 和 Block RAM 兩種存儲器。

用分布式RAM 時其實要用到其所在的SliceM,所以要占用其中的邏輯資源;而Block RAM 是單純的存儲資源,但是要一塊一塊的用,不像分布式RAM 想要多少bit都可以。

頂級的Virtex系列FPGA更繼承了高達8GB的HBM高寬頻內存。

時鐘方面,有MMCM/PLL。

MMCM:混合模式時鐘管理器,用於在與給定輸入時鐘有設定的相位和頻率關係的情況下,生成不同的時鐘信號。

PLL:鎖相環,主要用於頻率綜合,使用一個PLL可以從一個輸入時鐘信號生成多個時鐘信號。

這些主要用在收發器領域。

KU115里還包含5520個DSP,能夠大幅度提高圖像和視頻類任務的處理速度,這是類似GPU的並行運算架構,可以說這片FPGA還包含一個小GPU。

這個DSP可以對應乘法累加器、乘加器或單步/n步計數器。

級聯多個DSP48E邏輯片可執行複雜的功能。

例如,不使用額外的FPGA架構資源的情況下實現複雜乘法器或n階FIR濾波器。

對某些如FFT運算,速度大大提升。

Virtex系列頂配有12288個DSP,性能達21897GMAC/s。

Xilinx的Soc+FPGA系列產品則完全可以叫SoC了,其不僅包含多個ARM CPU內核,還有針對安全領域的R5內核,還有Mali 400這樣的GPU,最誇張的是RFSoC把射頻的ADC/DAC也集成了,還有SD-FEC。

目前集成電路設計基本上都是用IP核搭積木的形式。

IP核分為行為(Behavior)、結構(Structure)和物理(Physical)三級不同程度的設計,對應描述功能行為的不同分為三類,即軟核(Soft IP Core)、完成結構描述的固核(Firm IP Core)和基於物理描述並經過工藝驗證的硬核(Hard IP Core)。

軟核就是我們熟悉的RTL代碼;固核就是指網表;而硬核就是指指經過驗證的設計版圖。

ARM還是以軟核為主的。

IP軟核(Soft IP Core):通常是用硬體描述語言(hardware Description Language,HDL)文本形式提交給用戶,它經過RTL級設計優化和功能驗證,但其中不含有任何具體的物理信息。

據此,用戶可以綜合出正確的門電路級設計網表,並可以進行後續的結構設計,具有很大的靈活性,藉助於EDA綜合工具可以很容易地與其他外部邏輯電路合成一體,根據各種不同半導體工藝,設計成具有不同性能的器件。

其主要缺點是缺乏對時序、面積和功耗的預見性。

而且IP軟核以原始碼的形式提供的,IP智慧財產權不易保護。

IP硬核(Hard IP Core)是基於半導體工藝的物理設計,已有固定的拓撲布局和具體工藝,並已經過工藝驗證,具有可保證的性能。

其提供給用戶的形式是電路物理結構掩模版圖和全套工藝文件。

由於無需提供寄存器轉移級文件,因而更易於實現IP保護。

其缺點是靈活性和可移植性差。

IP固核(Firm IP Core)的設計程度則是介於軟核和硬核之間,除了完成軟核所的設計外,還完成了門級電路綜合和時序仿真等設計環節。

一般以門級電路網表的形式提供給用戶。

深鑒只是做了最上層的基於PC的應用算法,要想讓算法在嵌入式系統中流暢運行,還需要大量的工作,而這正是Xilinx做的。

這就好像圖像識別算法,基於PC的幾百家都不止,但要一直到車內的ARM系統上,表現會大大折扣,完全不具備實時性,也就無法應用。

上圖是一個典型的行人識別算法HOG+SVM所需要時間的對比,硬核只需要79.3毫秒,軟核需要3983毫秒,所以純軟核的設計要麼用極簡單的算法,要麼用英偉達貴到飛起的晶片,即便如此,也不能和硬核比。

所以單純的算法公司,特別是複雜視覺處理算法公司如果不能將算法用晶片來承載,那就不可能成功。

當然,融資還是能成功的,畢竟還有很多投資者不是真正懂技術。

《2018第四屆中國硬體創新大賽華南分賽區(深圳站)決賽》

強強對決!爭奪高交會全國總決賽入場券!

活動地點:深圳市福田區名堂·微谷眾創社區路演廳

報名請掃描下方二維碼↓

點「閱讀原文」了解更多


請為這篇文章評分?


相關文章 

AI晶片可能只是FPGA的附庸

央行放水之後,催生出了一大批手握重金的投資機構,而國內優秀的投資標的,特別是高科技領域的標的極為稀缺,AI晶片獲得投資易如反掌,一時間冒出來幾百家AI晶片公司,也給投機分子可乘之機。

FPGA可編程邏輯結構二

模塊功能:可編程輸入輸出單元(IOB)簡稱I/O單元,是晶片與外界電路的接口部分,完成不同電氣特性下對輸入輸出信號的驅動與匹配要求,內部結構下圖