AI晶片新救星?FPGA真這麼神嗎

文章推薦指數: 80 %
投票人數:10人

智東西(公眾號:zhidxcom)文 | 心緣

導語:「AI晶片」這個新鮮的概念在過去一年間逐漸走過了普及的階段,越來越被大眾所熟知。

在行業走過野蠻生長,開始加速落地、加速整合的過程中,也有更多的AI晶片公司也開始走出屬於自己的差異化路線。

智東西在此前AI晶片系列報導第一季之後,再次出發,進一步對AI晶片全產業鏈上下近百間核心企業進行差異化的深度追蹤報導。

此為智東西AI晶片產業系列報導第二季之一。

隨著大數據發展和算力的提升,AI晶片正迎來新一輪的爆發期。

近兩年來,越來越多以FPGA切入AI晶片的玩家湧現出來,包括國內AI晶片創企深鑒科技、百度XPU、微軟Project Brainwave、深思考醫療影像專用AI晶片等等。

儘管ASIC在性能功耗上往往有更好的表現,不過我們發現,在一片紅海的AI晶片市場中,FPGA憑藉自己獨特的優勢占有了一席之地。

甚至有媒體報導稱,FPGA是AI晶片的終極未來。

這一觀點是否準確我們暫且不論,但它的確在AI晶片領域引起了不少波瀾,也不禁讓我們想要問一句,「AI晶片新救星?FPGA真的這麼神嗎?」

FPGA屆的肯德基跟麥當勞:賽靈思vs英特爾Altera

FPGA(Field-Programmable Gate Array)即現場可編程門陣列,其靈活性介於CPU、GPU等通用處理器和專用集成電路ASIC之間,在硬體固定的前提下,允許使用者靈活使用軟體進行編程。

它的開發周期比ASIC短,不過相對於批量出貨ASIC,單個FPGA的成本會更高。

由於FPGA容錯空間相對更大,以前FPGA常被用作ASIC晶片流片前的硬體驗證方法。

目前,FPGA晶片的主要四家生產廠家都在美國:Xilinx(賽靈思)、Altera(阿爾特拉)、Lattice(萊迪思)和Microsemi(美高森美)。

它們一共占了98%以上的市場份額,其中,絕大多數市場被賽靈思和Altera瓜分,賽靈思約占58%,Altera約占39%。

近三年,FPGA行業完成了多項併購。

2015年6月,英特爾宣布以167億美元收購Altera(阿爾特拉)。

2016年上半年,紫光在公開市場收購萊迪思6.07%的股權,同年11月萊迪思被Canyon Bridge以13億美元收購,但此案一直沒有獲得美國監管單位同意。

這些併購案並未影響到FPGA在AI晶片市場的整體格局。

幾乎二分天下的賽靈思和英特爾確立了相似的FPGA戰略布局,均將重心放在了數據中心市場,並都致力於讓FPGA編程更簡單。

1、FPGA的創造者——賽靈思

說到FPGA,絕對避不開的公司就是賽靈思,因為這項晶片技術就是賽靈思開創的。

從2011年起,賽靈思提出全可編程(All Programmale)理念,將FPGA技術從傳統的通訊、航空、國防等領域拓展到了AI和雲計算領域的應用。

去年12月,智東西曾對賽靈思全球銷售和市場部亞太及日本地區高級總監周海天進行深度專訪(對話賽靈思:33年老牌晶片廠如何在AI浪潮里新興業務年增46%),周海天告訴智東西,16nm產品是賽靈思眾多產品線中最受AI應用廠商歡迎的產品,其尖端技術能將更多可編程應用邏輯元件集成在晶片上,滿足AI對強大計算能力的需求。

作為FPGA行業長期的霸主,賽靈思擁有超過2萬家下遊客戶,其中亞馬遜AWS、以及中國的BAT雲服務巨頭都是它的客戶。

今年3月,賽靈思新CEO Victor Peng上任之後不久,就宣布了賽靈思在AI時代的三大戰略布局:數據中心優先、加速八大主流市場發展、以及重磅推出全新一代AI晶片架構ACAP。

首款代號為「珠穆朗瑪峰(Everest)」的ACAP AI晶片新品將採用台積電7nm工藝打造,今年內實現流片,2019年向客戶交付發貨。

(首發!賽靈思推顛覆性AI晶片 正面宣戰英偉達英特爾)

而在終端AI方面,賽靈思則在今年收購了國內三大AI晶片獨角獸之一的深鑒科技,主攻終端人工智慧。

深鑒科技是國內少數以FPGA切入AI晶片、並取得不錯成果的代表性玩家之一。

(突發!AI晶片獨角獸深鑒科技被美國賽靈思收購)

此外,賽靈思FPGA也長期深耕在車用領域,適用於處理越來越複雜的先進駕駛輔助系統(ADAS)和自動駕駛。

某AI晶片創業公司CEO透露,相較其他進入自動駕駛車市場的AI晶片公司,只有賽靈思有車規級的 FPGA,L1-L3層找不到比賽靈思性價比更高的平台, 因此賽靈思至少在5年內有較好的市場契機。

2、英特爾收購Altera

另一個FPGA行業不得不提的大事就是英特爾收購Altera。

為了增強其在AI晶片領域的競爭力,2015年,英特爾以167億美元天價收購Altera,這也是迄今為止英特爾史上最大手筆的收購。

英特爾隨即設立研發FPGA晶片的可編碼部門(PSG)。

FPGA是英特爾的AI晶片布局之一,但英特爾最重要的AI晶片項目還是難產多年的Nervana神經網絡處理器項目。

英特爾採用雙管齊下的FPGA戰略:一方面打造CPU-FPGA混合器件,讓FPGA與處理器協同工作;另一方面基於Arria FPGA或Stratix FPGA打造可編程加速卡(PAC/programmable acceleration card)。

基於FPGA技術,英特爾已經構建了一個完善的NFV生態,覆蓋軟硬體廠商、系統集成商、電信運營商、OTT廠商等相關企業。

此外,英特爾還為OME廠商提供一個面向包含FPGA的英特爾至強可擴展處理器的英特爾加速堆棧,進而為客戶提供完整的軟硬體一體的FPGA解決方案。

英特爾在7月收購晶片公司eASIC後將其併入PSG部門,並隨後透露這一收購案主要是為了滿足解決客戶痛點,滿足FPGA客戶端的降低成本和能耗需求,並提供可降低16nm、10nm、7nm製程的FPGA產品成本的規模化技術。

目前加速卡還是FPGA進入硬體領域的主要形態之一,不過英特爾已經在進行其他方向、其他形態的探索,並在積極推進和其他數據中心OEM廠商在FPGA方面的合作。

FPGA AI晶片市場的主要玩家

近兩年來,FPGA在數據中心的應用日益廣泛。

目前,FPGA伺服器已在全球七大超級雲計算數據中心IBM、Facebook、微軟Azure、AWS、百度雲、阿里雲、騰訊雲得到部署。

由於ASIC路線風險高,目前僅有谷歌批量部署TPU。

1、最會玩FPGA的微軟AI:BrainWave項目

微軟Azure與FPGA的淵源可以追溯到八年前,當時的Bing(必應)搜尋引擎無論是搜索結果還是相應速度都比不過谷歌搜索。

為了滿足Bing的需求,2010年底,一位微軟研究員提出了能在FPGA上運行Bing機器學習算法的硬體設計得到了微軟的認可。

如今,FPGA在加速數據處理方面的出色表現使它在微軟Bing、Azure雲計算服務和Office 365中均得到部署。

今年3月26日,微軟Bing官方微博宣布通過英特爾Arria FPGA和Stratix FPGA晶片打造出Project Brainwave深度學習加速平台。

該平台將DNN處理單元整合入FPGA,支持微軟Cognitive Toolkit、谷歌Tensorflow等流行深度學習框架的軟體棧,能夠執行Bing智能搜尋功能所需的大規模機器閱讀理解任務。

在5月微軟Build 2018大會上,微軟AI晶片Brainwave開放了雲端試用版,開發者現在可以接入微軟Azure雲,試用由Project Brainwave晶片計算平台提供的AI服務。

微軟稱其延遲比谷歌TPU低5倍,正面對標谷歌。

Project Brainwave可以看作微軟基於英特爾FPGA晶片打造的低延遲AI晶片。

總的來說,微軟基於FPGA打造的AI晶片是目前業內最認可的FPGA方案之一。

2、百度XPU

相比微軟對英特爾FPGA的專一,百度對FPGA生產廠商的態度更為開放。

從2011年起,百度已就開始將FPGA應用到搜索、圖像、語音等多個核心業務,它的數據中心、雲計算平台和自動駕駛項目都部署了大量的FPGA。

在去年加州Hot Chips大會上,百度發布和賽靈思合作完成的基於FPGA的256核雲計算加速晶片XPU。

基於FPGA加速器擅長處理計算任務的特點,XPU兼具GPU的通用性和FPGA高效率、低能耗的特點,旨在處理多樣化的計算任務,對百度深度學習平台PaddlePaddle優化和加速,並實現性能和效率的平衡。

不過,在今年的百度AI開發者大會上,百度推出了首款雲端ASIC AI晶片崑崙,據說就是源自百度的XPU技術。

此外,百度和英特爾已有超過十年的合作歷史,近兩年雙方在AI領域的合作加強。

同樣是在今年的百度AI開發者大會上,英特爾人工智慧事業部副總裁兼人工智慧架構總經理Gadi Singer透露,百度正在開發基於英特爾最新FPGA技術的異構計算平台,這項技術將靈活加速百度雲上的工作負載。

3、深鑒科技

深鑒科技是國內一家年輕卻履歷亮眼的AI晶片公司,前年成立,去年年初估值超過10億,今年7月18日被全球第一大FPGA廠商賽靈思收購,其科研成果也在國際AI頂級會議屢獲大獎。

FPGA開發難度大、周期長(一般需要3-6個月)的高門檻曾將許多公司拒之門外,深鑒從這一痛點嗅到商機。

從2016年成立以來,深鑒科技一直基於賽靈思FPGA技術平台開發機器學習解決方案。

經深鑒科技優化的神經網絡剪枝技術運行在賽靈思FPGA器件上,可實現更優的性能和能效。

該公司提出深度學習處理單元DPU(Deep Learning Processing Unit)系列,為不願直接使用FPGA的廠商提供了一個帶接口的黑盒子。

廠商只需把自己的模型訓練好,將模型和數據從接口導入,就能直接獲得需要的輸出。

深鑒負責其中的壓縮和編譯,生成指令可在FPGA上運行。

▲DPU 系列:用於嵌入端的亞里士多德板(上)和用於大數據端的笛卡爾板(下)

不過在後期,深鑒科技也開始涉足ASIC AI晶片的設計與流片,曾經發布「聽濤」、「觀海」兩款AI晶片並宣布2018年流片,不過暫時沒有看到相關產品信息。

4、騰訊雲、華為雲、阿里雲

近年來,賽靈思和英特爾在中國雲服務市場可謂是動作頻頻,和華為雲、阿里雲、騰訊雲等國內頂尖的雲計算服務提供商分別展開合作。

去年年初,騰訊雲發布國內首款高性能異構計算基礎設施——FPGA雲伺服器,隨後推出基於賽靈思VU9P FPGA卡的FX3實例和基於Intel Stratix10 FPGA卡的FI3實例。

華為雲也在今年年初聯合賽靈思FPGA宣布在歐洲首次推出華為雲FPGA加速雲伺服器(FACS)平台,該平台搭載了賽靈思高性能 Virtex UltraScale+ VU9P FPGA,為用戶提供高性能的FPGA加速雲服務。

華為雲還推出FPGA加速雲伺服器FP1 DPDK實例和推出了FP1 OpenCL實例。

今年5月,阿里雲發布新一代FPGA計算實例F3,採用其自研高性能FPGA加速卡,搭載賽靈思16nm Virtex UltraScale+器件VU9P,提供16個VU9P實力規格,首創統一FPGA SHELL架構和FPGA虛擬化支持方案,使阿里雲客戶能加速機器學習、數據分析、基因組學和視頻處理等多種工作負載。

5、其他玩家

目前,國內能夠生產FPGA的公司包括紫光國芯、智多晶和AgateLogic等。

而國內深思考人工智慧、瑞為智能、深維科技、高雲半導體、安路科技、京微雅格等公司,都曾宣布具有基於FPGA的AI晶片開發能力。

紫光國芯是國內上市公司中唯一能夠量產FPGA的廠商,其FPGA、ASIC和特種微處理器常年為軍方穩定供貨。

該公司在2016年9月正式推出國內首款內嵌高速接口(serdes)的千萬門級高性能FPGA晶片——Pango PGT180H。

深思考人工智慧公司在今年3月的GTIC 2018全球AI晶片創新峰會上發布全球首款基於FPGA醫療影像專用AI晶片——M-DPU,該晶片在100秒內可以分類90000個細胞,同時具備先進醫學影像算法加速核心和深度學習加速核心。

深思考CEO楊志明告訴智東西,FPGA的研發周期比ASIC快很多,適於算法還在不斷演進智慧醫療影像領域。

深思考的DPU不是通用DPU,而是面向特定應用領域的DPU,在AI領域的最大優勢是DPU與特定領域算法的深度整合,形成面向特定場景的一站式整體解決方案。

瑞為智能是國內最早使用FPGA實現技術路徑的AI晶片公司之一,該公司在2015年就做了基於FPGA的AI晶片,滿足前端攝像機對高算力和低功耗的需求,並在2016年實現規模商用。

其AI晶片能使攝像機的圖像處理達到每秒25幀,從而提取清晰的人臉圖像供雲端識別分析。

除了創企外,國內研究機構如北京大學、清華大學、中國科學院等在基於FPGA的AI晶片領域都有深入研究。

比如,北京大學曾聯合商湯科技提出一種基於 FPGA 的快速 Winograd 算法,可大幅降低算法複雜度,改善 FPGA 上的 CNN 性能。

FPGA在AI晶片行業的發展趨勢

目前FPGA在AI晶片行業呈現出幾種不同的發展趨勢,一個是在FPGA的基礎上推出優化架構,一個是最大化程度挖掘FPGA的使用疆域,還有一個是將FPGA作為跳板,逐步轉向專用定製晶片ASIC。

1、基於FPGA優化架構

基於FPGA進行優化架構的發展路線以賽靈思為代表。

面對價格貴、開發難度大的問題,今年3月,賽靈思發布歷時4年、投入超過10億美元打造的新一代AI晶片架構ACAP,直接宣戰英偉達、英特爾處理器,對此智東西曾做深入報導(首發!賽靈思推顛覆性AI晶片 正面宣戰英偉達英特爾)。

2、長期最大化使用FPGA

微軟則是長期最大化程度挖掘FPGA使用邊界的典型玩家。

從八年前起,微軟就執著於將FPGA作為其核心AI計算平台。

從使用裝滿FPGA的專用伺服器集群,到用專用網絡連接的FPGA加速卡集群,再到將共享數據中心網絡的大規模FPGA雲服務,微軟一直在嘗試FPGA部署的各種可能,尋找將FPGA優勢發揮的最優路徑。

3、FPGA的終點是ASIC?

目前,業內的主流觀點是:隨著AI算法的進一步成熟固化,AI晶片最終會走向ASIC——也就是較為固定的晶片架構。

不過,賽靈思CEO Victor Peng持有不同觀點,他曾經智東西,AI算法疊代、應用創新的速度還將持續很長一段時間,甚至會維持10-20年之久,因此一款靈活、可應變的計算平台將成為創新的重中之重。

而且,未來最終並不會是一款AI晶片架構統一天下的局面,我們越來越需要能夠適應眾多AI應用、適應不斷變化的AI算法的新型晶片架構出現。

與此同時,英特爾可編程解決方案事業部亞太區市場拓展經理劉斌也認為,,FPGA在所有市場領域裡都會占有一定的市場份額,從原生市場環境而言,FPGA和ASIC都有一個競爭合作的共生環境。

「專用的ASIC其實還是非常有競爭力的,」劉斌表示,「不過FPGA是在所有的垂直市場都會有一定的份額,這種靈活性和普適性是FPGA最主要的價值。

某AI晶片創業公司CEO告訴智東西,至少在在深度學習算法穩定前,FPGA都有其生存空間。

因為很多公司都發現,剛做完傳統算法硬化,過了半年,內部算法團隊又把算法換了。

深思考CEO楊志明則認為,FPGA與ASIC融合是AI計算的未來。

單純的ASIC晶片無法完全替代FPGA,也不具備FPGA的靈活性。

就如同ASIC到現在都無法在傳統領域完全替代FPGA一樣,在AI領域,FPGA與ASIC也會分而治之。

智慧工業機器人、智慧通信、智慧醫療、智慧裝備等領域都是除FPGA以外的其他AI晶片難以介入的應用領域。

結語:深度學習加持,FPGA前景可期

最近一年,AI晶片踏入紅海,除了賽靈思、英特爾等傳統晶片巨頭外,國內外眾多AI晶片創企也紛紛加入戰場。

FPGA的可編程性使軟體和終端應用公司能夠根據算法靈活修改解決方案,這讓它在AI晶片市場愈發有存在感。

當下AI仍處於早期階段,AI算法正從訓練環節走向推理環節,這個過程需要對訓練後的模型進行壓縮,在基本不損失模型精度的情況下將模型壓縮到原來的幾十分之一。

在這一階段,AI是向著有利於FPGA發展的方向進行優化和升級的。

FPGA或許只是小眾的晶片,但在AI市場上,它的普適性和靈活性都使其有適合發揮其優勢的應用場景。

在各類AI晶片之間沒有拉開絕對差距之前,每一種技術路線都有其發揮更多價值的空間。


請為這篇文章評分?


相關文章 

深鑒不見 AI晶片戰局「深不可見」?

集微網報導 (文/李映)今日凌晨,國內AI晶片獨角獸——深鑒科技宣布被FPGA開山鼻祖、美國賽靈思(Xilinx)公司收購,具體交易金額未知。此事在業界引起巨大反響,賽靈思方面對集微網獨家表示,...

FPGA大廠賽靈思為何要收購深鑒科技?

今天凌晨,美國自適應和智能計算企業賽靈思(Xilinx)公司宣布已經完成對中國人工智慧初創企業深鑒科技的收購。雖然具體金額並未披露,但是業界人士評估收購金額可能在3億美金左右。深鑒科技是一家總部...

中國AI晶片初創公司被美國巨頭收購

【觀察者網 綜合報導】一家成立僅兩年的國內AI晶片初創獨角獸公司深鑒科技(DeePhi Tech)18日被美國晶片巨頭賽靈思(Xilinx)收購。雖然具體交易金額尚未可知,但業界人士評估,收購金...