AI晶片設計難?廠商要給軟體開發者降低門檻

文章推薦指數: 80 %
投票人數:10人

「不管有什麼好的AI算法,要想最終得到應用,就必然要通過晶片來實現。

」在2018中國半導體市場年會上,清華大學微電子所所長魏少軍教授曾這樣表示。

AI晶片的出現,與深度學習技術的成熟及應用密不可分。

深度學習的過程可以簡化理解為利用大量標註的數據進行訓練,訓練出一個行之有效的模型,再將這一模型運用於新數據的推理。

隨著5G和物聯網的發展,AI晶片的應用普及也指日可待。

「從最早的人工智慧的計算,不管是訓練還是推理實際上都是發生在數據中心,因為深度學習需要大量的運算,只有在數據中心運用一些通用的處理器才能夠提供如此巨大的計算以及提供這些計算所需要的電力的消耗。

近年來,我們看到隨著人工智慧技術的發展,現在無論在算法方面還是在晶片方面,人工智慧都達到了一個很高的水平。

」英特爾中國區物聯網事業部首席技術官兼首席工程師張宇說。

與傳統計算模式不同,AI晶片結合了多層次的人工神經網絡算法,需要通過大量的數據訓練,它的發展推動晶片新一波的熱潮。

與此同時,也讓晶片廠商重新思考一個問題:晶片需要適配不斷出現的AI新算法,這讓晶片研發不再僅僅是硬體工程師的「專屬」,但對於算法工程師來說,想要把原來軟體的功能實現到硬體上就需要面臨更多挑戰。

這一點,要如何應對?

「深度學習網絡模型是以大規模數據經過千萬次的疊代而形成的結果,整個的轉接過程對於我們來說是黑盒,而在這個基礎上進行模型優化確實需要對算法進行更深入的了解。

」科達研究院執行院長曹李軍說。

在和從事人工智慧應用開發的開發者交流時會發現,目前在進行人工智慧開發的時候還有諸多問題有待解決。

比如,開發者已經有了一個經過訓練的網絡模型,但是推理平台相對來說能力有限,需要把現在網絡模型的一部分而不是全部下載到推理平台之上,這要如何實現?另外,現在訓練的模型,如果推送到推理平台之上發現其性能不高,要如何提升?再者,深度學習、人工智慧應用開發所用到的框架並不被一些架構所支持,要如何兼容?

這也是晶片廠商面臨的挑戰:CPU雖然能解決單次複雜問題,但無法支撐深度學習的大規模並行計算需求。

GPU最初隨著圖像處理需求出現,處理大量數據並行運算、浮點運算的能力迎合了深度學習的需求,相比CPU處理速度更快、功耗更低,因此被最先引入深度學習,但通用和優化之間仍有差距。

相比之下,FPGA被稱作可編程的「萬能晶片」,可以通過FPGA配置文件來定義這些門電路及存儲器間的連線,從而實現特定的功能,並且可以通過配置特定的文件將FPGA轉變為不同的處理器,就如一塊可重複刷寫的白板。

雖然有可以多次更改的優勢,但是在AI晶片的進展上不算快。

「有用CPU做的、GPU做的,也有用VPU做的,還有喜歡用FPGA做的,每家根據市場需求不同,都強調不同硬體架構的不同特性。

在上面有特別多的編程的框架又不一樣,怎麼辦?」英特爾中國銷售總經理王稚聰給出了自己的答案,「英特爾也不可能為每一種組合都推出一個軟體工具,所以OpenVINO的推出就是在最大程度上能夠水平化地給客戶(提供基礎功能),裡面又帶有很多定製化的特性,能夠使得在保持硬體的多樣性異構計算的同時,又能夠保持上面編程的多樣性需求。

這樣使得我們開發的成本、時效性能夠得到很大的提高。

OpenVINO工具包是英特爾新近面向中國市場推出的專注於加速深度學習並將視覺數據轉換為業務洞察的工具,可以方便地使用英特爾的各種硬體的加速資源,包括CPU、GPU、VPU、FPGA,這將充分幫助企業在邊緣側快速實現高性能計算機視覺與深度學習的開發。

它能夠支持異構處理和異步執行,這樣能夠減少由於系統資源等待所占用的時間。

這就意味著一次編程可以通過異構的接口支撐跑在其他的硬體平台之上。

賽靈思技術銷售總監朱勇告訴第一財經,這幾年晶片廠商越來越關注軟體工具的提供,而不僅僅是關注硬體,目的就是為了實現「更好用」的目標,「這種好用是指對軟體工程師的好用,在他們熟悉的領域裡能更好地對硬體進行升級。

作為FPGA晶片的領軍者,賽靈思有設置軟體開發者專區和硬體開發者專區。

在軟體開發者專區,賽靈思和第三方的生態系統的關鍵開發環境和嵌入式平台提供一整套的工具、庫和方法。

這些環境不僅可以縮短開發時間,更輕鬆地定製硬體加速器,包括提供類似GPU和CPU的編程體驗,面向數據中心負載加速的SDAccel,還有類似C/C++應用開發體驗的SDSoC,以及將可編程性從「控制」擴展至「數據面板」的SDNet。

「就是因為這個平台里提供了好多庫,讓工程師覺得更好用,所以英偉達在AI晶片領域的發展才這麼快。

」一位業內人士告訴第一財經。

他提到的就是英偉達搭建的CUDA開發平台(ComputeUnifiedDeviceArchitecture,統一計算設備架構)。

這一編程模型可以在應用程式中充分利用CPU和GPU各自的優點。

留住開發者,適配更多的人工智慧算法,已成為AI晶片浪潮中各家廠商的發力點。


請為這篇文章評分?


相關文章