全球下一代處理器峰會在京舉行 中國能領跑異構計算嗎

文章推薦指數: 80 %
投票人數:10人

2016年全球異構計算HSA峰會於8月22日在北京拉開帷幕,本次峰會由全球異構系統架構(HSA)聯盟和中國半導體行業協會(CSIA)共同主辦,並得到了網信辦、工信部和北京經濟技術開發區的大力支持。

本次在京全球HSA峰會,一方面是推動形成統一的計算標準,另一方面也為國內廠商互相合作、共謀發展搭建一個良好的平台。

同構計算是使用相同類型指令集和體系架構的計算單元組成系統的計算方式。

而異構計算主要是指使用不同類型指令集和體系架構的計算單元組成系統的計算方式,常見的計算單元類別包括CPU、GPU、DSP、ASIC、FPGA等。

異構計算用簡單的公式可以表示為「CPU+XXX」。

舉例來說,AMD著力發展的APU就屬於異構計算,用公式表示就是CPU+GPU。

由於術業有專攻,CPU、GPU、DSP、ASIC、FPGA各有所長,在一些場景下,引入特定計算單元,讓計算系統變成混合結構,就能讓CPU、GPU、DSP、FPGA執行自己最擅長的任務。

如果能做到無縫地將運行於CPU之上的通用計算、運行於GPU之上的並行計算、運行於DSP之上或者ASIC/FPGA之上的優化計算整合在一起,就能獲得更好的應用性能,更低的功耗等特性,相對於同構計算而言也可能有一定性能優勢。

事實上,最近幾年曾經在TOP500刷榜,或者排名靠前的超算都採用了異構計算——中國神威太湖之光、美國超算泰坦、中國天河1號和天河2號都屬於異構超算。

泰坦有18688個運算節點,每個運算節點由1個16核心AMD Opteron 6274處理器和1個NVIDIA Tesla K20加速器組成,共計299008個運算核心,屬於CPU+GPU。

天河2號有16000個計算節點,每個節點由2片Intel的E5 2692和3片Xeon PHI組成,共使用了32000片Intel的E5 2692和48000片Xeon PHI,屬於CPU+眾核晶片。

天河1A使用了14336片Intel Xeon X5670處理器和7168片NVIDIA Tesla M2050高性能計算卡,屬於CPU+GPU。

神威太湖之光則比較特殊,雖然太湖之光只使用了40960片申威26010,按照之前說的定義,應該屬於同構計算,但實際上,由於申威26010的設計思想非常先進,單片晶片就相當於一個計算節點,其所擁有的4個管理核心發揮著類似CPU的作用,而256個運算核心發揮著類似於眾核加速器的作用。

因此,神威太湖之光也是屬於異構超算,而這種獨特的設計還是想了內存共享,避免了顯式拷貝,從而降低了對內存的壓力,並減小了性能損失。

在參會單位中,除了華為、中科院、北大、申威等數十家國內處理器設計公司、科研院所、IP及工具供應商、軟體及作業系統廠商、應用廠商外,包括許多手機整機廠商、無人機和機器人等應用開發商、大學和科研院所、投資機構等都踴躍參會。

大會討論的主題除HSA專題研討外,還包括了HSA的不同應用領域:如人工智慧、深度學習、軟體無線電、物聯網等。

本次HSA峰會最大的意義在於確立一個統一的技術標準,正如全球異構系統架構聯盟主席John Glossner表示,「幾個月前,我們發布了異構系統架構HSA 1.1規範,極大地提高了在異構設計中整合開放或專有IP模塊的能力。

我們現在已經可以看到一系列的HSA兼容解決方案進入市場,峰會期間與會成員公司還將展示進一步的技術細節和HSA兼容系統演示。

峰會的另一個意義在於為國內廠商互相合作、共謀發展搭建一個良好的平台,讓各家公司能夠互相協助,形成合力,為中國在異構計算領域搶占創新高地。

正如國家信息化專家委常務副主任周宏仁所言,「中國現在已經具備了成為CPU+ 創新高地的條件,比如繼天河2號之後,國產超級計算機神威太湖一號再次登頂世界TOP500,成為世界上運算速度最快的計算機」,周宏仁認為,「在異構計算領域,中國與國際先進水平差距小,甚至在某些領域還處於領先」,在此情形下,如果國內科研院所、大學、企業通力合作,未嘗不能實現在異構計算方面和歐美分庭抗禮的局面。

(作者微信公眾號:tieliu1988)

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。

關注觀察者網微信guanchacn,每日閱讀趣味文章。


請為這篇文章評分?


相關文章