鐵流:超算的核心技術並不只有CPU

文章推薦指數: 80 %
投票人數:10人

作者 鐵流 微信公眾號 :tieliu1988

隨著天河2號成為全球運算最快的超級計算機,並在2015年國際超級計算機大會上蟬聯5連冠,天河超算再次成為國人的驕傲。

就在天河超算取得傲人成績之時,一些不和諧的音符也如影隨形——有人表示中國超算只是拿國外CPU做的組裝貨,不具備科技含量;有人表示,把只要有錢,買更多的CPU就能堆出比天河2號性能高好的超算;更有人表示只要把中國人的手機晶片連接起來就能輕鬆超越天河2號的運算能力,因此,天河2號沒啥大不了的。

那麼,事實真如上述「冷靜黨」所言,只要有錢堆砌更多的CPU就能獲得優於天河2號的超算……讓我們來看看超算由哪些系統組成,並有各有什麼功能。

超算系統組成和功能

超算系統可以分為軟體系統和硬體系統兩部分。

超級計算機硬體系統主要由高速運算系統、高速互連通信網絡系統、存儲系統(I/O 管理結點和 I/O 存儲結點)、維護監控系統、電源系統、冷卻系統和結構組裝設計等部分組成。

高速運算系統負責邏輯複雜的調度和串行任務和並行度高的任務,可以是採用同構計算(純CPU組成計算節點),也可以採用異構計算(CPU+加速器組成計算節點)。

(飛騰CPU計算節點)

  1. 高速互連通信網絡由infiniband、高速乙太網、自定製互聯機制構成,將所有計算節點連接起來,使其成為一個整體;

  2. 存儲系統由內存和外存組成,負責數據交換和儲存;

  3. 維護監控系統保障超算不死機、不出錯,畢竟每隔幾秒出一次錯,死一次機,這種足以讓超算的使用者精神崩潰;電源系統包裝能源供應;

  4. 冷卻系統幫助超算降溫,防止出現超算過熱而造成的不良後果;

  5. 結構組裝設計是將上述系統裝載到一起,在保障性能的基礎上,實現機櫃體積最小。

超級計算機軟體系統主要包括作業系統、編譯系統、並行程序開發環境、科學計算可視化系統等四個重要組成部分。

  1. 作業系統系統主要包括對同構技術或異構協同支持,高效能支撐擴張,基礎服務內核,全局並行文件系統;

  2. 編譯系統的功能是支持C、C++、Fortran77/90/95等程式語言,支持OpenCL、OpenMP、MPI等並行程式語言,支持編譯優化;

  3. 並行程序開發環境的功能是提供一體化圖形用戶介面,支持應用程式的調試和性能分析;

  4. 科學計算可視化系統由海量數據服務模塊、並行繪製與顯示模塊和可視化映射與操作模塊組成。

因此,運算系統、存儲系統、互聯繫統、作業系統、基礎庫、應用軟體,以及監系統控、冷卻自提、電源系統等都是超算的重要組成部分,將CPU等同於超算的全部技術的說法顯然是非常不科學的。

超算的核心技術並不只有CPU

CPU是超算的重要組成部分,但不是超算技術的全部。

網絡上一些人將CPU技術等同於超算技術,進而因天河超算使用美國Intel公司的CPU而聲稱中國超算不具備核心技術的說法是荒謬而可笑的。

就以天河2號來說,除了計算節點的CPU是美國Intel公司的,體系架構、網際網路、存儲、系統軟體、應用軟體、電源、冷卻等系統大部分都是中國人自己做的。

實際上,相對於聲名顯赫的CPU,默默無聞的體系結構設計才是一直被大眾和媒體忽略的關鍵技術。

舉例來說,曙光星雲採用了自主研發的超並行處理體系結構、神威藍光超算採用了大規模並行處理體系結構、天河1號採用了多陣列可配置協同並行體系結構、天河二號採用了自主創的新型異構多態體系結構。

(天河1號)

體系結構設計能力有多重要呢?

打個比方,如果說超算是一隻軍隊,那麼體系結構設計就是軍隊的歷史傳承、光榮傳統、組織管理水平、軍事訓練水平、武器裝備、後勤能力、高級將領的戰略指揮水平和中下層軍官的戰術指揮能力,而CPU則是軍隊的士兵。

鐵打的營盤,流水的兵。

相對而言,前者對一直軍隊更為重要,士兵軍事素養相對而言則處於相對次要地位,而士兵的來源地和籍貫就居於更加次要的地位。

也正是因此,某些媒體攻擊天河超算採用國外CPU,不具備核心技術的說法是非常不妥當的。

超級計算機不是簡單的CPU堆砌

某些人覺得只要有錢買足夠多的CPU就能堆出性能超越天河2號的超算,甚至有媒體說,把足夠多的手機晶片連起來就能超越天河2號。

但實際上,這個說法也是值得商榷的。

因為堆CPU也是一個技術活,體系結構設計的不好,高速網際網路做的不行,系統軟體做的不好,儲存列陣做的不行,即使堆再多的CPU,超算的性能也上不去。

簡單粗暴的堆砌CPU根本不可能製造出一台超級計算機,更不要說是能與天河2號相匹敵的超算。

另外,哪怕掌握了正確的堆砌CPU的方法,也不是單憑靠堆CPU數量就能獲得一台能與天河2號相匹敵的超算。

原因何在? 因為超算建設不是簡單的搭積木式的堆砌CPU——即便堆砌了海量的計算卡,但受制於其他方面,比如高速網際網路的技術水平而導致無法到達理論計算性能。

具體來說,高速網際網路的難點在於超算的計算節點之間傳輸的數據量巨大,延遲要求嚴格,當網際網路效率不足,就會導致數據擁堵,大幅降低超算整機系統效率。

而超算的計算節點越多,對網際網路的要求也就越高。

因此,即使想通過堆砌CPU來提升運算能力,也會受限制網際網路的性能,造成這種做法並不能無節制的提升超算的性能——受限於諸如網際網路以及其他方面的瓶頸,整機效率被拉低,導致實際性能並沒有因為堆砌了更多的CPU而有所提高。

另外,堆砌過多的CPU還存在功耗過大、機箱體積過大等問題,非常不利於日後的運營維護和使用,在超算市場基本不具備市場競爭力。

正是因為高速網際網路的重要性,相對於在2015年才對中國四家超算中心禁售計算卡,高速網際網路卻早就被美國列入技術封鎖的名單。

在軟體系統方面,控制少量計算節點和控制大量計算節點對軟體系統的要求近乎於天差地別。

軟體系統必須保證每個超算計算節點的性能被發揮到最大才能充分挖掘出硬體上的潛力,否則,就會影響超算的整機效率。

另外,TOP500頭幾名的計算節點大多在數千近萬,甚至一萬個以上,某幾個計算節點損壞,並需要更新是常有的事。

當計算節點損壞時,軟體系統必須做到部分節點損壞時不會發生死機、報錯等情況,不影響計算任務的持續。

因此,如果沒有一個好的體系結構,那麼CPU的性能將無法全部發揮出來,而且堆砌的CPU數量越多,整個系統就越複雜,對高速網際網路、存儲列陣、監控系統、冷卻系統和軟體方面的要求也就越高,整機效率的提升也就越難。

而體系結構設計能力水平不夠高的情況下,單純堆砌CPU數量,反而會降低整機效率,無法提升整機性能。

天河2號的閃光點

回到開篇提到的,某些人指責天河1號和2號使用美國CPU的話題。

其實,天河1號和天河2號在使用美國CPU和GPU的同時,也部分使用了國產飛騰CPU,具體來說,天河1號使用了2048片我國自主研發的飛騰 1000 八核心處理器,被用於高速網際網路系統,天河2號使用了4096片飛騰1500,也被用於高速網際網路系統。

那麼兩台天河超算各用了多少美國的CPU和GPU呢?

天河1A使用了14336片Intel Xeon X5670六核處理器,7168片NVIDIA Tesla M2050高性能計算卡,飛騰1000占天河1號總晶片比重為9%;天河2號使用了32000片Intel的E5 2692和48000片Xeon Phi,飛騰1500占天河2號總晶片比重為5%。

這一方面暴露出在在建設天河1號和天河2號時,中國在CPU、GPU的設計和製造方面與美國有較大的差距,當時的國產CPU中找不到Intel公司的E5和至強PHI計算卡,以及英偉達GPU的替代品。

但從另一個方面講,同樣使用美國的CPU,為何美國的超算在性能上就是敵不過中國超算呢?同樣使用E5和至強PHI計算卡的美國超算Stampede,不僅運算能力僅為天河2號的五分之一左右,整機效率也比天河2號更低,只有60.7%,這是否說明國防科大在超算研發方面深厚的技術底蘊呢?

(天河1A參數)

結語如果說天河2號、曙光6000、天河1號等超算使用了國外CPU、GPU是白璧微瑕。

那麼,走GPDSP技術路線的天河2A完全實現了對Intel至強PHI計算卡的國產化替代。

而某100P超算實現了全面國產化,實現了在超算領域徹底扭轉了在技術和信息安全上受制於人的局面。


請為這篇文章評分?


相關文章 

中國超算逆襲簡史

新一期全球超級計算機500強榜單20日公布,使用中國自主晶片製造的「神威太湖之光」取代「天河二號」登上榜首,中國超算上榜總數首次超過美國,名列第一。相對於天河2號採用Intel的至強PHI計算卡...

全球最牛的計算機終於來了......

■ 網際網路頭條新聞每天為你報導■文:網際網路熱點主編賀博中國「芯」,震驚世界!全球超級計算機500強榜單20日公布,中國首款自主晶片製造的「神威太湖之光」取代「天河二號」登上榜首,中國超算上榜...