「神威」超算拿下世界第一!國產處理器全面反攻Intel

文章推薦指數: 80 %
投票人數:10人

本周早些時候,《全球超算500強》正式公布了2016年上半年排行名單。

原本以為會獲得「7連冠」的天河2號,竟意外被趕超,且還是被另一國產超算給擊敗……如此的意料之外頓時讓中外媒體和小編們又一次沸騰。

實際上,筆者大概在去年的這個時候也寫過一篇有關國產超算的文章,不過內容主要是質疑「天河2」連續五次蟬聯《全球超算500強》之意義所在。

當時的觀點並非是認為「天河系列」已沒有所謂的技術價值,而是想強調:當「天河1」於2010年10月首次擊敗美國橡樹嶺國家實驗室的「美洲虎」超級計算機後,成功幫助國人在歷史上首奪「最快超算」之頭銜時,「天河系列」的偉大使命實際上就已經基本完成

再之後的「天河2」連續蟬聯,即使媒體用再多的篇幅去報導和渲染,也只能是徒增一些虛無飄渺的「自豪感」,而不能改變國產超算實際面臨的兩項殘酷事實:1. 最核心的技術仍依賴於美國——所以後來有了美國單方面宣布禁止向中國科研機構出口Xeon CPU和Tesla GPU的新規;2. 美國已經在研究下一代「百億億次級」(exascale)超算,能效標準遠超當前水平——所以我們眼下的領先,真的不能代表什麼。

因此,基於我們一時半會兒在自主核心硬體上難以趕超美國的事實,小編提出——將超算小型化、節能化和普及化會是一套更符合實際意義的做法,因為這能讓我們製造出更多可以榮登《綠色超算500強》榜單的中小型超算系統,能讓更多的學校和科研機構隨時隨意地用上屬於自己的超級計算機。

實際上,這也是大國發展、科技興國的重要指標之一。

然而萬萬沒有想到,時間僅過了一年,「神威太湖之光」的出現不僅確保了今年《綠色超算500強》前三甲的一個席位(過去中國大陸產超算從未登榜前十),更還一舉同時奪得了《全球超算500強》的冠軍頭銜,且完完全全用的是國產自主設計處理器(小編這裡不用CPU一詞,是因為從架構看已經脫離了傳統CPU的概念,有點英特爾Xeon Phi加速協處理器的意思,後者也是美國禁售名單產品之一)。

這樣的成績,在美國剛剛宣布對華禁售高性能處理器的大環境下,在苦苦掙扎也不願配合大陸共同研發的台灣半導體面前,簡直等同於一次核爆,其意義遠非「天河系列」繼續蟬聯「全球最強」所能比擬——當然這裡還是要再次澄清,小編沒有無視「天河」的價值,但用一套已掌握的技術標準來連續贏得競爭對手現階段已不參與的角逐,真的已不再具備任何值得大篇幅渲染的意義。

不要將所有的「國產芯」都一視同仁

每每提到「國產芯」,總會有那麼一群「不明真相」的網友要調侃、要嘲笑。

不能怪他們,畢竟有過上海交大「漢芯事件」這樣的黑歷史,也有著「龍芯」過分高調而不討喜的事實。

「少說多做」一直是小編在評價「龍芯」時的觀點,而「神威太湖之光」背後的「申威系列」處理器,就實實在在做到了這點,所以今天他們成功了,並且一鳴驚人。

當然,這裡要插個畫外音,要為「龍芯」做一點解釋:出於某些原因,「龍芯」雖然受到國家重視,但卻是「自負盈虧」的放養模式。

相比也是國家重點項目的「申威」,後者則得到了軍方的完全支持,因而無需擔憂能否持續發展的問題。

所以從這個角度理解,我們不能怪「龍芯」的完全商業化,但是——少接受採訪、少吹噓性能、低調做產品就行了,誇大產品在特定測試環境下性能趕超歐美是沒有意義的,因為「龍芯」定位的是通用計算市場,不是在指定領域下玩跑分。

「申威」顯然在獲得軍方支持後,走的並不是「通用」路線——能否支持普通人能理解的Windows、UNIX或者Linux發行版並不重要,「申威」作為國家安全戰略用晶片自然會有特殊定製版系統與之配合;性能或許也非最重要指標,能掌握核心技術並用於關鍵領域才是最具意義的事情——所以,「申威」一直特別低調,鮮有報導(比較大篇幅的報導始於2015年)。

直到今天勇奪世界第一,才讓美國頓時懵逼了,讓主流媒體突然沸騰了。

能被用於超算領域的「國產芯」大概也只有「申威」和「龍芯」兩個選擇,其它的基於ARM架構的晶片,則主要面向移動和通用市場,因此要一視同仁地進行比較並不具備價值。

未來還有可能出現的能挑戰「申威」的國產晶片,恐怕就只有等與AMD合作的那款SoC了——當然小編對此是極度懷疑中。

「神威太湖之光」的厲害和不同

「神威太湖之光」採用的是申威26010處理晶片,共40960個計算節點,每個節點由256個計算內核 4個管理內核(據說也帶計算功能)組成,所以整套系統共1060萬個CPU計算核——這個數字為排名第二的「天河2」的三倍,後者約為312萬個計算內核,因而在浮點計算性能上也大約是「天河2」的三倍:93.01 petaflop/s比33.86 petaflop/s。

然而,「神威太湖之光」的整機功耗只有15.37 MW,而「天河2」則為17.81 MW。

也就是說,「神威」是實現了性能倍增的前提下,功耗反而大幅降低了。

這才是一次真正意義的技術突破——當然,這與美國提出的50 gigaflops/watt的exascale次世代超算還是有很大差距(「神威」換算過來的每瓦性能約為6 gigaflops/watt)。

申威26010之所以能有如此強大的浮點計算性能是得益於Alpha處理器架構。

Alpha是不同於今天市場主流的X86、ARM、MIPS、Power和Sparc的又一處理器微架構,屬於RISC(精簡指令集)家族,曾在上世紀90年因大膽前衛的亂序並行設計而風靡。

雖說Alpha也不是申威的自主專利技術(原持有公司為DEC,後輾轉賣給了惠普,於2004年停止研發),但與龍芯使用MIPS一樣,在經過那麼多年的沉淪,把已經「過氣」的舊指令集和架構重新發揚光大,並加入新的構思(異構架構設計),也能算是一種創新,因此申威26010在「自主原創性」方面並不存疑。

申威26010的挑戰

不過,也正因為申威26010是基於DEC Alpha 21264這個專利已過保護期的技術所發展出的產品,且採用了類似英特爾Phi加速處理器的架構設計,「神威太湖之光」勇奪世界第一的背後,恐怕要面臨編程難、使用難、兼容性難等諸多挑戰。

譬如,Alpha早在2004年就停止後續開發了,因此很顯然它不會有開源社區的支持。

因此申威及其使用者就不得不自主維護一套系統和應用生態,而早期有能力參與其中開發的人員相信是十分有限。

此外,申威26010的架構既不像GPU,又不完全是基於CPU,想要合理調用計算加速,在編程上也需要額外學習成本,今天大量懂得OpenCL或CUDA編程的軟體工程師們恐怕也無法順利平移到「神威太湖之光」。

當然,申威還是主要以突破美國封鎖、掌握晶片核心技術為目的的項目,沒有那麼高的通用性或許並不是迫在眉睫的問題。

文章出處:網易


請為這篇文章評分?


相關文章