解密神威系統裝配的國產「申威1600」中央處理器

文章推薦指數: 80 %
投票人數:10人

「神威·太湖之光」取代「天河二號」登上榜首,中國超算上榜總數量首次超過美國名列第一。

基於全球最快超級計算機「神威·太湖之光」系統的三項全機應用入圍國際高性能計算應用領域最高獎--戈登貝爾獎。

中國芯又一次獲得大滿貫。

在這裡不得不提一下其中的一位幕後「英雄」——申威。

無論是傳統紙媒還是網絡媒體,申威的曝光率比起龍芯、海思、展訊等國產晶片都要低得多,而且相比於嘲諷天賦技能被點滿的龍芯,申威極少成為網媒和充滿虐氣的網民的攻擊對象。

申威的軍方背景更是給它帶一縷神秘的色彩。

下面,讓我們一起走進申威,解密申威的「芯」路歷程。

神威藍光計算機系統裝配的國產「申威1600」中央處理器

1、申威的誕生

上世紀60-70年代末,中國在高性能計算機領域也曾有過自己的輝煌——哈軍工曾經製造出具有分時作業系統和彙編語言、FORTRAN語言及標準程序庫的441B系列計算機。

北京大學、北京有線電廠等單位聯合研製150計算機。

清華大學、北京無線電三廠研製生產了130、131、132、135、140、152、153系列計算機近千台。

國防科大成功研製出151計算機,華東計算技術研究所成功研製1001中型集成電路計算機和HDS-9計算機,其中HDS-9計算機每秒運算達500萬次,更為難能可貴的是,這些計算機的軟體和硬體是中國人自己編譯和製造的。

但在80年代因迷信「造不如買、買不如租」、「市場換技術」等理論,放棄了自主晶片的研發轉而大量外購國外晶片。

從80年代的銀河1超算開始,到90年代的銀河2、銀河3,曙光系列超級計算機都沒有中國「芯」,在技術上始終受制於人。

即使是在幾年前的天河2號上,也只有4096片飛騰1500作為計算節點前端處理器,而飛騰1500是在SUN的UltraSPARC T2基礎上做的改進版本。

為解決在超算和國防、信息安全無「芯」可用的困境。

總參謀部第五十六研究所(無錫江南計算技術研究所)於2003年開始著手設計中國人自己的高性能晶片。

申威從此踏上了征途。

2、申威的娘家

申威由總參謀部第五十六研究所(無錫江南計算技術研究所)設計,上海高性能集成電路設計中心是56所的馬甲。

該研究所創建於1951年6月,坐落於無錫。

主要研究方向有計算機系統結構、並行/分布處理與智能計算機系統、計算機軟體、人工智慧與智能控制、計算機與通信、計算機信息處理與應用。

八十年代以來,在計算機、通信及機電一體化等領域共榮獲國家、軍隊科學技術成果獎300多項,其中國家科學技術進步特等獎3項,軍隊科學技術進步一等獎35項。

1987、2000年,中央軍委兩次為56所榮記集體一等功。

1993年中央軍委授予56所「勇攀科技高峰先進研究所」榮譽稱號。

3、申威的指令集和技術淵源

申威屬於Alpha陣營,指令集也是基於Alpha進行擴展。

申威的技術來源是於DEC的Alpha 21164。

DEC的技術實力很強,Alpha性能更是驚艷,AMD就曾經購買了Alpha 21264的技術資料,挖走了部分DEC的技術人員後,開發出自己的K7微結構。

DEC是技術實力比人強,但商業模式不如人而失敗的典型例子,Alpha也被幾經轉手,先被康柏收購,後被惠普雪藏。

目前Alpha已經被束之高閣,指令集和微結構都已經不再更新,技術專利大多已過期或快過期了。

申威是目前Alpha陣營中僅存的碩果,擁有自主擴展指令和發展路線的自主權。

4、自主可控體系構建

申威和龍芯作為國內碩果僅存的兩個走自主可控路線的IC設計單位,和龍芯一樣在積極構建自己的軟硬體體系以保障從軟體和硬體兩個方面實現安全可控。

申威開發了自己的神威睿智編譯器,研發了基於Linux的神威睿思作業系統。

加上超算領域不像PC領域那樣存在軟體生態的掣肘,申威構建自主技術體系的道路可謂一片坦途——於2012年9月投入使用的神威藍光超算使用了8704片申威1600,搭載神威睿思作業系統,實現了軟體和硬體全部國產化。

5、申威歷程

56所(江南所)以Alpha指令集為基礎,擴展出自己的指令集,並在2006年設計出具有自主微結構的申威1,申威1是一款130nm製程工藝的單核心CPU,主頻900MHz,集成5700萬電晶體。

2008年完成的申威2,是一款130nm製程工藝的雙核CPU,主頻1.4GHz。

如果說申威1和申威2更像是56所磨礪技藝的作品,是對Alpha21164技術的消化吸收,那麼2010年研發的申威1600則是56將國外技術融會貫通後,推陳出新的產品。

申威1600是一款65nm製程工藝的16核CPU,主頻1.1G,雙精浮點140G。

申威1600被用於神威藍光超算。

也許是因Alpha當年強悍的性能,本人對源自Alpha的申威抱有很高的期望。

但根據國家高性能集成電路設計中心公布的論文顯示,申威1600的SPEC2000測試分數只能說是差強人意,唯有性能功耗比和LINPACK測試聊以自慰。

平心而論,雖然申威1600處理器的單核性能有限,但16核的可擴展性很好,實現了比較理想的多核性能加速比。

2012年,56所研製出申威1610和申威410,申威1610為40nm製程的16核CPU,集成10億電晶體,主頻1.6G,最大功耗50W,雙精浮點運算200G。

申威410為40nm製程的4核CPU,集成2.7億電晶體,主頻1.6G。

前者用於伺服器,後者用於PC,支持中標麒麟作業系統。

這兩款產品同樣遭遇了龍芯在PC市場遇到的軟體生態貧乏和產業聯盟弱小導致產品缺乏市場競爭力的困境,加上申威410單核性能太弱,搭載申威410的安全可信PC基本不具備在民用PC市場的競爭力。

2014年底,申威5成功流片。

根據一篇由坐落於無錫的數字工程與先進技術國家重點實驗室和坐落於北京的國家並行計算機工程技術研究中心聯合發布的論文,申威5很有可能是一款集成了4個管理核心和256個運算核心的高性能眾核CPU,雙精浮點運算超過1T,核內 linpack效率93%,並有很高的性能功耗比。

6、神威藍光超算

神威藍光超算總投資6億元,於2012年9月投入使用。

神威藍光超級計算機使用了8704片申威1600,搭載神威睿思作業系統,實現了軟體和硬體全部國產化。

神威藍光超算峰值計算性能1PFlops(一千萬億次每秒),持續性能為0.796PFlops,性能功耗比超過741MFlops/W(百萬次浮點運算/秒?瓦),LINPACK效率為74%。


請為這篇文章評分?


相關文章 

「神威·太湖之光」背後的功臣

6月20日,德國法蘭克福國際超算大會(ISC)公布了新一期全球超級計算機TOP500榜單,由國家並行計算機工程技術研究中心研製的「神威·太湖之光」以超第二名近三倍的運算速度奪得第一。這兩天,神威...