轉發《那個想挑戰Intel的中國晶片公司,背後都有什麼故事?》

文章推薦指數: 80 %
投票人數:10人

收藏文章 評論(104)隨著天河2號成為全球運算最快的超級計算機,並在2015年國際超級計算機大會上蟬聯5連冠,國防科大和飛騰CPU逐漸走進我們的視野。

國防科大研究計算機技術起步於50年代末,50多年來,國防科大在心酸和淚水、鮮花與掌聲交織之中,艱苦奮鬥,自強不息,一步一個腳印地走出了從模仿到超越的旅程。

一、國防科大

國防科大是國防部和教育部雙重領導下的國家重點綜合性大學,前身是1953年創建於黑龍江省的哈爾濱市軍事工程學院。

1970年學校主體南遷長沙,改名為長沙工學院,1978年改建為國防科技大學。

國防科大現有10個學院,下設40多個系、所、實驗室,其中有國家重點實驗室4個、教育部重點實驗室1個,共有10個國家重點學科處於國內領先水平。

在2007-2009年全國一級學科整體水平評估中,計算機科學與技術、信息與通信工程、系統科學、光學工程、管理科學與工程、航空宇航科學與技術等6個學科進入前5名。

(國防科大)

二、國防科大計算機學院

計算機學院起步於1958年,1966年成立全國第一個電子計算機系,1971年擴建成計算機系兼研究所,1999年成立計算機學院。

學院下設計算機科學與技術系、網絡工程系、計算機研究所、軟體研究所、微電子與微處理器研究所、網絡與信息安全研究所、並行與分布處理國家重點實驗室和銀河計算機工廠。

計算機學院是研製國產計算機的老牌單位,在陳賡大將任哈軍工校長期間,就開始著手計算機研發。

在上世紀60-70年代,先後研發出安裝有分時作業系統和彙編語言、FORTRAN語言及標準程序庫的441B系列計算機,該型計算機在軟體和硬體方面實現全部國產化,共生產100餘台,在科研和教學領域穩定運行10年以上。

在80年代後又先後研發了銀河系列、天河系列超級計算機,技術底蘊深厚。

共獲部委級三等獎以上科技進步獎500多項,其中國防科技成果特等獎1項、國家發明二等獎1項、國家科技進步一等獎6項、二等獎13項、部委級科技進步一等獎82項、二等獎151項。

在國家5次教學成果評獎中,學院獲得特等獎1次,一等獎2次,二等獎1次。

「計算機體系結構」、「軟體工程」、「編譯原理」、「計算機網絡」、「計算機原理」和「作業系統」6門課程被評為「國家級精品課程」。

《計算機前沿領域的研究》獲全國圖書一等獎,《編譯原理》獲國家優秀教材一等獎,《並行算法》獲第七屆中國圖書獎。

三、善於「借鑑」的國防科大

因80年代迷信「造不如買、買不如租」、「市場換技術」等理論,國防科大放棄了自主晶片的研發轉而大量外購國外晶片。

在80、90年代,國防科大的銀河1、銀河2、銀河3超算都沒有中國芯。

因此,研發自己的CPU就成為國防科大的一項緊迫任務。

相對於從零開始自主研發,「借鑑」國外的產品,將技術消化吸收後,站在巨人的肩膀上顯然擁有更高的研發效率,而且國防科大科研任務多、時間緊、任務重、資金少、科研力量有限,當年在不考慮商業應用,主攻軍用和超算領域的情況下,飛騰「借鑑」國外產品自然成為國防科大計算機學院的必然選擇。

之後,國防科大和一直深耕Mips和Alpha並擴展了指令集,建設自主體系的龍芯和申威不同,飛騰一直沒有一條很明確的技術路線,先後仿製過德儀、INTEL、SUN等公司的產品,前後產品基本沒有多大延續性。

飛騰這種路線雖然在發展初期占優勢,並能較短的時間內拿出性能不錯的晶片,還能鍛鍊一批技術人才,但是因為缺乏技術延續性和技術積累,很容易導致後勁不足和難以構建自己的生態體系。

舉例來說,國防科大先後仿製過德州儀器的DSP、Intel的安騰和Pentium MMX,在imagine基礎上研製過流處理器,仿製過UltraSPARC T2,也有自主研發的飛騰ARM處理器和矩陣2000(DSP),先後換了X86、Epic(VLIW)、SPARC、ARM四個指令集,雖然這些產品都屬於銀河飛騰系列,但是彼此之間完全沒有什麼關係。

(天河1號)

四、飛騰(Sparc)與天河2號

飛騰(Sparc)有飛騰1000和飛騰1500兩款產品。

Sun在被甲骨文收購前將UltraSPARC T2開源,國防科大遂對其進行仿製和改良,成功研發出飛騰1000和飛騰1500兩款產品,並用於天河超算中作為計算節點前端處理器。

飛騰1000為65nm工藝製造,八核64線程,電晶體數目達到3.5億個。

晶片主頻800MHz-1GHz,擁有3個HTT直連總線接口,4個獨立的DDR3內存通道,帶寬達到32GB/s,8個PCIE 2.0通道。

飛騰1500是對飛騰1000的改進升級,是一款40nm的16和晶片,主頻也提升到1.8G,最大功耗65W,雙精浮點144G。

據統計,天河1號使用了2048片飛騰1000作為計算節點前端處理器,天河2號使用了4096片飛騰1500作為計算節點前端處理器。

相對於天河2大量採用的Intel晶片,為天河2號55Pflops超強運算能力打下堅實基礎的架構設計——高效異構協同計算技術、高效易用的用戶編程環境、網絡連接等方面技術能力才更值得我們關注。

四、飛騰(ARM)

自2012年開始,飛騰選擇加入ARM陣營,雖然在發展權上會受制於ARM,還要花費不菲的ARM指令集授權費,但也有可以兼容AA體系的軟體生態上的優勢。

目前,飛騰(ARM)有「火星」和「地球」2款產品。

「地球」是一款4核CPU,微結構是國防科大自主研發的「小米」,是一款桌面CPU。

「火星」的微結構也是「小米」,「火星」擁有64核心,主頻達2G,製程工藝28nm,功耗120W,理論浮點計算能力是512G,擁有32M二級緩存、128M三級緩存和16通道內存,205G/s理論內存帶寬。

晶片上還有32個PCIe 3.0通道。

雖然「火星」單核性能較弱,但依靠核心數量優勢,在Spec 2006跑分中,多核整數分數達672,浮點分數585,足以和Xeon E5-2699v3相媲美。

當然,目前的「小米」還無法與Intel的ivy、haswel相比,即使和龍芯GS464E也有一定差距。

但在ARM陣營中,根據Spec 2006測試成績,單核性能是強於ARM的A57的。

在功耗方面和高通810做參照的話,28nm製程,2G主頻功耗僅僅2W不到,顯然比同樣2G主頻,20nm的A57功耗要小不少。

因此,「小米」顯然是一個優於ARM公版設計的微結構。

國防科大雖然有很強的技術研發能力,但公關營銷、市場推廣能力遠不能和海思、展訊相提並論。

想要在ARM陣營立足,10%-20%的性能優勢沒有太多意義,市場營銷能力強弱、晶片搭載平台穩定性和平台的數量等因素才是關鍵。

畢竟,用ARM公版微結構照樣能在市場上大賣。

國防科大真要想將自主研發的微結構推廣出去,親自上陣賣晶片顯然是以己之短,攻敵之長。

正途是和展訊、海思等購買ARM微結構的IC設計公司加強合作,向展訊、海思推銷國防科大研發的IP核,使其能集成到展訊、海思的SOC中去。

五、GPU

國內做GPU的有兩家公司,一家是兆芯,技術源自被VIA收購的美國S3公司;另一家是和國防科大有很深淵源的景嘉微電子(當然,十有八九是國防科大的馬甲)。

景嘉微電子是國家火炬計劃重點高新技術企業,和國防科大有很深的淵源。

公司位於長沙,公司的三位創始人都畢業於國防科大,而且最初的一批骨幹成員也大多來自國防科大。

目前有員工300餘人,共申請國家發明專利83項,其中已授權專利33項。

產品涵蓋晶片設計、板卡、整機和小型系統等,神舟飛船、軍用戰機等都曾搭載有景嘉微的產品。

2014年,景嘉微年產值超過2億元,凈利潤達7600餘萬元,目前最好的產品是JM5400。

雖然性能有限,但性能參數和已公開的資料怎麼看都像軍用GPU。

軍用GPU更看重穩定性和可靠性,性能較弱。

因此,就不多介紹了。

下圖為景嘉微的發展計劃。

一般這樣的小公司三年以後的計劃基本可以無視,但景嘉微的背景使本人對它多了幾分期待。

另外,景嘉微和龍芯是合作夥伴,5年後,沒準市場上會出現龍芯CPU或飛騰CPU+景嘉微GPU的組合。

六、天河2A和矩陣2000

在ISC 2015發布會上,國防科大公布了天河2A升級方案,用矩陣2000(DSP)替換被美國政府禁售的PHI。

DSP是數位訊號處理器,廣泛用於雷達、移動通訊、衛星導航、高畫質電視、網絡攝像、可視電話、數位相機、圖像與指紋識別、網絡控制、數字硬碟等領域。

國防科大在DSP方面有較深厚的技術積累。

國防科大早在2004年就研發過一款嵌入式數位訊號處理器YHFT-Q,該處理器用130nm工藝製造,主頻350MHz,雙精浮點11.2Gflops,功耗2.99W。

今年發布的矩陣2000採用40nm製程工藝,擁有16核,主頻1G,雙精浮點2.4T,功耗為200W。

根據國防科大公布的資料,因保留了天河2號的主體I/O結構,計算節點處理器依舊使用E5-2692 V2,計算節點增加到18000個,按照一個計算節點需要2個E5和3個加速器來計算,天河2A需要36000片E5和54000片矩陣2000,僅54000片矩陣2000的理論浮點峰值就可以達到129.6Pflops。

在美國對華禁售用於超算的至強PHI後,國防科大接連對外發布足以替代E5的「火星」和可以替代至強PHI的矩陣2000,既是向美國禁售至強PHI的亮劍,也是公開了天河超算將來的發展方向——矩陣2000替代PHI,走GPDSP路線,創建超算GPDSP體系。

甚至在不遠的將來,不排除會用「火星」或者「火星」的下一代產品替代E5,實現天河超算軟體和硬體的全面國產化。

走GPDSP路線的難點不是晶片,而是軟體堆棧——包括GPDPS驅動程序、作業系統、編譯器、數學庫等,這是一項工程量巨大的工作。

祝國防科大好運!

七、小結

相比於龍芯中科和總參56所,國防科大計算機學院就少了幾分定力和毅力。

在技術路線上存在朝令夕改、朝秦暮楚的問題,客觀上使飛騰沒能像龍芯、申威那樣走出一條自己的路埋下了伏筆。

白璧微瑕,瑕不掩瑜。

國防科大計算機學院技術成就可謂碩果纍纍,本文介紹的關於飛騰、天河超算、GPU僅為冰山一角。

自進入21世紀以來,國防科大以「借鑑」國外先進產品為突破口,學習技術、積攢內功,並在擁有一定技術實力後設計出了「火星」和矩陣2000等擁有自主智慧財產權的產品,在學習借鑑用GPU和眾核處理器做加速器後,在超算領域探索出GPDSP道路,實現了從模仿到自主創新的飛躍。

國防科大不聲不響地拿出了自主架構arm超算晶片,新能已經超過intel Xeon E5-2695 v3

http://www.theplatform.net/2015/ ... -arm-big-iron-chip/

在25日結束的27屆HOT CHIPS 大會上,來自中國的神秘公司Phytium Technology,發布了一款名為"火星「的64核高性能微處理器,該處理器兼容ARM V8指令集。

同時該公司還在開發名為」地球「的另一款CPU。

該處理器64個核心的全局緩存一致性由專門的硬體實現,核間互聯採用2維mesh網格,擁有 32MB L2 cache 、128MB L3 cache, 內存接口為 16通道的 DDR3-1600,兩個pci - express 3.0 x16接口。

晶片的雙精度浮點峰值性能512Gflops,內存帶寬204GB/s ,I/O帶寬32GB/s。

採用28nm工藝,工作頻率 2Ghz,功耗 120瓦特。

有意思的是其每個單核的名字叫」小米「,為超標量架構 支持亂序執行。

這基本上意味著Phytium 擁有ARM的指令集完全的授權。

根據之前的測試結果其單核心的 SPEC_CPU2006_int 分值為19.2,SPEC_CPU2006_fp為17.8 ,

整個晶片的SPEC_CPU20006_rate測試結果為 整數672 ,浮點585。

對比:Xeon E5-2695 v3 (Haswell-EP) 14核:557(整數),410(浮點)

Phytium Technology 的宣講者表示,這款晶片僅是個開始,後續將推出核心更強大,核心數目更多,採用更為先進的生產工藝的高性能處理器。

這晶片是代替天河2號超算英特爾晶片的,和矩陣2000加速卡構成全自主100p超算,美國禁運加速卡玩完。

菊花自主arm架構要加油了。


請為這篇文章評分?


相關文章 

龍芯、飛騰大比拼

據公開消息,龍芯和飛騰最新的產品都與去年年底開始流片,也就是說,新產品即將與國人見面。那麼,在飛騰的ARM晶片和龍芯3A3000即將完成流片之時,筆者將從自主智慧財產權、裸CPU性能和軟體方面...