國產CPU新里程碑!龍芯3號新一代發布,性能追趕AMD

文章推薦指數: 80 %
投票人數:10人


智東西(公眾號:zhidxcom)
文 | 韋世瑋 心緣

智東西12月24日消息,今天,龍芯中科發布龍芯4000系列CPU晶片,分別為3A4000和3B4000。

性能方面,3A4000/3B4000採用28nm FDSOI工藝,微架構為GS464V核心,通用處理性能提升一倍以上,這將成為我國自主CPU發展史上又一新的里程碑。

據悉,龍芯4000系列進一步完善對虛擬機的支持,效率達到95%以上。

在相同主頻下,龍芯4000系列比3A3000的流水線效率提高50%,主頻提升至1.8GHz-2.0GHz。

龍芯中科總裁、中科院計算技術研究所總工程師、龍芯CPU首席科學家胡偉武博士介紹,龍芯4000系列是首次全面集成可信模塊、國內密碼算法、訪問控制等安全機制的CPU晶片。

也就是說,龍芯4000系列處理器除了性能大幅提升之外,還擁有片內安全機制和高效雲化的特點。

據介紹,龍芯在2019年的晶片出貨量已超50萬顆。

未來,龍芯中科將著重提升CPU主頻與核數,3A5000和3C5000兩款晶片將分別計劃在2020年上半年和下半年流片。

▲龍芯中科總裁、中科院計算技術研究所總工程師、龍芯CPU首席科學家胡偉武博士

一、我國自主CPU發展的里程碑

龍芯中科是國產自主高性能通用處理器技術領先者和產品提供商,搭載龍芯中科CPU的計算機已進入政府採購目錄。

龍芯脫胎於中國科學院計算所,曾研發出我國首枚擁有自主智慧財產權的通用高性能微處理晶片。

CPU晶片長期被英特爾等國外巨頭所壟斷,龍芯先推出的龍芯1號、龍芯2號,打破了中國缺自主研發CPU晶片的歷史,是中國形成自主智慧財產權計算機產業道路上的一座里程碑。

從2001年至今,龍芯研發了龍芯1號、龍芯2號、龍芯3號三個系列處理器和龍芯橋片系列。

龍芯1號系列為32位低功耗、低成本處理器,主要面向低端嵌入式和專用應用領域;龍芯2號系列為64位低功耗單核或雙核列處理器,主要面向工控和終端等領域;龍芯3號系列為64位多核系列處理器, 主要面向桌面和伺服器等領域。

今天發布的龍芯3A4000是龍芯3號系列處理器的最新產品,據上一代龍芯3A3000發布已相隔兩年。

2017年時,龍芯年營收達1.5億元,利潤2000多萬元,2018年營收和利潤均比2017年翻番,利潤達到歷史最高水平,交的稅款已超過國家給龍芯各類補助的總和。

胡偉武表示,今年上半年龍芯收入已超過去年全年,利潤是去年全年的1.3倍左右,預計到2021年,龍芯交給國家的稅將超過之前所有的研發投入。

二、採用GS464v架構,實現三大特點

龍芯3A4000是龍芯第三代高性能處理器核,採用新一代處理器架構GS464V,擁有雙DDR4-2400/2133內存通道,雙HT3.0系統總線,效率提升一倍。

性能方面,其主頻為1.8GHz,睿頻2.0GHz,採用37.5mm*37.5mm封裝工藝,典型功耗為30-40W。

據胡偉武介紹,龍芯3A4000主要有三方面特點:

1、相同工藝性能成倍提高

龍芯3A4000採用28nm工藝,進一步通過設計優化提升處理器性能,反映傳統桌面性能的SPEC INT2000的單核base分值,從930分提高到了2090分。

此外,它的科學計算性能與3A3000相比,提升了4倍以上,支持128/256位向量。

而3B4000支持四路直連,與3B3000雙路伺服器相比,四路伺服器性能亦提升了4倍。

與此同時,龍芯3A4000的虛擬機效率大幅度提高,從原先的88%提升至98%。

胡偉武稱,其單核性能已高於用14nm實現的Arm處理器。

2、片內安全機制

龍芯3A4000支持AES、MD5、SHA等加解密算法,片內集成安全可信模塊,支持國密算法。

此外,它支持作業系統內核棧防護機制,支持IO防護、安全執行環境等訪問控制,其高性能密碼算法服務能力支持商密及以上算法。

3、自主研發

龍芯3A4000的所有模塊原始碼和各類全定製模塊均為自主研發,除了廠家提供的標準單元庫和內存編譯器(Memory Compiler)外,沒有任何第三方IP。

除此之外,龍芯3A4000在功耗管理和封裝方面也有了進一步提升。

一方面,它第五個核(GS132E)監控主核運行,並進行動態功耗管理。

例如,搭載龍芯3A4000的筆記本電腦工作時長比3A3000相比,提高了一倍以上;

另一方面,龍芯3A4000的封裝尺寸比3A3000更小,支持普通BGA、LGA和CBGA多種封裝形式,同時其桌面主板可支持四層布線。

值得一提的是,龍芯4000系列用於片間互連及連接橋片的HT控制器帶寬提高了一倍以上,內存控制器從DDR3升級至DDR4,SPEC CPU2006定點和浮點單核分值提高到20分。

但胡偉武也指出,龍芯4000系列處理器依然存在兩大問題。

一是DDR4內存頻率不夠高。

DDR4規定的速率範圍是1600至3200,而龍芯4000系列最高DDR4工作速率為2400/2133,與規定範圍還存在一定差距。

二是功耗偏大。

其非向量模式的典型功耗為30至40W,主要在於工藝不夠先進,設計優化比較極致,建議科學計算環境下使用256位浮點向量時,適當降低電壓和頻率。

三、未來重點突破主頻與核數

胡偉武談到,龍芯的下一步將會把研發重點放在提高主頻與核數上。

一方面,龍芯3A5000將提高主頻至2.5GHz,採用12nm工藝,單核性能將提高至30分左右,計劃於2020年上半年流片。

同時,其內存控制器延遲/寬頻進一步優化,LLC增加一倍,實現作業系統級二進位兼容。

另一方面,龍芯3C5000將增加核數,同樣採用12nm工藝,支持4至16路伺服器,計劃將於2020年下半年流片。

在胡偉武看來,目前國內CPU企業發展核心技術主要有兩個途徑,一是市場換技術,如汽車產業;二是市場帶技術,如航天產業,而龍芯中科走的則是第二條路。

龍芯中科通過體制內市場引導,帶動技術進步後,再進一步參與體制外的市場競爭。

同時,龍芯CPU自主編寫CPU原始碼,在應用中不斷演進,並注重自主CPU的自主生態建設,以逐步提高產品性能和完善生態。

雖然,龍芯發展至今已經為我國半導體產業的崛起提供了不可或缺的力量。

但胡偉武認為,我國自主CPU與國外先進水平相比,在通用處理能力、單核性能和設計能力三大方面還存在較大差距。

「龍芯需要練好內功,通過設計優化提高單核通用處理性能。

」胡偉武說到,3A4000和3B4000已基本填補單核通用處理性能的缺陷,性能提高2至3倍(約20-30分),達到AMD的水平。

而目前,市場主流CPU使用GCC編譯的單核分值為20至40分。

四、龍芯作業系統支持軟體生態建設

胡偉武談到,龍芯的作業系統目前具有兩種商業和技術模式。

面向專門企業,龍芯提供桌面和Windows伺服器系統;面向設備企業,龍芯則基於基礎版開源OS維護,支持OS、整機和應用企業。

實際上,龍芯已面向三大不同的平台開發相應的作業系統:

1、面向通用信息化系統的Loongnix。

該系統基於通用Linux平台進行完善和優化,為統一作業系統UOS龍芯版提供支撐。

2、面向高可靠實時終端的LoongOS。

該系統基於Linux/RT-Linux構建了簡潔高效的OS。

3、面向實時嵌入式應用的LoongWorks。

該系統針對歷史應用,基於VxWorks內核,完善圖形和網絡等API。

另一角度看,龍芯作業系統針對不同的硬體和應用,亦分別提出了兩種不同的二進位兼容。

除此之外,胡偉武也提到,龍芯將進一步統一系統架構,構建標準規範體系,實現作業系統跨主板整機兼容和CPU代際兼容。

從龍芯3A4000開始,龍芯也將參考設計全面支持統一系統架構,開發支持ACPI主板、固件、內核及OS的參考設計,以及基於ACPI/EC筆記本標準的解決方案。

結語:我國自主CPU研發的里程碑

龍芯中科經過近二十年的發展,已經成為我國國產自主高性能通用處理器的技術領先者,不僅打破了我國缺乏自主研發CPU晶片的歷史,同時也是我國形成自主智慧財產權計算機產業道路上的一座里程碑。

近二十年來,龍芯的自主CPU和OS已經趨於成熟。

胡偉武稱,龍芯CPU單核通用處理性能已達到AMD水平,OS成熟度也已接近Windows XP。

然而,龍芯尚未豐富的應用和產業不配套,無疑是擺在自主CPU和OS未來發展道路上的一個阻礙。

未來,龍芯如何完善基礎軟體環境和配套晶片,推動CPU和OS生態的進一步成熟發展,這十分值得我們期待。

感謝閱讀。

點擊關註上船,帶你浪在科技前沿~


請為這篇文章評分?


相關文章 

觀察者網獨家:龍芯,龍芯!你向何處去?

(文 龍科多)龍哥今天終於有機會來寫一寫「龍芯」,曾幾何時,這個相近的名字因為「漢芯」的恥辱,一直被龍哥周圍的朋友所誤解。然而,就在18日的發布會上,龍芯再次讓許多了解它、厚愛它的粉絲「芯」動,...

屬於中國的處理器:龍芯3A2000/3B2000來了!

ZD至頂網伺服器頻道 08月18日 新聞消息(文/張銳):龍芯中科技術有限公司(簡稱龍芯)這個名字,對於熟知英特爾和AMD的人來說或許並不是很熟悉,但是在美國政府禁止企業向中國高性能計算有關部門...