AMD 32核心深度揭秘:堆一起真不容易!

文章推薦指數: 80 %
投票人數:10人

如果說Ryzen在桌面上完美歸來,為重塑公司和產品形象奠定了基礎,那麼今天發布的EPYC(霄龍)伺服器平台,就是AMD全面扭轉競爭態勢的天王山戰役。

多年前,AMD因為各種原因離開了利潤豐厚的、廣闊的x86伺服器市場,現在終於回來了!

EPYC伺服器處理器和桌面、移動領域的Ryzen一樣,都是基於全新的Zen架構,但是針對伺服器、數據中心做了大量的針對性設計和優化,畢竟這些領域對於軟硬體的要求都太高了。

AMD也毫不吝嗇地公布了有關EPYC平台的大量細節,其中凝聚了眾多工程師的心血,值得細細品味,當然很多細節技術性都比較強,我們也不會過多地深入,就帶著大家大致了解一下。

【伺服器版的Zen架構】

Zen架構在設計之初,就充分考慮了不同市場領域的適應性,桌面、移動、伺服器(數據中心)都要靠這一套架構拿下,這和Intel近些年的理念也是類似的。

Zen微架構設計,EPYC、Ryzen是相通的,包括核心與緩存配置,AMD從數據中心應用角度做了重新梳理介紹,也可以參考我們此前的解析。

當然,Zen架構也有諸多面向伺服器和數據中心的針對性設計,比如大數據負載、虛擬化增強、安全加密增強。

除了標準指令集,EPYC還增加了大量新的指令集,更好地優化數據中心應用,其中既有和Intel通用的,也有兩條AMD獨有的:CLZERO(清理緩存行)、PTE Coalescing(4K頁表合併為32K)。

虛擬化方面也加入了不少新指令集,包括Data Poisoning內存錯誤處理、AVIC高級虛擬化中斷控制器、Nested Virtualization嵌套虛擬化、SME安全內存加密、SEV安全加密虛擬化。

虛擬化延遲,可比推土機架構降低50%。

52% IPC(每時鐘周期指令集)的架構性能提升,EPYC同樣是適用的。

【數據中心優化】

EPYC的設計原則有四個方向,包括每路能力、Fabric互連、內存、IO,接下來都會涉及到。

AMD認為,現有的雙路系統存在諸多局限,比如IO擴展有限、配合第二路CPU才能有完整IO、CPU間專用連結無法擁有其他IO、平台需要PCI-E切換和晶片組等。

EPYC重點改進了這些方面,無需PCI-E每雙路系統就能提供多達128條PCI-E,整合晶片組為SoC單晶片設計,支持全新的Infinity Fabric互連。

即使是單路EPYC,擴展性依然充足,包括128條PCI-E、所有連結都能用於IO、四個IO Hub、完整支持PCI-E P2P。

EPYC每顆處理器都能提供128條PCI-E,單路系統中可全部用於外部IO,雙路系統中各拿出64條用於兩顆CPU互連,然後各有64條對外IO,總計還是128條。

相比之下,Intel單路平台僅40條,雙路也才80條。

EPYC集成了一套獨立的安全子系統,整合的AMD安全協處理器(ARM Cortex-A5架構的32位控制器),運行於安全的系統/內核,可以確保固件數據等片外非易失性存儲的安全,提供安全加密功能,並可實現硬體驗證啟動。

SME安全內存加密是基於硬體的,可以保護物理內存免受攻擊,單個安全密鑰,作業系統/虛擬器管理器可以自己選擇需要需要加密的頁面,而網絡、存儲、顯卡等硬體設備可以無縫訪問加密頁面。

SEV安全加密虛擬化則可以保護虛擬機免受其他虛擬你、非法管理員、不信任虛擬機管理器的傷害,每個虛擬機和管理器都有獨立的秘鑰,彼此加密隔離,並與AMD現有的AMD-V虛擬化技術整合。

針對虛擬化,EPYC在二三級緩存、核心間延遲、緩存和內存拓撲方面都做了優化。

企業級的RAS(可靠性/可用性/可服務性)也是一應俱全。

Infinity Fabric總線串聯起了EPYC系統的幾乎所有部分,具備低延遲、可伸縮性、可擴展性等特點,並有SCF、SDF兩層控制與管理結構,將處理器、顯卡、加速器、內存等有機地結合起來。

SCF可以提供SoC和系統級的連接與控制,並提供安全增強、電源管理、遠程管理等。

EPYC的有效內存帶寬可以達到290GB/s,相比於Broadwell Xeon高出多達150%。

同時從單路到雙路的性能擴展幾乎完美,可以提升多達98%。

【IO與互連】

內存方面,EPYC每路支持八個DDR4通道,每通道最多兩條,也就是每路可以搭配最多16條內存,包括RDIMM、LRDIMM、NVDIMM-N、3DS DIMM等各種類型,頻率最高2667MHz,容量最高2TB。

EPYC每顆內部都有四個獨立內核,彼此之間如何通信是個大問題,這同樣仰仗張Infinity Fabric,每兩個內核之間都可以直連(共六條),雙向帶寬42GB/s,並且延遲很低(具體多少沒說)。

而在兩顆EPYC處理器之間,也有四條Infinity Fabric,每個內核與另一顆處理器內的配對內核相連(單個帶寬38GB/s總計152GB/s),這樣任意兩個內核彼此通信,最多只需要兩跳。

單路和雙路EPYC都可以對外提供八個x16連結(總計128 PCI-E),能任意拆分組合,每連結雙向帶寬32GB/s,合計256GB/s,支持各種PCI-E特性並整合了SATA。

單路擴展性都能完勝Xeon。

EPYC是一個SoC單晶片設計,整合了晶片組(SCH),可提供平台時鐘發生器、計時器、實時時鐘、中斷、UART、四個USB 3.0、兩個SMBus、六個I2C、SPI、GPIO等等。

AMD很大方地公布了各處互連的帶寬數據,不過延遲只是說很低,沒有具體指標。

雙路系統:64核心、4TB內存、128條PCI-E。

單路系統:32核心、2TB內存、128條PCI-E。

【電源管理】

在一套典型的雙路伺服器系統中,處理器的功耗占了整體的53%,當然是首要的優化對象,排第二的內存也只占14%。

EPYC集成了先進的電源管理系統,整個處理器內部遍布上千個傳感器,32個核心都能以1毫秒的間隔實時調節狀態。

全方位的功耗和溫度監控,可以根據工作負載,實時適應性調整運行狀態,尤其是頻率,以確保不超過功耗限制。

精細的電壓和頻率控制,可以根據功耗分布,讓處理器運行在最佳狀態,活躍核心較少的時候可以自動提高頻率。

我們知道,每顆處理器的體質都不一樣,包括溫度、漏電率等都會有差異,而有的環境需要在各種條件下保持性能一致,有的則要求始終發揮最高性能,為此EPYC可以在啟動時選擇任何一種運行狀態。

EPYC的熱設計功耗也是可以根據需要調節的,需要高性能的就加強,需要低功耗的就削弱一些,比如180W的最高可以到200W,最低則可以到165W。

伺服器應用基本都可以讓所有核心都跑起來,但此時無論負載高低,默認各個核心都會運行在高頻率,造成浪費,AMD則加入了新的算法,可以根據負載程度動態優化,能效可提升最多10%。

EPYC雖然可以提供充裕的帶寬,但並不是所有應用都需要全部帶寬,EPYC就可以進行適應性調節,能將能效再提升最多8%。

EPYC每一個內部都有四個內核,總計32個核心,如何讓它們平衡地運行在最佳狀態,難度是極大的,AMD能針對每一個核心進行管控,避免不同核心負載失衡,並降低功耗。

結果呢,反正就是比Intel更高的性能、更低的功耗。


請為這篇文章評分?


相關文章 

Arm開闢新戰線背後|半導體行業觀察

來源:內容由 公眾號 半導體行業觀察(ID:icbank)翻譯自「nextplatform」,謝謝。編者按:近來,全球最大的IP供應商Arm正在面向基礎設施業務推出一個全新的產品線。在一個全新的...

Opteron到EPYC, AMD十四年後再度挑戰intel

在過去很長一段時間內,英特爾在伺服器晶片市場以高達99%市場份額處於壟斷地位,如同PC市場一樣,缺乏競爭的市場環境導致了B端或C端用戶的選擇缺失,數據中心市場的眾多企業和供應商也不得不選擇價格居...