步步緊逼!英特爾至強E7 v3對決IBM POWER8

文章推薦指數: 80 %
投票人數:10人

ZDNet至頂網伺服器頻道 06月02日 新聞消息(文/趙效民):在高端關鍵伺服器領域(4插槽或以上級別),自從IBM出售了其x86伺服器業務之後,與英特爾決絕交鋒的意味也就更加明顯了,而2015年5月6日正式發布的至強E7 v3處理器家庭,無疑是這場交鋒中最新的入局者。

有關高端伺服器發展的必要性,我想在此已無需多言。

雖然Scale-Out的架構獲得了廣泛的認同,但不得不承認,在某些應用場景下,Scale-Up系統仍然有其存在的必要性。

當越來越多的應用和數據在雲時代不斷向後台集中時,對於當前很多關鍵業務,尤其是對響應速度、準確性、關聯複雜度有較高要求的負載,是否真的是廉價的雙路伺服器配以Scale-Out架構就能搞定的呢?顯然不是,這就好比HPC(高性能計算)領域中的OpenMP(單系統)與MPI(集群)架構之分,理論上講機器內部的通訊速度與響應時間永遠要好於分布式的互聯,這種本質上的區別也預示著單靠其中一種架構都不可能獨霸天下。

事實上,也正是因為信息處理量的急劇提升,也讓關鍵業務伺服器在大規模即時數據分析與在線交易等應用中的地位更加突顯。

也正是基於這樣的應用需求,英特爾與IBM都不會放棄這一市場,反而會不斷的對這一級別的伺服器進行創新、變革。

而最終的交鋒對象就是E7與POWER8(在主流的應用伺服器市場,IBM也希望用POWER來對抗英特爾至強E5,但這不在本文的討論範圍)。

在去年4月,筆者就當時發布的E7 v2進行了性能分析,可以看出E7的性能有了明顯的進步,在與POWER8的競爭中,已經有了比肩的可能,而時隔一年之後,E7 v2的接班人的表現又會怎樣呢?今天我們就來看一看!

至強E7 v3的主要改進和規格提升

E7 v3相對於E7 v2的提升之處(圖中藍色字部分)

相對於E7 v2,E7 v3重點提升部分的優勢說明,這裡有必要提醒大家關注一下TSX(Transactional Synchronization Extensions),在我看來,這是其最主要的功能性改進之一

E7 v3屬於英特爾TOCK級的產品線,即核心架構進行了較大的改良,代號Haswell-EX,而E7 v2則是TICK級產品(代號IvyBridge-EX)。

相較E7 v2,E7 v3的主要提升在於:

l 處理器核心數量從15個提高到18個

l 支持第二代AVX指令集,雙精度浮點處理性能提升一倍

l QPI速率從8GT/s提升到了9.6GT/s

l 支持DDR4內存,最高速率1866MT/s

l 內存緩衝速率從2667MT/s提升至3200MT/s

l 新一代RAS(可靠性、可用性與可維護性)設計:第二代MCA架構(eMCA 2.0)/多列內存備用/DDR4地址與命令信號校驗與恢復/關鍵內存區鏡像等

l 一些核心與電源管理的增強設計(如虛擬化方面的支持)。

E7 v3不再有面向雙插槽系統的2800系列,而且4800與8800系列也進行了結合,按照一個統一的「系統平台空間」(基礎-標準-高級,而非嚴格按照插槽數量)進行型號的劃分,也因此相較E7 v3,主流型號(SKU)少了一半,同時新增加了4款面向HPC(高性能計算)的型號

E7 v3家族所有成員規格列表

有關於E7 v3非常細節的技術設計(比如嶄新的內部雙環互聯架構),並不是本文的重點,有興趣的讀者可以自行找資料深入了解。

不過有一點我覺得有必要重點說一下,那就是TSX,即交易同步擴展指令集(Transactional Synchronization Extensions)。

其實,TSX本來就是Haswell的一個新能力,但發布之後即發現了Bug,所以立刻在晶片內部禁用,至強E5v3亦受到此影響而取消了這一功能,如今這一問題在E7 v3上得以修復,正式投入使用。

TSX的目標是針對傳統「內存鎖」的,所謂的內存鎖,是一種防止不同線程操作相同內存區域的機制,以防止數據發生同步問題,這一點在交易處理中非常重要。

在實際的應用中,單一時間段里,內存鎖賦予單一線程鎖定內存的能力,在這一狀態下,其他線程不可以訪問相應的內存數據,即使是讀取也不可以,所以在並行處理中,其他線程要等到內存鎖才能獲得內存訪問的權限,顯然這個設計對於線程關聯較為緊密的應用效率是有很大阻礙的。

而TSX則打破了這種傳統的束縛,可以讓軟體在開發者不用再擔心如何利用內存鎖,而應用的實際效率也獲得了明顯提升。

我個人認為,TSX可算是E7 v3帶給應用開發者最大的禮物,在某種程度上講,它所帶來的性能收益要遠高於硬體規格本身的提升。

英特爾TSX的說明,分為硬體鎖省略(HLE,Hardware Lock Elision)和受限事務內存(RTM,Restricted Transactional Memory)兩種模式


請為這篇文章評分?


相關文章