華為TaiShan能把ARM伺服器做起來嗎?

文章推薦指數: 80 %
投票人數:10人

2019年伊始,當華為重磅發布ARM處理器晶片鯤鵬920時,即意味著基於ARM的華為TaiShan系列伺服器將肩負著新的重要使命。

作為華為布局全棧全場景的智能計算平台的重要一部分,ARM平台意在華為為做大計算領域空間,滿足企業異構計算需求而生。

然而當多個圖謀ARM伺服器領域的「前輩」折戟沉沙時,華為這個後來者又如何在ARM數據中心陰影中走出一條光明之路?既然決心投入於此,當初定的小目標又實現了幾何?

說得現實點,至今為止,華為到底構建了怎樣的ARM計算解決方案能力?被客戶接受的程度是什麼?在那個關鍵的生態問題上,華為的ARM「朋友圈」又是什麼樣子?

在日前於福州召開的華為生態夥伴大會上,這些問題我們得以解開。

總之來說,答案超出預料。

長期的ARM創「芯「戰略

謀定而後動!實際上,華為在ARM架構處理器領域的探索已經超過了15年

早在2004年,華為就與ARM公司開展合作,啟動基於ARM架構相關晶片的開發,涵蓋智能終端、通信、存儲、伺服器等各個領域。

2009年,華為推出智慧型手機處理器K3,也就是麒麟晶片的前身,如今麒麟晶片已經把手機帶入智慧時代。

2014年華為推出存儲型處理器Hi1610。

2016年華為推出鯤鵬916伺服器處理器。

直至今年重磅發布的鯤鵬920。

一步一個腳印,華為在ARM創「芯」之路上走得異常堅實而堅決。



如果說初期ARM處理器產品是華為面向數據中心存儲、計算領域的試水之作。

那麼鯤鵬916的推出和鯤鵬920的橫空出世,則是要真正應驗「鯤鵬凌雲、泰山聚勢「,其是把TaiShan伺服器全面帶向數據中心的重磅產品。

從最初的產品能用,到匹配業界中端水平、覆蓋主流應用場景,再到業界領先的製程和技術,華為鯤鵬處理器在競爭力維度實現了跟隨、持平到超越的步伐。

不妨再來看看鯤鵬920的實力:

  • 高性能處理器內核:如果說處理器是伺服器的核心,那麼內核則是核心中的核心。

    基於華為在晶片研發的長期積累,鯤鵬920處理器內核實現自主設計,同頻單線程性能相比前一代提升45%,滿足高性能應用場景和對數據安全有要求的特定場景。

  • 高集成度:鯤鵬920處理器採用業界領先的7nm先進工藝,集成最多64核,並支持最高3.0G Hz的工作主頻,實現極致的多核架構和低時延表現,滿足高並發、低時延應用的計算需求。

    此外,鯤鵬920處理器還集成了南橋、網卡和SAS控制器等功能,節省了伺服器系統能耗並提升了系統PCIe擴展能力。

  • 高吞吐能力:鯤鵬920處理器業界率先支持8通道內存控制器和PCIe 4.0,相比業界,內存帶寬提升46%,IO速率提升66%。

    這些數據吞吐能力的提升對於CAE仿真、氣象仿真和基因分析等HPC應用場景非常關鍵。

  • 硬體加速引擎:除了上述提到的一系列晶片功能的集成,鯤鵬處理器還集成了數據加密/解密、壓縮/解壓縮、EC(Erasure Code)糾刪碼、數據校驗等硬體加速引擎,能夠替代處理器的指令計算,極大提升數據處理效率,並提升數據安全。



面向未來,華為甚至已經開始著手規劃未來五年的鯤鵬處理器產品,在數據中心領域ARM產品的投入決心可見一斑。

構建五大TaiShan ARM應用場景解決方案

如果說鯤鵬處理器體現的是華為長遠的戰略輸出,那麼基於鯤鵬處理器和TaiShan伺服器的ARM解決方案則是聚勢而為。

對於在什麼場景下能夠發揮鯤鵬處理器的技術優勢,並為客戶帶來什麼樣的實際價值,華為明顯是做了深度思考。

基於自身強大的硬體和工程創新能力,華為從晶片、伺服器整機,到系統全方位地構建解決方案能力

具體策略方面,華為明顯是有的放矢,並不打算全面開花,而是結合實際情況,聚焦大數據、分布式存儲、ARM原生、HPC和Web等五大應用場景,為客戶提供最優的計算解決方案,幫助實現高效能計算和降低數據中心TCO。

下面以華為打造的前三大TaiShan ARM解決方案舉例:

1 TaiShan大數據場景

目前大數據的主流計算框架是分布式計算模型MapReduce,它的原理是將大數據量切分成多個獨立的、較小的數據集,從而實現對大數據量的分布式處理。

如果能在一個計算節點上提升多個任務或獨立Task進程的並發能力,則能夠有效提升大數據計算性能和效率。



鯤鵬的多核計算架構則完美匹配這種多線程、高並發的典型業務模型。

為此,華為在構建TaiShan大數據解決方案時,主要從以下幾方面開展研究:

  • 優化大數據組件的數據處理流程,提升計算並行度。

  • 充分發揮TaiShan領先的內存能力,優化內存設置和系統Cache預取。

  • 優化大數據開發工具包JDK(Java Development Kit),提升ARM平台運行效率。

  • 利用鯤鵬920處理器內置的加密、壓縮、EC等硬體加速引擎,提升大數據性能。

對比TPC benchmark測試,華為TaiShan大數據方案相比傳統方案能夠提升30%性能

2 TaiShan分布式存儲場景

分布式存儲將數據分散存儲在多台獨立的伺服器存儲硬碟上,集群中的節點之間會有大量數據和管理信息的交互、輸出,節點的並發處理能力對集群的整體性能影響很大。

鯤鵬多核架構的特性則可以有效地解決單個節點並發處理能力不足的問題,提升整個集群的整體性能。

華為TaiShan分布式存儲解決方案主要進行了如下優化措施:

  • 針對HDD、NVMe SSD等不同類型的硬碟採取匹配的處理器核配置策略,確保一個或多個物理的處理器核支持單個數據硬碟,避免進程切換,提升性能。

  • OSD節點的空閒CPU核運行RGW業務,無需部署獨立的RGW節點,提升單位節點的處理器核使用率。

  • 利用鯤鵬920處理器內置的一系列硬體加速引擎,提升整體存儲性能。

華為TaiShan 分布式存儲解決方案,相對於傳統解決方案,在全NVMe SSD熱數據場景下,整體性能提升10%以上;在NVMe SSD與HDD混合型的溫數據場景下,能減少10%的伺服器數量;在全HDD冷數據應用場景,集群能耗低10%以上

3 TaiShan ARM原生場景

由於市場上超過80%的移動應用是基於ARM指令集的安卓應用,因此,安卓應用與ARM伺服器屬於原生同構。

安卓應用與ARM伺服器天然兼容,無需移植即可直接運行,而且運行過程中無指令翻譯環節,性能無損失,相比傳統方案最高能夠提升3倍性能。



ARM雲手機則是ARM原生應用的典型場景之一,通過在ARM伺服器上運用虛擬化仿真技術,為用戶提供基於雲的仿真手機服務。

它能夠完美解決終端測試、移動娛樂和移動辦公場景下的性能體驗、維護管理,以及數據安全的相關需求。

當前面向不同行業的應用需求,主要有三種ARM雲手機類型:

  • 面向網際網路行業的託管型雲手機,滿足移動APP開發的手機自動化仿真測試。

  • 面向遊戲行業的遊戲型雲手機,提供免安裝、支持即點即玩的高性能雲手機服務。

  • 面向企業的辦公型雲手機,提供數據不落地的雲手機辦公解決方案。


基於TaiShan伺服器的雲手機方案


那麼,TaiShan ARM雲手機解決方案又該如何構建?簡單理解,它有點類似於移動端的VDI(虛擬桌面),需要雲端硬體層、雲端軟體層等端到端的解決方案。

基於華為雲的ARM雲手機服務已經構建了一整套的ARM原生解決方案能力,包括硬體層以TaiShan伺服器為核心,並使能各類異構資源(GPU、內存)、加速單元資源。

軟體層包括固件、作業系統和安卓仿真環境。

雲端和用戶設備間傳輸指令流,圖像在手機側渲染,可以提供更高的幀速率、減小帶寬消耗和網絡延時。

總結來說,華為選擇了ARM計算擅長的應用場景進行解決方案能力的構建,這對於開拓一個全新的市場尤為重要。

以點帶面,讓客戶看到ARM計算的獨特價值才能獲得更大的機會。

華為TaiShan的成功突破

華為發布的三大ARM計算解決方案在企業用戶側已經得到了應用,並且是成功的。

例如某平安城市ARM架構大數據分析平台項目,成功部署了1000+台TaiShan伺服器,是目前國內規模最大的ARM架構大數據集群。

支持10類大數據集群,集群性能完全滿足設計要求,系統運行穩定。

成功部署只是基礎,更重要的是可以看到,基於鯤鵬處理器的高效能和高集成度優勢,TaiShan伺服器整機功耗相比傳統伺服器有明顯的能耗優勢。

在該項目的實際部署情況中, TaiShan伺服器充分利用機櫃供電能力,實現單機櫃能夠部署多30%的計算節點,集群減少23%的部署機櫃數量,降低了20%的集群能耗,給客戶帶來整體TCO降低10~20%的顯著價值。

在分布式存儲方面,也獲得了某銀行的成功應用。

其採用華為TaiShan伺服器成功構建了銀行業第一個PB級容量的ARM架構分布式存儲集群

由於是銀行業首次應用ARM架構伺服器,銀行首先從自身積累了大量經驗的開源分布式存儲系統切入,定期跟蹤伺服器內部運行指標和監測金融業務系統的運行穩定情況,並與華為團隊通過大量系統級測試和優化工作,有效驗證了TaiShan伺服器應用在各項金融業務場景中的可行性。

與同等配置和存儲容量的傳統集群相比,TaiShan集群的整體功耗降低20%以上,能夠有效提升整體數據中心的資源部署密度及利用率。

迄今為止,該集群平穩運行,達到了銀行設計預期的業務性能目標,有效地支持了生產數據的實時存儲和備份。

在雲手機服務上,基於TaiShan ARM伺服器的雲手機服務,幫助華為內部研發團隊進行移動應用開發的手機自動化仿真測試,擺脫對真機的依賴,研發團隊的相關驗證工作可以提前3個月完成,極大加速了新產品的研發進度。

事實上,雲手機服務已經在國外遊戲廠商得到商業實踐,在整個行業內也已經處於驗證和部署的前期,隨著此類應用服務模式的普及甚至爆發,也必將給華為TaiShan帶來巨大的機會。

說到這,不妨再來用一個數據側面驗證下華為TaiShan的市場情況。

據了解,當前基於ARM架構的TaiShan相關產品已經實現在運營商、金融、政府、製造、網際網路等行業的部署與應用,2018年的應用規模數已經突破了2萬台/套,實現了規模化應用的市場檢驗,也反饋出市場對於華為TaiShan伺服器產品的接受度。

可以說,華為TaiShan已經形成突破。

TaiShan的生態之花

當然,從突破到深化,從一點到整面,還缺不了一項十分重要的工作—生態。

好的計算硬體平台還需要好的生態體系來支撐,如何將TaiShan伺服器的創「芯「能力轉化成面向客戶的計算解決方案,生態建設尤為關鍵。

在產業生態領域,華為有著這樣的規劃:從硬體、基礎軟體和應用三個層面持續推進ARM產業合作,計劃通過3到5年的時間,協同ARM產業組織,打造完備的TaiShan產業生態

其實,目前TaiShan的生態合作已經取得較大進展,生態體系已經相對比較完善。

這體現在四個維度的使能方面:

  • 基礎硬體使能:支持兼容業界主流的存儲硬碟、網卡和FPGA等硬體板卡或加速部件產品;
  • 基礎軟體使能:支持覆蓋國內外的業界主流作業系統、大數據、軟體定義存儲,以及資料庫、虛擬化、雲平台和Web的基礎軟體;
  • 行業應用使能:華為聯合行業夥伴,構建TaiShan行業解決方案,目前已經在金融、政府、電力、運營商和平安城市等行業實現應用使能;
  • 產業標準化使能:華為積極深度地參與GCC、Linaro、OEHI等ARM產業組織工作,與產業鏈夥伴攜手制定並推出基於ARM的伺服器合規計劃ServerReady,同時也已經成為Linaro生態組織的核心成員。

當然,在生態建設上,基於ARM架構的華為TaiShan要想一口吃成胖子也不可能。

殊不知,即使如x86這樣強大的存在,英特爾也在持續不遺餘力地投入在生態完善上。

所以,迎接ARM計算的是一條長長的生態之路



好在華為有著其擅長的生態基因,這在華為2011年進入企業業務的發展歷程中可以看出。

在華為中國生態夥伴上,華為還重磅啟動了智能計算生態聯盟,這預示著華為智能計算在AI產業和ARM伺服器產業的生態建設日趨完善。

以「技術+生態」雙輪驅動的模式,華為正在攜手產業鏈的所有合作夥伴開出繁茂的ARM生態之花


請為這篇文章評分?


相關文章 

AI晶片之上,華為正在放眼「下一次計算革命」

未來的計算會是什麼樣的形式?今天,雲計算和 AI 正在改變著許多行業,但也有很多人對新技術能夠做到什麼表示懷疑。華為也曾是這樣。這家科技巨頭在過去的幾年中進行了大量內部探索,只想知道:人工智慧在...

滿足客戶多場景需求 華為讓智能計算無死角

好的開始是成功的一半。2019年剛剛開始,華為又有了大動作。回想兩周前,華為剛剛舉辦了首屆華為智能計算大會暨中國智能計算業務戰略發布會。在會上,華為宣布在2019年推出全球首個AI管理晶片,內建...