高通是如何在驍龍 855上改進性能,遊戲和人工智慧功能的

文章推薦指數: 80 %
投票人數:10人
高通全新的驍龍 855移動處理器平台

在高通公司2018年的Snapdragon峰會上,該公司宣布了他們最新的高端級旗艦晶片組:Snapdragon 855平台。

這款新產品將成為2019年大部分旗艦產品的核心,通過Snapdragon X50數據機帶來令人難以置信的數據速度。

除此之外,Snapdragon 855還為每個片上系統模塊帶來了一系列改進,其中一些計算單元在最近的歷史中實現了最大的同比性能和功效提升。

例如,我們已經詳細介紹了Spectra 380 ISP-CV,它進一步改善了智慧型手機攝影,同時還為用戶提供了健康的電池節省。

雖然我們越來越多地關注像Hexagon DSP這樣的外圍組件,但是發燒友最關注的核心模塊 - 即CPU和GPU - 新的工藝節點,以及在體系結構改進和移動方面也獲得了超過適度的收益。

在本文中,我們將快速回顧Snapdragon 855的CPU,GPU和DSP的新特性和已知內容,以及改進和新功能如何影響2019年的用戶體驗。

基於A76的Kryo 485 CPU又轉向7nm

Snapdragon(驍龍) 855轉向台積電最新的7nm FinFET製造工藝。

我們通常每年或每兩年看一次工藝節點修訂,縮小或中期優化(例如從Samsung-LSI節點中的「Low-Power Early」(LPE)轉變為「Low-Power Plus」(LPP)),所以你很可能在一些或另一篇新聞文章中聽說過這些指標。

但是這是什麼意思?在這種情況下,它描述了處理器電晶體特性的大小,這反過來讓我們了解每一代新電晶體可以實現的電晶體密度的改進,通過每單位面積集成更多的電晶體,可以擴大處理器的最終性能。

此功能也很重要,因為較小的工藝節點允許處理器設計以較小的規模實現,這直觀地縮小了處理器元件之間的空間,從而縮短了電子必須行進以完成計算的距離。

這使得網絡性能得到改善,較小的工藝也具有較低的電容,這意味著電晶體可以以較低的延遲和較低的能量打開和關閉。

作為參考,台積電宣稱其7納米工藝的性能和功率效率分別達到20%和40%提升,儘管這與台積電自己的10納米FinFET工藝相比的結果。

對於過去幾款Snapdragon旗艦晶片組,我們看到高通與三星合作,實施了14nm和10nm LPP / LPE工藝。

然而,考慮到三星的7nm工藝剛於10月份進入批量生產,台積電7nm的Snapdragon 855並不出人意料,儘管當時據報導將推出5G高通晶片組。

此外,三星的7nm LPP設計採用改進的光刻技術 - 極紫外光刻(EUVL)製造,與10nm FinFET前代產品相比,在相同的設計複雜度下,面積減少了40%,速度提高了20%,功耗降低了50%。

每個新的跳轉到較小的工藝節點都是精確的,因為它們很難實現。

例如,隨著電晶體變小,它們可能會顯示更大的「泄漏」或流過「關閉」電晶體的電流,從而增加空閒狀態下的靜態功耗。

雖然具有更密集的電晶體數量的較小晶片可能允許最大限度地利用給定的矽晶片,但由於上述泄漏,產量往往較低,而且難以獲得以其(高)參考頻率運行的「更高分檔(higher binned)」的處理器。

這些只是當一個新的工藝節點進入大規模生產時所解決的許多開發障礙中的一部分,但簡而言之,有許多研發和製造挑戰增加了新工藝尺寸晶片的市場成本。

最新的ARM A76架構獲得Kryo 485許可,是我們對Qualcomm Snapdragon 855進行大幅度逐年改進的另一個重要貢獻者.A76核心是ARM奧斯汀辦事處全新的空白板岩設計(blank slate design),採用全新設計微架構從頭開始構建,提供ARM稱之為「具有移動效率的筆記本電腦級性能。

」它仍然是一種半定製設計,高通公司已經進行了改進,例如優化數據預取以提高效率,並且更大訂單執行窗口。

與Snapdragon 845的Gold核心基於A75相比,這種新設計提供了一些巨大的性能改進:它可以實現35%的性能提升和40%的更高功效。

當將7nm工藝的A75與7nm工藝的A76進行比較時,在750mW /核心的相同功率範圍內,新核心的性能優勢增加到40%,節能也可以攀升至50%。

此外,非對稱單指令多數據(ASIMD)流水線和點積指令的其他改進將機器學習任務的性能提高了約3.9倍,如卷積神經網絡中的推理。

所有這些都達到了業界領先的每面積性能,並且是對新7nm工藝的有力補充,高通的2.84GHz「Prime內核」接近於ARM在詳細介紹新內核時使用的3GHz參考時鐘速度。

總而言之,高通公司承諾在845上提升45%的CPU性能,這是迄今為止最大的同比提升。

說到Snapdragon 855的「Prime核心」,考慮到ARM的DynamIQ技術平台對big.LITTLE的改進,看到高通公司採用這種新的集群設置也就不足為奇了。

從本質上講,DynamIQ在多核處理器設計中允許更大的靈活性和可擴展性,允許在給定集群中進行多核設計,以及細粒度的每核電壓控制。

A76特別適合這種具有自己時鐘功能的單獨高級內核,因為它在單線程性能方面有所突破,比A75每時鐘整數指令多25%,ASIMD高出35%和浮點性能,同時提供90%更高的內存帶寬。

簡而言之,A76比前幾代產品更具代代相傳,這無疑促成了高通公司Snapdragon 855的同比業績大幅增長(參考資料顯示,高通公司表示,該產品提升了25%至30%。

在835上845)。

這可能足以讓高通Snapdragon 855的性能領先於三星LSI在Exynos 9810中發現的Mongoose 3(M3)核心,儘管這種特殊設計遭遇了高通晶片沒有的功率效率,以及Snapdragon 855最有可能也不會。

這對最終用戶意味著什麼?當然,我們應該期待增加基準核心 - ARM項目移動Geekbench基準測試得分提高28%,Javascript性能提高35%。

除了可能與終端用戶體驗關係不大的基準測試外,A76還延續了A75對持續性能的關注,這意味著用戶應該期望在長時間的遊戲過程中減少限制。

轉向7nm與新的核心設計相結合,絕對會為最終用戶帶來顯著的電池壽命改善,這可能是這套升級中最具吸引力的功能。

新的'Prime'核心也很有趣,因為專注於頂級單線程性能的單獨核心可以證明在整個應用程式和流程中是有益的,而這些應用程式和流程並未設置為適當利用多線程。

當然,7nm製造工藝也會進一步影響Snapdragon 855的其他模塊,與其他涉及日常用戶體驗的計算單元(例如智慧型手機攝影的圖像處理)相比,可以節省相同的功率。

'Snapdragon Elite遊戲體驗'和Adreno 640 GPU

鑒於Fortnite和PlayerUnknown的Battlegrounds等遊戲的流行以及移動電子競技在亞洲越來越受歡迎(是的,這是一件事),Qualcomm Snapdragon 855在這次重點關注遊戲,這是一個不足為奇的事件。

根據高通公司在Newzoo 2017年全球遊戲市場報告中顯示的數據,移動遊戲趨勢正在上升,預計2018年總收入為703億美元,占所有博彩收入的51%,這要歸功於同比增長25.5%。

Adreno 640 GPU為圖形性能帶來了20%的健康提升,進一步提升了高通公司在這一特定領域的競爭優勢。

不過,作為參考,Snapdragon 845比Snapdragon 835提升了30%,Snapdragon 835本身也比Snapdragon 821提升了30%。

儘管如此,這仍然會使高通在圖形性能方面保持領先,最重要的是,如果他們能夠在這方面做出改進,那麼每瓦特的性能仍將保持領先。

除此之外,高通公司對於Adreno一如既往地保密:我們聽說過用於電源管理的集成微控制器,以及640如何具有最低的驅動器開銷,儘管該公司確實提到包含50%以上的電源管理算術邏輯單元(ALU)將進一步加速AI性能。

高通公司花了很多時間談論簡報是他們希望將「基於物理的渲染」(PBR)帶入更多的移動遊戲體驗。

PBR是一種陰影模型,允許逼真的圖形渲染,根據紋理中表示的材質或曲面的細分來精確地建模光流。

這允許遊戲中的對象正確地模仿真實世界材料的視覺屬性,包括正確渲染微表面,如擦傷和鏡面高光。

然而,最顯著的改進在於它如何能夠更準確地描繪所有表面的反射率和光澤度,甚至包括平面和不透明(模擬)材料的表面。

高通和流行的Unity引擎背後的開發人員一直致力於使PBR更易於訪問,但該公司還與其他引擎和遊戲開發商合作,為Snapdragon設備優化手機遊戲。

Unity,Unreal,Messiah和NeoX等遊戲引擎已經針對Snapdragon設備進行了優化,而Snapdragon 855則支持最新的圖形API,如新的Vulkan 1.1。

像Lineage II:Revolutions一樣落後於NetMarble的工作室過去也曾與Qualcomm合作,以最好地展示Snapdragon平台的優勢。

此外,通過Snapdragon 675,我們看到了一種自定義算法的討論,與同樣的平台相比,優化後的janks減少了90%,同樣的變化已經進入了Snapdragon 855.它仍然不明確這些優化需要什麼,我們不希望它們適用於每個遊戲,但它絕對意味著更好的性能,至少在Android上更大的遊戲。

最重要的是,雖然Snapdragon 835和845允許回放和分別捕獲10位真正的HDR視頻,但Qualcomm Snapdragon 855將成為第一款支持真正HDR遊戲的移動晶片組。

這將需要真正具有HDR功能的顯示器,這在旗艦智慧型手機中越來越常見。

因此,用戶可以期待更豐富的色彩,更多的色調深度,更高的動態範圍(如名稱所暗示)和更高的對比度。

這不一定是必備功能,但鑒於目前的HDR遊戲設置需要昂貴的HDR電視和顯示器,以及功能強大的計算機和特定的遊戲控制台,這當然是件好事。

使用Qualcomm Snapdragon 855,遊戲中的HDR可以說更容易訪問(當然沒有觸摸屏控制)。

用於AI工作負載的新型Hexagon 690 DSP

雖然該公司沒有在其營銷材料中明確稱其為「神經處理單元」,但AI工作負載也將受益於新的和改進的Hexagon 690 DSP。

高通公司很久以前就悄然推出了這些協處理器(正確引入了QDSP6 v6和820),但直到最近他們才開始將它們作為AI的更好的SoC模塊。

最初設計用於加速成像工作負載,DSP的架構 - 特別是包含Hexagon Vector eXtensions(HVX) - 非常適合ML任務。

DSP比固定功能硬體更具可編程性,同時仍保留了特定應用特定處理器模塊的一些性能和效率優勢,大大加速了標量和矢量運算。

這被證明適用於可以卸載到DSP的不斷變化的圖像處理算法,但自然也適用於AI工作負載。

Hexagon DSP憑藉其出色的硬體級多線程和並行計算,在每個處理周期內處理數千位矢量單元,與平均每個CPU內核數百位相比,一直是邊緣設備機器學習的福音。

循環,並為多個卸載會話提供服務。

Hexagon DSP特別適用於成像任務,因為它可以將數據直接從成像傳感器傳輸到DSP的本地存儲器(L2緩存),從而繞過設備的DDR存儲器控制器。

例如,谷歌在推出自己的Pixel Visual Core之前,使用Hexagon DSP的圖像處理技術為Pixel和Pixel 2的HDR +算法提供動力。

它也是Hexagon準備好的設備,可以看到流行的Google Camera埠的最佳效果,您可以在這裡探索。

它已被用於虛擬和增強現實工作負載,著名的是在聯想Phab 2 Pro和華碩ZenFone AR上為現已解散的Project Tango提供支持。

也就是說,大多數採用Snapdragon旗艦設備的OEM都採用Hexagon DSP以某種方式進行圖像處理,您可以使用Snapdragon Profiler等工具進行驗證。

那麼新的DSP有什麼新東西? Hexagon 690將矢量加速器(HVX)的數量從兩個增加到四個,與四個標量螺紋串聯工作,其性能也提高了20%。

最重要的是,Hexagon 690帶有Hexagon Tensor Accelerator(HTA)的第一個移動張量加速器。

這是一個重要的補充:它用作昂貴的矩陣乘法的硬體加速,並且還在硬體級集成了非線性函數(如sigmoid和ReLU),進一步加快了推理速度。

DSP的這些變化應轉化為更好的語音助理性能,例如從熱字檢測到設備上命令解析,提供改進的回聲消除和噪聲抑制。

Qualcomm強調他們提供了一個完整的異構計算平台,允許AI工作負載進入CPU,GPU或DSP,或三個塊的任意組合 - 用Qualcomm的Gary Brotman的話說,這是「不止一個核心,它是不僅僅是硬體,它還是一個完整的系統「。

他們的第四代「Qualcomm AI Engine」也超越了硬體,因為我們也發現支持Snapdragon Neural Processing SDK和Hexagon NN來訪問前面提到的塊,以及Android NN API和流行的ML框架,如Caffe / Caffe 2,TensorFlow / Lite和ONNX(開放式神經網絡交換)。

總的來說,包括GPU中的額外ALU和上述CPU中的新指令,Snapdragon 855的原始AI性能是其前代產品的三倍(與華為相比是原來的兩倍),超過每秒7萬億次操作(TOPs) )。

但請記住,高通公司繼續專注於異構計算解決方案而不是專注於單個專用模塊。

總之,Snapdragon 855的計算軟體包帶來了近年來我們看到的一些更具影響力的年度改進。

Spectra 380 ISP-CV,我們在一篇單獨的文章中介紹,也帶來了性能和功效的巨大提升,實現了出色的新功能,如4K 60FPS HDR視頻錄製,縱向模式或背景交換(非常靈活!)。

正如本文所解釋的那樣,這些進步和新功能應該在整個用戶體驗中切實體現。

(完)


請為這篇文章評分?


相關文章 

厲害了我的哥 台積電7nm工藝將領先Intel五年

台積電作為一家晶片製造商,知名度一直以來都被英特爾和三星死死壓制,很多人並沒有意識到台積電也是移動處理器市場的「巨頭」之一,但是包括蘋果、Nvidia和聯發科等大廠商都是台積電的客戶之一,今年i...

聯發科新旗艦處理器曝光 12核心7nm工藝

中關村在線消息:在手機處理器核心數上,聯發科一向是激進主義者。據外媒報導,全球最大的專業集成電路製造服務企業台積電將攜手聯發科試驗集成12核的7納米處理器,新的旗艦處理器預計將比之前的10納米晶...

原創蘋果黑科技——解讀A9系列處理器

每次蘋果發布新的設備,新處理器都是其中最吸引人的元素之一,而每一次蘋果新處理器帶來的強悍性能和極為出色的能耗比表現都令人驚訝。這一次,蘋果又帶來了A9系列處理器:包括使用在iPhone上的A9和...