高通是如何在驍龍 855上改進性能,遊戲和人工智慧功能的
文章推薦指數: 80 %
在高通公司2018年的Snapdragon峰會上,該公司宣布了他們最新的高端級旗艦晶片組:Snapdragon 855平台。
這款新產品將成為2019年大部分旗艦產品的核心,通過Snapdragon X50數據機帶來令人難以置信的數據速度。
除此之外,Snapdragon 855還為每個片上系統模塊帶來了一系列改進,其中一些計算單元在最近的歷史中實現了最大的同比性能和功效提升。
例如,我們已經詳細介紹了Spectra 380 ISP-CV,它進一步改善了智慧型手機攝影,同時還為用戶提供了健康的電池節省。
雖然我們越來越多地關注像Hexagon DSP這樣的外圍組件,但是發燒友最關注的核心模塊 - 即CPU和GPU - 新的工藝節點,以及在體系結構改進和移動方面也獲得了超過適度的收益。
在本文中,我們將快速回顧Snapdragon
855的CPU,GPU和DSP的新特性和已知內容,以及改進和新功能如何影響2019年的用戶體驗。
基於A76的Kryo 485 CPU又轉向7nm
Snapdragon(驍龍) 855轉向台積電最新的7nm FinFET製造工藝。
我們通常每年或每兩年看一次工藝節點修訂,縮小或中期優化(例如從Samsung-LSI節點中的「Low-Power Early」(LPE)轉變為「Low-Power
Plus」(LPP)),所以你很可能在一些或另一篇新聞文章中聽說過這些指標。
但是這是什麼意思?在這種情況下,它描述了處理器電晶體特性的大小,這反過來讓我們了解每一代新電晶體可以實現的電晶體密度的改進,通過每單位面積集成更多的電晶體,可以擴大處理器的最終性能。
此功能也很重要,因為較小的工藝節點允許處理器設計以較小的規模實現,這直觀地縮小了處理器元件之間的空間,從而縮短了電子必須行進以完成計算的距離。
這使得網絡性能得到改善,較小的工藝也具有較低的電容,這意味著電晶體可以以較低的延遲和較低的能量打開和關閉。
作為參考,台積電宣稱其7納米工藝的性能和功率效率分別達到20%和40%提升,儘管這與台積電自己的10納米FinFET工藝相比的結果。
對於過去幾款Snapdragon旗艦晶片組,我們看到高通與三星合作,實施了14nm和10nm LPP / LPE工藝。
然而,考慮到三星的7nm工藝剛於10月份進入批量生產,台積電7nm的Snapdragon 855並不出人意料,儘管當時據報導將推出5G高通晶片組。
此外,三星的7nm LPP設計採用改進的光刻技術 - 極紫外光刻(EUVL)製造,與10nm
FinFET前代產品相比,在相同的設計複雜度下,面積減少了40%,速度提高了20%,功耗降低了50%。
每個新的跳轉到較小的工藝節點都是精確的,因為它們很難實現。
例如,隨著電晶體變小,它們可能會顯示更大的「泄漏」或流過「關閉」電晶體的電流,從而增加空閒狀態下的靜態功耗。
雖然具有更密集的電晶體數量的較小晶片可能允許最大限度地利用給定的矽晶片,但由於上述泄漏,產量往往較低,而且難以獲得以其(高)參考頻率運行的「更高分檔(higher
binned)」的處理器。
這些只是當一個新的工藝節點進入大規模生產時所解決的許多開發障礙中的一部分,但簡而言之,有許多研發和製造挑戰增加了新工藝尺寸晶片的市場成本。
最新的ARM A76架構獲得Kryo 485許可,是我們對Qualcomm Snapdragon 855進行大幅度逐年改進的另一個重要貢獻者.A76核心是ARM奧斯汀辦事處全新的空白板岩設計(blank slate
design),採用全新設計微架構從頭開始構建,提供ARM稱之為「具有移動效率的筆記本電腦級性能。
」它仍然是一種半定製設計,高通公司已經進行了改進,例如優化數據預取以提高效率,並且更大訂單執行窗口。
與Snapdragon
845的Gold核心基於A75相比,這種新設計提供了一些巨大的性能改進:它可以實現35%的性能提升和40%的更高功效。
當將7nm工藝的A75與7nm工藝的A76進行比較時,在750mW
/核心的相同功率範圍內,新核心的性能優勢增加到40%,節能也可以攀升至50%。
此外,非對稱單指令多數據(ASIMD)流水線和點積指令的其他改進將機器學習任務的性能提高了約3.9倍,如卷積神經網絡中的推理。
所有這些都達到了業界領先的每面積性能,並且是對新7nm工藝的有力補充,高通的2.84GHz「Prime內核」接近於ARM在詳細介紹新內核時使用的3GHz參考時鐘速度。
總而言之,高通公司承諾在845上提升45%的CPU性能,這是迄今為止最大的同比提升。
說到Snapdragon 855的「Prime核心」,考慮到ARM的DynamIQ技術平台對big.LITTLE的改進,看到高通公司採用這種新的集群設置也就不足為奇了。
從本質上講,DynamIQ在多核處理器設計中允許更大的靈活性和可擴展性,允許在給定集群中進行多核設計,以及細粒度的每核電壓控制。
A76特別適合這種具有自己時鐘功能的單獨高級內核,因為它在單線程性能方面有所突破,比A75每時鐘整數指令多25%,ASIMD高出35%和浮點性能,同時提供90%更高的內存帶寬。
簡而言之,A76比前幾代產品更具代代相傳,這無疑促成了高通公司Snapdragon 855的同比業績大幅增長(參考資料顯示,高通公司表示,該產品提升了25%至30%。
在835上845)。
這可能足以讓高通Snapdragon
855的性能領先於三星LSI在Exynos 9810中發現的Mongoose 3(M3)核心,儘管這種特殊設計遭遇了高通晶片沒有的功率效率,以及Snapdragon 855最有可能也不會。
這對最終用戶意味著什麼?當然,我們應該期待增加基準核心 -
ARM項目移動Geekbench基準測試得分提高28%,Javascript性能提高35%。
除了可能與終端用戶體驗關係不大的基準測試外,A76還延續了A75對持續性能的關注,這意味著用戶應該期望在長時間的遊戲過程中減少限制。
轉向7nm與新的核心設計相結合,絕對會為最終用戶帶來顯著的電池壽命改善,這可能是這套升級中最具吸引力的功能。
新的'Prime'核心也很有趣,因為專注於頂級單線程性能的單獨核心可以證明在整個應用程式和流程中是有益的,而這些應用程式和流程並未設置為適當利用多線程。
當然,7nm製造工藝也會進一步影響Snapdragon
855的其他模塊,與其他涉及日常用戶體驗的計算單元(例如智慧型手機攝影的圖像處理)相比,可以節省相同的功率。
'Snapdragon Elite遊戲體驗'和Adreno 640 GPU
鑒於Fortnite和PlayerUnknown的Battlegrounds等遊戲的流行以及移動電子競技在亞洲越來越受歡迎(是的,這是一件事),Qualcomm Snapdragon 855在這次重點關注遊戲,這是一個不足為奇的事件。
根據高通公司在Newzoo
2017年全球遊戲市場報告中顯示的數據,移動遊戲趨勢正在上升,預計2018年總收入為703億美元,占所有博彩收入的51%,這要歸功於同比增長25.5%。
Adreno 640 GPU為圖形性能帶來了20%的健康提升,進一步提升了高通公司在這一特定領域的競爭優勢。
不過,作為參考,Snapdragon 845比Snapdragon 835提升了30%,Snapdragon 835本身也比Snapdragon
821提升了30%。
儘管如此,這仍然會使高通在圖形性能方面保持領先,最重要的是,如果他們能夠在這方面做出改進,那麼每瓦特的性能仍將保持領先。
除此之外,高通公司對於Adreno一如既往地保密:我們聽說過用於電源管理的集成微控制器,以及640如何具有最低的驅動器開銷,儘管該公司確實提到包含50%以上的電源管理算術邏輯單元(ALU)將進一步加速AI性能。
高通公司花了很多時間談論簡報是他們希望將「基於物理的渲染」(PBR)帶入更多的移動遊戲體驗。
PBR是一種陰影模型,允許逼真的圖形渲染,根據紋理中表示的材質或曲面的細分來精確地建模光流。
這允許遊戲中的對象正確地模仿真實世界材料的視覺屬性,包括正確渲染微表面,如擦傷和鏡面高光。
然而,最顯著的改進在於它如何能夠更準確地描繪所有表面的反射率和光澤度,甚至包括平面和不透明(模擬)材料的表面。
高通和流行的Unity引擎背後的開發人員一直致力於使PBR更易於訪問,但該公司還與其他引擎和遊戲開發商合作,為Snapdragon設備優化手機遊戲。
Unity,Unreal,Messiah和NeoX等遊戲引擎已經針對Snapdragon設備進行了優化,而Snapdragon 855則支持最新的圖形API,如新的Vulkan 1.1。
像Lineage
II:Revolutions一樣落後於NetMarble的工作室過去也曾與Qualcomm合作,以最好地展示Snapdragon平台的優勢。
此外,通過Snapdragon 675,我們看到了一種自定義算法的討論,與同樣的平台相比,優化後的janks減少了90%,同樣的變化已經進入了Snapdragon
855.它仍然不明確這些優化需要什麼,我們不希望它們適用於每個遊戲,但它絕對意味著更好的性能,至少在Android上更大的遊戲。
最重要的是,雖然Snapdragon 835和845允許回放和分別捕獲10位真正的HDR視頻,但Qualcomm Snapdragon
855將成為第一款支持真正HDR遊戲的移動晶片組。
這將需要真正具有HDR功能的顯示器,這在旗艦智慧型手機中越來越常見。
因此,用戶可以期待更豐富的色彩,更多的色調深度,更高的動態範圍(如名稱所暗示)和更高的對比度。
這不一定是必備功能,但鑒於目前的HDR遊戲設置需要昂貴的HDR電視和顯示器,以及功能強大的計算機和特定的遊戲控制台,這當然是件好事。
使用Qualcomm Snapdragon
855,遊戲中的HDR可以說更容易訪問(當然沒有觸摸屏控制)。
用於AI工作負載的新型Hexagon 690 DSP
雖然該公司沒有在其營銷材料中明確稱其為「神經處理單元」,但AI工作負載也將受益於新的和改進的Hexagon 690 DSP。
高通公司很久以前就悄然推出了這些協處理器(正確引入了QDSP6 v6和820),但直到最近他們才開始將它們作為AI的更好的SoC模塊。
最初設計用於加速成像工作負載,DSP的架構 - 特別是包含Hexagon Vector eXtensions(HVX) -
非常適合ML任務。
DSP比固定功能硬體更具可編程性,同時仍保留了特定應用特定處理器模塊的一些性能和效率優勢,大大加速了標量和矢量運算。
這被證明適用於可以卸載到DSP的不斷變化的圖像處理算法,但自然也適用於AI工作負載。
Hexagon
DSP憑藉其出色的硬體級多線程和並行計算,在每個處理周期內處理數千位矢量單元,與平均每個CPU內核數百位相比,一直是邊緣設備機器學習的福音。
循環,並為多個卸載會話提供服務。
Hexagon DSP特別適用於成像任務,因為它可以將數據直接從成像傳感器傳輸到DSP的本地存儲器(L2緩存),從而繞過設備的DDR存儲器控制器。
例如,谷歌在推出自己的Pixel Visual Core之前,使用Hexagon DSP的圖像處理技術為Pixel和Pixel 2的HDR +算法提供動力。
它也是Hexagon準備好的設備,可以看到流行的Google
Camera埠的最佳效果,您可以在這裡探索。
它已被用於虛擬和增強現實工作負載,著名的是在聯想Phab 2 Pro和華碩ZenFone AR上為現已解散的Project Tango提供支持。
也就是說,大多數採用Snapdragon旗艦設備的OEM都採用Hexagon DSP以某種方式進行圖像處理,您可以使用Snapdragon Profiler等工具進行驗證。
那麼新的DSP有什麼新東西? Hexagon 690將矢量加速器(HVX)的數量從兩個增加到四個,與四個標量螺紋串聯工作,其性能也提高了20%。
最重要的是,Hexagon 690帶有Hexagon Tensor
Accelerator(HTA)的第一個移動張量加速器。
這是一個重要的補充:它用作昂貴的矩陣乘法的硬體加速,並且還在硬體級集成了非線性函數(如sigmoid和ReLU),進一步加快了推理速度。
DSP的這些變化應轉化為更好的語音助理性能,例如從熱字檢測到設備上命令解析,提供改進的回聲消除和噪聲抑制。
Qualcomm強調他們提供了一個完整的異構計算平台,允許AI工作負載進入CPU,GPU或DSP,或三個塊的任意組合 - 用Qualcomm的Gary Brotman的話說,這是「不止一個核心,它是不僅僅是硬體,它還是一個完整的系統「。
他們的第四代「Qualcomm AI Engine」也超越了硬體,因為我們也發現支持Snapdragon Neural Processing
SDK和Hexagon NN來訪問前面提到的塊,以及Android NN API和流行的ML框架,如Caffe / Caffe 2,TensorFlow / Lite和ONNX(開放式神經網絡交換)。
總的來說,包括GPU中的額外ALU和上述CPU中的新指令,Snapdragon 855的原始AI性能是其前代產品的三倍(與華為相比是原來的兩倍),超過每秒7萬億次操作(TOPs)
)。
但請記住,高通公司繼續專注於異構計算解決方案而不是專注於單個專用模塊。
總之,Snapdragon 855的計算軟體包帶來了近年來我們看到的一些更具影響力的年度改進。
Spectra 380 ISP-CV,我們在一篇單獨的文章中介紹,也帶來了性能和功效的巨大提升,實現了出色的新功能,如4K 60FPS HDR視頻錄製,縱向模式或背景交換(非常靈活!)。
正如本文所解釋的那樣,這些進步和新功能應該在整個用戶體驗中切實體現。
(完)
傳LG正研發第二款移動處理器 定位高端
此前就有傳聞稱,LG準備推出全新處理器以對抗老對手三星電子。日前,據業內人透露,LG的第二款移動處理器叫作Nuclun 2,預計會用在LG未來的旗艦手機上。
小米6三星S8重啟原因指向驍龍835 台積電卻偷笑
近期新上市的兩款旗艦新機小米6和三星S8深陷重啟門,而小米6還有WiFi斷流情況。兩者均使用高通驍龍835處理器,因此重啟門事件主因直指驍龍835,高通公司目前尚未回應。那麼這鍋高通該不該背呢?
厲害了我的哥 台積電7nm工藝將領先Intel五年
台積電作為一家晶片製造商,知名度一直以來都被英特爾和三星死死壓制,很多人並沒有意識到台積電也是移動處理器市場的「巨頭」之一,但是包括蘋果、Nvidia和聯發科等大廠商都是台積電的客戶之一,今年i...
全球首個7nm晶片麒麟980亮相,為什麼大家都在追7nm?
9月5日,華為展示了其最新一代手機晶片麒麟®980,這款手機晶片是全球最早商用TSMC 7nm工藝的手機SoC晶片,集成69億電晶體,實現了性能與能效的全面提升。而搭載麒麟980的華為Mate2...
3D電晶體加身 英特爾下一代Atom處理器性能快三倍
英特爾的Atom處理器在移動市場混得並不好,主要原因是上網本死得早,智慧型手機領域又不敵ARM。不過,依託自己強勁的半導體製造業務,英特爾正漸漸扳回局面。在下一代移動處理器領域,英特爾很可能要反...
聯發科新旗艦處理器曝光 12核心7nm工藝
中關村在線消息:在手機處理器核心數上,聯發科一向是激進主義者。據外媒報導,全球最大的專業集成電路製造服務企業台積電將攜手聯發科試驗集成12核的7納米處理器,新的旗艦處理器預計將比之前的10納米晶...
AMD、高通7nm處理器齊發力,2019年Intel還能如日中天嗎?
時間來到了2018年年末,在x86的PC市場卻是風起雲湧,消息不斷。在PC領域Intel和AMD兩家公司一直處於不斷競爭的狀態。雖然至06年以來,Intel在處理器市場一直處於領跑的地位。但是從...
被稱為「最佳遊戲處理器」的i9-9900K也沒擺脫英特爾的設計困擾?
雷鋒網消息,上周英特爾宣布推出一系列新款處理器,其中第九代酷睿i9-9900K處理器被稱為市場上「最佳遊戲處理器」。i9-9900K基於英特爾現有的14nm工藝,擁有8個物理內核和 16 線程,...
64核Zen 2處理器解析:AMD正在改變X86市場遊戲規則
X86處理器是英特爾發明的,長期以來在X86市場上英特爾都是有絕對優勢的,最新統計顯示AMD在今年Q3季度的整體CPU市場份額上首次突破10%,這統計的大概是最近幾年的份額,縱觀歷史AMD在C...
原創蘋果黑科技——解讀A9系列處理器
每次蘋果發布新的設備,新處理器都是其中最吸引人的元素之一,而每一次蘋果新處理器帶來的強悍性能和極為出色的能耗比表現都令人驚訝。這一次,蘋果又帶來了A9系列處理器:包括使用在iPhone上的A9和...
蘋果 A12 處理器性能強大到讓對手望塵莫及!
蘋果 iPhone XS 和 iPhone XS Max 均搭載了 A12 仿生晶片,採用台積電的 7 納米工藝製造。2018 年的 iPhone 是目前唯一一款大量採用 7nm SoC 內置的...
蘋果A12每平方毫米電晶體比A11多70%
IT之家9月27日消息 蘋果iPhone XS和iPhone XS Max均搭載了A12仿生晶片,採用台積電的7納米工藝製造。2018年的iPhone是目前唯一一款大量採用7nm SoC內置的智...
領先對手三年!英特爾最強10nm工藝完全碾壓台積電、三星
近幾年,「摩爾定律失效」是近兩年來業界討論的熱門話題。隨著製程工藝在物理層面越來越接近極限,摩爾定律所詮釋的「當價格不變時,集成電路上可容納的元器件的數目,約每隔18-24個月便會增加一倍,性能...
高通公司確認新一代的驍龍 855移動處理器將採用7nm工藝製造
高通公司已經證實有傳言稱Snapdragon 855晶片組將採用台積電代工廠的7納米工藝製造。 這款最新的移動處理器晶片的小批量生產已經在進行中,並且高通公司的客戶們已經收到了樣品。