剛剛!英特爾解密全新布局,晶片教父狂懟「摩爾定律悲觀論」

文章推薦指數: 80 %
投票人數:10人

剛剛(北京時間12日23時),英特爾的NDA終於正式解密,就在現場的DT君為大家送上第一手報導。

北京時間 12 日早上,英特爾於加州 Los Altos 舉辦了架構日,揭露未來數年的架構布局,以及未來英特爾應對市場挑戰所將採取的策略。

DT君參與了整個架構日議程,見證英特爾揭露包含異構計算生態布局、CPU 核心架構、GPU 核心架構、存儲技術、數據中心方案等最快在明年就可以和世人見面的最新架構發展。

圖|Raja Koduri 與 Jim Keller 一同出席於加州 Los Altos,仙童半導體與英特爾的聯合創始人 Robert Noyce 故居舉辦的英特爾架構日,共同揭露未來英特爾技術與架構走向。

開場由 Raja 主持,他指出,由於現今社會,人們產生數據的速度已經遠超出現有基礎設施所能處理的速度,因此,未來的社會亟需要更高效率,且規模能夠更彈性擴大的計算架構,他斷言,未來 10 年計算架構的發展將遠超過過去 50 年的速度。

圖|Raja 與 Jim 在英特爾中的工作分擔,二者屬於平行地位,主導未來 GPU 與 CPU 的發展,可說是整個英特爾太極中的兩儀。

而 Jim Keller 登場時,更是不客氣的懟了產業那些高喊摩爾定律已死的傢伙,他表示,在英特爾任職的這幾個月中是他職涯中最有趣的一段,在他看完整個英特爾的技術布局之後,深覺得他能夠發揮的空間極大,身為工程師,解決問題就是最大的樂趣,而他相信能夠在英特爾中獲得極大的樂趣。

而且沒錯,他會讓摩爾定律在未來很長的一段時間內持續下去,要跌破那些評論家的眼鏡。

Raja 剖析了整個計算市場的走向,由於計算產業的轉變,未來英特爾在架構設計上也會越來越靈活,不但核心本身的設計會更接地氣,同時也將更強調不同場景的計算適配,未來不止 CPU 或 GPU,而是將引入更多計算概念,構成 xPU 生態,從各種方向去解決未來計算領域會面對的各種問題。

未來英特爾將針對三大計算領域布局更廣的計算架構,而這些架構將不會像過去一樣在核心設計方面涇渭分明,而是混合了更多元,更具彈性的計算能力,包含 CPU 或 GPU 都是。

不同時代所需要的計算架構不同,Raja 把整個計算軌跡分為三個階段,分別是 2000 年左右的 GHz 時鐘速度階段、2005 年開始的多核階段,以及未來的架構階段,未來架構將是主導整個計算市場的最主要核心。

而由於未來 AI 應用將是主流計算趨勢,為了更好解決來自這方面的計算問題,英特爾也會在其主力架構中增加更多針對包含深度學習、訓練以及推理計算加速的功能區塊,讓英特爾的整體計算架構能更好的因應未來 AI 產業的走向。

當然,Raja 在開場也揭露了英特爾在 CPU 以及 GPU 方面的最新布局,其在 CPU 核心方面,除了大方秀出未來英特爾 CPU 的核心發展路線,並且深入介紹了即將在明年 CES 顯露真身的 Sunny Core 微架構。

另一方面,Raja 也介紹了其最新的 Gen 11 世代繪圖核心,而以其為基礎,未來也將會把規模做大,設計出更符合全方位計算與繪圖應用的獨立 GPU 架構,正面挑戰 AMD 與 NVIDIA。

Raja 也介紹了包含在存儲、封裝以及伺服器的技術布局。

值得一提的是,在封裝領域,英特爾推出的 Foveros 是業界首個真正的 3D 封裝,可以把整個系統封進一顆晶片中,達成真正的 System in Package 概念,遠比目前台積電與三星都在發展的 2D 或 2.5D 封裝技術更為先進。

英特爾預計將從2019年下半年開始使用Foveros推出一系列產品。

首款Foveros產品將結合高性能10nm計算堆疊小晶片和低功耗基礎。

英特爾稱,它將在小巧的外形中實現世界一流的性能和功效結合。

圖|Foveros 封裝技術的側面圖,此封裝技術可做到極薄,約 1mm 的厚度,Raja 也秀出僅有 12mm*12mm 大小的量產晶片。

Raja 也揭露了其 FPGA 的最新布局,作為 xPU 成員中的重要角色,FPGA 不僅在計算方面肩負重責大任,挑起以推理為主的 AI 計算工作,另外在 Interconnector 連接總線中,也成為未來推動總線技術前進的最大動力,通過新架構的建立,提升未來包含PCIE等主流總線傳輸規格。

圖|新款的異構 FPGA 計算方案將會進入 10nm 製程世代,且規模將涵蓋從過去的中低端方案到高端方案,以同一架構,但以不同規模的設計來解決不同層次的計算問題。

圖|下一代 FPGA 晶片將會引入 3D 封裝技術。

與計算架構相對應的是軟體環境,Raja 也宣布了新的 OneAPI 軟體 Stack,可以在單一開發環境之下,開發出針對所有英特爾旗下所有可調整規模計算方案的應用軟體。

針對 AI 計算優化,Sunny Cove 微架構將徹底壓制 AMD 的 Zen 架構

在介紹全新的 Sunny Cove 架構之前,英特爾方面先秀了一張關於近年來層出不窮的晶片漏洞以及對應解決方案,最早是從軟體層面修改來修正已經發生的各種漏洞攻擊,Cascade Lake 更是引入了硬體防範設計,與作業系統配合,在防範手段上更有效率。

未來則是將會嘗試以純硬體方式解決,一方面避免性能損耗,一方面也要更早應對未來硬體資安事件的發生。

接下來,英特爾也介紹了過去在 14nm 架構的發展歷程,可以看到,從最早的 14nm 晶片中,時鐘速度僅能達到 4.2GHz,而到最新一代的產品中,已經可以把時鐘速度拉到 5GHz,雖然同樣是 14nm,但也是有隨著時間不斷強化精進,配合微架構的改善,達到計算效率的明顯增長。

另一方面,未來 CPU 計算也不會只是針對過去認知的一般通用計算,由於 AI 計算已經成為通用計算的一部份,因此針對這方面計算應用的加速也是勢在必行的工作,英特爾在首款 10nm 方案中將引進 VNNI 框架,以及針對深度學習發展全新的指令集來加速深度學習計算的工作。

具體的指令集強化主要是在 INT8/INT16 計算工作的強化,由於這是 AI 推理工作最常使用的精度,因此主流 AI 計算架構都是針對這方面進行大幅強化,英特爾在其 CPU 架構中也將引入同樣的概念。

由於英特爾處理器中已經包含了非常強大的 AVX-512 多媒體加速指令集,因此主要的修改就是來自於這個計算區塊,通過增加 4 道指令,將乘加計算的周期大幅縮短,讓相關精度的數據可以在最短的時間獲得處理,理論上可獲得比沒有內建相關指令的前代處理器產品 3 倍的 INT8 計算效能,以及 2 倍的 INT16 計算性能。

在處理器的 AI 計算加速方面,下一代 14nm 處理器 Cooper Lake 會引進 AI 模型訓練加速能力,並原生支持 bfloat16 的數據格式,達到比 fp32 強 2 倍的數據輸出能力。

而未來架構中,將會更進一步把 AI 和機器學習的加速能力做到更徹底,不只在推理,訓練也同樣會被重視,並同步改進。

當然,這些不會只是由英特爾自己來推動,而是結合業界力量共同推動。

Sunny Cove將成為明年晚些時候英特爾下一代伺服器(至強)和客戶端(酷睿)處理器的基礎。

Sunny Cove的功能包括改進的設計,允許它同時並行執行更多操作。

英特爾研究員Ronak Singhal表示,Sunny Cove找到了更廣泛,更深入,更智能的處理方法,並行完成更多工作,並通過更大的緩存來改善延遲。

接下來正戲登場,英特爾全新世代的 Sunny Cove 核心細節部分,以英特爾的定義而言,是接手 Skylake 的新一代微架構,雖是基於現有基礎的改進,但其改進幅度極大,已經夠格稱為全新的微架構。

Sunny Cove 微架構最大的改進在於緩存設計上,增大 50%的一級緩存可以說是最大的亮點,這個在過去 10 年的微架構中幾乎都沒有被更動過的設計,面對未來計算應用的複雜化,也終於做出相對的改善,而二級緩存以及操作緩存也都有明顯增加,有效對應 AI 計算所需要的大量數據流通與緩存需求。

其次,Sunny Cove 擁有更寬的 allocation,並增加了更多的執行埠,一集緩存的帶寬也倍增,這些設計上的改變讓 Sunny Cove 能夠更好的應對單指令多數據流計算和高效載入管線設計的優化。

此外,Sunny Cove 也增加了更大的緩衝空間,更好的應對新算法的規模化需求,另外,在分支預測能力方面也有了極大的改善,這代表指令的預取準確度更高,整個 CPU 管線中的指令流通就不會因為預測錯誤而必須清除重來,造成更多的延遲。

另外,在指令/數據載入管線的排程效率也獲得極大的改善,減少了載入指令或數據所需要的延遲。

而在壓縮/解壓縮工作,以及單一指令多數據流、矢量記散工作中,也因入更多指令集來協助解決相關的效能瓶頸。

另一方面,Sunny Cove 也獲得了更大的內存定址能力,最大可定址到 4096TB 的內存,足可負擔未來龐大數據的存儲與計算需求。

2019 年現身的 Sunny Cove 還只是個開端而已,接下來的 Willow Cove 以及 Golden Cove 也將分別針對緩存、電晶體使用優化進行更深的發掘,甚至也要瞄準包含網絡設備以及 5G 應用進一步強化包含 AI 等關鍵應用的性能表現。

而下方 Atom 架構的路線圖雖然不是本次架構大會的重點,但還是有不少有趣的地方值得探究。

而作為 CPU 核心主導者,Jim Keller 來到英特爾的時間不長,因此在 Sunny Cove 方面貢獻不大,但是在未來幾代的架構,甚至在 Cove 系列之後的全新架構,可望看到大神發揮其解決問題的實力,幫助英特爾在架構設計上達到更高的層次。

GPU 迎來重要革新,Tile-Based 架構成為未來繪圖核心基礎

目前英特爾在市場上採用的集成顯示架構,是已經有數年歷史之久的老舊架構,性能不只貧弱,連簡單的 3D 遊戲都很難順利執行,更不用提過去由 NVIDIA 吹的火熱的 GPGPU 計算概念,基本上是難以實現。

英特爾原本要在去年發布 10 代繪圖核心,也就是 Gen 10,但由於改善幅度過小,最終被拋棄,取而代之的是持續使用舊款核心,並轉而發展 11 代核心。

11 代 GPU 核心對英特爾來說有著極為重大的意義,其不僅代表集顯有著可以順利執行主流遊戲的能力展現以外,也在計算能力方面達到更全方位的強化,是作為抗衡 NVIDIA 在計算領域呼風喚雨地位的重要武器。

Raja 其實在 11 代 GPU 核心並沒有太多的涉入,畢竟 Raja 來英特爾也不過 1 年左右,基礎核心架構都已經確立,但是在軟體、規模定義方面則是給了設計小組不少建議,而未來走向獨立設計,甚至 11 代 GPU 核心之後的全新設計,則將會由 Raja 真正接手主導。

圖|左方為 11 代核心,右方為 9 代核心,執行鐵拳遊戲的對比,根據肉眼觀察,其畫面更新率在 11 代核心的表現非常流暢,有達到每秒 60 張的感覺,反之 9 代核心上的執行效果奇差無比,每秒可能不到 10 張畫面更新率。

圖|11 代核心的設計目標,主要是兼顧效能和效率,並且提供可接受的遊戲效能表現,而後者在現場的 demo 展示中著實讓與會者睜大了眼睛。

11 代核心,也就是 Gen11 有 4 大功能重點,首先就是該 GPU 是英特爾首個算力達到 1TFLOPS 的架構,雖然相較起其他高端手機 SoC 而言,已經不是很稀奇的事情,但對於英特爾架構已經是極大的進展。

其次,Gen11 也捨棄了傳統繪圖管線設計,而是以 Mali、PowerVR 等架構的移動晶片中占主流地位 Tile-Based 架構取而代之,藉此在內存帶寬消耗取得極大的改善,同時繪圖性能也有非常大的強化。

而在內存子系統的優化方面也擁有獨立的子系統。

而值得一提的是,所謂的 COARSE PIXEL SHADING 技術則是可依據場景自動優化著色管線的工作,帶來更高效的 3D 畫面計算性能。

圖|與傳統桌面 GPU 強調訓練性能不同,英特爾的 Gen11 還是著眼於推理性能的優化,並支持多作業系統。

圖|值得一提的是,Gen11 也支持了 HDR 與自適應幀率功能,完全支持 Free Sync 螢幕產品,在這方面與 AMD 站在一起,要與 NVIDIA 打對台。

圖|Gen11 之後的 X 系列,將會以 Gen11 架構為基礎,將規模擴大到 NVIDIA 獨顯的程度,並針對包含數據中心的 GPGPU 計算、娛樂繪圖,以及低端平台的顯示工作的全方位的應用適配,X系列獨顯預計將在2020年面世。

通過多架構融合 xPU 概念,要把摩爾定律推往更遠的未來

雖然過去英特爾在產品擠牙膏受到質疑,產能也因為製程技術難以突破,而面臨雙重困境,加上 AMD 和 NVIDIA 在各自的計算領域向英特爾發起挑戰,嚴重威脅英特爾的霸主地位,但英特爾畢竟還是在技術層次擁有極深厚基礎的公司,加上 Raja 以及 Jim 這兩位分別在 GPU 和 CPU 架構堪稱大神地位的人物進場主持,頗有扭轉英特爾危機成轉機的意味在。

其實過去英特爾亦曾多次遭遇危機,其嚴重程度也不下於這波,但能夠化險為夷的關鍵,還是在於英特爾能夠回歸初心,打造出真正市場需要的架構,而這次英特爾在架構大會上展示的技術概念,也著實讓 DT 君開了眼界,也對英特爾未來的布局有了更深的信心。

英特爾捨棄了過去的單一架構應對所有計算的傳統概念,除過去幾年積極收購市場中具備潛力的架構來補足自身的不足以外,也積極改造自有的架構,以更好的應對市場的需求。

過去 10 年吹起的 AI 風潮,英特爾認為這是足以改變整個計算產業走向的重要趨勢,雖然英特爾起步不算早,但其具備的龐大市場影響力,以及生態優勢,仍將可能扭轉過去英特爾在計算產業中不斷衰退的地位。

而不只是計算架構本身,在半導體製造工藝方面,也通過多方位的技術發展,不只是製程微縮,甚至也在封裝方面推出更具性能、應用優勢的方案,製程微縮只是其廣大半導體計算版圖的一小部分,而不是全部,通過架構設計優勢,即便製造工藝面臨短暫瓶頸,仍可在產品部分獲得市場認同。

英特爾此次推出的架構布局,意圖從多面向來解決現今的計算問題,對其客戶而言,能夠在同一渠道取得滿足所有計算需求的方案,這種一站式的邏輯雖然不新穎,但通過此次在架構日中發表的這些技術,我們可以說,在計算領域中,英特爾可以說是少數能夠真正達成這種要求的公司。

最後,DT 君也要呼應 Jim Keller 大神的觀點:摩爾定律萬歲!


請為這篇文章評分?


相關文章 

摩爾定律」真的不行了

摩爾定律是由英特爾(Intel)創始人之一戈登·摩爾(Gordon Moore)提出來的。其內容為:當價格不變時,集成電路上可容納的電晶體數目,約每隔18個月便會增加一倍,性能也將提升一倍。換言...

高通激戰蘋果,英特爾趁勢挑戰摩爾定律上位?

這邊蘋果和高通正因為專利戰打的不亦樂乎,那邊英特爾就趁勢發了大招,不僅大談特談摩爾定律,更是推出了六大戰略性架構。據外媒報導,高通在福州起訴蘋果成功之後,正在試圖說服美國貿易部門考慮對使用英特爾...