文章標籤：

震動

戰略

技術

架構

晶片

全新

發布

英特爾

英特爾發布全新晶片架構，六大技術戰略，震動晶片屆

2020-11-05

文章推薦指數： 80 %

投票人數：10人

智東西（公眾號：zhidxcom）文 | 心緣

英特爾火了！英特爾真的火了！

北京時間12月12日對英特爾來說大事連連，在北京，正舉辦20歲生日的英特爾中國研究院的隔壁樓房著了大火，而遠在大洋彼岸，英特爾在加州Los Altos舉辦的「架構日」上連發大招！

英特爾高管、架構師和院士們展示了下一代技術，並介紹了英特爾在驅動不斷擴展的數據密集型工作負載方面的戰略進展，從而為PC和其他智能消費設備、高速網絡、人工智慧（AI）、雲數據中心和自動駕駛汽車提供支持。

英特爾不僅展示了一系列處於研發中的基於10納米的系統，將用於PC、數據中心和網絡設備，並預覽了其他針對更廣泛工作負載的技術，還一連分享了聚焦於六個工程領域的技術戰略，包括：

1、先進的製造工藝和封裝。

2、可加速人工智慧（AI）和圖形等專門任務的新架構。

3、超高速內存。

4、超微互連。

5、嵌入式安全功能。

6、為開發者統一和簡化基於英特爾計算路線圖進行編程的通用軟體。

英特爾表示，對這些領域的重大投資和技術創新，將為更加多元化的計算時代奠定了基石，到2022年，潛在市場規模將超過3000億美元。

英特爾高級副總裁：摩爾定律將長存！

本次架構日的舉辦地加州Los Altos是仙童半導體與英特爾的聯合創始人Robert Noyce的故居，該活動由英特爾公司處理器核心與視覺計算高級副總裁Raja Koduri與英特爾公司高級副總裁兼矽工程事業部總經理Jim Keller擔任主講。

Jim Keller一出場就懟了所謂摩爾定律大限將至的說法，他表示，在他看完整個英特爾的技術布局之後，深覺得他能夠發揮的空間極大，他會讓摩爾定律在未來很長的一段時間內持續下去，要大跌那些評論家的眼鏡。

▲英特爾公司高級副總裁兼矽工程事業部總經理JimKeller

Raja則認為如今數據產生速度已遠遠超過出現有基礎設施所能處理的速度，因此未來亟需更高效、規模更大且更具可擴展性的計算架構。

根據現場媒體的報導，Raja預言說，未來10年計算架構的發展將遠超過過去50年的速度。

Raja提到，由於計算產業的轉變，未來英特爾在架構設計上也會越來越靈活，不但核心本身的設計會更接地氣，同時也將更強調不同場景的計算適配，未來將引入CPU、GPU以外更多的計算概念，構成xPU生態。

基於不同時代所需要的計算架構不同，Raja將整個計算軌跡分為三個階段，分別是2000年左右的GHz時鐘速度階段、2005年開始的多核階段，以及未來的架構階段，未來架構將是主導整個計算市場的最主要核心。

Raja表示，英特爾將針對三大計算領域布局更廣的計算架構，包括CPU和GPU在內的這些架構都將混合更多元、更具彈性的計算能力。

▲英特爾公司處理器核心與視覺計算高級副總裁Raja Koduri

針對AI應用這一當下和未來的主流計算趨勢，英特爾也會在其主力架構中增加更多包含深度學習、訓練以及推理計算加速的功能區塊。

其下一代 14nm 處理器Cooper Lake將引進 AI 模型訓練加速能力，支持 bfloat16的數據格式，可達到比 fp32高兩倍的數據輸出能力。

Raja還大秀英特爾在CPU以及GPU方面的最新布局，並展示未來英特爾CPU的核心發展路線，剖析了整個計算市場的走向。

他也介紹了其最新的 Gen 11 世代繪圖核心，並表示會將規模持續做大，設計出更符合全方位計算與繪圖應用的獨立GPU架構，正面迎擊AMD與英偉達。

此外，存儲、封裝以及伺服器的技術布局均在Raja本次全面介紹的射程之中。

作為xPU系列中的重要角色，Raja也不負眾望的揭曉了眾人關注的FPGA最新布局。

Raja介紹道，新款的異構FPGA計算方案將會採用10nm製程，且規模將覆蓋到從過去的中低端方案到高端方案，以同一架構不同規模的設計來解決不同層次的計算問題。

而且下一代FPGA晶片會引入3D封裝技術。

重拳出擊！六大技術新動向

值得一提的是，在封裝領域，英特爾推出的 Foveros 是業界首個真正的 3D 封裝，可以把整個系統封進一顆晶片中，達成真正的 System in Package 概念，遠比目前台積電與三星都在發展的 2D 或 2.5D 封裝技術更為先進。

1、業界首創邏輯晶片3D堆疊

英特爾展示了Foveros全新3D封裝技術，該技術首次引入了3D堆疊的優勢，可實現在邏輯晶片上堆疊邏輯晶片，比目前台積電與三星在發展的 2D 或 2.5D 封裝技術要更先進。

英特爾預計將從2019年下半年開始推出一系列使用Foveros的產品。

首款Foveros產品將整合高性能10nm計算堆疊「晶片組合」和低功耗22FFL基礎晶片。

英特爾稱，它將在小巧的產品形態中實現世界一流的性能與功耗效率。

據稱此封裝技術可做到約1mm的超薄厚度，Raja還在現場秀出僅有12mm x 12mm尺寸的量產晶片。

Foveros為整合高性能、高密度和低功耗矽工藝技術的器件和系統鋪平了道路，有望第一次將晶片的堆疊從傳統的無源中間互連層和堆疊存儲晶片擴展到高性能邏輯晶片，如CPU、圖形和AI處理器。

因為設計人員可在新的產品形態中「混搭」不同的技術專利模塊與各種存儲晶片和I/O配置，該技術提供了極大的靈活性，並使得產品能分解成更小的「晶片組合」，其中I/O、SRAM和電源傳輸電路可以集成在基礎晶片中，而高性能邏輯「晶片組合」則堆疊在頂部。

英特爾表示， Foveros將成為繼2018年英特爾推出突破性的嵌入式多晶片互連橋接（EMIB）2D封裝技術之後的下一個技術飛躍。

2、全新CPU微架構Sunny Cove

英特爾推出了接手 Skylake 的新一代CPU微架構Sunny Cove，旨在提高通用計算任務下每時鐘計算性能和降低功耗，並包含了可加速人工智慧和加密等專用計算任務的新功能。

Sunny Cove將在明年晚些時候成為英特爾下一代伺服器（至強）和客戶端（酷睿）處理器的基礎架構。

Sunny Cove的主要功能特性包括：

（1）增強的微架構，可並行執行更多操作。

（2）可降低延遲的新算法。

（3）增加關鍵緩衝區和緩存的大小，其一級緩存增大了50％，內存定址最大可定達4096TB，可優化以數據為中心的工作負載。

（4）針對特定用例和算法的架構擴展。

例如，提升加密性能的新指令，如矢量AES和SHA-NI，以及壓縮/解壓縮等其它關鍵用例。

Sunny Cove不僅能夠減少延遲、提高吞吐量，而且提供更高的並行計算能力。

英特爾表示，它將有望改善從遊戲到多媒體到以數據為中心的應用體驗。

緊隨Sunny Cove之後，Willow Cove和Golden Cove也將分別對緩存、電晶體進行更多優化，甚至會瞄準網絡設備和5G應用等來進一步強化 AI 等關鍵應用的性能表現。

3、全新第11代集成圖形卡

英特爾推出全新的第11代集成圖形卡，配備64個增強型執行單元，比此前的英特爾第9代圖形卡（24個EU）多出一倍，旨在打破每秒1萬億浮點運算次數（1 TFLOPS）的壁壘。

新的集成圖形卡將從2019年開始與10納米處理器一起交付。

此外，英特爾還重申了在2020年推出獨立圖形處理器的計劃。

英特爾此前要在去年發布第10代集成圖形卡，但由於改善幅度過小，最終該方案被捨棄，轉而發展 11 代圖形卡。

與英特爾第9代圖形卡相比，新的集成圖形卡架構有望將每時鐘計算性能提高一倍。

憑藉高於每秒1萬億浮點運算次數的性能，該架構旨在提高遊戲的可玩性。

此外，英特爾在此次活動上展示的第11代圖形卡幾乎將一款流行的照片識別應用程式的性能提高了一倍。

第11代圖形卡預計還將採用業界領先的媒體編碼器和解碼器，在有限的功耗配額下支持4K視頻流和8K內容創作。

第11代圖形卡還將採用英特爾自適應同步技術，為遊戲提供流暢的幀速率。

4、One API軟體

英特爾還推出了新的One API項目，可以在單一開發環境之下，簡化跨CPU、GPU、FPGA、人工智慧和其它加速器的各種計算引擎的編程。

該項目包括一個全面、統一的開發工具組合，以將軟體匹配到能最大程度加速軟體代碼的硬體上。

其公開發行版本預計將於2019年發布。

5、內存和存儲

英特爾還公布了英特爾傲騰技術以及相關產品的最新情況。

作為一款新產品，英特爾傲騰數據中心級持久內存集成了內存般的性能、數據的持久性和存儲的大容量。

這項技術通過將更多數據放到更接近CPU的位置，能夠提高使應用在AI和大型資料庫中的更大量的數據集能夠的處理速度。

其大容量和數據的持久性減少了對存儲進行訪問時的時延損失，從而提高工作負載的性能。

英特爾傲騰數據中心級持久內存為CPU提供緩存行（64B）讀取。

一般來說，當應用把讀取操作定向到傲騰持久內存或請求的數據不在DRAM中緩存時，傲騰持久內存的平均空閒讀取延遲大約為350納秒。

如果實現規模化，傲騰數據中心級固態盤的平均空閒讀取延遲約為10,000納秒（10微秒），這將是顯著的改進2。

在一些情況下，當請求的數據在DRAM中時，不管是通過CPU的內存控制器進行緩存還是由應用所引導，內存子系統的響應速度預計與DRAM相同（小於100納秒）。

英特爾還展示了基於英特爾1 TB QLC NAND裸片的固態盤如何把更多海量數據從硬碟遷移到固態硬碟，從而可以更快訪問這些數據。

英特爾傲騰固態盤與QLC NAND固態盤相結合，將降低對最常用數據的訪問延遲。

總體來說，這些對平台和內存的改進重塑了內存和存儲層次結構，從而為系統和應用提供了完善的選擇組合。

6、推出深度學習參考堆棧（Deep Learning Reference Stack）

英特爾宣布推出深度學習參考堆棧（Deep Learning Reference Stack），這是一個集成、高性能的開源堆棧，基於英特爾至強可擴展平台進行了優化。

該開源社區版本旨在確保人工智慧開發者可以輕鬆訪問英特爾平台的所有特性和功能。

深度學習參考堆棧經過高度調優，專為雲原生環境而構建。

該版本可以降低集成多個軟體組件所帶來的複雜性，幫助開發人員快速進行原型開發，同時讓用戶有足夠的靈活度打造定製化的解決方案。

（1）作業系統：Clear Linux 作業系統可根據個人開發需求進行定製，針對英特爾平台以及深度學習等特定用例進行了調優；

（2）編排：Kubernetes可基於對英特爾平台的感知，管理和編排面向多節點集群的容器化應用；

（3）容器：Docker容器和Kata容器利用英特爾虛擬化技術來幫助保護容器；

（4）函數庫：英特爾深度神經網絡數學核心函數庫（MKL DNN）是英特爾高度優化、面向數學函數性能的數學庫；

（5）運行時：Python針對英特爾架構進行了高度調優和優化，提供應用和服務執行運行時支持；

（6）框架：TensorFlow是一個領先的深度學習和機器學習框架；

（7）部署：KubeFlow是一個開源、行業驅動型部署工具，在英特爾架構上提供快速體驗，易於安裝和使用。

結語：踏過荊棘的英特爾或將全面出擊

英特爾今年可以說是歷經風雨，在市場上和AMD、英偉達等競爭對手交鋒激烈，奉為聖經的摩爾定律又屢遭質疑。

Jim Keller直接懟回去業界的風言風語、力挺摩爾定律將長存的行為，可以說是相當乾脆和直率。

在2018年收尾之際，英特爾這一波大秀肌肉，可見其不但對未來產品架構走向有著清晰、全面且頗為自信的布局，而且做好了從多方面解決問題並滿足一切計算需求的準備。

英特爾能否按著他們的既定計劃順利的走下去？10納米PC晶片能否在明年如約而至？這些答案我們並不知道，但英特爾這次在戰略規划上的全面布局，針對行業發展痛點各個擊破的做法，一方面會成為晶片產業下一階段發展很重要的參考，另一方面也讓我們看到作為全球晶片巨頭的英特爾發起威來，虎軀一抖也足夠讓晶片屆為之一震。