阿里巴巴發布全球最強AI晶片,芯雲戰略終成型

文章推薦指數: 80 %
投票人數:10人

自去年成立平頭哥半導體公司後,阿里巴巴在晶片方面的落子越發頻繁。

在今日的雲棲大會上,平頭哥正式發布了阿里的第一款晶片——含光800。

含光為上古三大神劍之一,該劍含而不露,光而不耀。

阿里巴巴用它來作為公司首款晶片的命名,體現了他們在這個領域的雄心與謙遜。

阿里巴巴集團CTO、達摩院院長張建鋒說:「在全球晶片領域,阿里巴巴是一個新人,玄鐵和含光800是平頭哥的萬里長征第一步,我們還有很長的路要走。

軟硬協同,造就全球最強的AI晶片

阿里巴巴方面介紹,含光800雖然是阿里巴巴第一款晶片,但卻是全球性能最強的AI晶片。

作為一款主要用於雲端視覺處理場景的晶片,含光800的性能打破了現有AI晶片記錄,在性能及能效比方面統領全球第一。

在業界標準的ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業界最好的AI晶片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

能達成這樣的表現,得益於軟硬體的協同創新。

阿里巴巴方面的專家指出,傳統CPU、GPU在深度學習推理任務上並沒有完全發揮硬體能力,例如GPU架構主要針對圖像處理設計,其硬體結構、軟體生態幾乎固化,因此對AI任務很難有深度優化。

為此,阿里巴巴在首先在晶片架構上面做了創新。

據介紹,含光800採用自研架構,針對深度學習中使用的大量權重參數和張量數據,在支持稀疏壓縮與量化處理的基礎上,通過獨特設計的數據訪存與流水線處理技術,大大減低了I/O需求和數據的搬移;同時深度優化了卷積,矩陣乘,向量計算和各種激活函數,通過高有效的硬體資源調度和全並行的數據流處理,把AI運算的性能和能效雙雙推向極致。

「傳統通用處理器基於馮諾依曼結構,其存儲和運算處理是分離的,如果處理深度神經網絡,需要大量讀寫運行操作,會受到帶寬限制,因此效率較低。

而以含光800為代表的神經網絡晶片,根據神經網絡推理運算特徵,設計特定的硬體神經元、高速連接的存儲結構以及專用指令集,對內存和計算單元實現高效組織管理,實現單條指令完成多個操作,提高計算效率和內存訪問效率」

來到算法這邊,一方面,阿里巴巴達摩院機器智能實驗室過去兩年構建了涵蓋語音智能、語言技術、機器視覺、決策智能等方向完整的算法體系,並且取得多個世界領先水平的成果。

「基於這些能力,平頭哥突破了算法和硬體之間的鴻溝,基於阿里巴巴豐富的場景和達摩院算法能力,自研晶片架構,並且設計了完整軟體棧」,阿里巴巴專家強調。

這樣的設計理念也讓整個晶片的效果立竿見影。

例如為了解決人工智慧晶片行業的通病——功耗,阿里巴巴在自研架構上大幅減少了對內存的訪問,這就保證極致性能的情況下,把晶片功耗降到最低水平。

值得一提的是,平頭哥用最短的時間完成了晶片的設計、流片整個過程。

其中7個月完成了前端設計,之後僅用了3個月就成功流片。

初露鋒芒,含光800已落地應用

在過去幾年的AI晶片浪潮里,大家一直詬病的是——不少AI晶片公司只是高調搞了個發布會,但對於晶片的落地,其實沒有太多的場景和想法。

這也是整個人工智慧行業的癥結所在。

但對於阿里巴巴而言,天然解決了這一問題。

阿里經濟體擁有包括圖像視頻分析、搜索和推薦在內的豐富人工智慧應用場景,這都需要AI專用晶片提供算力。

含光800一方面基於這些場景打造,另一方面又反哺場景,提升這些領域的計算效率。

據了解,含光800目前已經實現了大規模應用,應用於阿里巴巴集團內多個場景:例如視頻圖像識別/分類/搜索、城市大腦等。

依託阿里巴巴集團豐富的應用場景,他們早期就針對場景做了大量優化,並實現了性能上的突破。

在未來,這個晶片甚至還可被應用於醫療影像、自動駕駛等領域,阿里巴巴的專家強調。

在實際應用中,這款強大的AI芯在實際應用中表現也相當優越。

根據云棲大會的現場演示,在城市大腦中實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。

拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800後可縮減至5分鐘。

更為關鍵的是,其不僅服務阿里內部場景,還將全面通過雲服務開放。

據了解,,基於含光800的AI雲服務已正式上線。

阿里巴巴方面的專家表示,在人工智慧場景中,含光800是傳統異構計算很好地補充,通過阿里雲可以為企業提供更多的選擇,未來他們還會推出更多形態的人工智慧晶片,在終端、雲數據中心都會有更大規模的部署和應用。

「對於受限於算力瓶頸的企業而言,含光800可以更高效地運行更複雜、更先進的算法」,阿里巴巴方面舉例說。

端雲一體晶片格局成型

在發布了含光800以後,阿里巴巴的端雲晶片布局已經成型。

這家國內晶片「新晉」不止一次強調,平頭哥的目的並非賣晶片。

公司延續了母體阿里巴巴集團「讓天下沒有難做生意」的願景,開闢了全新的商業模式(平頭哥模式),致力於為企業提供普惠算力,目前已經擁有全棧晶片產品家族,涵蓋終端處理器IP、終端晶片設計平台SoC、雲端AI晶片。

在端側,平頭哥已擁有成熟的生態體系, CK801、CK802、CK803、CK805、CK807、CK810、CK860等7款自研嵌入式CPU IP核均已得到大規模量產的驗證,授權客戶超100家,累計銷售超十億顆,廣泛應用於機器視覺、工業控制、車載終端、移動通信和信息安全等領域;除此之外,基於RISC-V架構的玄鐵處理器以及無劍SoC平台也已服務各行業企業,例如人工智慧企業雲天勵飛、老牌晶片商炬芯科技等。

在雲端,這次發布的含光800就是一款代表作,全球前三、亞太第一的阿里云為平頭哥服務企業提供了絕佳平台,未來企業可以通過阿里雲輕鬆獲取含光800的極致算力。

未來他們還會在這個領域繼續升級。

談到未來的產品規劃的時候,阿里巴巴方面表示,公司產品形態還會進一步完善,例如雲上AI訓練晶片和端上的AI推理晶片就是下一步的目標。

目前平頭哥還在研發用於阿里雲神龍伺服器的SoC專用晶片,以滿足更多場景的算力需求。

過去十年,阿里巴巴的AI和雲計算齊頭並進,在這兩大領域,已經躋身全球前列。

在晶片領域的布局,則補齊了阿里技術版圖的一大短板,更為關鍵的是,三大領域已經展現出了化學反應:

作為業界最大的人工智慧應用者之一,阿里巴巴擁有豐富的應用場景,在此之上達摩院已建成完善的算法體系,涵蓋語音智能、語言技術、機器視覺、決策智能等方向,並取得多個世界領先水平的成果,在國際頂級學術會議上共發表了近400篇頂級論文;阿里雲穩居全球雲計算廠商前三、亞太第一的位置,超過一半的中國A股上市公司和80%中國科技類企業在使用阿里雲的服務。

平頭哥則得到了達摩院和阿里雲的軟實力加持,例如基於達摩院的算法能力,打破了算法和硬體之間的鴻溝;基於阿里雲飛天雲平台的優勢,快速形成了端雲一體晶片生態,玄鐵系列處理器以及無劍平台大幅降低終端晶片設計的門檻,含光800通過阿里雲輸出給全社會,讓企業隨時隨地可以享受到極致算力。

「晶片、AI和雲計算三位一體、協同發展——人工智慧算法逐漸集成到晶片,集成算法的專用晶片為雲服務提供了更強的性能,而雲計算本身則加速了人工智慧應用的大規模落地」,阿里巴巴方面補充說。

阿里巴巴晶片大圖已現

根據阿里巴巴在晶片上的定位,那就是端上做晶片基礎設施,雲端為企業提供普惠算力。

例如,處理器是所有高端系統晶片都需要的產品,它是最核心的基礎設施產品,AI晶片是人工智慧場景最高效的算力單元,阿里將投入重金打造好這些技術,同時構建應用生態。

而探索他們在晶片、AI和雲計算三位一體的策略中,SoC開發平台無劍在當中扮演了一個很重要的角色。

在前文我們提到,阿里巴巴擁有眾多的晶片IP,同時在雲端也能提供足夠的算力,在AI方面也有深入的研究。

對於那些想在他們平台上打造差異化的開發者來說,缺失的就是終端這塊方面的硬體實力。

而在這個領域,有一個明顯特徵,那就是開發者們都在基於其特定化的需求打造ASIC,而平頭哥的無劍開發平台,正是為了解決這個問題而生的。

據平頭哥方面介紹,無劍是面向AIoT時代的一站式晶片設計平台,提供集晶片架構、基礎軟體、算法與開發工具於一體的整體解決方案,能幫晶片設計企業將設計成本降低50%,周期壓縮50%。

「在這個平台研發晶片的企業,只需專注於20%的專用設計工作量,並讓這20%的工作產生80%的價值」,平頭哥強調。

除此之外,阿里巴巴旗下的平頭哥還將將成立晶片開放社區,進一步為晶片產業提供開放協作的平台;公司還將繼續開發作業系統,軟硬體融合的算法,核心的IP等。

把這些共性的技術能夠做好做精做出競爭力,並形成生態,然後開放給其合作夥伴,讓他們基於高質量的基礎設施打造晶片產品,有助於提升整體的產業競爭力。

憑藉這一系列的領先產品,阿里巴巴在AIoT賽道上占有了其他廠商並不具備的先機。

站上了未來萬億市場的風口。

*免責聲明:本文由作者原創。

文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點讚同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

今天是《半導體行業觀察》為您分享的第2078期內容,歡迎關注

半導體行業觀察

半導體第一垂直媒體

實時 專業 原創 深度


請為這篇文章評分?


相關文章