阿里第一顆晶片誕生!據稱性能「40倍於同類」逾百億美元市場會否誕生下一個英特爾

文章推薦指數: 80 %
投票人數:10人

阿里巴巴第一顆晶片今天誕生!

2019年9月25日,在杭州舉行的阿里雲棲大會上,阿里巴巴CTO、阿里雲智能總裁、達摩院院長張建鋒發布了阿里巴巴第一顆晶片「含光800」。

張建鋒從口袋掏出含光800晶片進行展示

張建鋒稱,這是全球最強性能的AI推理晶片。

是阿里平頭哥成立之後第一款正式流片的晶片,也是阿里20年發展史上第一款用了自己的硬體架構、並集成阿里算法的晶片,也是網際網路公司研發的第一款「大晶片」。

含光800的問世,是對張建鋒一年前承諾的交代。

一年前的阿里雲棲大會上,張建鋒宣布阿里巴巴將把此前收購的中天微和達摩院自研晶片業務整合成「平頭哥半導體有限公司」,由集團全資控股,推進雲端一體化的晶片布局。

張建鋒當時宣稱,達摩院已經開發一款神經網絡處理器(NPU)晶片,預計將在2019年4月流片。

按照設計,該晶片的性價比將是同類產品的40倍。

從平頭哥這款含光800的性能來看,「40倍於同類」所言非虛,其性能是應用最廣的英偉達P4晶片的46倍。

張建鋒說:「在全球晶片領域,阿里巴巴還是一個新人。

我們的晶片是萬里長征第一步,但阿里巴巴有足夠信心、有足夠能力,去做傳統硬體公司能做到的和不能做到的事情。

阿里巴巴今後會成為一家真正軟硬體一體化協同發展的科技公司。

「全球最高性能AI推理晶片」

張建鋒介紹,含光800在業界標準的ResNet-50測試中推理性能達到78563IPS,比目前業界最好的AI晶片性能高4倍;能效比500IPS/W,是第二名的3.3倍。

根據科技自媒體「量子位」的比較,如果與英偉達最新的T4相比,含光800是T4性能的15倍,是應用最廣的英偉達P4的46倍。

圖片來源:量子位

據介紹,含光800採用12nm製程,其性能的突破得益於軟硬體的協同創新:硬體層面採用阿里巴巴自研晶片架構,通過推理加速等技術有效解決晶片性能瓶頸問題;軟體層面集成了達摩院先進算法,針對CNN及視覺類算法深度優化計算、存儲密度,可實現大網絡模型在一顆NPU上完成計算。

張建鋒現場介紹,含光800已經率先在阿里內部多個業務場景開啟大規模應用。

從視頻圖像識別、分類、搜索,到城市大腦等,未來還可應用於醫療影像、自動駕駛等領域。

根據云棲大會的現場演示,在城市大腦中實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。

這意味著1顆含光800的算力相當於10顆GPU。

拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800後可縮減至5分鐘。

阿里巴巴平頭哥方面介紹,含光800是一款雲端AI推理晶片,不對外單獨售賣,而是通過阿里雲對外輸出AI算力。

雲端AI晶片場景關注的重點就是性能和能效。

平頭哥晶片版圖

平頭哥首席科學家、阿里巴巴高級研究員元尊介紹阿里巴巴造芯的具體優勢包括「ABCDE」五個方面:A(Algorithm)為世界領先的AI技術和算法,B(Big Data)為廣泛生態積累的大數據,C(Computing)為阿里雲安全穩定的計算力,D(Domain knowledge)為滿足各行各業需求的專業領域知識,E(Ecosystem)為比傳統晶片公司更容易搭建的生態。

在這款NPU晶片前,平頭哥在今年7月已經推出了RISC-V處理器玄鐵910,8月推出無劍SoC平台,可謂動作頻頻。

據介紹,玄鐵910是目前業界性能最強的一款RISC-V處理器,可以用於設計製造高性能端上晶片,應用於5G、人工智慧以及自動駕駛等領域。

阿里巴巴集團副總裁戚肖寧介紹,在性能方面,玄鐵910支持16核,單核性能達到7.1Coremark/MHz,主頻達到2.5GHz,比目前業界最好的RISC-V處理器性能高40%以上。

戚肖寧還宣布了「普惠晶片」計劃,未來平頭哥將全面開放玄鐵910IP Core,全球開發者可以免費下載該處理器的FPGA代碼,快速開展晶片原型設計和架構創新;同時,平頭哥還打造了面向領域定製優化的晶片平台(Domain specific SoC),提供包括CPU IP、SoC平台以及算法在內的軟硬體資源,面向不同AIoT場景為企業和開發者提供不同層次的晶片服務。

「無劍」SoC晶片平台則是面向AIoT時代的一站式晶片設計平台,提供集晶片架構、基礎軟體、算法與開發工具於一體的整體解決方案,能夠幫助晶片設計企業將設計成本降低50%,設計周期壓縮50%。

平頭哥半導體研究員孟建熠表示,平頭哥將以「無劍」平台為核心,面向應用領域全棧開放集成,實現處理器、算法、作業系統等軟硬體核心技術的深度融合,為企業提供從晶片到應用的全棧技術能力。

當時平頭哥還發布了「無劍」視覺AI平台,平台基於高性能「玄鐵」全系列CPU,最大存儲帶寬400Gbps,單通道PCIE接口帶寬16Gbps,可支持16TOPS以下的邊緣側AI計算需求。

該平台已經應用到多家IoT廠商的產品中,產品包括多媒體AI晶片、AI視覺晶片、邊緣AI伺服器晶片等。

再加上今天發布的AI推理晶片,平頭哥已迅速集齊了從IP核、到SoC平台、到AI推理晶片多個層次的晶片業務能力和生態。

據平頭哥方面介紹,未來還將研究雲端AI訓練晶片、端上推理晶片,以及用於阿里雲神龍伺服器的SoC專用晶片等,以滿足更多場景的算力需求。

行業軟硬體一體化發展趨勢明顯

從自研飛天作業系統、到今天發布雲端AI推理晶片,阿里巴巴在晶片、雲和AI三大業務之間的協同關係初現雛形。

這應該是面向未來十年的布局。

正如張建鋒今天在演講中所述,阿里雲目標成為軟硬體一體化的雲平台。

「未來的十年,是整個數字經濟轉型的關鍵時期,也是阿里雲智能成為數字經濟基礎設施關鍵的十年。

除了阿里巴巴,近來諸多以算法見長的AI公司都在選擇「變硬」。

今年5月,AI四小龍之一的依圖科技發布了雲端視覺推理AI晶片「求索」。

該晶片也不進行單獨銷售,而是與自身雲端伺服器或邊緣產品打包。

華為副董事長鬍厚崑一周前在華為全聯接大會上演講表示,未來智能世界需要兩個關鍵技術的持續創新和投入,一是連接,另一個是計算。

華為認為,預計5年後,AI計算所消耗的算力,將會占到全社會算力消耗總量的80%以上。

基於這樣的變化,華為認為計算正在進入一個新的智能時代。

Gartner數據預計,到2023年,計算產業的規模將超過2萬億美元。

此前CPU也可以執行AI算法、提供算力,但由於AI往往需要海量並行計算,CPU架構並不能達到最優性價比。

因此GPU、FPGA、ASIC為代表的AI晶片應運而生,此外還有類腦晶片、可重構計算晶片架構的通用AI晶片等。

據美國市場研究公司ReportLinker研究報告,預計到2023年,AI晶片市場規模將達到108億美元,複合年均增長率達到53.6%。

在資本助力下,AI晶片這一「增量」市場迅速群雄並起,既有英特爾、英偉達、谷歌等老牌玩家,也有寒武紀、地平線、深鑒科技等國內後起之秀。

清華大學微電子所所長魏少軍認為,AI晶片各種架構孰優孰劣仍有待市場檢驗,未來是否會有通用架構、是否會出現像CPU時代英特爾這樣一統江湖地位的公司仍未可知。

網際網路公司的優勢是「算法」和「速度」。

張建鋒強調,今天含光800的發布,代表了阿里巴巴硬體的能力、網際網路公司的速度,「從晶片設計、驗證一直到流片,總共只花了一年半時間」。

從傳統硬體廠商造芯過程來看,這幾乎是一個不可能完成的任務。

軟體公司變硬,硬體公司也沒有閒著,歸根到底是增強智能時代解決方案的能力。

比如,從去年到今年,華為已經構建了更全面更開放的AI解決方案版圖。

去年的全聯接大會,華為發布了用於推理的昇騰310AI處理器和ModelArts應用開發平台。

今年的全聯接大會,華為發布了用於訓練的全球算力最強的昇騰910AI處理器和AI計算框架MindSpore。

至此,華為的全棧全場景AI解決方案全面落地。

在資本追捧、行業火熱的勢頭下,華創投資投委會主席陳大同在今年5月的中關村IC創業大賽上也做出「提醒」:半導體行業出現跟風嚴重和高估值現象,AI晶片就是其中之一。

晶片公司不應該染上「明星病」,必須要克服浮躁心理、埋頭苦幹、長期堅持、貼近市場、以需求促創新、避免「網際網路病」。

(本文圖片除特殊說明外,均為阿里巴巴提供)

編輯:葉松

來源: 中國證券報

關注同花順財經微信公眾號(ths518),獲取更多財經資訊


請為這篇文章評分?


相關文章