一家AI創業公司竟推出一款比ipad還大的晶片,頂數百個GPU集群
文章推薦指數: 80 %
這麼大的晶片,是標新立異的怪物,還是市場催生的算力炸彈?
翻譯 | 太浪
編輯 | 宇多田
「小」,一直被看作是計算機晶片的通用特徵。
舉個例子,最新款 iphone 和 ipad 的處理器比指甲蓋還小;即使是雲伺服器中使用的類似器件,也不比郵票大多少。
然而,初創企業 Cerebras 推出的一款新晶片,竟然比一塊 iPad 還要大。
這個「矽基巨人」的邊長大約有 22 厘米 (大約 9 英寸),可能會成為有歷史記載以來最大的計算機晶片。
開個玩笑——它難道會成為象徵著「科技行業對人工智慧寄予厚望」的一座里程碑?
左邊是Cerebras的巨無霸,右邊是非常受研究人員歡迎的英偉達最大尺寸GPU Titan V
曾參與過 AI 晶片設計,但沒有參與這個項目的晶片製造商美光 (Micron) 的研究員 Eugenio Culurciello 感嘆,Cerebras 晶片的規模和雄心堪稱「瘋狂」。
但他同時也表示,做這麼大號晶片的理由其實完全講得通,因為物聯網與自動駕駛汽車等項目及產品的確需要強大的算力支持。
「它無疑會很貴,但肯定會在一些場景中派上用場。
」
而 Cerebras 的目標客戶,除了實驗室,最主要的就是那些試圖構建更強大 AI 技術與產品的科技公司。
1算力需求催生「巨無霸」
人工智慧如今的繁榮是由深度學習驅動的。
基於深度學習建立的 AI 系統是經過大量數據訓練出來的。
在訓練過程中,算法通過分析標註數據來優化自己以完成一項任務。
這些訓練數據可能是打上腫瘤標記的醫學影像,也可能是通過反覆嘗試贏得電子遊戲比賽的機器人。
當可供學習的數據越多,或者學習系統越大越複雜,用這種方式開發的軟體也通常會越強大。
從包括智能硬體以及汽車行業的近期反饋來看,算力已經愈加成為一些非常具有野心的 AI 項目能夠順利推進的限制因素。
譬如,康奈爾大學 Emma Strubell 等研究員在 2019 年 7 月發布的一項關於深度學習訓練能耗的研究發現,開發一款語言處理軟體可能要花費 35 萬美元。
OpenAI 曾做出過一項估計:2012 年至 2018 年間,大約每三個半月,已發布的最大型 AI 實驗需要的算力就會翻一番。
因此,渴望更高技術表現力的人工智慧專家會使用圖形處理器或 GPU。
為了訓練深度學習軟體執行圖像識別等任務,工程師們通常會使用 GPU 集群。
去年,為了製作一款能夠打電子競技遊戲 Dota 2 的遊戲機器人,Open AI 在數周內消耗了數百個 GPU 集群。
2017 年,英偉達發布了被其稱為最強大的伺服器 GPU ,並聲稱這款產品是有史以來最複雜的晶片。
然而,Cerebras 創始人兼 CEO Andrew Feldman 表示,他們公司的這款巨型處理器可以完成數百個 GPU 集群的工作,具體能完成多少要取決於手頭的任務。
同時,它將消耗更少的能源和空間。
當然,Cerebras 的晶片面積也是英偉達最強大的伺服器 GPU 的 56 倍。
「這種晶片將使人工智慧研究人員有能力去做更多的嘗試。
這也將大大推動人工智慧技術的發展。
」他強調。
2晶片變大,問題也不少
Feldman 的這些說法部分建立在 Cerebras 晶片擁有大量內存的基礎上,充足的內存將使訓練更複雜的深度學習軟體成為可能。
但他的超大型設計還得益於這樣一個事實——
數據在一個晶片上的移動速度比連接在一起的單獨晶片快 1000 倍左右。
然而,製造如此巨大和強大的晶片本身就存在一些不能忽視的問題。
譬如,大多數計算機需要通過基於各個方向的吹風來保持冷卻,但是 Cerebras 必須設計一個靠近晶片運行的「水管系統」,以防止晶片過熱。
但 Feldman 表示,已經有一小部分客戶正在嘗試這款晶片,項目包括藥物設計。
此外,他也會計劃出售圍繞該晶片構建的伺服器。
因此,雖然他透露並不會單獨出售晶片,但卻拒絕公開價格或可用性。
這款巨無霸晶片的另一個問題來自於生產製造的技術難度。
為了製造出這個巨型晶片,Cerebras 與台積電(TSMC,客戶包括蘋果和英偉達)進行了密切合作。
台積電高級副總裁——從上個世紀 80 年代就進入半導體行業的 ——Brad Paulsen 公開表示,這絕對是他見過的最大晶片。
因此,為了這款晶片,台積電不得不調整其設備以製造出這個巨大的連續工作電路板。
這裡需要具體解釋一下:
Fabs(晶圓廠),也就是眾所周知的半導體工廠,是用純矽的圓晶片來製造晶片。
這裡面通常的工藝是,將由多個晶片組成的網格放置在晶圓片上進行切割,以製造成品設備。
而現代晶圓廠通常會用直徑約為 300 毫米、大小約為 12 英寸的晶圓,這種晶圓片通常能生產超過 100 個晶片。
然而 Paulsen 透露,生產 Cerebras 的巨型晶片需要台積電調整其設備以進行一次連續設計,而不是多個獨立設計的網格。
事實上,Cerebras 是從 300 毫米的晶圓上切割下來一個最大的正方形做晶片。
「我認為人們看到這個會說『哇,這可能嗎?也許我們需要朝那個方向探索。
』」他覺得這是一個突破。
3市場會給「怪物」機會嗎?
深度學習的興起,恰恰主要是源於「人們發現 GPU 非常適合支撐該技術的數學運算」。
這一需求與能力的匹配讓 GPU 供應商英偉達的股價在過去 5 年間提高了 8 倍。
時間再往後推進一些,除了谷歌開發出專為深度學習定製的 AI 晶片——TPU,一大批初創企業也陸續開始研發自己的人工智慧晶片。
全球最大的晶片製造商英特爾(Intel)也在研發用於深度學習的專用晶片,其中一款晶片是與百度聯合打造的,旨在加速訓練。
英特爾副總裁 Naveen Rao 表示,谷歌在 AI 晶片方面的努力使谷歌的 AI 競爭對手們確信,他們也需要新的晶片。
「很明顯,谷歌正用其 TPU 為一些 AI 新功能設置門檻。
」
Cerebras 將在周一一個大會上展示其巨型晶片,而英特爾也將在這個會議上討論其最新的晶片設計,這款晶片的尺寸與其他典型晶片沒什麼差異。
但英特爾已經計劃將其與現有計算機系統相適配,預計今年將交付給客戶。
「形狀不同尋常的晶片很難銷售,因為顧客不願意放棄他們現有的硬體。
要改變這個行業,我們必須循序漸進。
」Rao 略微點評了一下 Cerebras 的產品。
市場研究機構 Tirias Research 的創始人 Jim McGregor 也不是很看好這款巨型晶片。
他認為,並非所有科技公司都會急於購買像 Cerebras 這樣形狀非常奇特的晶片。
一方面,他估計 Cerebras 的系統可能就要花費數百萬美元,因為現有的數據中心可能需要修改以適應它們的結構。
另一方面,Cerebras 還必須開發軟體,使 AI 開發人員能夠輕鬆適應這款新產品。
不過他給出一個有意思的預測——那些賭上性命也要與 Facebook、亞馬遜和百度等 AI 公司競爭的大型科技企業,也許會認真研究 Cerebras 這款超大號晶片。
「對他們來說,這可能會很有意義。
」
「角力」人工智慧,老將英特爾的「新江湖」
無AI不熱點,當晶片公司都在談論人工智慧的發展戰略時,作為晶片老將的英特爾也在試圖做點什麼。過去幾年,熟悉的合作夥伴英偉達成為了人工智慧領域發展最為迅猛的晶片公司,網際網路巨擘谷歌儼然成為開發者...
英偉達、英特爾AI晶片鬥爭你死我活,中國芯何時出頭?
AI時代已經到來,晶片市場格局風起雲湧。深度學習應用大量湧現使超級計算機的架構逐漸向深度學習應用優化,從傳統 CPU 為主 GPU 為輔的英特爾處理器變為 GPU 為主 CPU 為輔的結構。
英特爾10nm量產又双叒叕跳票,AMD一陣竊喜?
英特爾再次延遲了10nm的量產計劃;AMD正在加緊搶進7nm工藝;英特爾和AMD下一代產品的競爭將異常激烈。上周,英特爾發布了最新財季的季度營收報告,得益於數據中心業務的強勁增長,英特爾扭虧為盈...
忘掉酷睿和驍龍:人工智慧時代你該認識這些晶片
如果你今天問身邊懂科技的朋友「未來是什麼時代?」他八成會告訴你是人工智慧的時代。已經開發了數十年,但在近幾年得到迅猛發展的深度學習神經網絡技術,正在驅動一次人工智慧革命。而革命的對象正是微信、F...