華為詳解昇騰AI晶片:自研指令集/架構,全場景最優能耗比

文章推薦指數: 80 %
投票人數:10人

三天前華為在上海全連結2018大會上正式宣布了自家的AI晶片——昇騰310及昇騰910,其中昇騰910是目前單晶片性能最強的AI晶片,FP16半精度性能可達256TFLOPS,比NVIDIA的Tesla V100還要高一倍,製程工藝也是更先進的7nm。

華為昇騰AI晶片是支撐華為AI戰略的關鍵,根據官方所說,昇騰AI晶片使用了自主研發的CISC指令集及達文西架構,能夠覆蓋從智慧型手機到數據中心在內的多場景,並在每種場景都能提升最好的能效。

華為的AI晶片目前只公布昇騰310及昇騰910,未來還會推出更多,不過這兩款晶片中昇騰910是明年才能上市的,需要使用高性能7nm工藝,主打數據中心市場,FP16半精度性能256TFLOPS。

相比之下,昇騰310規格沒那麼高,使用的是12nm FFC工藝,但功耗也低了很多,只有8W,主要適用智慧型手機、智能設備等低功耗產品上。

華為官方日前詳細介紹了昇騰310 AI晶片的細節,它使用了華為自研的高效靈活CISC指令集,每個AI核心可以在1個周期內完成4096次MAC計算,其架構代號達文西,集成了張量、矢量、標量等多種運算單元,支持多種混合精度計算,支持訓練及推理兩種場景的數據精度運算。

昇騰310的架構非常靈活,統一架構可以適配多種場景,功耗範圍從幾十毫瓦到幾百瓦,彈性規模增減,並且在每種場景下都能提供最優秀的能耗比。


請為這篇文章評分?


相關文章 

英特爾欲借Silvermont微架構打破ARM神話

英特爾公司日前表示,採用新型CPU架構的Atom晶片將比之前的產品提高三倍以上性能,並降低五倍功耗,從而一舉打破「ARM處理器能效更高」的神話。英特爾期望Silvermont這個新架構從今年開始...

A12處理器5萬億次運算怎麼樣?

一句話結論:牛逼,但是和行業頂級水平相比,並無值得稱道之處。牛逼就不展開說了,手機晶片達成5萬億次運算,吊打一眾競爭對手。主要說一下為什麼說「並無值得稱道之處」。首先,5萬億次速度,來自於發布會...