人工智慧:要怎樣渡過「人工智障」的尷尬期

文章推薦指數: 80 %
投票人數:10人

人工智慧(AI)很熱,但很多時候我們覺得人工智慧還不夠「智能」,比如說蘋果手機,一家公司的創始人楊靜前一段時間就把Siri卸載了,因為它不夠智能,有時候還會添亂,一按它就跳出來,使得人工智慧似乎變成了「人工智障」,感覺還不如不出現的好。

這就說明在人工智慧技術的研發及應用方面遇到了一些技術挑戰,很多專家都在自己深耕的領域對AI技術進行著自己的探索,很多探索是很超前的,那麼,我們怎樣才能跨越這樣的艱難險阻,達到AI的一種新境界呢?

火爆下的隱憂

AI這麼火,一切的根源在於數據,龐大的數據洪流。

我們身處在智能萬物互聯的時代,一切東西都聯在網上,而且越來越智能,都在收集數據、分析數據。

所以人工智慧這個技術的關鍵性就在於怎麼更好的把收集的數據挖掘、分析,然後利用起來,實現增值,從而帶來增值的業務,這是大家如此關注人工智慧的一個重要原因。

目前,人工智慧還處在發展的初期。

隨著計算機時代的發展變得愈加成熟,很多技術的部署變得非常困難,因為很多技術都是在整個人工智慧的框架之下的,但是在整個AI相關的領域當中,只有7%的應用才是符合AI的具體要求的。

為了更好地實現人工智慧,需要非常強大的計算能力才能夠處理如此大型的數據。

預計到2020年,用於人工智慧的計算循環將會增長12倍之多。

英特爾的執著

大概在一年之前,英特爾收購了人工智慧公司Saffron Technology。

Saffron是AI領域平台服務的佼佼者,他們特別關注在基於技術的邏輯和推理的處理能力,非常關注數據的分析,同時也希望能夠加入大家對於數據的理解,比如說對於欺詐的分析及其在銀行業當中的具體應用,很多成功的案例都是在Saffron Technology的推動下得以完成的。

近期,該行業巨頭又收購了Nervana Systems。

對於這次併購,英特爾公司副總裁,數據中心事業部數據中心解決方案部門總經理Jason Waxman表示,在這次Nervana Systems的收購中最激動人心的一點是,我們認為這家公司是符合我們的戰略思路的,尤其在解決方案的初期一直到整個軟體基礎設施的構架,同時可以增加我們的資料庫,並助力我們半導體的優化。

因此,我們通過這麼大量的IP的收購,最後將整個產品組合買下。

這個收購結束完之後,我覺得在前90天我們就已經把這種非常好的技術進行了破壁式的發展,我想這也是增加了英特爾的處理和戰略的能力。

與此同時,英特爾還併購了Movidius,這項收購案尚未完全完成,但是完成之後這項收購對於推動智能設備的發展將會非常關鍵。

Movidius在嵌入式計算機領域是非常關鍵的,英特爾將會在智能照相機和圖象識別,以及物聯網領域都使用Movidius技術。

因此將會持續擴大其在這個領域的投資。

Jason Waxman表示,構建基於英特爾架構的涵蓋至強處理器、至強融核處理器、Nervana平台和FPGA、Omni-Path網絡、3D XPoint存儲等技術的硬體平台,結合英特爾針對深度學習/機器學習而優化的英特爾數學函數庫(Intel® MKL)、數據分析加速庫Intel® DAAL)等,和致力於為多節點架構提供卓越性能的開源軟體框架,如Spark、Caffe、Theano以及Neon等,及可推動前後端協同人工智慧發展布局的Saffron、TAP、Nervana 系統、Movidius等工具和平台,以上這些產品組合可幫助企業更方便地獲取、開發和部署人工智慧應用,將人工智慧潛能在各個領域充分釋放,如智能工廠、無人駕駛汽車、體育、欺詐檢測、生命科學等。

技術的創新機遇

現在技術的發展日新月異,我們看到大量的創新和新的改革。

有些技術其實已經存在有幾年了,現在正是開拓新市場機遇的時機。

機器學習

機器學習有不同的理念和觀點,通常就是指從數據當中學習的方法,它能夠構建這些數據,並且通過數據改進自己的性能,包括如何從數據當中進行系統化和架構的學習,這是非常寬泛的一個定義,並且這個概念在學術界已經存在很久了。

直到最近,生活和工作當中能夠產生更多的數據,因此就推動了機器學習的需要。

機器學習有三種不同類型,Nervana Systems公司的前CEO、人工智慧專家Naveen Rao表示,對此,我不能說只有這三種類型,但是這可以讓大家稍微了解一下機器學習的世界。

我們在最近的許多新聞當中可以看到一個叫做監督學習的概念。

比如說我有一些圖片、標識,這個標識是貼在我的數據上的,例如一個人的面部識別,這個數據的標識就代表他的名字,這個名字可以聯到計算機當中,計算機就能夠學習,或者將這種輸入的數據,將它的名字和圖片連在一起。

非監督學習則處於我們的技術前沿,很難去真正找到具有潛在的、可使用的一種數據架構,而且前提是你一開始還不了解這個架構的詳情。

如果你想學一種語言,你先要聽它,了解它的發音,了解語音語調,至少要形成一個語言的框架之後才能開始真正學習這個語言。

事實上,我們很難賦予機器學習這項能力,但是我們還在不斷推動這方面的研究。

接下來講一下強化學習。

就像培訓你自己家的寵物一樣,你希望它有一個正面、你想要的反映,如果它給了負面的、你不想要的反映,你就要懲罰它,這就是強化學習的概念。

我想真正的AI不僅僅是這三種類型。

而事實上,讓我們的生活、我們的世界更加好也就是機器學習和人工智慧的最終目標。

舉一個例子,是非常傳統經典的機器學習。

這裡可以給大家看一些圖片。

大家可以看到這是我們其中的一個創始人,我們如何教會機器能夠識別人的面孔,也就是說,讓機器將名字和面孔連接在一起。

按照傳統方法來說,我要看一下他面部的特點,也就是眼睛和眉毛的寬度和鼻子的長度,這些都是非常重要的辨識特點,通過軟體進行辨識,把它變成一種圖像的關鍵點,我們把它叫做面部識別特點的函數。

最後我們通過不同的分類器,和一些集成的方法,最終能夠辨別出他的名字。

我想人類或者是動物能夠更好的辨別這個面孔,但是機器需要很多的學習,因為它們沒有辦法直接提取出這些特點。

傳統的經典機器學習就是以這種方式進行面部識別的。

機器能力向人類看齊

未來,要想讓機器具備像人一樣的能力,這個能力體現哪幾方面呢?英特爾中國研究院院長宋繼強先生將其概括為四大能力:首先是感知外界環境的能力;二是根據感知來的能力進行推理;三是推理形成一些決策觸動機器做反饋,這個反饋可以是動的,也可以是不動的,比如說視覺的反饋、聲音的反饋;最後一個更重要的是能適應環境,要能根據環境的變化,交互的人的變化去相應的做適應,這個非常重要,要不然就會變成一個死的程序。

這裡面有一條橫線很重要,「記憶」,記憶是一個非常突出的重點。

Jeff Hawkins,就是Numenta的創始人,他寫了一本書叫《人工智慧的未來》,就是專門講人工智慧或者說智能怎麼去看待他,其實就表現在能夠利用記憶去進行預測,如果能做到這一點,這個機器就真的有智能了。

所以記憶這個能力非常重要,我們現在看到很多做人工智慧的廠商也都把這個加入到系統方案裡面。

深度學習

深度學習的好處是深層的,這樣可以在很多不同的抽象層提取特徵,而這個特徵不是人去定義的,以前很多做人工智慧和機器學習的人是去找Future,所以有Future engineer的工作,但現在可以不需要了,它可以讓特徵是自己從數據中發現,並且通過越來越多的數據提升系統的性能,而不是靠一兩個Future engineer。

同時,深度學習也越來越具備強大的表示能力,從原來只能表示靜態的圖像和簡單的語句,到現在有能力去表示連續的圖像,也就是視頻,甚至加上多模態這種方式。

深度學習是一種突破性的技術,它的突破表現在在數據足夠大的情況下,已經可以在某些層面超過人的能力,比如說在做人臉識別方面,在ImageNet上面已經超過了人的能力。

在語音方面,語音識別、機器翻譯也都達到了讓人滿意的水平。

所以,隨著計算量和數據量的增加,深度學習方面已經看到了巨大的突破。

我們期望性能隨著數據增多而提升,同樣數據多了訓練時間也變長,當訓練時間變長,一種情況下可以通過增加處理器的數量去擴展它的性能,讓它仍然保持在一兩天內可以把這個模型訓練出來,如果處理器數量達到了一定程度,這個時候它的瓶頸不再是計算能力了,而變成了I/O能力,就是處理器和處理器之間通訊,或者是處理器訪問內存的I/O變成了瓶頸,這個時候你再增加處理器的數量也看不到性能的增長,還是要那麼多時間才能訓練出來。

Nervana技術就可以更高效的去定義內存的訪問帶寬和計算的密度,讓它很好的去匹配現在的數據量增大的需求。

同時可以讓多個節點並行支持這種大模型的訓練,所以我們可以看到近乎一種線性的性能擴展。

下圖是一個基於張量運算的架構,張量運算是一個多於二維塊狀的運算,矩陣運算都屬於張量運算。

裡面這些綠色的部分都是專門針對矩陣運算的處理單元。

同時我們還用了一種叫Flexpoint技術,這個技術既不是定點的,也不是雙精度浮點的,它其實是基於這兩者之間可以變化的技術,所以在這個裡面它可以提供前所未有的並行化的水平,計算密度非常高,是目前最好的一種硬體加速水平的10倍。

同時,由於計算單元是專門針對張量運算所設計的,所以它的功耗非常低。

同時我們看到旁邊有黃色的4塊,這個是高帶寬內存,專門通過專用的內存訪問接口連接到主晶片上,中間灰色大區域可以把它看作是一個晶片。

這些內存是直接由軟體管理的,所以整個計算裡面不會存在Cache,不會存在不可預測的Cache miss,完全由程序去控制去哪裡讀數據,什麼時候數據好了,我放回去。

你會想到這一個晶片可能處理不了所有的深度學習訓練任務,那我用多個晶片。

多個晶片之間的互聯就是靠RCL,我們專門定製了一種Interchip Link,它的速度比傳統的PCIE要快20倍,而且是雙向的數據帶寬通道,有這樣技術以後,我可以把一個晶片最多可以跟12個晶片連在一起,這樣可以組成一個很大的超網格做訓練。

軟體/算法對AI發展的重要性

同時,有了硬體之後,我們不能放鬆對軟體AI算法的研究,因為硬體提供了一個基礎,如果你用設計得很差的算法去運行,實際上也是浪費它的資源。

所以在英特爾研究院以及軟體部門也在一起進行AI算法的各種研究,其中包括這4大類,第一大類是怎樣讓訓練做得更快,讓它需要更少的數據和人的監督。

因為現在做訓練通常還需要大量的數據,需要label好的數據,但是我們很多非人工智慧領域的人就問了,小孩子去識別哪需要這麼多圖片,給兩三張圖片看看就懂了,也不需要那麼長時間,所以這裡面應該還有更多的技術點可以去鑽研。

怎麼樣去增強現在的深度神經網絡,因為這只是其中一個工具,未必是最終的工具。

深度神經網絡+X,加什麼呢?另外再加上一些記憶,或許這裡面就有更好的適合於去學習產生知識並且進行推理的模型能夠出來。

另外,我們知道大的模型訓練出來以後是很稀疏的,它裡面很多參數是0,對於這些0傳輸它或者存儲它甚至做運算都是毫無價值的,所以我們就要想辦法讓模型更稀疏,讓它存儲起來更壓縮,同時我們可以在模型裡面做裁剪,裁剪的時候一些0的地方就不運算了,所以運算量也會減少。

另外一個維度是計算的精度下降,這也是目前很熱的一個研究點,原來我們用16位去計算,現在我們看看用8位、4位、2位甚至到1位,是否也能夠完成這個模型的運算,同時我來保證性能、準確度不會下降太多,這也是目前我們在研究的一個重點。

同時還看怎麼樣能夠讓它去擴展,採用更大的BachSize和High-order方法去做深度學習的訓練。

AI何時飛入尋常百姓家

今年,從AlphaGo開始,AI就成為社會焦點議題了,現在AI雖然炒得很熱,但是它的應用仍局限在一些比較窄的專業領域,比如圖象識別、語音識別,或者是無人駕駛、智能駕駛,神經語言學等,那麼,AI在大眾生活方面有沒有相關的應用呢?

處在嬰兒期的深度學習應用

對於AI在百姓生活中的應用情況,英特爾數據中心事業部首席工程師兼人工智慧解決方案架構師張彤表示,現在深度學習的應用還處在嬰兒階段,我們預計在未來幾年時間裡面,在各個領域會有更深入、更廣泛的應用。

目前英特爾主要是在圖像、語音或者自然語言處理等,特別是跟我們的雲的提供商(Cloud Provider)它們之間的合作比較多。

下一步我們會更多的深入到行業應用當中去,比如說醫療領域的應用,這個跟我們大家的生活是息息相關的,比如醫學影像的識別,現在很多時候機器判斷癌症,我就看到國內有的教授在這方面研究做得非常好,就是用機器學習來判斷癌症,比一般的醫生判斷得都要準確。

商湯科技讓AI落地

商湯科技主要做人工智慧落地的產品,比如說直播領域,對此,該公司異構並行計算部門工程總監劉文志表示,女主播是否漂亮是非常重要的,商湯的人臉識別技術可以精準美化女主播的顏值,這是實際中已經在大範圍使用的,當然也借了今年直播的風口。

另外,我們在一些人臉閘機,用於通關,如果我們自己掏出身份證或者其他設備,相對來說是比較複雜的,如果靠著我們自己的一張臉就可以暢通無阻的話,包括在某種情況下自己的家門都不用帶鑰匙了。

還有一些和圖像相關的,當然商湯科技也能提供很好的解決方案。

比如說Pikazo。

京東的AI謀略

京東集團AI/VR/AR實驗室人工智慧方向研發總監陳宇表示,作為一個技術的研發從業者,我感覺這個事情分兩層看,首先從感知角度,感知本身就是人工智慧領域的一個非常重要的方向,比如說視覺、聽覺,我們對事物的分析,也就是說圖象識別、語音識別,我們京東都有在落地。

舉個例子,我們的圖象識別不只是大家看到的一些人臉識別或者文字識別,或者是圖像的一些簡單識別,我們甚至可以幫助我們的倉儲系統進行貨品的審核和分揀,這些東西都是具體落地場景。

同時除了感知之外,我們京東也有很多其他的應用,舉一個例子,京東有吉米機器人,它可以替代人工進行Q&A的服務,可以節省大量的人工,這些不只是感知,同時也是做了智能信息的處理,這些都是人工智慧在京東實際的落地場景,也是大家能夠直接體會到的東西。

來自中科院的聲音

中國科學院計算技術研究所研究員,博士生導師,計算機體系結構國家重點實驗室副主任馮曉兵博士表示,因為我是做研究的,所以在具體的應用上,我只能說一些別人的例子,像我們現在用的智慧型手機,手寫體識別、語音的輸入,這後面都是有人工智慧的支持,包括像京東也好,國內很多電商網站,商品推薦,其背後多少都是有人工智慧的幫忙,讓它做得更精準。

包括有些旅遊、簡單的問答系統、客服等等,我相信後面都是有人工智慧支持的。

但是我想,未來可能我們在新的製造業、工業的升級上面應該也會有它的作用。

馮曉兵表示,我覺得人工智慧繼續發展會有兩大趨勢,第一是怎麼讓更多的應用,從人工智慧本身的理論、方法,能處理更多的應用,現在主要是基於學習的方法比較成功,除了學習方法之外,我們還有沒有別的可以讓它往前走的,但這個可能跟我們關係不大。

我們可能跟英特爾比較類似,因為計算所都是做系統的,所以說第二個大方面的問題是我們怎麼做一個更合理的系統,使得已經有的人工智慧的應用,讓它在一個可接受的代價的前提下得到更廣泛的應用,

像晶片、系統軟體,包括編程框架的支持,像這些方面可能都面臨很多挑戰。

不管是計算所在做的,還是企業界提到的,都是在嘗試怎麼做一個更好的系統,使得我們可以用更小的功耗、更低的程序開發代價,獲得更好的性能,可以做更大的數據規模的處理。

另一方面,因為有很多不同的種類,我們有沒有一些基礎的技術,使得一些系統可以在不同的應用種類上面獲得更好的適應性,而不需要太多的程式設計師或者系統工程師深度的介入,這將來都會面臨很大的挑戰。

對未來的期待

2020年快來了,人工智慧在哪個領域會出現更新的、更引人注目的突破呢?

對此,馮曉兵表示,我最希望的一點還是在醫療方面,因為醫療確實有很多新聞事件,對於每一個家庭來說都是非常重要的事情,通過人工智慧,能夠作為醫療的輔助和管理系統,可能沒辦法完全替代醫生,但是我們可以通過人工智慧的輔助,使得我們平均的醫生水準,以及每個人受到的醫療服務的水準得到比較好的改善,能夠讓大家更安心的、花更少的錢得到更好的服務,這是我的期望。

【關於轉載】:轉載僅限全文轉載並完整保留文章標題及內容,不得刪改、添加內容繞開原創保護,且文章開頭必須註明:轉自「半導體行業觀察icbank」微信公眾號。

謝謝合作!

【關於投稿】:歡迎半導體精英投稿,一經錄用將署名刊登,紅包重謝!來稿郵件請在標題標明「投稿」,並在稿件中註明姓名、電話、單位和職務。

歡迎添加我的個人微信號MooreRen001或發郵件到 [email protected]

點擊閱讀原文加入摩爾精英


請為這篇文章評分?


相關文章