聲學行業深度報告:智能聲學創新開啟語音交互新時代

文章推薦指數: 80 %
投票人數:10人

聲學產業鏈:中國企業占據核心位置,受益產業發展

智能聲學產業鏈主要供應商包括:

1) 晶片供應商;

2) 聲學元件(麥克風陣列、揚聲器)供應商;

3) 語音交互方案提供商;

4) OEM/ODM;

5) 內容提供商。

晶片:成本大頭,傳統晶片大廠領導市場

智能音箱由於功能的高度集成以及強大的語音交互能力,必須要有一個強大的心臟—主晶片。

目前智能音箱的主晶片供應商包括TI、聯發科、Intel等。

AmazonEcho採用了TI方案,由於EchoShow和EchoSpot需要處理影像,改用了Intel的解決方案,蘋果的HomePod則是採用自家A8晶片。

除主晶片外,內存晶片、WiFi藍牙晶片、電源管理IC也是必不可少的構成部分。

成本方面,以亞馬遜的Echo與國內的叮咚音箱為例,晶片都是整個設備成本中占比最大的一塊,其次是聲學單元。

目前智能音箱的主晶片提供商有晶片界的傳統強者(英特爾、聯發科、高通和蘋果),聯發科的代表產品為專為智能語音助理裝置和智能揚聲器產品而設計的系統單晶片MT8516。

高通推出「智能音效平台SmartAudioPlatform」,在這個平台上,高通提供了兩款新的系統級晶片,基於驍龍425(APQ8017)晶片和驍龍212晶片(APQ8009)針對音頻處理進行優化。

國內的晶片廠商利用本土優勢積極進入國內智能音箱市場,占據了一席之地。

以全志科技為例,2015年發布的國內第一款智能音箱—叮咚音箱使用的就是全志科技的R16晶片(Cortex-A7四核架構)。

此外國內廠商瑞芯微電子和紫光展銳也相繼發布了自己的「AI語音助手」晶片,並與國內智能音箱廠商取得合作。

下載本文完整報告,請在PC端訪問樂晴智庫網站: www.767stock.com

麥克風:陣列為主流方式,MEMSMIC用量快速提升

手機在使用的過程中由於低噪聲、無混響、距離聲源很近,所以大多採用單麥克風系統。

智能音箱在實際使用中會比使用手機的距離遠,真實環境存在大量的噪聲、多徑反射和混響,導致拾取信號的質量下降,這會嚴重影響語音識別率。

智能音箱單麥克風接收的信號,是由多個聲源和環境噪聲疊加的,很難實現各個聲源的分離,從而無法實現聲源定位和分離,更重要的是將會導致語音識別不能同時識別兩個以上的聲音。

因此為了解決這一問題,即「遠場語音識別」,利用麥克風陣列進行語音處理的方法應時而生。

麥克風陣列主要由一定數目的聲學傳感器組成,用來對聲場的空間特性進行採樣並處理的系統。

從形狀上來看,麥克風陣列主要有一字、十字、平面、螺旋、球形及無規則陣列等,而陣元的數量可以從2個到上千個不等,智能音箱所用的麥克風陣列陣元的數量一般不會超過10個。

目前主流的麥克風陣列方案公司包括:樓氏電子,歌爾股份,瑞聲科技,ST,芯奧微,博世和敏芯微。

揚聲器:蘋果帶動音質提升,發聲元件價值量大幅增長

揚聲器作為傳統音箱中最為重要的部分,與音箱的的音質息息相關。

在傳統音箱時代,音箱的音質是消費者最看重的部分。

然而,智能音箱為了實現更好的語音交互將大量的成本和空間讓給了晶片部分,在音質方面表現較差。

以目前音質較好的GoogleHome和Amazonecho為例,兩個音箱在100Hz-2kHz的頻譜波動大,波動在10dB左右,音質表現依舊欠佳。

有別於其他產品的是蘋果的HomePod配備了8個揚聲器,單機價值有望達200元左右,在宣傳上蘋果也著重突出了音質的優勢。

隨著蘋果HomePod的發售,消費者與廠商對智能音箱音質的重視度有望會提升。

智能音箱市場的揚聲器業務的主要受益者包括:國光電器(HomePod),美律(亞馬遜、谷歌)、致伸(亞馬遜、谷歌),通力電子(谷歌、哈曼、天貓和京東)。

OEM/ODM:全新產品形態帶來業務增量

目前智能音箱的組裝廠主要分兩類:

1) 由智能音箱的某元件供應商擔任組裝廠;

2) 專門的組裝廠;由元件供應商廠擔任組裝廠的好處在於其對元件特性的理解更為深刻,有助於核心部件品質的把控,比如台灣致伸(供應AmazonEcho聲學元件,同時為AmazonDot組裝)。

專門的組裝廠則在大量生產上有豐富的經驗積累,成本控制能力強。

亞馬遜和谷歌都委託富士康組裝他們的產品,蘋果的HomePod則由英業達組裝。

聲學龍頭歌爾股份近年來除了繼續深耕聲學零件業務外,在智能硬體ODM方面也走出了堅實的一步,公司有希望也有意願切入到智能音箱產品ODM。

軟硬體逐漸成熟,助推音箱智能化創新

過去聲學領域主要的產品類型為家庭影院、數碼音箱、有線耳機等,當前聲學領域的一大變化在於智能音箱與智能無線耳機在快速普及。

我們認為軟硬體的進步與成熟是推動聲學產品功能與形態升級的核心原因,同時軟硬體的升級將拓展聲學產品的能力範疇,聲學產品有望成為語音交互的最佳入口,智能家居的控制中心。

語音交互/遠場拾音技術進步,催生聲學創新

語音交互為本能表達,帶來全新體驗

早期的人機互動主要利用鍵盤,如打字機和DOS系統的電腦。

隨著滑鼠的發明和可視化圖形介面的普及,人機互動迎來了第一次重大創新。

隨後觸摸屏的普及以及多點觸控的出現,令人機互動進入了二維層面。

相比滑鼠和鍵盤,多點觸控能更方便、多樣的實現輸入。

但是至於此,人機互動依然沒有脫離手動的信息輸入,在人機分離下無法實現互動,語音交互的出現將使這一問題得到解決。

百度搜索「樂晴智庫」,獲得更多行業深度研究報告

軟體端:方案不斷發布,AI技術提升識別準確度

(1) 各類語音交互軟體不斷面世

近期三星發布了其語言識別助手Bixby,正式用於S8系列、Note8手機。

事實上,從產品推出的時間順序來說,三星Bixby還只能算作是智能語音交互領域的一位新玩家。

在Bixby之前,就已經有了諸如蘋果Siri、微軟Cortana、谷歌GoogleAssistant、亞馬遜Alexa等在內的多款智能語音助手被業界熟知。

硬體端:麥克風陣列解決遠場語音交互難題

在硬體端,語音設備主要包含:晶片、揚聲器、麥克風、結構件等,再經過ODM形成完整產品。

晶片、揚聲器、結構件、ODM等環節皆已成熟,且和傳統聲學方案差異不多,差異較大部分在於麥克風。

語音交互依賴麥克風拾音,在手機等近距離使用的設備上傳統的麥克風即能滿足拾音需求,而在遠距離、嘈雜環境下,傳統麥克風使用效果欠佳,麥克風陣列是解決這一問題的最佳手段。

行業巨頭入局,市場迎來爆發

從1970年代起,語音助理(VirtualPersonalAssistant)產品就陸續面世。

尤其是近年來,在解決了軟體端和核心零組件的技術問題之後,以智能音箱為代表的遠場語音交互設備不斷湧現。

亞馬遜、Google、蘋果、京東、阿里等巨頭相繼發布了自家智能音箱產品。

根據VoiceLab的數據顯示,2015年全球智能音箱銷量為170萬台,2016年銷量為650萬台。

其中2016年AmazonEcho銷售超過400萬台,同時亞馬遜於9月27日在西雅圖推出了第二代智能音箱家族:Echo、EchoPlus和帶螢幕的EchoSpot,分別針對入門需求,智能家居需求以及桌面端的智能音箱需求。

隨著產品多元化以及價格不斷親民,預計2017年AmazonEcho銷售超過1500萬台。

預計2017年全球智能音箱設備出貨為2600萬台,到2021年有望達1.37億台,2017至2021年CAGR為51.6%。

智能音箱:語音交互的入口,智能家居的中心

軟硬體的成熟是智能音箱爆發的必要條件,但不是充分條件,我們認為廠商的大力推動才是核心因素。

近年來,傳統音箱企業、消費電子企業、網際網路巨頭紛紛加入戰局,先發者如亞馬遜Echo、天貓精靈X1則在促銷季以低於硬體成本的姿態進行降價促銷(Echo降價50美元至149美元促銷、天貓精靈從499元降至99元)。

各種跡象表明,智能音箱對廠商而言絕不是一個以獲取硬體利潤為目的的產品,對用戶而言智能音箱基本的音樂屬性是吸引其購買的基礎,基於語音交互的拓展功能則是吸引其購買的關鍵。

智能音箱是在傳統音箱的基礎上增加了智能化功能,體現在兩方面,一、技術上具備Wi-Fi連接,可語音交互;二、功能上,可提供音樂、有聲讀物等內容服務、信息查詢、外賣、O2O等網際網路服務,以及場景化智能家居控制能力。

移動網際網路之後又一核心入口,價值凸顯

為何蘋果、三星、谷歌、微軟、亞馬遜等科技巨頭,都不約而同的將大量精力投入到了智能語音交互領域,而且爭相推動其智能音箱產品的銷售?我們認為原因如下:

1) 音箱本身不是目的,廠商爭奪的是移動網際網路之後的稀缺入口。

與以往不同的是這一入口以語言的形式進行輸入和輸出。

在即將到來的萬物互聯時代,次類型的入口以及語言交互的形式極有可能會成為主流;

2) 智能音箱是語音交互真正落地的第一款產品,而且其自帶控制中心屬性,將成為智能家居的核心。

廠商通過讓用戶把產品帶回家,觀察後續的使用情況,是最好的測試和改進方法。

2016年智能家居穿透率普遍不超過5%,例如門鎖3.5%、照明系統2.1%、洗衣機1.8%、冰箱1.1%,到了2020年預計都將各環節智能化滲透率都將超過20%。

中國智能家居市場規模也將在未來幾年保持超過50%的增速,預計到2020年將達3294億元。

產品不斷面世,市場迎來爆發

目前各大巨頭已經在智能音箱與語音交互的探索上邁出了實質性的步伐,亞馬遜的Echo是行業的先行者,其為語音交互找到了合適的運用場景。

谷歌推出了搭載GoogleAssistant的GoogleHome智能音箱,微軟聯合微哈曼卡頓推出了搭載Cortana的Invoke智能音箱,並還要將Cortana擴展到汽車場景;

蘋果在HomePod、AppleTV、Mac等產品上亦是搭載了Siri語音控制系統;

三星也推出了其語音助手Bibxy,在三星的規劃中其也不僅限於智慧型手機,而是將會應用到物聯網領域,擴展到三星的所有產品品類之中,諸如冰箱、洗衣機、電視機等產品之中,並且將會對外開放,打造基於Bixby的人工智慧生態。

國際品牌:軟體體系完善,引領市場風潮

國內品牌:本土化優勢明顯,語言限制有望突破

中國廠商在智能音箱上跟進的速度很快,僅在Echo發布後的第二年,中國市場就出現了第一款較為成熟的本土智能音箱—叮咚音箱。

該款音箱由京東與科大訊飛成立靈隆科技聯合推出,是網際網路電商與技術廠商的一次完美合作。

據調研公司「易觀」統計,截止2017年上半年,京東智能音箱叮咚在京東平台上的銷量已占據智能音箱的80%,在整個中國智能音箱市場銷量也占據第一的位置。

智能耳機:聲學領域另一重大創新方向

如果說智能音箱是實現遠場語音交互的利器,那麼在近距離貼身設備的語音交互中,除了傳統的手機外,未來的一大表現形式將為智能耳機。

耳機作為電子設備重要的發聲設備,擁有良好的便攜性、隱私性和隔音效果,

在人們生活中發揮著不可替代的作用。

進入網際網路時代,隨著藍牙和WiFi等無線技術的發展,以及TypeC和Lightning接口在手機端的普及和進化,傳統耳機正面臨著巨大變革。

智能耳機的出現使得耳機的功能和應用場景發生了極大地拓展。

蘋果帶動市場發展,用戶滿意度極高

蘋果推出AirPods,產品品質出色

在iPhone7推出後,蘋果取消了3.5mm耳機孔,並推出它們的解決方案:AirPods無線耳機。

該耳機售價為1288元,可通過內置的W1無線晶片與iPhone7配對,續航在5小時左右。

通過使用附帶的充電盒,這副耳機的續航可以達到24小時。

蘋果在AirPods中內置了一顆定製的W1晶片,支持BT4.2標準,覆蓋的傳輸距離廣泛,音質極佳。

AirPods除了配備了W1處理器以外,還配備了Maxim音頻編解碼器,

BoschBMA280加速度計等,小小的身軀下包含了當前聲學的最高技術。

AirPods對消費者的吸引力巨大,人們對於AirPods的喜愛程度甚至超過了AppleWatch。

據CreativeStrategiesandExperian調查顯示,使用者對於AirPods的滿意程度達到了驚人的98%。

其中快充,設計以及配對速度受到的好評最多。

調研機構IDC預測,2017年蘋果AirPods的營收將達到3513.9百萬美元,超過AppleWatch的2800百萬美元。

廠商積極推進,未來有望標配

目前布局智能耳機的既有智慧型手機巨頭也有傳統耳機商,主要涉及的公司有蘋果、三星、索尼、谷歌等,2016年蘋果公司的AirPods的發布催生了一大批智能耳機的出現。

我們認為智能耳機將在無線連接、智能降噪、語音交互和生物監測等領域發揮重要的作用,未來將成為智慧型手機的標配。

據WiForeConsulting的報告《智能耳機市場2016-2020》顯示,蘋果airpods的入場,帶來了智能耳機市場的變革,整個智能耳機行業在2020年將可能成為一個超過400億美元的市場。

從出貨量而言,根據Statista的數據顯示2016年至2020年,全球智能耳機的CAGR高達93%,預計從2016年的500萬副增長至2020年的7100萬副。

獲取本文完整報告請百度搜索「樂晴智庫」。

點擊下方「了解更多」,獲得更多行業深度研究報告


請為這篇文章評分?


相關文章