語音辨識 人工智慧 Siri 語音助理 智慧音箱

VUI應用潛力看好 市場升溫大廠加速發展

AI語音辨識浮現資安隱憂 需求著眼兼顧便利隱私

2019-05-14
語音是最接近人性化的使用介面,近來進展十分神速,具語音辨識功能的Amazon Echo、Apple HomePod、Google Home等智慧音箱大量上市,由於皆處於24小時開機狀態,所有對話都會上傳至雲端儲存,存在著外漏風險,如何兼顧個人隱私與使用便利值得關注。

 

使用介面(User Interface)是設備裝置與使用者之間重要的媒介,在各種使用介面中,語音使用介面(Voice User Interface,VUI)由於具有使用一般會話語言而不需學習過程、操作時不須動手、無須目視螢幕畫面、可在安全狀況下進行多工作業等諸多優點,因此相關技術研發未曾中斷。

近來,更在語音辨識之人工智慧相關技術快速進展下,逐漸進入商用化階段,尤其是Amazon Echo在2014年推出後,Google、Apple等也快速跟進,形成一股市場風潮。

大廠透過結盟加速應用發展

從Amazon、Google、Apple等大廠投入語音辨識的狀況分析,可看出各自不同的切入點與佈局策略。以電商起家的Amazon從網路購物切入,提供搜尋引擎的Google從檢索服務出發,而Apple的Siri語音服務僅是帶動產品銷售的附加服務之一。

整體觀之,驅動語音使用介面普及的關鍵,還是在於各種功能是否完備,以及應用能否引起用戶共鳴。由於單一業者獨自開發難以滿足所有需求,尋求策略聯盟與外部合作,為市場卡位與佈局策略中重要的一環。

兩大平台業者Google與Amazon可謂典型代表,兩者皆採開放策略,積極建構生態體系。Amazon於2018年9月發表的Amazon Connect Kit,提供包含硬體模組與相關雲端服務,以簡化裝置開發者處理連線、App開發與連接雲端服務等作業。在第三方開發者的支持投入下,Amazon已累積了近2萬種類似智慧型手機App的功能,並對新用戶提供使用指南(Skills Guide)等支援,擴大生態體系。

Google亦於CES 2019發表Google Assistant Connect開發套件,免除過去在開發Google Assistant對應裝置時的複雜程序,以吸引應用開發商加入。該套件利用藍牙提供裝置與Google Home對接與傳輸指令,不須經由閘道器等中介裝置,簡化智慧家庭網路架構。

對一般廠商而言,語音使用介面相關應用的發展,大致可分為搭配硬體裝置以及結合服務場域兩種途徑。硬體廠商可思考選擇現有開放的Amazon Alexa、Google Assistant或微軟的Cortana等語音使用介面,搭配自家硬體進行產品開發,以縮短產品開發流程,加速上市時間。

市場持續升溫產品多元發展 

根據Google發布的數據顯示,美國以智慧型手機等裝置,使用檢索服務的用戶中,有20%是採用語音方式,顯示語音方式接受度不低。Amazon Echo在2014年推出後持續熱賣,包含Apple HomePod、Google Home,乃至騰訊、百度、小米等中國大陸廠商皆積極投入,成為關注焦點。在CES 2019展會中,處處可以看到配備語音使用介面的產品,足以證明市場熱度持續升高。

由於適合搭配語音使用介面的產品眾多,舉凡汽車導航╱音響、各類家電、照明等皆是,市場發展潛力看好。瑞典的家具大廠IKEA在2017年即推出支援Amazon、Google與Apple規格的聲控LED照明系統,透過各家語音端末裝置即可進行操控;後續將從智慧家庭應用概念,依序開發其他家用產品。

美國家電廠商GE Appliances亦推出支援Alexa、具備聲控功能的冰箱、洗衣機、微波爐等系列家電產品。Whirlpool則推出可透過語音控制的智慧烤箱「Smart Countertop Oven」,搭配子公司KitchenAid的廚房專用智慧顯示器,結合自家專業主廚資料庫,提供食譜、料理步驟等服務。衛浴品牌Kohler發表搭載Amazon Alexa的智慧馬桶「Numi 2.0」,配備藍牙喇叭,具備播放音樂、語音控制座蓋開關與問答功能。此外,也有廠商推出門鈴、門口監視器、車庫開關等智慧門禁相關產品。

應用融入生活資安隱憂浮現 

搭配語音使用介面的產品陸續推出,應用地點從過去以客廳、臥室,逐漸涵蓋到廚房、門廳與浴室等家庭中各個角落,未來與日常生活的各種服務場域進一步結合,也是可預期的趨勢。車站、機場、展場等公共場所之Kiosk、售票機,或者旅館、商場、金融機構接待客服等,結合語音使用介面都能提供更好的客戶體驗。

然而,隨著網路個資外漏事件層出不窮,個人對隱私愈來愈重視,隱私外漏的疑慮亦可能成為影響應用推展的負面因素。以銷售量居冠的Amazon Echo為例,在美國阿肯色州發生的一起命案中,經警方調查,將案發住宅所有者列為嫌疑人,由於現場置有一台Amazon Echo,警方為辦案需求,對Amazon發出搜索票,要求提供嫌疑人的對話資料,經過媒體報導引發連鎖反應,形成隱私與執法的爭議。

類似Echo的智慧音箱大量上市,由於處於24小時開機狀態,所有對話都將上傳至雲端儲存,雖然用戶可選擇刪除自己的對話履歷與紀錄,但仍存在外漏風險,一旦外漏個人私隱恐將蕩然無存。

不可否認,語音是最接近人性化的使用介面,近來的進展也讓各界對未來發展充滿期待,但欲達到普及化,需要不同構面因素的配合。從技術研發的角度來看,目前技術層次上,距離真人對話仍有一段落差,過度期待或許只會帶來失望,但透過服務提供,可累積資料,不斷學習持續改進。

另從應用發展角度來看,以智慧型手機為例,在平台上已累積成為上萬的App,但大量且持續被使用的卻屈指可數,目前語音應用似乎也面臨相同的問題,從解決大多數用戶問題,滿足大部分用戶需求著眼,是投入時必要的思維,也是最大的挑戰。

 

<本文作者周維忠,現任資策會MIC主任,專業於資訊應用相關技術及基礎環境與市場趨勢研究,長期深度觀察資訊應用新興技術發展、創新服務模式與市場競爭態勢。資策會產業情報研究所(MIC)長期觀測紀錄高科技產業市場情報及發展趨勢,是臺灣資通訊產業最重要的軍師,也是政府倚重的專業智庫。更多資訊請參閱官網https://mic.iii.org.tw/>


 


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!