各大互聯網巨頭(Amazon、Google、Apple、Microsoft 等)都紛紛透過搭載自家智能語音助手的 AI 智能音箱(Amazon 亞馬遜-搭載自家語音助理Alexa的Echo系列、Google 谷歌-搭載Google Assistant的Google Home 、Microsoft 微軟-搭載Cortana的Invoke、Apple 蘋果-搭載Siri的 HomePod )搶佔市場,目的是為了提供更好的生活質量予消費者嗎?還是說是為了背後更大的利益?如果兩者讓我選擇,我會傾向選擇後者。
AI 智能音箱
近年智能家居及人工智能的進步,搭載智能語音助手的 AI 智能音箱也成為智能家居中的一份子,由於其方便的語音交互方式,能夠聆聽並透過上傳至雲端服務器進行語義分析,理解用戶的說話,並對家中各種智能物聯網設備下達控制命令,比如說:播放音樂、開啟門鎖、設置定時煮咖啡、查詢天氣、透過搜索引擎查詢問題、甚至購物,都會逐一為使用者辦妥令使用者的日常生活更方便。所以近年來,開始成為智能家居的核心,使用者家中的"大管家"。
聽起來好像很方便,對吧?但,這些便利是怎樣能夠做到的呢?而背後是否涉及其他商業元素?是否安全呢?
在說這些問題之前,我們首先詳細了解一下它的運作原理:
AI 智能音箱的設計概念是:AI 智能音箱會一直處於待機狀態,內置的麥克風將持續地開啟並監聽著,直至聽到特定關鍵詞時,設備就會被喚醒,進入交互模式,開始記錄用戶的說話,然後就會將說話發送給廠商的雲端伺服器上,並透過人工智能進行語義識別,得出用戶的真實意圖,隨後就能把相關的意圖生成指令響應至智能音箱,智能音箱則執行相關的指令,並可透過內置的語音庫,給用戶作出反饋。
舉個例子,就比如用戶說:"Hey, Google!9:30分前為我煮好一杯咖啡。"。
智能音箱就會把說話發送給 Google 雲端伺服器上,最後得出類似 "動作:煮咖啡;份量:一杯;執行時間:09:28" 這種格式的指令,然後告訴智能音箱,隨後智能音箱就會透過咖啡機的資料接口設置定時煮咖啡的任務。
這樣,就完成了一次的任務流程。還不明白?看以下這段影片:
不過,你是否也注意到,使用者每次的說話(請求)都是被發送到雲端伺服器上,亦即在雲端伺服器也存儲使用者的說話,當然,使用者可以手動帳戶中刪除相關語音文件及記錄的(相信大部份的使用者很少會主動去刪除的),但實際在伺服器上是否仍儲存著相關記錄,那就只有這些公司才知道了。
另外,這些設備會否在背後一直在記錄聲音?這個的答案是:可能會,又可能不會。這是什麼意思?目前,大部份廠商的產品仍暫時未有這種,因為只要一直在記錄並上載聲音、文字等資料,就必定會產生網絡數據流量,亦意味著會被人發現,而且,這些互聯網巨頭如果採取這種見不得光的做法,那恐怕一早已被人知道了。
Google Home Mini 被用戶發現個別的設備會隨機錄製用戶的聲音並發送到Google 的雲端服務器。而 Google 隨後表示目前已經發佈系統軟件更新,修復了這個漏洞。這個漏洞的產生很有可能是 Google Home Mini 在頂部的觸摸傳感器有故障而導致,新固件禁止了這個傳感器的工作,算是暫時解決了這個問題。
那就是說不會一直記錄啊。不,也可能會。即使以上所提及的智能音箱背後並沒有被設置為一直錄音的狀態,既然可以透過系統軟件更新修改設備的軟件,在特定情況或他們認為有需要的情況下,把設備修改成他們想要的狀態,甚至可能在他們的後台就能夠控制並下達雲端命令。從雲端設置音箱,按不同模式記錄用戶的說話。再者,智能音箱如果被黑客破解或入侵,那智能音箱豈不變為一個竊聽器?把使用者的私人生活赤裸裸地暴露在黑客面前,讓他們能知道使用者在家中的一舉一動。
國外有黑客已經成功破解亞馬遜智能音箱Echo ,Echo被破解後,本身就能被黑客當作實時的咪高峰,來監聽設備周圍的聲音。
整個破解過程需要進行拆機,並僅限於2017年發售的Echo設備,因此很難大規模推廣。不過在成功破解之後,在沒有說喚醒命令的情況下能實時執行用戶下達的命令,此外還允許破解者遠程恢復認證令牌和其他敏感數據。
各位可以試想像一下,如果這些廠商在雲端設置了一份"負面清單"或"敏感詞清單",當聆聽到某些特別用戶說出"炸彈"、"襲擊"、"摧毀"等等這些特定關鍵詞時,就會觸發特定的模式,在沒有任何提示的情況下,把這段時間的對話發送到雲端伺服器,並通知有關執法部門採取行動,這不是天馬行空的想法,這以目前的技術水平來說,完全是有可能的。
今年初,Amazon 亞馬遜 Echo 與一樁命案牽扯上,亞馬遜被警方要求提交出嫌犯家中Echo錄下的聲音訊息以破解該謀殺案,但亞馬遜拒絕向警方提交Echo服務器上的相關訊息,當時,發言人表示:「除非收到當局的合法要求,亞馬遜不會將用戶訊息上繳給任何人。」話雖如此,亞馬遜依然提供給警方嫌犯的帳戶信息、購買記錄等,但警方究竟取得了用戶哪些數據,沒有人知道。
商業角度
從商業角度出發,用戶個人數據被收集後,用作建立和分析用戶的用戶畫像是非常有價值的,藉此可以了解用戶的行蹤、喜好、習慣等用戶特性,更重要的是,結合現在一日千里的 AI 人工智能及大數據分析技術,透過這些"無價"的數據,繪畫出真實的用戶畫像,為夠這些公司帶來難以想像的廣告及商業價值,小至精準廣告投放、設計新產品的功能,甚至公司將來的總體發展規劃都是相當有"價值"的。雖然絕大部份的智能音箱廠商都聲稱,智能音箱上只會用於聆聽記錄及執行指令,並不會一直在錄音狀態,但是由於使用者每次的說話(請求)都是被發送到雲端伺服器,所以雲端伺服器怎樣使用這些數據,使用者根本無法得知背後的運作。再退一步說,如果只分析每次使用者經過雲端伺服器後得出的使用意圖,再透過大數據分析,也能夠到得到相當多,豐富且真實有用的資料。這絕不是陰謀論,如果還不相信,請各位在使用這些服務及設備前,請先看看他們提供的使用及私隱條款。
競爭對手與用戶數據共享
為與對手們競爭,以用戶數據作交換?由於各大互聯網巨頭(Amazon、Google、Apple、Microsoft 等)搶佔這個極具"價值"的智能家居市場,所以除了他們自身會保持研發硬件上的新功能外,軟件方面,除了他們自家的研發團隊,亦傾向借助第三方開發者的力量,在他們這個平台打造更多的豐富的軟件應用。Google 已允許第三方開發者使用用戶的數據,Amazon 已向少數的「白名單」開發人員提供了一些用戶數據,並考慮授予第三方開發者存取內建Alexa之設備所保存的音檔權限,希望透過提供更多數據,吸引第三方開發者以Alexa做為開發平台。至於 Apple 及 Microsoft,由於競爭對手們已向第三方開發者拋出橄欖枝,希望吸引更多的開發者為自家服務「添磚加瓦」,相信 Apple 及 Microsoft 不久亦會朝著這個方向前進。
凡事要付出同等代價,要想智能也不例外
在現今網絡上免費服務盛行的時代,經常會聽到一句說話「免費的往往比收費的還要貴」,但反問一句,收費的是否比免費的要便宜?這裡所說的"貴"和"便宜" 其實是指付出私隱的多與少,隨著智能音箱上的軟件功能的不斷更新,將來推出涉及打電話、電子郵件、短信、聯絡人等的操作,屆時這些廠商又可以收集更多的數據了。試問付出金錢購買了一個智能音箱回家,但在軟件上又要付出自己及家人的個人私隱換取實現智能家居,這是什麼交易?在智能手機上,您還可以因應各種不同的應用而選擇性開啟設備的訪問權限,比如說:GPS、麥克風等,關掉後,其他大部份的功能還可以正常使用。但在這些智能音箱上,如果你把麥克風關掉,相當於這個音箱處於半停頓狀態,只能透過手機連接訪問。
如何更好地平衡智能時代下的大數據及私隱,這是一個眾多互聯網巨頭和使用者要關注的課題。到目前為止,如果沒有一個能夠充分解決對智能音箱信任度的答案,那怕是智能音箱能夠為我的生活帶來極大的便利,相信我個人是絕不會使用的,如果我真要使用智能助理,或許我會自己開發或使用能夠開源代碼來構建真正屬於自己的"智能語音助手"。畢竟數據始終被集中掌握在少數人手上,他們怎麼使用,我們不會知道。而解決智能音箱信任度目前個人認為可以讓各大廠商共同開源固件源代碼、甚至使用區塊鏈技術等等的方式解決,但,這涉及到無法有效地收集寶貴的用戶數據和挖掘商業價值,這試問這些廠商會願意嗎?
科技帶生活帶來便利,但又要犧牲個人私隱的同時,你又會怎麼選擇?