與我交談:語音控制正在起飛

如果意外的包裹開始出現在您的門口,您可能希望與您的某個智能設備有關聯。

本月早些時候,達拉斯的一個六歲小孩問她的家人 亞馬遜迴聲 玩具屋的智能揚聲器。 和Alexa,亞馬遜的Siri式人工助手,及時 訂購一個到他們家.

一個聖地亞哥電視新聞節目收聽了這個故事,當一位新聞主播評論道:“我愛這個小女孩,說'Alexa命令我一個玩具屋'時,無意中重複了這個故事。”聽到這個,其他幾個亞馬遜設備在家裡聖地亞哥 試圖買更多的娃娃屋.

CW6聖地亞哥有關Alexa意外玩具屋購買的新聞報導。

{youtube}oI2KLIULjXc{/youtube}

對於試圖與Apple的Siri或微軟的Cortana進行對話的人來說,這個故事可能聽起來很熟悉。 我們的設備已經非常善於傾聽我們,但這並不總是意味著他們理解。

微軟的研究人員最近發現這是當今談話界面的一個潛在問題:它們作為“智能”助手銷售,具有聰明的笑話和世俗知識,但他們常常因缺乏常識而使我們感到沮喪。


內在自我訂閱圖形


小研究研究人員發現,隨著時間的推移,繼續與他們的數字助理交談的人是那些開始時期望最低的人。

語音界面實際上做了什麼?

當您使用語音界面時,它必須:

  • “聽到”你的聲音,並將其與背景噪音區分開來
  • 找出每個單詞的開頭和結尾,忽略你的“umms”和“ahhs”
  • 將每個單詞的聲音與字典中的單詞匹配,如果有,則從上下文中選擇正確的單詞 同音
  • 正確地解釋整個句子的意思
  • 生成符合您要求的有意義且有用的響應。

其中每一項都是一項複雜的技術挑戰,不同的技術公司在不同領域取得了進展。

Google即時擅長針對各種請求提供相關回复,因為如果您使用Google服務,它可以從Google有關網絡的大量數據以及您的個人活動中受益。

由於採用了降噪遠場麥克風陣列,Amazon Echo特別擅長在嘈雜的房間內聽到您的請求。 當然,它也擅長通過亞馬遜購物。

在過去的幾年中,語音界面在理解日常或“自然”語音方面變得更加出色,而不僅僅是笨拙且措辭謹慎的命令。 他們仍然更擅長處理簡單的查詢,例如“誰在澳大利亞網球公開賽?”,並且往往會遇到更複雜的要求,例如“誰今年第一次參加澳大利亞公開賽?”,以及後續行動問題,比如“決賽期間會下雨嗎?”。

對於除英語以外的語言,情況更加複雜:雖然Siri支持的不僅僅是40語言和方言,但到目前為止,Alexa僅提供英語和德語版本。 但所有這些功能都在穩步提升。

語音接口口吃的地方

因此,正如電影中預測的那樣,語音接口很快將接管我們的所有技術 她的? Gartner,一家技術研究公司, 有預測 到明年,30%與技術的互動將與語音接口進行對話。

但語音接口有局限性,並非所有這些都可以通過更好的技術來解決。

語音是Spike Jonze電影Her中與技術接口的核心手段。

{youtube}ne6p6MfLBxc{/youtube}

噪音污染是一個主要障礙。 您的設備可以區分您所說的與您周圍的背景噪音嗎? 技術可以幫助解決這個問題,包括降噪,個性化語音識別和唇讀。

但是,通過與智能設備交談,您為其他人創造的背景噪音怎麼樣? 想像一下,一個人坐在你旁邊的辦公室 - 或者在飛機上 - 在你試圖閱讀時與Siri聊天,你可以看到為什麼語音界面可能並不總是在社會上可以接受。

另一組問題來自語音界面的心理需求。 學習使用基於語音的系統可能很難,尤其是如果沒有屏幕,就像Amazon Echo一樣。

如果你曾經打電話給銀行或電話公司,你就會知道在等待你需要的所有選項時,聽到合成語音清單所帶來的濃度和無聊的悲慘組合,並儘量不要混合它們起來。 傳統的圖形界面通過向您顯示可用選項並讓您快速點擊您的選擇來避免此問題。

在學習了語音命令後,使用它們可能會分散注意力。 研究人員發現了語音命令 破壞你的思路 不只是鼠標和鍵盤。

這對於車載語音接口來說尤其危險:猶他大學的一對研究發現司機是 分心達到27秒 使用語音命令後。

猶他大學/ AAA交通安全基金會關於駕駛員分心的研究。

{vimeo}108281698{/vimeo}

找到它的聲音?

因此,語音接口不可能完全接管,但它們將在我們的生活中找到有用的利基。 它們在汽車中已經很常見,隨著技術的進步,它們有望減少分散注意力。

在廚房,您可以要求Alexa通過食譜與您交談,或在您的手忙於烹飪時更新您的購物清單。 在虛擬和增強現實中,當您無法看到自己的手時,語音界面可讓您控制系統。

在語言學習中,它們可用於練習發音。 最重要的是,語音界面可以幫助運動障礙,RSI或閱讀障礙的用戶克服他們的殘疾。

語音接口是一種期待已久的技術,有充分的理由認為他們的時間終於來了。 請記住,他們可能還不像聽起來那麼聰明。 如果孩子在附近,您可能想要在語音購買時輸入PIN碼。

談話

關於作者

Fraser Allison,人機交互博士候選人, 墨爾本大學

這篇文章最初發表於 談話。 閱讀 原創文章.

相關產品

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf 市場和亞馬遜