声控助手的智能及其轻松理解语音命令的能力逐年提高,但他们从一开始就非常擅长的一件事是理解简单的命令。选择 Apple、Google 和 Amazon 无线耳塞的最佳理由之一是通过触发词轻松访问每家公司的智能助手,因此体验完全免提。
但是对于那些你不想大声吠叫的时候(比如挤进拥挤的地铁车厢)或者不想让任何人知道你在让 Siri 为你的 Celine 最热门的播放列表排队,SpeeChin 是一个有趣的选择。
SpeeChin 由康奈尔 Ann S. Bowers 计算与信息科学学院信息科学助理教授 Cheng Zhang 和康奈尔大学博士生张瑞东设计,是一款挂在胸前项链上的紧凑型红外相机。摄像头朝上,捕捉佩戴者下巴运动的高对比度视频,经过一些训练后,可以在不发出任何声音的情况下判断某人在说什么。摄像头的位置不仅比将摄像头安装在某人的脸上来记录他们的嘴巴动作更隐蔽,而且它还处于一个无法捕捉到其他人的脸的角度,确保没有隐私问题。
研究人员对 20 名参与者测试了 SpeeChin;其中10人用英语说54个简单的短语,包括数字和常用语音助手命令,10人用普通话说44个简单的单词和短语。经过一段时间的训练,下巴跟踪摄像头能够以 90.5% 的准确率识别英文命令,以 91.6% 的准确率识别普通话命令。这是参与者在保持静止的同时说出各种短语。当被要求在走路时说出这些短语时,由于每个人的动作(包括他们的步态和头部的额外运动)的变化,准确性下降了。
这个问题可以通过更长的培训课程来解决,其中包括参与者在通过短语和命令库工作时站立和行走,以及改进的相机设备,能够通过更高或更高的分辨率更好地跟踪下巴运动帧速率。希望研究人员继续开发这项技术,因为有了更先进的语音识别能力,世界将变得更加和平,无需任何人发出声音。