今日  首页 - 往期报纸 - 帮助    
  文章搜索:
聚焦智能音箱市场(下)
智能音箱 为何总是会错意
作者:武晓莉
图片
图片
图片


    ■本报记者 武晓莉
  智能音箱虽然吸引了不少消费者的眼球,但是真正打算入手的消费者却不多,造成这种尴尬处境的原因除了安全性方面的隐忧外,应用场景以及使用习惯的差异,也是重要原因。从泰尔实验室收集的用户、媒体和厂商的反馈来看,智能音箱给用户带来便捷语音交互和丰富内容的时候,应用感受不佳的问题主要集中在远场识别能力差、误唤醒率高、语义理解能力差等方面。
  根据存在的问题,泰尔实验室组织开展了人工智能音箱的AI交互性能测评。泰尔实验室智能产品测评部副主任傅蓉蓉就测评结果进行了详细解读。
9款音箱参与测评
  据了解,针对市场现状,泰尔实验室今年初匿名购买了9款音箱来测试,整个测试都在实验室环境下完成。
  傅蓉蓉说,实验室选取了4种价位的音箱:1200元以上的代表是若琪月石AI音箱;800-1200元的代表是小雅AI音箱、问问音箱;400-800元的代表是叮咚2代、小度在家、联想智能音箱、天猫精灵X1、腾讯听听9420;400元以下的代表是小米小爱音箱。“主要从用户体验的角度去测试,多维度立体地去测评音箱整体性能表现。”傅蓉蓉说,“我们测试了超过58个指标,累计上万条测试数据。指标有语音唤醒、用户意图识别、中文语音识别和音频质量。”
  据悉,为了保证结果的公正客观,可复现、真实,测试采用实验室环境模拟,使用人工头和背景噪声模拟声环境,并采用噪声数据库模拟背景噪声,使用国际领先的测试仪器进行测试。
  唤醒是最直观的智能指标,主要测试了三类指标:唤醒率、误唤醒率、唤醒延迟。实验模拟了安静、外噪声和自噪声等近远场情况。其中误噪声测试了在叠加噪音的情况下,音箱自启动的情况或者发出不正常声音的情况。
  唤醒延迟测试主要是在近远场、安静、噪声和自噪声情况下,测试智能音箱的唤醒速度和响应速度。中文识别响应指标测试是考虑上述场景的情况下,中文识别准确率和响应时间。用户意图识别则是评价整个智能音箱对用户意图的正确响应情况和理解能力。测试考虑了三类用户意图:有声资源播放、信息查询和语音操作控制。音频质量包括失真率、粉噪频响和MOS值。
测评结果不如人意
  从测评结果看,智能音箱最害怕嘈杂。
  唤醒率测试结果显示,在3米、安静情况下,所有音箱都达到100%的唤醒率。而在中度噪声情况下,所有音箱都受到不同程度的影响。重度情况下,大部分音箱都表现较差,只有叮咚2代表现良好。在5米、安静情况下,也都达到100%的正确唤醒率,加入干扰噪声,唤醒率出现下降。傅蓉蓉说,综合测试结果,排前三名的智能音箱是叮咚2代、天猫精灵X1和小度在家。
  自噪声音量处于低和中段位的时候,大部分可以成功唤醒,中高音量时则大幅度下降,噪音音量最大时,所有音箱表现都不佳。综合测试结果,排名前三的音箱是腾讯听听9420、天猫精灵X1和若琪月石。
  误唤醒方面,从测试结果看,约一半音箱出现不同程度的误唤醒。小米小爱、天猫精灵X1、问问音箱、腾讯听听9420没有出现误唤醒的情况。
  唤醒延迟是指用户结束唤醒到音箱响应的时间,音箱的表现分层不大,相差仅在毫秒范围之内。唤醒延迟比较小的是天猫精灵X1、小雅AI音箱、问问音箱、腾讯听听9420。
  中文识别响应准确率方面,在3米、安静场景下,大部分音箱都可以达到90%以上的识别率,外部噪声增加1-2个等级,效果出现不同程度下降。前三名为问问音箱、联想AI音箱和小米小爱。在5米、安静场景下大部分音箱可以达到80%的识别率,在外部噪声情况下,识别准确率急剧下降,影响用户体验。排名前三的是联想智能音箱、问问音箱和若琪月石AI音箱。
  中文识别响应时间方面,大部分音箱完成应答都在2.5-3秒内。响应时间最短的是小度在家、天猫精灵X1和问问音箱。
  智能的另一个表现是用户意图识别准确率,可以从有声资源播放、信息问讯和语音控制等方面进行测试。结果显示,对于有声资源播放需求,所有音箱都可以给出比较准确的响应;对于信息类的问询,测试音箱表现差别明显。排名前三的是小雅AI音箱、天猫精灵X1、叮咚2代和小米小爱表现相当。
  人耳可接受的声波失真率是5%,被测音箱失真率都在0.3%到4%之间。MOS值的范围是1-5,越大说明音频质量越好,所有的被测音箱都在2.5-3.6之间,小度在家MOS值最高,其后是小雅、若琪月石。
  粉噪频响应曲线是音响性能优劣的重要指标,排名前三的是天猫精灵X1、联想智能音箱和小度在家。
  综合所有的测试指标,综合评价榜排名前五的是小雅AI、若琪月石、小度在家、天猫精灵X1和出门问问。结合价格排出的性价比榜是天猫精灵X1、小度在家、小米小爱、叮咚2代和联想AI音箱。
测评暴露“智商”欠缺
  傅蓉蓉针对测试过程和测试结果,分析了智能音箱面临的问题及其所产生的影响。
  外噪声情况下的唤醒率低。傅蓉蓉说,这个问题在测试的时候表现很明显,安静情况下达到100%的唤醒率,一旦加入噪声,唤醒率马上会急剧下降,严重影响用户的使用体验。
  男女识别声音的差异。大部分音箱在测试过程中都表现出对女性声音更加敏感,唤醒率更高。
  自噪声情况下唤醒困难。用户在使用音箱过程中,常常会在听音乐或者听有声资源的时候唤醒音箱。这种情况下如不能唤醒音箱,会使用户使用体验大打折扣。远场的效应率低。尤其是5米、10米情况下,音箱的唤醒和响应情况远不如3米。远场交互不畅将阻碍整个智能音箱行业的普及。
  用户意图识别能力差异大。表现优异的音箱除了正确响应用户,还能读取用户的意图,推荐相关信息,但有些音箱答非所问,多轮对话能力欠缺,不管是用户主动发起还是音箱主动推荐,与目前人与人的自然交互都还有很大的差距。
●链接
智能音箱水土不服

  对于智能音箱来说,我国和西方国家用户家居场景不同,西式厨房与客厅相连,消费者使用音箱的频次较高,而中式厨房与客厅相对隔离,环境嘈杂、油烟重,因此家庭使用频次不高。泰尔实验室智能产品测评部副主任傅蓉蓉认为,我国尚未建立完整的智能家居生态体系,使用场景碎片化、硬件操作复杂等问题没有解决,消费者无法对智能家居的智慧和便携产生直观的感受。因此,智能音箱在我国还有些水土不服。
  傅蓉蓉说,虽然已经有众多厂商推出自己的音箱产品和解决方案,但是整体的销售规模还处于较低的水平。智能音箱的自身能力也有待提高,产品的消费体验还有待进一步提升。
  第三方服务数字版权也是问题。对于音箱级杀手功能有声资源来说,与音箱合作的第三方服务资源涉及版权问题,也让用户受到限制,导致体验不佳。
  傅蓉蓉认为,针对现状,可以从三方面助推智能音箱行业的发展:一是智能音箱虽然发展迅速,但是整体智能水平参差不齐,急需制定相应的标准或者政策规范市场,促进行业的良性发展。二是建立相应的测评体系,针对语音类的产品评价能力的建设。三是加强智能家居宣传力度,培养用户习惯。注重全面布局智能家居的生态系统,借助于智能音箱的语音交互功能打通智能家居的入口。
  据了解,2017年12月,工业和信息化部发布的《促进新一代人工智能产业发展三年行动计划》着重提出,在智能语音交互方面,希望取得突破性进展,到2020年实现多场景下中文语音识别平均准确率达到96%、5米远场识别率超过92%、用户对话意图识别率超过90%。
(武晓莉)

  

更多>>    中国消费者报近期报纸查看
 
  本文所在版面
【第 07 版:数码】
  本文所在版面导航
·智能音箱 为何总是会错意
©版权所有 中国消费者报社
©中国消费者报社 京ICP备09107225号