第六届猎云网年度创投奖项评选启动,43大奖项开始正式申报
第六届猎云网年度创投奖项评选启动,43大奖项开始正式申报
霸王茶姬连续完成超3亿元A轮和B轮融资,XVC、复星、琮碧秋实投资
霸王茶姬连续完成超3亿元A轮和B轮融资,XVC、复星、琮碧秋实投资
郭美美因销售有毒、有害食品罪被判二年六个月,罚款二十万元
郭美美因销售有毒、有害食品罪被判二年六个月,罚款二十万元
无代码开发平台轻流完成近亿元B轮融资,启明创投领投
无代码开发平台轻流完成近亿元B轮融资,启明创投领投
立即打开APP
苏舒
私信
1
来源:壹图网

“语音生活助手”哪家强?猎云网评测告诉你答案

2020-12-14
苹果“Siri”、 华为“小艺”、晓悟APP、百度“小度”之战。

【猎云网(微信:ilieyun)北京】12月14日报道(文/小树)

当点外卖、订酒店、推荐餐厅、订电影票都不用对着手机屏幕犹豫不决,动动嘴就可以解决所有的事情时,对于有选择困难症的人来说,简直是福音。

当然,前几年,对着手机、智能音箱等硬件产品语音对话时,语义理解错误、对话困难、流畅性差等体验让很多人对于语音助手望而却步。而现在,随着以NLP语义理解为代表的语音技术日益发展,语音助手已经逐渐褪掉“智障”的称号,开始真正走向智能。用语音对话处理生活上的问题,逐渐成为可能,甚至越来越多的人将语音助手看作是一种陪伴。

在小米MIDC开发者大会中公布了小爱同学的一则数据,截止今年6月,小爱同学MAU达到7840万,累计唤醒次数达617亿次。小米集团AIoT战略委员会主席、IoT平台部总经理范典谈到“小爱同学的目标是成为拥有大规模落地场景的‘智能生活助手’。”此外,华为、OPPO等国内大型手机与智能设备厂商也在多个场合表示语音助手将会是实现跨场景互联网服务的重要方式。

从最开始的语音对话到现在的生活助手,语音交互不再简单的作为生活中的点缀而出现,更多的以陪伴助手的角色出现在日常生活中。在未来,语音交互在生活服务场景中的使用将是大势所趋。

生活服务不同于闲聊等服务场景,用户在使用语音助手点外卖、订酒店时,是带有明确任务目的的。如何准确理解用户意图并帮助用户完成点餐、订票服务,这就要求语音助手必须要在生活服务领域拥有较高的意图理解能力和具备面向任务型(Task-Oriented)的连续对话能力。基于以上前提,猎云网找到了四款在生活服务场景中的“语音助手”较为突出的三款硬件产品和一款软件应用,做了一次深度评测。

三款硬件产品包括苹果手机、华为手机、小度音箱,另外一款软件产品为晓悟APP。鉴于每一款产品在生活服务场景中所处优势不同,且有些产品未开通相关功能。因此,猎云网对四款产品逐一进行了体验,并对四款产品的自然语言理解能力(NLU)、对话管理能力(DM)、自然语言生成能力(NLG)进行了深度体验,最终选取每个产品服务可用性最佳的场景进行横向语义理解率测试。

苹果手机Siri:视觉交互依赖过高,不能体现语音交互特性

在四款产品中,猎云网首先对苹果手机Siri进行了测评,服务场景选择了餐厅查询场景。

“嘿,Siri,附近有什么好吃的呀?”

“好的,希望这些信息对你有帮助。”

手机会以苹果地图为搜索基础,屏幕会弹出附近四、五家餐厅,并显示出距离。但和其他三款测试产品相比,Siri的多轮对话体验感不好,每一次进行二次提问时,需按下Siri接口,在进行提问。如果再次用Siri语音唤醒,则默认重新进入新一轮对话,连贯性不好。

在餐厅选择上,Siri可以直接下达距离、评分等要素排序的命令,但当猎云网对着Siri发问“这个评分高么?”“还有别的选择么?”“有没有近一点的餐厅?”等问题时,Siri则无答应,也不会以“这个问题我没听清楚,请再说一遍。”这样的安慰型话术收尾,语音对话结束的相对生硬,甚至会自动弹出以整句话为搜索关键词进行搜索的界面。

“有没有推荐的川菜”“我想撸串儿,有推荐的么?”在类似餐厅类别的问题识别上,Siri还是可以准确定位出来并推荐给用户。

“Siri,有没有评分高的呷哺呷哺店。”

“好的,请过目”

“这些店哪个评分最高”

“我找到的评价最好的是北京市方庄芳古园一区18号楼4层的呷哺呷哺(方庄新城广场店),评价为4.5星。”

诸如此类的对话下来,可以明显的发现,Siri不会直接用语音说出除了餐厅名称之外更多的详细信息,需要用户在视线不离开手机屏幕的前提下,和它完成对话。这一点相对于其他三款产品来说,语音交互的特性不能完全体现出来。

此外,Siri利用苹果地图作为信息检索的入口,在餐厅的评分和评价上,和其他三款产品有所差别,没有结合中国用户特色进行本土化的定制化升级,体验相对较差。

华为智慧助手:成熟的电影票语音预订功能

猎云网对于华为手机智慧语音助手“小艺”的测评,同样选择了小艺语音助手中用户体验度较好的电影票预订作为测试场景。据悉,该语音订电影票服务是由第三方智能语义理解与多轮对话服务提供商“玩秘”提供。

直接用语音对华为小艺说“电影票助手”唤醒服务。“你好,欢迎回来,你可以说,我想看赤狐书生。”小艺会用一句话开启和用户的沟通,这一点相对于其他产品来说,可以完美解决聊天开场的尴尬,直接带用户进入聊天模式。

在界面设计上,以白色为基底,下方分别排列着键盘接口按键、语音接口按键以及相机接口按键,简单大方。和晓悟相同的是,小艺也保留着对话框以供用户翻看记录。

“最近有什么好看的电影推荐?”

“最近《除暴》不错,要去看吗?”

“评分怎么样?”

“有8.5分”

“了解,那就去看除暴啦,你一般常去哪家电影院呀?”

“在公司附近看吧。”

和小艺对话,最明显的特点是,它在回复的同时,还会抛出问句追问。不仅是简单的对话,直接用商量的语气在回应用户,沉浸感十足。

除了评分之外,问到“金刚川的评价怎么样?”类似于评价的问题,小艺电影票助手会回答到“听说金刚川镜头处理的高明,情绪有起有伏。要看这个么?”

对于评价性的问题,小艺的电影票助手是猎云网在这四款语音交互产品中体验和可用性最佳的一款。

此外,在涉及到用户地址隐私时,电影票助手会主动询问用户是否可以保存,获得授权后才会保存地址信息,大大提升了用户隐私的安全性。当用户授权保存地址后,再次使用电影票助手购票时,小艺会直接问到,“今天想在家附近还是在公司附近看电影?”、“今天周六,要在家附近看电影么?”这类的问题,更显人性化。甚至于直接告诉小艺“去我经常去的电影院看电影”,小艺电影票助手都可以直接识别出来。

目前,电影类型、场次、票房、评分、评价等基本要素,小艺已经涵盖到,并可以清晰的通过多轮对话显现出来。

在电影票预订生活服务场景上,相比于其他三款产品的体验而言,小艺电影票助手(玩秘)的用户体验已经相对较好,各种对话场景已经覆盖,多轮对话逻辑清晰,出现回答不上来或者逻辑混乱的次数相对较少。

晓悟APP:应对需求简单的酒店预订

第三款测评产品猎云网选取了晓悟APP的酒店预订作为测试场景。

打开晓悟APP,从界面设计上来看,黑色作为底色存在,用户对话框以白色为主,晓悟对话框则以黄色为主,色调相对暗沉,但也简单明了。

在简单了解后,猎云网开始了第一轮对话。直接发问“我想要订个酒店”、“我要去上海出差,有什么酒店可以推荐”等类似涉及到“订酒店”的关键词句后,晓悟都会回复“你想什么时候入住?住几天?”

“明天入住,下周一离开。”“推荐酒店为上海鸢尾花公寓(中路分店),1间舒适一室一厅套房,房间总价格为285.00元/一天,从2020年12月10日入住,2020年12月14日离开,地址位于上海市黄浦区上海黄浦区黄浦西藏中路200号大(中华小区来福士广场对面)要订这家酒店吗?”

如果用户再具体说到一个区域内,晓悟会再搜索后推荐区域内一家酒店。在最初的一轮对话中,晓悟基本上没有什么问题。但在对晓悟进行询问,“这个是评分最高的吗?”“这个酒店是几星级?”“这个酒店有浴缸么?”“这个酒店有停车场吗?”等再一轮对话时,晓悟则回答为“晓悟还在帮您订酒店呢,要么您换个说法试试。”类似的话术,进一步深入了解酒店详情则稍显困难。

猎云网以“帮我换一个更高级(价格更高)一点的”的问题开启第二轮对话,晓悟则可以反应并选择价格高一点的再次询问。

但在酒店的分类上,晓悟对青年旅舍、民宿等酒店类型暂无分类功能;在房间分类上,晓悟已经可以识别大床房、双床房等说法,但唤醒效果却差强人意,在几轮对话后,再次询问时就会出现语义理解不清等问题。

总体来说,晓悟在服务简单指令时有较为不错的表现,但如果涉及到更多类似于酒店类型、酒店服务、房间选择上,晓悟的体验感就会直线降低。

小度音箱:生活服务场景停留在简单对话上

最后,猎云网在小度音箱上体验了餐厅推荐场景。

当猎云网在小度上询问到“小度小度,附近有什么好吃的餐厅推荐。”小度则会回答 “找到了好几个好吃的餐厅,为您推荐汉田肃肃免面馆”。而屏幕下方则会出现引导词“小度小度,第一个。”“小度小度,去这里。”

当猎云网再一次唤醒小度推荐餐厅时,就直接弹到了搜索界面。在生活服务场景下,小度音箱语义理解体验感十分差。

当询问到餐厅类别“小度小度,有没有川菜馆推荐?”小度音箱屏幕上则会直接播放出教你做川菜的视频。

在评分、类别、评价等关键要素上,小度的体验效果并不好。

结语:语音交互,各有所长,但生活服务场景是大势所趋

猎云网对这四款产品各选取了200句生活场景测试语料,测试结果显示,华为手机“小艺”在预订电影票场景下理解率达89%,晓悟在预订酒店场景下理解率为31%,而苹果Siri由于在生活场景上所开通的功能有限,因此,基于苹果地图信息上的餐厅预订功能理解率为24%,小度同样如此,在餐厅推荐场景的表现更为差强人意,理解率不足10%。

尽管猎云网对不同产品选择其相对成熟的场景进行测试,但从以上数据中可以很清晰的看出,华为手机在订电影票场景的多轮对话语义理解力最为成熟,而晓悟APP在订酒店场景下多轮对话语义理解力有待加强,而Siri和小度在生活服务场景的可用性较差。

值得注意的是,Siri和小度尽管在生活服务场景上体验不好,但是小度音箱的优势在于教育场景,甚至与以“儿童陪伴”为标签而存在,童声对话中讲故事板块、日常语音沟通等板块相对成熟。

语音交互作为一种人机交互方式的重要补充,由于其输入与查询效率高、“可以想怎么说就怎么说”等特点,加入了语音交互的人机交互服务体验显著优于单一的触控交互方式。越来越多的厂商开始意识到这一点,尤其是以华为为代表的国内主流手机厂商及智能终端厂商,纷纷开始提前布局语音交互,并将打造智能语音助手列为未来几年的核心战略之一。

当各大厂商都在通过自己的力量推动的语音交互发展时,作为语音交互中的蓝海市场——生活服务场景,也将是各大厂商抢滩布局的领域。只有在技术不断成熟稳定之后,用户对话体验感上升,语音交互才会逐渐成为“生活助手”,常伴用户身边,解决生活中的方方面面的问题。

猎云网APP阅读全文

体验更加

猎云网

微信扫码关注猎云网

  1. 猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权;
  2. 转载时须在文章头部明确注明出处、保留官方微信、作者和原文链接,如:转自猎云网(微信号: ilieyun )字样;
  3. 猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
猜你喜欢
长按图片可以分享给好友
×