-小鸟CMS新零售系统

QQ登录

只需一步,快速开始

扫一扫,访问微社区

-小鸟CMS新零售系统 首页 干货 查看内容

新零售语音技术交互AI现状怎么样?

2018-8-7 12:37| 发布者: admin| 查看: 1511| 评论: 0

摘要: 一方面,相比图像识别语音的交互链条更长,是一个点往纵深深入走。语音交互不只包括识别,还要识别后理解文本意思再反馈出来,包括自然语言理解、语音合成以及对内容资源的整合挖掘,路线远比图像更长。

  小鸟CMS新零售消息,语音交互是去年AI最火的领域,先锋的智能音箱一个单品就让所有互联网大佬们都参战其中。

  但从当初惊人眼球的苹果SIRI语音助手到智能音箱,语音这项被寄予厚望成为人机交互入口的技术,似乎未能形成真正颠覆市场的应用落地,始终在单品上火一阵试一阵。相反,视觉技术里人脸识别已经形成规模化的基础应用,渗透到金融、安防甚至零售领域。

  为何最早火起来被寄予厚望的语音交互反而在市场化应用这一环节上似乎慢了?

  一方面,相比图像识别语音的交互链条更长,是一个点往纵深深入走。语音交互不只包括识别,还要识别后理解文本意思再反馈出来,包括自然语言理解、语音合成以及对内容资源的整合挖掘,路线远比图像更长。

  另一方面,机器视觉受干扰因素较少,例如人脸识别的脸部特征几十年不会大变,光线的强弱通过红外都已经解决。而语音是个变量,噪音、环境、距离、人的发音特征等因素下的语音交互都完全不一样,同一句话在逛街、办公室等不同场景,所表达的意思完全不一样。

  因此,语音比视觉的挑战更大,它只存在于整体智能,而不是局部智能。语音是个交互手段,通过交互调取后端的服务,例如听什么歌,去什么地方。而这又涉及与后端内容的配合,如果第三方内容库内容不够全,也会导致整体语音交互显得不够智能。

  第三,语音商业化落地不具有非常强的复制性,图像识别技术的应用复制性非常高,对设备的依赖程度不高,就一个数据包在任何情况下都可以用。

  语音所处的场景不一样,例如用在机器人、冰箱、车载不同的产品里,对三款产品说同一句“我饿了”,对机器人说有可能就是单纯聊天;对车载说肯定不会是点外卖也不会是聊天,只有可能是导航。

  因此,没有办法把所有语义做成一个通用库复制到所有产品,每一个产品针对不同场景都有不同需求,都需要个性化定制。

  基于语音的特征,语音交互的商业化更像个系统工程,从语音识别到语义理解到后端内容资源库,互相制约,牵一发而动全身。由于语音交互的复杂带来的商业化困境,语音交互技术公司也开始走技术平台输出路线。

  一方面开放自己的基础技术能力,让市场化的应用企业直接在基础上商业化应用,例如家居、车载、金融、医疗、教育等各领域的智能语音服务都可以采用其平台的技术来探索细分领域的商业化,扩大定制规模化;另一方面,将语音交互技术开放出来扩大生态合作,以突破语音交互的局限。


鲜花

握手

雷人

路过

鸡蛋

最新评论

QQ|Archiver|手机版|小黑屋| 小鸟CMS

GMT+8, 2024-4-20 19:56 , Processed in 0.069325 second(s), 21 queries .

Powered by Niaocms!

© 2015-2018

返回顶部