百度唇语语音唤醒技术
集微网消息,7月25日,百度举办了“百度AI城市&乌兰察布战略合作签约仪式”。这次签约仪式上,百度和乌兰察布市集宁区正式达成了合作共识,将在交通、城管、社区、供热等24个项目中进行合作,联合带动人工智能城市治理产业向集宁区聚集,打造内蒙古智能城市样板间。
在人工智能城市治理项目规划上,双方将共同投入智能城市基础设施建设并促进全面智能的城市治理体系的建成。从人工智能城市基础设施及重点示范项目建设开始,逐步实施人工智能交通管理系统建设、人工智能政务服务系统建设等多个方面的建设,逐步推进集宁区人工智能城市发展改造进程。
而语音识别技术则是智能城市中不能缺少的一个环节,随着语音识别的能力的增强,越来越多的智能设备也应用到了语音识别。目前的智能设备的语音交互方式基本上使用的是基于语音唤醒词的语音交互。在进行语音功能唤醒的具体操作一般为采用固定的唤醒词,比如:小度小度,等来唤醒语音交互设备。在由语音交互设备进行启动识别,然后再和用户进行语音交互。然而,现有的语音唤醒的方式,每次在进行语音交互前都要说一遍唤醒词,重复的说唤醒词会给用户造成不好的体验。
在这样的背景下,百度在18年1月22日申请了一项名为“基于唇语的语音唤醒方法、装置及计算机可读介质”的发明专利(申请号:201810061009.1),申请人为北京百度网讯科技有限公司。
根据目前公开的专利文件,让我们一起来看看这项基于唇语的语音唤醒方法吧。
如上图所示为基于唇语的语音唤醒方法的步骤流程图。首先,采集用户的嘴唇变化图像,当用户需要针对某个智能设备启动语音交互功能时,可以直接对着智能设备的摄像头上说话,此时可以通过摄像头实时采集用户的嘴唇图像。
其次,判断用户的嘴唇变化图像是否与预设变化图像相匹配。根据接收到的用户的嘴唇变化图像进行判断,可以跟预设变化图像进行比对,判断是否相匹配。另外,由于用户可能在与其他人对话,此时需要判断用户是否正对着智能设备进行语音输入。
最后,当用户的嘴唇变化图像与预设变化图像相匹配时,唤醒语音交互功能。此时,当用户嘴唇变化图像与预设图像相匹配时,说明用户想与智能设备进行语音通话,此时智能设备开始唤醒语音交互功能。此时用户不需要做额外的唤醒动作,就可以直接进行语音对话。
如上图为嘴唇闭合和张开的示意图。当用户的嘴唇变化图像与预设变化图像相匹配时,唤醒语音交互功能的步骤之后,还要接收用户的语音,并判断所述语音是否为有效的语音信息;若是,则执行响应动作,若否,则关闭语音交互功能。
以上就是基于唇语的语音唤醒方法,在某些尴尬的场合,并不适合发出声音,甚至是在一些危险的场合,那么这样的唇语技术就可以发挥用场了。也是一项脑洞大开的专利,希望随着面部识别等技术的完善及发展,以后也有可能会出现唇语解锁等新技术呢!
相关文章
-
出去千万别说UI和美工是一个职业,千万别暴露你的缺点哦
文章来源:老铁商城2019-10-31 -
我优化多年的 C 语言竟然被 80行Haskell 打败了?
文章来源:老铁商城2019-10-20 -
当程序员遇到中秋节,会产生怎样的化学反应......
文章来源:老铁商城2019-09-18 -
淘宝、京东这些网站的哪个部分用了web前端技术?你能学会吗?
文章来源:老铁商城2019-09-18 -
Linux和哪些行业有关?2019Linux运维必备哪些技能?
文章来源:老铁商城2019-09-18 -
公认最具影响力的4种编程语言!平均薪资20K,Java第一
文章来源:老铁商城2019-09-18 -
PYPL 9 月编程排行榜:Python第一,继续称霸!就业薪资怎么样?
文章来源:老铁商城2019-09-18