Products 新闻资讯

人工智能语音交互,边缘计算下的智能音箱

日期: 2018-05-31
浏览次数: 16

在大家享受物联网带来便捷的同时,不断猜想未来的人机交互会发展成何种模式。运用边缘计算的声纹识别无疑是最直接的逻辑交互方式。让机器通过边缘计算,真正做到“知我所想,行其我意”变得尤为重要。作为最有可能打开这个市场第一个入口的边缘计算智能音箱,多家巨头都做了资金与技术投入。

 

语音交互技术提供基于声纹识别的个性化解决方案,让音箱变得真正智能。声纹识别(Voiceprint Recognition)是什么?与指纹、虹膜等生物识别手段类似,声纹识别是从一个人的语音片段中提取出独特且有规律的特征数据,下次再听到这个声音的时候能快速识别出来的技术。

 

声纹识别用处颇多。首先,它保证智能音箱使用的安全性和私密性。假如我们在初次使用智能音箱时了对家中小孩子的声音进行了录入,那么系统会根据孩子的声纹特征作为依据,对孩子后续的使用做规划和限制;在公共场合,当智能音箱询问是否要读新到的短信时,也可以通过声纹识别避免他人的恶作剧。其次,有个人定制感。在家中多人使用同一个智能音箱的情况下,当人们想放歌、购物时,不同的声纹可以通过该人的历史记录作个性化推荐。

 

麦克风阵列由一定数目的麦克风,是用来对声场的空间特性进行采样并处理的系统。而我们在语音交互中,尤其是智能音箱方案涉及到非常多的远场语音交互,麦克风阵列可以更好地解决更远的距离、更复杂的场景中出现的识别问题。的麦克风阵列算法支持常见的双麦,四麦,六麦方案,同时也成功的为合作伙伴提供了定制的高达16和24麦的大阵列方案。

 

在智能音箱方案的前端使用了麦克风阵列,以取得更好的语音采集效果。我们甚至可以这么说,不把智能音箱的前端采集处理做好,下一步的识别以及更后的指令处理、执行等等完全无从谈起。

 

另一方面,要使音箱执行正确的指令,首先应该获取纯净而正确的语音信号。在复杂的环境中,从含有噪音的语音信号中将目标语音提取出来,也是智能音箱技术中重要的一环,这个过程被称之为语音增强。麦克风阵列在此层面,通过波束形成技术,细致地处理了单麦很难应对的非平稳噪声和混响的影响,也在提取声源的同时更好地抑制噪声。

 

相比单麦克风而言,麦克风阵列在时域和频域的基础上增加了空域的概念,确定声源在空间中的位置,从而达到声源定位的目的。

 

语音交互方案采用边缘计算,将运算集中在低功耗端上设备处理,分担云的工作量,结合信号处理,深度学习,聚焦声学等。依靠先进的边缘计算才能达到快速响应,更高效的数据收集和分析,以及最佳用户体验。边缘计算语音交互核心算法全部于端上根据环境自适应计算,减少了网络交互的时间,达到低功耗高性能的唤醒、声纹识别,降噪,立体声回声消除效果。目前,智能音箱方案目前已适配了多家主流嵌入式平台。

热点新闻
点击次数: 11
8月11日,设备银行赋能高等院校科研教育技术研讨会在深圳职业技术学院隆重召开。来自北方工业大学、湖南师范大学、广东工业大学、深圳大学、湖南工业大学、深圳高训中心、湖南科技职业学院、中山火炬职业技术学院等数十家高校的专家老师们齐聚一堂,就工业互联网在高等院校教学、科研等技术应用展开交流。本次研讨会由深圳职业技术学院、湖南师范大学、深圳市矩形科技有限公司和深圳市老狗科技有限公司联合举办。在深圳职业技术...
2018 - 08 - 14
点击次数: 20
一、开门见山名词解释:设备银行:工业互联网极简开发工具,极简接入、分析、显示、控制。(设备银行 万物极简互联)数字双胞胎:通过将工业实际设备上的数据通过设备银行投影到云端,并在云端根据这台设备进行建模。这时云端的这个数字镜像与实际设备之间是完全相同的,简称为数字双胞胎。EBOX:设备银行超级网关,带一套协议适配软件,支持任意485、以太网协议设备的上云,同时可实现两种任意协议间的互相转换,同时EB...
2018 - 08 - 06
点击次数: 24
第十届深圳国际物联网博览会夏季展(IOTE)于7月31日上午在深圳会展中心隆重召开。本次博览会由中国物联网产业应用联盟主办,深圳市物联传媒有限公司、深圳市易信物联网络有限公司协办。IOTE由物联传媒集团创办于2009年6月份,今年已是第十届,是国内目前规模宏大、专业度高的物联网展之一,同时也已成为国内物联网产业发展的风向标。此次参展的企业展商以集成应用为导向,覆盖完整的产业链,包括物联网感知层(R...
2018 - 08 - 03
Copyright ©2017 - 2018 深圳市老狗科技有限公司
犀牛云提供企业云服务
关注我们
0755-8966 6680
合作交流
微信小程序
5
电话
  • 0755-8966 6680
6
二维码
回到顶部