Products 新闻资讯

人工智能语音交互,边缘计算下的智能音箱

日期: 2018-05-31
浏览次数: 25

在大家享受物联网带来便捷的同时,不断猜想未来的人机交互会发展成何种模式。运用边缘计算的声纹识别无疑是最直接的逻辑交互方式。让机器通过边缘计算,真正做到“知我所想,行其我意”变得尤为重要。作为最有可能打开这个市场第一个入口的边缘计算智能音箱,多家巨头都做了资金与技术投入。

 

语音交互技术提供基于声纹识别的个性化解决方案,让音箱变得真正智能。声纹识别(Voiceprint Recognition)是什么?与指纹、虹膜等生物识别手段类似,声纹识别是从一个人的语音片段中提取出独特且有规律的特征数据,下次再听到这个声音的时候能快速识别出来的技术。

 

声纹识别用处颇多。首先,它保证智能音箱使用的安全性和私密性。假如我们在初次使用智能音箱时了对家中小孩子的声音进行了录入,那么系统会根据孩子的声纹特征作为依据,对孩子后续的使用做规划和限制;在公共场合,当智能音箱询问是否要读新到的短信时,也可以通过声纹识别避免他人的恶作剧。其次,有个人定制感。在家中多人使用同一个智能音箱的情况下,当人们想放歌、购物时,不同的声纹可以通过该人的历史记录作个性化推荐。

 

麦克风阵列由一定数目的麦克风,是用来对声场的空间特性进行采样并处理的系统。而我们在语音交互中,尤其是智能音箱方案涉及到非常多的远场语音交互,麦克风阵列可以更好地解决更远的距离、更复杂的场景中出现的识别问题。的麦克风阵列算法支持常见的双麦,四麦,六麦方案,同时也成功的为合作伙伴提供了定制的高达16和24麦的大阵列方案。

 

在智能音箱方案的前端使用了麦克风阵列,以取得更好的语音采集效果。我们甚至可以这么说,不把智能音箱的前端采集处理做好,下一步的识别以及更后的指令处理、执行等等完全无从谈起。

 

另一方面,要使音箱执行正确的指令,首先应该获取纯净而正确的语音信号。在复杂的环境中,从含有噪音的语音信号中将目标语音提取出来,也是智能音箱技术中重要的一环,这个过程被称之为语音增强。麦克风阵列在此层面,通过波束形成技术,细致地处理了单麦很难应对的非平稳噪声和混响的影响,也在提取声源的同时更好地抑制噪声。

 

相比单麦克风而言,麦克风阵列在时域和频域的基础上增加了空域的概念,确定声源在空间中的位置,从而达到声源定位的目的。

 

语音交互方案采用边缘计算,将运算集中在低功耗端上设备处理,分担云的工作量,结合信号处理,深度学习,聚焦声学等。依靠先进的边缘计算才能达到快速响应,更高效的数据收集和分析,以及最佳用户体验。边缘计算语音交互核心算法全部于端上根据环境自适应计算,减少了网络交互的时间,达到低功耗高性能的唤醒、声纹识别,降噪,立体声回声消除效果。目前,智能音箱方案目前已适配了多家主流嵌入式平台。

热点新闻
点击次数: 10
工业互联网时代MES新应用技术交流会随着制造产业链全球化分工日益加剧,客户对供应商现场管理能力的要求也越来越高。在工业4.0和智能制造2025的推动下,数字化智能工厂已然成为国内诸多工厂的标准实力体现。MES作为数字化工厂的一部分,解决了原材料成本、人工成本上升、生产现场管理混乱、定单杂生产效率难以提升、生产异常难以实时临控等问题,真正地可以实现精益制造及管理,是工业4.0与智能制造的必要环节。工...
2018 - 10 - 11
点击次数: 16
开门见山名词解释:名词解释:MES:所谓MES(manufacturing execution system)即为智能制造中的过程执行系统。设备银行:工业互联网极简开发工具,极简接入、分析、显示、控制。阿普奇:行业智能专用设备服务商,率先提出工业电脑模块化极简设计和免维护计算机概念,是国内领先的一家加固工业计算机生产商,也是国内第一家工业电脑上市企业,设备银行指定工业计算机品牌。EBOX:设备银行...
2018 - 10 - 09
点击次数: 11
一、前言本人从2000年开始就参与MES系统的设计和工程工作,但这并不是一个轻松的工作,有些项目历时数年也没能让用户满意,以至于有“上MES是找死,不上MES是等死”的说法。究其缘由是MES数据的不可信。为何不可信?主要是因为中小型企业用的MES系统的数据来源主要是来自于人,与管理流程息息相关,插单、变更、退单等管理不顺都会导致系统数据的错乱,从而导致管理层不信任MES。包罗万象的MES直到去年设...
2018 - 10 - 09
Copyright ©2017 - 2018 深圳市老狗科技有限公司
犀牛云提供企业云服务
关注我们
0755-8966 6680
合作交流
微信小程序
5
电话
  • 0755-8966 6680
6
二维码
回到顶部