2021年声纹识别技术五大发展趋势总结

2021-10-21 07:20:05下载本文作者:会员上传
简介:写写帮文库小编为你整理了这篇《2021年声纹识别技术五大发展趋势总结》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《2021年声纹识别技术五大发展趋势总结》。

2021年声纹识别技术五大发展趋势总结

撰写人:___________

期:___________

2021年声纹识别技术五大发展趋势总结

走出实验室的声纹识别技术因其广阔的应用场景和价值,从特定领域到民用领域,在国内外正迎来第一波商用化浪潮。而与此同时,关于声纹识别技术研究的成熟度以及安全可靠性,一直是应用领域讨论的重点,本文基于时下声纹识别技术研究的前沿观点,总结出五大发展趋势:

1、声纹识别研究朝着深度学习和端到端方向发展

语音作为语言的声音表现形式,不仅包含了语言语义信息,同时也传达了说话人语种、性别、年龄、情感、信道、嗓音、病理、生理、心理等多种丰富的副语言语音属性信息。以上这些语言语音属性识别问题从整体来看,其核心都是针对不定时长文本无关的句子层面语音信号的有监督学习问题,只是要识别的属性标注有不同。

近年来,声纹识别的研究趋势正在快速朝着深度学习和端到端方向发展,其中最典型的就是基于句子层面的做法。在网络结构设计、数据增强、损失函数设计等方面还有很多工作去做,还有很大的提升空间。

2、提升声纹识别系统的短时语音情况

在实际应用中,由于对基于语音的访问控制需求的不断增长,提升声纹识别系统在短时语音情况下的性能变得尤为迫切。短时语音中说话人信息不足以及注册和测试语音的文本内容不匹配,对于主流的基于统计建模的声纹识别系统是一个严峻的挑战。

3、改进现有的深度说话人学习方法

目前采用的深度说话人识别方法首先利用神经网络提取前端的帧级特征,然后通过池化映射获得可以表示说话人特性的段级向量,最后采用LDA/PLDA等后端建模方法进行度量计算。

相对于传统的i-vector生成过程,基于深度学习的说话人识别方法优势主要体现在区分性训练和利用多层网络结构对局部多帧声学特征的有效表示上。如何进一步改进现有的深度说话人学习方法是现阶段的一个研究热点。

4、深度对抗学习在声纹识别技术中的应用

生成式对抗网络(GAN)的主要目的是用在数据生成、降噪、等很多场景里面。它还被用在领域自适应里面,形成一个新的分布。

第三个广泛的应用是生成对抗样本,这会对分类系统产生大的困扰。很多研究者用对抗样本攻击机器学习的系统,在原始数据上增加一些扰动,生成样本,经过神经网络之后就有可能识别成完全不同的结果。这个思想在图像处理领域非常活跃,会造成错误识别,引起了自动驾驶,安全等领域的研究人员的广泛___。

在语音领域,GAN可以用在语音识别、口音自适应上,通过多任务学习和梯度反转层来进行口音或信道的自适应,然后加上其他方法可以得到较好的效果。声纹识别也存在各种不匹配的问题,在声纹识别上也可以使用这一思想。同样的思想也用在了TTS语音合成领域,目的是把不同的音素解耦成说话人,风格等,去除噪声对建模的影响。

5、深度嵌入学习是进行声纹识别和反欺骗的一个重要途径

说话人识别和欺骗检测近年来受到学术界和业界的广泛___,人们希望在实际应用中设计出高性能的系统。基于深度学习的方法在该领域得到了广泛的应用,在说话人识别和反欺骗方面取得了新的里程碑。然而,在真实复杂的场景下,面对短语音、噪声的破坏、信道失配、大规模等困难,开发一个鲁棒的系统仍然是非常困难的。深度嵌入学习是进行说话人识别和反欺骗的一个重要途径,在这方面已有一些著名的研究成果。如之前的d-vector特征和当前普遍使用的__-vector特征。

结语:

目前,指纹识别、人脸识别已经被大众所熟知,但同样作为生物识别的声纹识别,还处于技术挑战的前沿地带。据声纹识别企业快商通分析,当下全球生物识别产业规模庞大,仅声纹识别这一细分方向的市场规模就将近百亿美元,预计__年更是有望超过___亿美元(合___亿元人民币),占整个生物识别市场的___%。

以国内公共安全领域为例,公安部面向全国推广声纹技术,与指纹库、DNA库类似,声纹库建设是一项有着重要实战价值的工作,具体表现在声纹特征具有非接触式采集的优点,和已有DNA库、指纹库相结合,可形成立体生物特征库,建成后直接为多警种服务,是利用高科技手段在侦破案件和诉讼活动中应用的一个新的增长点,将能有效提高公安机关侦查破案的效率和能力,成为落实科技强警的重要实践之一。目前,公安部已在声纹库建设方面进行了重点布局,并选择快商通等通过公安部标准检测的厂商作为声纹采集设备提供方,力求双发共同完成这项专业技术性强、应用领域广、建设难度大的系统工程。

快商通成立于__年,以声纹识别等智能生物识别、自然语言处理等人工智能技术为核心,投入声纹识别研发超过___年。以李海洲教授领衔的团队,包括来自声学所、新加坡国立大学、___大学、___大学、剑桥大学等全球顶级名校的众多博士和硕士。

快商通是国家声纹识别和自然语言处理技术与应用标准化研究基地唯一承建单位,中国标准化研究院战略合作单位,公安部第一研究所战略合作单位。是国内声纹识别和自然语言处理技术的行业标准制定者。

范文仅供参考

感谢浏览

下载2021年声纹识别技术五大发展趋势总结word格式文档
下载2021年声纹识别技术五大发展趋势总结.doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    中国旅游电子商务的五大发展趋势

    中国旅游电子商务的五大发展趋势 导读:自1997年首个旅游网站上线,我国旅游电子商务已走过17年的历程,并保持了持续快速发展的势头。2013年我国旅游电子商务市场交易规模达到220......

    中国户外广告的五大发展趋势

    中国户外广告的五大发展趋势 1.户外广告从城市走向城镇,走向农村已成必然!近五年来户外超高速发展令广告业人士瞠目结舌,户外广告从城市走向城镇,走向农村已成必然!喷绘广告(灯箱......

    多媒体技术发展趋势

    多媒体技术发展趋势   1、发展趋势状况  总的来看,多媒体技术正向二个方而发展:一是网络化发展趋势,与宽带网络通信等技术相互结合,使多媒体技术进入科研设计、......

    社区矫正声纹识别IVR系统

    社区矫正声纹识别IVR系统 本系统为司法行政工作中产生的其他信息和各基层单位相关组织人员信息提供动态管理与维护功能。系统的建立和使用将使得司法矫正人员管理工作从传统......

    工程项目管理将出现五大发展趋势

    工程项目管理将出现五大发展趋势 时间:2008-08-04 点击: 在当前经济全球化日益发展的背景下,我国的工程项目管理将出现五大发展趋势大走向: 一是建筑业的项目管理由生产方......

    数据中心五大热门技术

    数据中心五大热门技术,你采用了吗? 从某种程度上,几乎所有的企业都要依靠技术。不同企业之间业务成败的关键,往往是由于技术因素的差异限制;或者说依靠这些业务的经营方式,并及时......

    光纤通信技术的发展趋势

    光纤通信技术的发展趋势[摘要]对光纤通信技术领域的主要发展热点作一简述与展望,主要有超高速传输系统、 超大容量波分复用系统、光联网技术、新一代的光纤、IP over SDH与IP......

    光纤通信技术及其发展趋势

    光纤通信技术及其发展趋势 摘要:光纤通信技术是目前通信行业应用的主要技术,光纤通信跟传统通信方式比较具有很强的优势,在通信网络中已得到广泛应用。光纤通信技术作为信息技......