重庆邮电大学李鹏华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于重参数化交叉并行卷积神经网络的说话人识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116030802B 。
龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310018504.5,技术领域涉及:G10L15/16;该发明授权一种基于重参数化交叉并行卷积神经网络的说话人识别方法是由李鹏华;方昳凡;唐培渊;谢潇;刘学超设计研发完成,并于2023-01-06向国家知识产权局提交的专利申请。
本一种基于重参数化交叉并行卷积神经网络的说话人识别方法在说明书摘要公布了:本发明涉及一种基于重参数化交叉并行卷积神经网络的说话人识别方法,属于语音识别领域,包括以下步骤:S1:构建结构重参数化卷积网络RepCNN;S2:基于RepCNN搭建交叉平行卷积神经网络;S3:采用两个不同三角滤波器个数的梅尔滤波器组从说话人的语音帧中提取两个不同频域分辨率的特征S4:以作为交叉平行卷积神经网络的输入,输出增强特征和S5:将特征和进行特征融合,输出说话人深层特征向量。本发明降低了模型对计算资源的依赖,提升了模型运算速率和准确性的同时,实现了网络模型的轻量化。
本发明授权一种基于重参数化交叉并行卷积神经网络的说话人识别方法在权利要求书中公布了:1.一种基于重参数化交叉并行卷积神经网络的说话人识别方法,其特征在于:包括以下步骤: S1:构建结构重参数化卷积网络RepCNN; S2:基于RepCNN搭建交叉平行卷积神经网络; S3:采用两个不同三角滤波器个数的梅尔滤波器组从说话人的语音帧中提取两个不同频域分辨率的特征、;步骤S3中,梅尔滤波器组由M个三角形滤波器组成,梅尔滤波器组频域响应描述如下: 其中M是梅尔滤波器组中三角形滤波器的个数,k是频率值;和分别为第m个三角形滤波器的下限截止频率和上限截止频率; 梅尔滤波器组从语音帧中提取M维功率谱,然后通过计算语音帧M维功率谱的对数得到M维特征,从同一个人的语音中提取出两个MFBF特征作为网络的输入,用、表示,、,和为输入特征的维度,T为输入语音帧数; S4:以、作为交叉平行卷积神经网络的输入,输出增强特征和;步骤S4中,将、作为交叉平行卷积神经网络的输入,k表示第k个平行卷积层,网络由n个平行卷积层构成,,,和分别表示和的长,和表示和的宽; 所述交叉平行卷积神经网络包括平行层,所述平行层包括两个互补特征提取模块,以及两个结构重参数化卷积网络RepCNN1和RepCNN2; 所述互补特征提取模块由两个结构重参数化卷积网络RepCNN1、RepCNN2及其sigmoid激活函数,以及取平均值模块构成; 平行层中的RepCNN1用于提取输入特征中隐藏的重要信息,输出表达式为: 其中是RepCNN1层的输出,,表示RepCNN1层中的参数; 同理RepCNN2用于提取输入特征中隐藏的重要信息; 互补特征提取模块用于获取说话人输入特征、中的互补特性,通过RepCNN1和RepCNN2,激活函数均采用sigmoid,输出特征矩阵的表达式为: 其中表示sigmoid激活函数,和分别表示RepCNN2和RepCNN1卷积层的参数; 然后通过融合了说话人互补信息的互补特征提取模块输出来增强说话人特征: 其中表示第k个平行卷积层左边的交叉平行卷积神经网络的输出,,表示对应元素相乘; 第k个平行卷积层右边的交叉平行卷积神经网络的输出,公式为: 其中,和分别表示第k个平行层中右边交叉平行卷积神经网络中RepCNN中的参数; S5:将特征和进行特征融合,输出说话人深层特征向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区黄桷垭崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励