平安科技(深圳)有限公司张旭龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利一种语音合成方法和装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115294961B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210912149.1,技术领域涉及:G10L13/08;该发明授权一种语音合成方法和装置、电子设备及存储介质是由张旭龙;王健宗设计研发完成,并于2022-07-29向国家知识产权局提交的专利申请。
本一种语音合成方法和装置、电子设备及存储介质在说明书摘要公布了:本申请实施例提供了一种语音合成方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括获取第一语音素材,将第一语音素材输入至第一主干网络,对第一主干网络进行预训练得到参考模型;第一语音素材包括单人说话语音内容;根据参考模型的第一模型参数构建第二主干网络;获取第二语音素材,将第二语音素材输入至第二主干网络,对第二主干网络进行低资源目标训练得到适配模型;第二语音素材包括多人说话语音内容;将目标文本素材输入至适配模型,通过适配模型进行语音合成,得到目标语音频谱。本申请实施例能够省去模型构建的前序处理流程,简化处理流程,提高处理效率;并且通过少量的目标语料以及标签信息进行较高质量的语音合成。
本发明授权一种语音合成方法和装置、电子设备及存储介质在权利要求书中公布了:1.一种语音合成方法,其特征在于,所述方法包括: 获取第一语音素材,将所述第一语音素材输入至第一主干网络,对所述第一主干网络进行预训练得到参考模型;所述第一语音素材包括单人说话语音内容; 根据所述参考模型的第一模型参数构建第二主干网络; 获取第二语音素材,将所述第二语音素材输入至所述第二主干网络,对所述第二主干网络进行低资源目标训练得到适配模型;所述第二语音素材包括多人说话语音内容; 将目标文本素材输入至所述适配模型,通过所述适配模型进行语音合成,得到目标语音频谱; 采集目标对象的真实语音素材,并对所述真实语音素材进行语音频谱提取,得到真实语音频谱; 通过均方损失函数,计算所述真实语音频谱与所述目标语音频谱之间的第一损失值; 根据所述第一损失值对所述第二主干网络的低资源目标训练过程进行约束; 其中,所述获取第二语音素材,将所述第二语音素材输入至第二主干网络,对所述第二主干网络进行低资源目标训练得到适配模型这一步骤,包括: 将所述第二语音素材输入至所述第二主干网络; 通过所述第二主干网络对所述第二语音素材中的说话人进行声纹识别,根据识别结果生成说话人编码;其中,所述说话人编码特征是用于区别不同的说话人的说话人标签; 通过所述第二主干网络对所述第二语音素材进行向量化处理,得到音素向量序列,对音素向量序列进行特征提取,得到音素嵌入特征; 结合所述说话人编码以及所述音素嵌入特征进行编码得到语音频谱素材;在所述语音频谱素材中的语音频谱携带有说话人标签; 获取输出所述语音频谱素材后的所述第二主干网络的第二模型参数,根据所述第二模型参数确定所述适配模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励