荣耀终端股份有限公司王泰辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉荣耀终端股份有限公司申请的专利一种音频生成方法及相关设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120431901B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411998549.4,技术领域涉及:G10L13/08;该发明授权一种音频生成方法及相关设备是由王泰辉;夏日升设计研发完成,并于2024-12-31向国家知识产权局提交的专利申请。
本一种音频生成方法及相关设备在说明书摘要公布了:本申请提供了一种音频生成方法及相关设备,适用于语音交互场景。通过结合残差量化的修正流模型处理文本的相关特征,得到量化后的声学特征,复用音频解码器对该声学特征进行解码,得到文本对应的音频信号。其中,修正流模型的训练过程中,修正流模型的输入数据是根据由音频编码器与音频解码器匹配编码之后的数据得到的。量化后的声学特征相比于常用的梅尔谱维度更低,因此扩散模型相比于生成梅尔谱的模型参数量和算力需求都更小,也能不额外配置解码模块而考虑复用音频解码器进行解码,不带来额外的参数量且节省算力。修正流模型相比于传统扩散模型能提升推理效率。因此,上述方案能够明显提升音频生成的效率,节省电子设备的算力。
本发明授权一种音频生成方法及相关设备在权利要求书中公布了:1.一种音频生成方法,应用于电子设备,其特征在于,所述方法包括: 获取待生成音频信号的第一文本; 获取所述第一文本的语义特征和音素长度特征; 将所述语义特征、所述音素长度特征以及随机采样得到的第一高斯噪声,输入修正流模型,得到与码本对应的离散码矢; 根据所述离散码矢针对所述码本进行查询,并对查询到的码本矢量进行融合,得到连续声学特征,所述离散码矢表示为所述码本中与所述连续声学特征最接近的矢量,所述离散码矢为所述连续声学特征的离散化表示,将所述语义特征和所述音素长度特征作为条件信息,将所述第一高斯噪声作为观察信号; 利用音频解码器对所述连续声学特征进行解码,得到时域的音频信号,所述音频信号的内容与所述文本的内容相同; 所述音频解码器与所述电子设备中的音频编码器编码格式匹配且互为逆过程,所述修正流模型的训练数据中的样本信号是经过所述音频编码器处理得到的样本音频信号编码后的量化特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人荣耀终端股份有限公司,其通讯地址为:518040 广东省深圳市福田区香蜜湖街道东海社区红荔西路8089号深业中城6号楼A单元3401;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励