Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州电子科技大学曹九稳获国家专利权

杭州电子科技大学曹九稳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州电子科技大学申请的专利一种电话场景下热词在线定制更新的自动语音记录方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114283796B

龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111393878.2,技术领域涉及:G10L15/08;该发明授权一种电话场景下热词在线定制更新的自动语音记录方法是由曹九稳;钱伊扬;王天磊;刘鹏;向建发设计研发完成,并于2021-11-23向国家知识产权局提交的专利申请。

一种电话场景下热词在线定制更新的自动语音记录方法在说明书摘要公布了:本发明公开了一种电话场景下热词在线定制更新的自动语音记录方法,首先训练基于深度神经网络的自动语音识别模型:然后通过电话音频文件对自动语音识别模型进行再训练,生成预训练模型;定制差异化语言模型自更新模型与热词表,并实时调整解码阶段的权重,组成自适应语音识别热词系统。本发明提出了基于不同场景的电话客服可在线定制热词的语音识别系统,生成不同场景下的热词表,提高了语音转写成文本效率的准确性;提出了热词权重实时更新算法,在线统计热词词频,依据词频在声学模型的解码阶段实时更新模型参数采用迁移学习的方式对8K电话音频进行再学习,提高了电话场景下音频语音识别的准确率。

本发明授权一种电话场景下热词在线定制更新的自动语音记录方法在权利要求书中公布了:1.一种电话场景下热词在线定制更新的自动语音记录方法,其特征在于,步骤如下: S1:采用公开的通用语音数据集训练基于深度神经网络的自动语音识别模型: 所述的自动语音识别模型的训练包括确定自动语音识别模型的基本参数;初始化自动语音识别模型的各层权重和确定优化方法; S2:通过电话场景下采集的8k的电话音频文件对自动语音识别模型进行再训练,生成基于8K电话场景的自动语音识别模型的预训练模型; 将电话场景下的8K音频转化为频谱图,通过迁移学习将频谱图进行训练,在16K的公开标准数据音频上训练得到的自动语音识别模型称之为老师模型进行再训练获得学生模型,微调模型,用老师模型指导学生模型进行训练;学生模型在训练过程中,尽量使其逼近老师模型的后验概率分布,生成基于8K电话场景的自动语音识别模型的预训练模型; S3:将预训练模型部署运行;在运行过程中,利用预训练模型对通话语音进行识别,并将获得的文本数据进行存储,用于热词在线定制; S4:定制差异化语言模型自更新模型与热词表,并实时调整解码阶段的权重,组成自适应语音识别热词系统; S4-1:对文本数据进行分词,去掉停用词,对词频进行提取; S4-2:对于词频进行归一化,依据概率差异,其归一化使用词频如下: Wf表示词频,Wf*为归一化后的词频,μ表示词频均值,σ表示词频标准差; S4-3:提取出不同场景下的通用热词表与差异热词表,并根据词频的中位数数值确定相对应的激活阈值与差异阈值,若某热词在当前场景下使用频率超过激活阈值且小于不同场景下的差异阈值时,将其作为差异热词;只在超过差异阈值的场景下对模型的解码阶段进行权重调整;若某热词在当前场景下使用频率超过激活阈值且超过不同场景下的差异阈值时,将其作为通用热词;在所有场景下模型的解码阶段提高权重;判定公式如下: word为进行判别的词,Hotwordcommon为通用热词,Hotwordparticulary为差异化热词;Wf表示词频,AcTh表示激活阈值,DiffTh表示差异阈值; S4-4:系统对音频的解码生成文本数据时,依照热词权重表对解码结果进行参数调整与优化;当Transformer模型的解码器输出文字的拼音与热词表中热词相同时,进行热词判别模式,新增一条含有热词的路径,在该路径解码分数中加入偏移分数,重新进行打分,其公式如下: δk=log1+Wf 其中,scorey1,...,ys为BeamSearch解码下第一个字y1到最后一个字ys的路径上的最终分数,Plmyk|y1,...,yk-1,x表示第k个字出现在输出中的概率,δk表示参数的偏移分数; 将得到新路径与其他路径进行比较,依据得分高低,得到一条分数最高的路径作为最优路径,保存文本结果;将实时保存的文本数据作为新的语料进行补充,在线更新激活阈值与差异化阈值; S4-5:设计自适应语音识别热词系统的更新频率,通过用户调整更新权重的间隔时间或者设置在空闲时自动更新; S4-6:还提供一种可互动的热词更新方式,同时将自己的常用热词依照“热词-词性-权重等级”的格式生成json文件上传至系统中,依据权重等级调整偏移分数,进行热词的用户自定义得到自定义热词,以满足自己的需求;上述自定义热词具有初始权重,并可在系统使用过程中动态调整权重、激活阈值与差异阈值,使其能够在语音识别中提升效率,同时更好的对用户语音进行识别。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。