和美(深圳)信息技术股份有限公司张俊峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉和美(深圳)信息技术股份有限公司申请的专利文本自动纠错方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114154487B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111489580.1,技术领域涉及:G06F40/232;该发明授权文本自动纠错方法、装置、电子设备及存储介质是由张俊峰;王艳飞;胡茂海;胡碧峰;刘庆设计研发完成,并于2021-12-08向国家知识产权局提交的专利申请。
本文本自动纠错方法、装置、电子设备及存储介质在说明书摘要公布了:本申请涉及一种文本自动纠错方法、装置、电子设备及存储介质,结合了字词层面和句子层面的纠错方式进行纠错,在保证纠错效率的前提下,可以对文本进行更全面有效的纠错,该方法包括:对输入文本进行错误检测,以确定出所述输入文本中包含的易错词条;生成每个易错词条对应的正确候选词条,基于每个易错词条对应的正确候选词条以及易错词条在所述输入文本中的位置,构建多个候选纠错结果并添加到候选结果集合中;基于下游纠错模型获得所述输入文本对应的若干候选纠错结果,并添加到所述候选结果集合中;对所述候选结果集合中的候选纠错结果进行排序,基于排序结果获得所述输入文本对应的纠错结果。
本发明授权文本自动纠错方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种文本自动纠错方法,其特征在于,包括: 对输入文本进行错误检测,以确定出所述输入文本中包含的易错词条; 生成每个易错词条对应的正确候选词条,基于每个易错词条对应的正确候选词条以及易错词条在所述输入文本中的位置,构建多个候选纠错结果并添加到候选结果集合中; 基于下游纠错模型获得所述输入文本对应的若干候选纠错结果,并添加到所述候选结果集合中; 对所述候选结果集合中的候选纠错结果进行排序,基于排序结果获得所述输入文本对应的纠错结果; 所述下游纠错模型包括基于Bi-LSTM的检测网络和基于ALBERT的纠错网络,所述检测网络用于预测文本中每个字的错误概率,所述纠错网络用于预测纠错后的文本; 所述基于下游纠错模型获得所述输入文本对应的若干候选纠错结果,包括: 将所述输入文本对应的向量表示输入所述检测网络,以获得所述输入文本中每个字的错误概率,其中,表示所述输入文本中第i个字对应的向量; 对向量表示中的进行掩码操作后,通过预测模型对掩码操作后的向量进行预测,获得所在位置的预测向量;其中,所述预测模型与所述纠错网络为功能不同的独立模块,所述预测模型用于生成被掩码位置的预测向量,所述纠错网络用于基于融合后的新向量生成最终的候选纠错结果; 基于如下公式获得所述输入文本中每个字的新向量: , 其中,表示第i个字的新向量,表示通过预测模型对向量表示中的进行掩码操作后获得的针对所在位置的预测向量,表示第i个字的错误概率;所述新向量的构建使得:当越高时,越接近于;当越低时,ei′越接近于;所述检测网络的输出作为权重,直接控制所述纠错网络的输入向量的构建; 将输入所述纠错网络,获得若干候选纠错结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人和美(深圳)信息技术股份有限公司,其通讯地址为:518040 广东省深圳市福田区沙头街道泰然工贸园苍松大厦1301室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励