中国银联股份有限公司彭树远获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国银联股份有限公司申请的专利基于贝叶斯网络的同义词判断方法及其装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115526167B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210614905.2,技术领域涉及:G06F40/247;该发明授权基于贝叶斯网络的同义词判断方法及其装置是由彭树远;才华设计研发完成,并于2022-06-01向国家知识产权局提交的专利申请。
本基于贝叶斯网络的同义词判断方法及其装置在说明书摘要公布了:本发明涉及一种基于贝叶斯网络的同义词判断方法及其装置。该方法包括:数据预处理步骤,对于待消歧词进行特征提取,获得特征变量;贝叶斯网络训练步骤,根据所述待消歧词的特征变量计算得到待消歧词间的相似度,将计算得到的待消歧词间的相似度进行离散化得到待消歧词间的相似度级别,将所述待消歧词间的相似度级别输入到预先训练好的贝叶斯网络模型,利用所述贝叶斯网络模型得到与所述待消歧词间的相似度级别相对应的同义词概率;以及同义词判断步骤,基于所述同义词概率进行同义词判断。
本发明授权基于贝叶斯网络的同义词判断方法及其装置在权利要求书中公布了:1.一种基于贝叶斯网络的同义词判断方法,其特征在于,包括: 数据预处理步骤,对于待消歧词进行特征提取,获得特征变量; 贝叶斯网络训练步骤,根据所述待消歧词的特征变量计算得到待消歧词间的相似度,将计算得到的待消歧词间的相似度进行离散化得到待消歧词间的相似度级别,将所述待消歧词间的相似度级别输入到预先训练好的贝叶斯网络模型,利用所述贝叶斯网络模型得到与所述待消歧词间的相似度级别相对应的同义词概率;以及 同义词判断步骤,基于所述同义词概率进行同义词判断, 其中,所述预先训练好的贝叶斯网络模型通过以下步骤训练得到: 随机选取规定数量的主题词; 计算所有主题词的字向量间的Jaccard相似度,对于所述字向量间的Jaccard相似度大于规定阈值作为经筛选的主题词对,对于所述经筛选的主题词对标注主题词对间的同义词的概率; 对于所述经筛选的主题词对,计算TF-IDF权重得到各个主题词所在句子词向量、去除停用词并计算相对位置距离权重得到的主题词所在句子词向量、主题词出现的作者姓名词向量、主题词出现机构词向量、主题词出现分类号词向量、主题词相关论文发表时间词向量的6个特征变量; 计算主题词对间的所述6个特征的余弦相似度; 将所述6个特征的余弦相似度进行离散化得到主题词对间的相似度级别;以及 将所述主题词对间的相似度级别以及所述标注主题词对间的同义词的概率作为训练样本集,根据所述训练样本集使用K2算法进行贝叶斯网络结构的学习得到贝叶斯网络模型, 其中,所述进行贝叶斯网络结构的学习包括: 假设所述Jaccard相似度和所述6个特征的余弦相似度存在依赖关系,用连接边表示,建立完全潜在图,得到相似度的概率; 对所述完全潜在图进行修剪以降低计算复杂度; 设定输入初始的变量顺序和变量父节点的上限值k,其中k取值为小于7的自然数; 对于每一个节点,从空节点集开始,依据修剪后的潜在图计算候选父节点组合的K2评分,逐步增加父节点的数目,当增加了父节点的数目而评分值不增加或者父节点数目达到k个时,算法结束; 在上述网络结构基础上进行参数学习,根据所述得到相似度的概率,学习各个节点的条件概率分布表;以及 更改初始变量顺序,对贝叶斯网络进行多次训练,选择准确率最高的网络结构,并按照训练样本集估计参数, 所述特征变量包括: 用于表示组成词的字符和字符的次序以及属性的单独词特征; 用于表示文本中待消歧词周边的词特征的上下文特征;以及 用于表示待消歧词所在文本的结构化信息的文本标签特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国银联股份有限公司,其通讯地址为:200135 上海市浦东新区含笑路36号银联大厦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励