北京航空航天大学张日崇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京航空航天大学申请的专利一种基于知识库增强的跨域新闻推荐方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115640462B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211382100.6,技术领域涉及:G06F16/9535;该发明授权一种基于知识库增强的跨域新闻推荐方法是由张日崇;刘德志;王健宇;屈云陆设计研发完成,并于2022-11-07向国家知识产权局提交的专利申请。
本一种基于知识库增强的跨域新闻推荐方法在说明书摘要公布了:本发明通过网络安全领域的方法,实现了一种基于知识库增强的跨域新闻推荐方法。方法通过引入外部数据集作为输入,提取新闻内容语料输入基于对抗训练的跨域实体抽取模型,并输出新闻实体名称后,与实体共同输入基于多策略集成的新闻实体链接模型,得到最终实体间匹配度得分;将所述最终实体间匹配度得分、新闻内容语料,新闻类别信息得到的词汇三者共同作为多知识图谱增强的新闻推荐模型的输入,经过计算得到对用户兴趣点进行推理及预测,在待选新闻中找出符合用户兴趣点的新闻向用户推荐。本发明实现了一个可以有效解决跨域推荐问题的知识库增强的新闻推荐系统,并在MIND数据集上对各个子模块及完整算法的有效性进行评估。
本发明授权一种基于知识库增强的跨域新闻推荐方法在权利要求书中公布了:1.一种基于知识库增强的跨域新闻推荐方法,其特征在于:方法通过引入Freebase、WordNet和MIND数据集作为输入,从MIND数据集中提取新闻内容语料输入基于对抗训练的跨域实体抽取模型,并输出新闻实体名称后,与从Freebase中引入的实体共同输入基于多策略集成的新闻实体链接模型,得到最终实体间匹配度得分;将所述最终实体间匹配度得分、MIND数据集中提取的所述新闻内容语料,MIND数据集中提取的新闻类别信息得到的词汇以及WordNet中得到词汇三者共同作为多知识图谱增强的新闻推荐模型的输入,并基于用户浏览历史作为另一输入参数,经过计算得到对用户兴趣点进行推理及预测,在待选新闻中找出符合用户兴趣点的新闻,最终将新闻推荐给用户; 所述基于对抗训练的跨域实体抽取模型具体结构为:将源域带标注数据与目标域无标注数据通过新闻标题及摘要文本特征提取模型,分别得到源域词向量序列和目标域词向量序列;源域词向量序列经过BIO标注模型得到源域BIO标注序列,并使用损失函数计算损失;目标域词向量序列经过梯度翻转模块和注意力模块得到句向量,并使用领域判别计算损失;最终得出损失函数; 模型的运算部由两部分构成,分别是生成BIO标注的基础分类器,以及使用对抗训练方法的跨域鉴别器; 所述生成BIO标注的基础分类器输入源域词向量序列,即给出,经过BIO序列标注模型得到源域BIO标注序列,对新闻的内容语料进行实体抽取;BIO序列标注模型首先将新闻的内容语料中的每个单词转换成单词的嵌入向量,得到新闻内容语料的词嵌入向量表示;接着,使用文本特征提取器对新闻内容语料中每个单词的词嵌入向量进行上下文信息提取,得到每个单词的隐层的向量表示ht;选用特征提取方面常用的双向长短期记忆模型以及在大规模数据上经过预训练的BERT模型作为文本特征提取器; BiLSTM作为文本特征提取器时,隐层向量表示为: BERT模型作为文本特征提取器时,隐层向量表示为: 进而,对新闻内容语料中各词的词向量经过特征抽取,得到新闻内容语料的特征表示;该特征表示作为实体抽取中的任务分类器的输入,通过线性层和softmax层预测每个单词的BIO标注,新闻内容语料中第个单词所对应标注的概率分布为: 是一个三维向量,代表新闻内容语料中第个词属于BIO这三类标注的概率分布,第个词的BIO标注根据的分布情况得到: 损失函数L的计算方法为:所述使用对抗训练方法的跨域鉴别器输入源域词向量序列和目标域词向量序列,经过梯度反转模块、注意力模块后,分别得到源域句向量和目标域句向量,并输入领域判别器得到领域判别损失函数,为了特征提取器能够尽可能地提取出领域无关的特征,构建一个对抗损失函数,为表示新闻内容语料属于源领域还是目标领域而设置变量,对于每个新闻内容语料,如果来自源领域,;如果来自目标领域,;对抗损失函数,联合损失函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励