电子科技大学李波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种面向技术文献的技术功效矩阵构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115481636B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211117627.6,技术领域涉及:G06F40/295;该发明授权一种面向技术文献的技术功效矩阵构建方法是由李波;刘婷;李辉;曾洪;王海洋设计研发完成,并于2022-09-14向国家知识产权局提交的专利申请。
本一种面向技术文献的技术功效矩阵构建方法在说明书摘要公布了:本发明公开一种面向技术文献的专利技术功效提取方法,分析高端装备领域专利技术术语和功效术语的特征,提高中文专利中的技术术语和功效术语提取的精确性。本发明构建了面向技术术语和功效术语抽取的深度学习模型,并结合专利的句式规则,进行技术术语启发式特征的构造,通过构建功效术语特征词典,定位功效语句,加快模型的训练速度,提高抽取精度,为降低人工标注样本的成本以及避免数据集过小导致模型过拟合现象,采用一种自训练算法实现模型的弱监督学习。通过词聚类从中选择与专利文本主题最相近的技术术语,利用余弦相似度合并相似语义的术语,构建技术功效矩阵。
本发明授权一种面向技术文献的技术功效矩阵构建方法在权利要求书中公布了:1.一种面向技术文献的专利技术功效提取方法,包括以下步骤: 步骤1:利用工具LTP对技术文献进行分词、词性标注,通过依存句法分析将句子所包含的语法单元或词语单元之间的关系,更换为句法分析树,将技术功效目标句分解为短语的嵌套和层叠的组合,强调句子中词语之间的依赖关系,提取具有依存关系的词对,将复杂冗长的技术、功效术语转为词语组合的形式;对专利数据集的术语采用{B,I,O}的标签方案进行人工标注,即由标签{B,I}表示技术和功效术语,标签{O}表示非技术功效术语,构造模型训练数据集和测试数据集; 步骤2:对步骤1已标注的训练集采用skip-gram模型进行预训练,得到词向量; 步骤3:分别构建技术术语抽取模型和功效术语抽取模型; 步骤3.1:通过技术术语前后的线索词以及技术术语所具备的词语特征,构建技术术语实体特征; 步骤3.2:根据技术文献在表达功效的语句中存在的相应规则,构建功效属性词典,进行功效语句的定位,初步过滤功效语句构建功效术语;将功效语句的功效术语拆分为主词与受词分别进行提取;主词表示功效和作用的词语,受词表示主词所作用的属性; 步骤3.3:将词性、依存关系加入词向量中作为功效术语抽取模型的输入,将技术术语实体特征、词向量、词性、依存关系合并成向量矩阵作为技术术语抽取模型的输入; 步骤3.4:基于双向长短时记忆神经网络构建技术术语抽取模型和功效术语抽取模型; 步骤4:实现技术术语抽取模型和功效术语抽取模型的弱监督学习;其具体步骤为: 步骤4.1:对抽取模型初始化,这里的抽取模型表示技术术语抽取模型或功效术语抽取模型,使用少量已标注数据对抽取模型进行训练; 步骤4.2:将训练出的抽取模型对未标注数据进行标注,采用判决算法计算每一标注判决的置信度,优选出置信度高于阈值的可信数据; 执行标准的硬判决Viterbi算法,以上一位置状态为前提,计算到当前位置得出的最大概率的状态作为最优隐含状态序列即幸存路径; 在执行过程中存储各子路径的分支度量值,即相邻两位置节点间的所有可能路径的分支度量值,存储节点与节点间所有子路径的分支度量值的公式如下: ; 其中,表示t-1位置各标签的状态得分,表示t-1位置各标签与t位置各标签间的转移得分,表示t-1位置各标签的状态的得分; 计算各幸存子路径在路径竞争中被选择的概率,将其作为相应节点标注的置信度,t位置节点标注的置信度表示为: ; 其中,为节点与节点间的幸存子路径度量值,为节点与节点间的各子路径度量值; 步骤4.3:将这些可信数据与其预测标签一起进行模型的增量训练,训练后对剩下的未标注数据同样进行如上操作,以此不断迭代,直至没有高于阈值的数据为止; 步骤5:根据步骤4得到的抽取模型,对目标技术文献进行技术术语抽取和功效术语抽取,抽取结果分别为技术术语向量和功效术语向量; 以名称中出现的术语作为种子词,利用余弦相似度计算各技术术语与种子词之间的相似度,选择相似度值最大的一个作为与主题最相近的技术主题词,余弦相似度公式为: 其中,A和B为术语对应的向量,为对应向量中的元素,n表示元素总个数; 步骤6:判定术语相似度; 采用基于相似度理论的实体对齐方法,分别计算技术主题词和功效术语向量间的余弦相似度来判定短语间的语义相似度,根据相似度的大小确定短语间是否具有相同含义,对相同语义词语进行合并; 步骤7:通过上述步骤获得技术方案的唯一技术主题词和多个功效术语,以技术主题词为横坐标,功效术语为纵坐标,交点表示对应技术方案数量,构建技术功效矩阵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励