广州欢聚时代信息科技有限公司葛莉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州欢聚时代信息科技有限公司申请的专利商品标题摘要生成方法及其装置、设备、介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115203400B 。
龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210970001.3,技术领域涉及:G06F16/34;该发明授权商品标题摘要生成方法及其装置、设备、介质是由葛莉设计研发完成,并于2022-08-12向国家知识产权局提交的专利申请。
本商品标题摘要生成方法及其装置、设备、介质在说明书摘要公布了:本申请涉及计算机技术领域中一种商品标题摘要生成方法及其装置、设备、介质,所述方法包括:获取商品的标题文本;从标题文本中提取出属于产品词和属于属性词的知识词条,以知识词条的统计特征确定每个知识词条的信息评分,根据其选取相应的产品词与属性词的组合文本构造第一候选摘要集合;计算由标题文本中的部分词元相应组合而成的多个长文本与标题文本之间的相似度,选出相似度较高的长文本构造第二候选摘要集合;以标题文本与第一候选摘要集合及第二候选摘要集合中各个候选摘要组成数据对,输入至预先训练至收敛的文本分类模型,预测出各个候选摘要相对应的质量评分,选出质量评分较高的候选摘要作为标题文本的摘要。本申请能生成高质量摘要。
本发明授权商品标题摘要生成方法及其装置、设备、介质在权利要求书中公布了:1.一种商品标题摘要生成方法,其特征在于,包括如下步骤: 获取商品的标题文本; 从所述标题文本中提取出属于产品词和属于属性词的知识词条,以知识词条的统计特征确定每个知识词条的信息评分,根据信息评分选取相应的产品词与属性词的组合文本构造第一候选摘要集合; 计算由标题文本中的部分词元相应组合而成的多个长文本分别与标题文本之间的相似度,优选出相似度较高的长文本构造第二候选摘要集合; 以所述标题文本与第一候选摘要集合及第二候选摘要集合中各个候选摘要组成数据对,输入至预先训练至收敛的文本分类模型,预测出各个候选摘要相对应的质量评分,优选出质量评分较高的候选摘要作为标题文本的摘要; 所述文本分类模型的训练过程,包括:获取预备的训练集中的单个训练样本,所述训练集中的各个训练样本包含商品的标题文本、候选摘要及质量标签,所述训练样本标注的质量标签表征训练样本的候选摘要能否作为标题文本的摘要;由文本分类模型对训练样本提取文本语义特征后,经预测模块输出预测所述训练样本为正样本对应的质量评分;根据所述训练样本相对应的质量标签计算所述文本分类模型的质量评分的损失值,在该模型损失值未达到预设阈值时对该模型实施权重更新,并继续调用其他训练样本实施迭代训练直到模型收敛; 其中,所述获取预备的训练集中的单个训练样本之前,还包括:获取商品的品类系统中每个品类相对应的多个商品的标题文本,构造相对应的第一候选摘要集合及第二候选摘要集合;对所述每个品类包含的各个标题文本对应的第一候选摘要集合及第二候选摘要集合中各个候选摘要进行分词,采用词袋模型构建各个品类的词袋,其中包含相应品类的各个分词对应在候选摘要中的不同位置时,该分词对应的多个位置词频,选取每个品类的各个候选摘要的最后一个分词,关联其对应的各个位置词频作为关联对构造关联数据集;判断关联数据集中的各个关联对中所有的位置词频是否满足预设的正样本条件分布中的所有条件,若满足则将相应的候选摘要标注为正样本相对应的质量标签,否则判断是否满足预设的负样本条件分布中任意一项或多项条件,若满足则将相应的候选摘要标注为负样本相对应的质量标签;将各个被标注的候选摘要关联其对应标题文本及质量标签作为训练样本构建训练集; 所述正样本条件分布包括:相应的候选摘要中,在候选摘要的最后一位的位置词频大于与其紧邻的位置的位置词频乘上第一权重;在候选摘要的最后一位的位置词频大于所述紧邻的位置的位置词频之外的位置词频;在候选摘要的最后一位的位置词频大于等于第一预定阈值;在候选摘要的最后一位的位置词频大于第二预定阈值,所述第二预定阈值基于所述候选摘要所对应品类包含的标题文本的总数确定; 所述负样本条件分布包括:相应的候选摘要中,在候选摘要的最后一位的位置词频小于第一预定阈值;在候选摘要中的最后一位的位置词频小于与其紧邻的位置的位置词频乘上第二权重;在候选摘要的最后一位的位置词频小于其他位置的位置词频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州欢聚时代信息科技有限公司,其通讯地址为:511442 广东省广州市番禺区南村镇万博二路79号万博商务区万达商业广场北区B-1栋23层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励