天府绛溪实验室汪洋旭获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天府绛溪实验室申请的专利一种基于多模态大模型的金融研报结构化识别方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121582957B 。
龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610099465.X,技术领域涉及:G06V30/42;该发明授权一种基于多模态大模型的金融研报结构化识别方法与系统是由汪洋旭;吴怀谷;张楠欣设计研发完成,并于2026-01-26向国家知识产权局提交的专利申请。
本一种基于多模态大模型的金融研报结构化识别方法与系统在说明书摘要公布了:本申请公开了一种基于多模态大模型的金融研报结构化识别方法与系统,涉及文本图像分析技术领域,首先通过获取并标注金融研报图像构建训练数据集,随后基于该数据集对多模态大模型进行两阶段训练:首先在冷启动有监督微调阶段,利用思维链信息微调基座模型,使其学会遵循协同推理逻辑以生成结构化输出;然后在强化学习优化阶段,以微调后的模型为初始策略,采用分组相对策略优化算法并基于多任务奖励函数进行策略优化。最终,将待识别研报图像输入训练好的模型,即可输出包含图表列表、正文文本和思维链推理链的结构化结果。过引入思维链指导模型训练,显著提升了金融研报信息提取的结构化程度、准确性与可解释性。
本发明授权一种基于多模态大模型的金融研报结构化识别方法与系统在权利要求书中公布了:1.一种基于多模态大模型的金融研报结构化识别方法,其特征在于,包括: 获取多份金融研报图像,并对每份金融研报图像进行标注,生成训练数据集,标注包括图像标识、场景信息、图表列表、正文文本和思维链推理链,图表列表包括至少一个图表项,每个图表项包含图表类型、边界框坐标、标题、内容详情、完整性状态和完整性原因; 思维链推理链的生成步骤,包括: 利用版面分析模型对金融研报图像进行语义结构定位,得到图表类型和边界框坐标; 利用多模态识别模型对定位出的语义结构进行解析,生成图表的标题和内容详情; 对金融研报图像的正文区域进行光学字符识别,生成正文文本; 整合图表类型和边界框坐标、图表的标题和内容详情以及正文文本,并辅以人工校验,生成思维链推理链; 基于训练数据集,对多模态大模型进行两阶段训练; 在冷启动有监督微调阶段中,使用标注数据中的思维链信息对基座多模态大模型进行有监督微调,使得基座多模态大模型学会遵循由思维链信息定义的协同推理逻辑,生成结构化的输出; 在强化学习优化阶段中,以微调后的模型作为初始策略,采用基于分组相对策略优化的强化学习算法,并基于一组多任务奖励函数对模型进行策略优化,多任务奖励函数为定位奖励、摘要奖励、OCR奖励、一致性奖励和完整性奖励的加权和; 定位奖励基于模型预测的边界框与真实边界框的交并比进行梯度计算; 摘要奖励基于模型生成的图表内容详情与真实内容详情的BLEU分数计算; OCR奖励基于模型识别出的正文文本与真实正文文本的字符错误率计算; 一致性奖励用于验证模型输出的思维链推理链与结构化输出内容的逻辑一致性; 完整性奖励基于模型对图表区域不可读状态判断的准确性计算; 将待识别的金融研报图像输入训练后的模型,获取输出的结构化识别结果,结构化识别结果包括图表列表、正文文本和思维链推理链。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天府绛溪实验室,其通讯地址为:641450 四川省成都市东部新区实验室一路366号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励