重庆大学伍承伍洲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆大学申请的专利面向大模型训练的双智能体协同合成代码生成数据方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121597181B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610116491.9,技术领域涉及:G06F8/33;该发明授权面向大模型训练的双智能体协同合成代码生成数据方法是由伍承伍洲;刘超设计研发完成,并于2026-01-28向国家知识产权局提交的专利申请。
本面向大模型训练的双智能体协同合成代码生成数据方法在说明书摘要公布了:本发明公开了一种面向大模型训练的双智能体协同合成代码生成数据方法,包括:将将需求、规约与血统令牌组成的复合提示输入生成智能体生成初始代码样本;验证智能体通过语义图抽取与三元交叉注意力计算三类概率;若联合概率低于阈值,则构造负奖励梯度回传用于更新适配器并生成增补样本,与初始样本按血统溯源拼接成合并样本;验证不达标则循环修正,直至满足阈值或迭代上限,得到最终代码样本;最终代码样本与三类令牌封装为四元组训练样本写入数据池。本发明能够在无需依赖大量人工校验的条件下,形成质量可控、结构统一、血统可追溯且易于高效调用的代码训练数据。
本发明授权面向大模型训练的双智能体协同合成代码生成数据方法在权利要求书中公布了:1.面向大模型训练的双智能体协同合成代码生成数据方法,其特征在于,包括以下步骤: 步骤1:将包含需求令牌、规约令牌与血统令牌的复合提示向量输入至生成智能体,所述生成智能体通过冻结权重的主干解码器与适配器串联而成的异构解码栈,自回归地输出候选代码令牌序列,形成初始代码样本,包括: 步骤1-1:在离线阶段利用规则-神经网络混合抽取器对已通过许可证清洗的合规源码库进行逐文件解析,对于每个函数级代码片段,以函数签名为锚点生成需求令牌,所述需求令牌包括函数功能自然语言描述、输入输出张量形状列表及行业规范标识符三者拼接而成的定长768维向量表示;同时对同一函数签名的源码执行抽象语法树遍历与数据流图遍历,将遍历所得节点属性序列化为规约令牌,所述规约令牌包括抽象语法树节点类型序列、数据流图边类型序列以及安全关键等级标记拼接而成的定长1024维向量表示;随后基于Git提交哈希、仓库URI及起始行号生成全局唯一血统令牌,所述血统令牌包括160位SHA-1散列值、32位时间戳及16位许可证编号拼接而成的256位二进制向量表示; 步骤1-2:将需求令牌、规约令牌与血统令牌按列拼接形成复合提示向量,并在拼接处插入可学习的分隔嵌入,得到维度为3,768的复合提示向量;将复合提示向量输入生成智能体,所述生成智能体包括冻结权重的LLaMA-38B主干解码器与仅含0.1%可训练参数的低秩适配器串联而成的异构解码栈构成,其中,低秩适配器采用秩为16的LoRA矩阵对主干解码器的Query与Value投影层进行旁路注入; 步骤1-3:异构解码栈在自回归生成阶段通过温度退火采样策略,以0.8→0.2的线性退火温度对复合提示向量进行解码,输出最大长度为512的候选代码令牌序列,将候选代码令牌序列经词表反映射与空白符恢复后,得到可直接送入编译器的初始代码样本,所述初始代码样本为UTF-8编码的纯文本字符串,其首尾分别附加血统令牌十六进制表示作为不可编译注释,用于后续验证阶段快速溯源; 步骤2:把初始代码样本注入由验证智能体驱动的并行验证管线,所述验证智能体调用与生成智能体权重共享的语义编码器对初始代码样本进行图结构抽取,以获得抽象语法树令牌与数据流图令牌,并将抽象语法树令牌、数据流图令牌与需求令牌进行三元交叉注意力计算,实时产生编译通过概率、规范符合概率及血统完整概率; 步骤3:当编译通过概率、规范符合概率及血统完整概率的联合概率低于预设阈值时,验证智能体将抽象语法树令牌、数据流图令牌与初始代码样本的错位位置编码成负奖励梯度,并通过反向传播通道把负奖励梯度回传至生成智能体的适配器,实现权重即时更新,得到修正后生成智能体; 步骤4:修正后生成智能体依据负奖励梯度对初始代码样本的错位位置进行掩码替换,重新解码出增补代码样本,并把增补代码样本与初始代码样本按血统令牌记载的溯源标识进行拼接,形成带增量血统链的合并代码样本; 步骤5:验证智能体对合并代码样本再次执行并行验证管线,若联合概率达到预设阈值则输出合并代码样本,若仍未达到则将合并代码样本标记为二次初始代码样本并循环执行步骤2至步骤4,直至联合概率达到预设阈值或迭代次数达到上限,得到最终代码样本; 步骤6:将最终代码样本与其对应的需求令牌、规约令牌及完整的血统令牌封装为四元组训练样本,并写入面向大模型训练的数据池,用于后续对生成智能体主干解码器的全量微调。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学,其通讯地址为:400000 重庆市沙坪坝区正街174号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励