华为技术有限公司和煦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华为技术有限公司申请的专利一种模型训练方法及相关设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115293227B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210705971.0,技术领域涉及:G06N3/092;该发明授权一种模型训练方法及相关设备是由和煦;李栋设计研发完成,并于2022-06-21向国家知识产权局提交的专利申请。
本一种模型训练方法及相关设备在说明书摘要公布了:一种模型训练方法,涉及人工智能领域,方法包括:通过第一强化学习模型,处理第一数据,以得到第一处理结果;通过从多个第一神经网络中选择的第一目标神经网络,处理第一数据,以得到第二处理结果;每个第一神经网络为对第一初始神经网络进行迭代训练的过程得到的一个迭代结果,并根据第一处理结果以及第二处理结果,更新第一强化学习模型。本申请利用历史上对抗智能体的历史训练结果历史迭代过程中得到的对抗智能体来输出针对于目标任务的干扰,从而可以得到适配于不同的场景下针对于目标任务的更有效的干扰,从而提高模型的训练效果和泛化性。
本发明授权一种模型训练方法及相关设备在权利要求书中公布了:1.一种模型训练方法,其特征在于,所述方法包括: 通过第一强化学习模型,处理第一数据,以得到第一处理结果;其中,所述第一数据指示目标物体的状态,所述第一处理结果用于作为在所述目标物体上执行目标任务时的控制信息; 通过第一目标神经网络,处理所述第一数据,以得到第二处理结果;其中,所述第二处理结果用于作为执行所述目标任务时的干扰信息,所述第一目标神经网络为从多个第一神经网络中选择的,每个所述第一神经网络为对第一初始神经网络进行迭代训练的过程得到的一个迭代结果; 根据所述第一处理结果和所述第二处理结果,执行所述目标任务,得到第三处理结果; 根据所述第三处理结果,更新所述第一强化学习模型,以得到更新后的第一强化学习模型;所述目标物体为机器人;所述目标任务为机器人的姿态操控,所述第一处理结果为机器人的姿态控制信息;或者, 所述目标物体为车辆;所述目标任务为车辆的自动驾驶,所述第一处理结果为车辆的驾驶控制信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华为技术有限公司,其通讯地址为:518129 广东省深圳市龙岗区坂田华为总部办公楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励