西安理工大学吴亚丽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安理工大学申请的专利基于强化学习与数字孪生的复杂重型装备工艺优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116088455B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310225916.6,技术领域涉及:G05B19/418;该发明授权基于强化学习与数字孪生的复杂重型装备工艺优化方法是由吴亚丽;金璐;杨延西;米嘉阳;吴铎;王同同设计研发完成,并于2023-03-09向国家知识产权局提交的专利申请。
本基于强化学习与数字孪生的复杂重型装备工艺优化方法在说明书摘要公布了:本发明公开的基于强化学习与数字孪生的复杂重型装备工艺优化方法,步骤如下:1.采集实际物理车间的数据信息并对其预处理;2.构建数字孪生模型;3.建立物理车间生产线问题的数学模型;4.优化数学模型,得到理论最优决策方案;5.评估理论最优决策方案,确定最优决策方案;6.进行生产线的仿真,并在数字孪生模型中同步实时物理车间状态,完成复杂重型装备工艺优化;7.存储数据,为相应故障状态采取的强化学习模型和调度方案提供历史资料。本发明基于强化学习的复杂重型装备数字孪生调度方法,缓解铝挤压生产线对调度人员的过分依赖,调度人员不能实时根据车间状态对排产方案做出决策,该方法所得调度方案能更好适应复杂的生产过程。
本发明授权基于强化学习与数字孪生的复杂重型装备工艺优化方法在权利要求书中公布了:1.一种基于强化学习与数字孪生的复杂重型装备工艺优化方法,其特征在于,具体按照以下步骤实施: 步骤1、采集复杂重型装备实际物理车间的数据信息并对其进行预处理; 步骤2、根据预处理后的数据信息构建复杂重型装备生产线车间的数字孪生模型; 步骤3、确定物理车间生产线排产调度问题描述和实际加工生产时的约束条件,建立物理车间生产线问题的数学模型; 步骤4、优化数学模型,得到理论最优决策方案; 数学模型优化过程采用头脑风暴优化算法及深度强化学习算法; 优化过程具体为: 4.1、头脑风暴优化算法设置 4.1.1、编解码设置 采用整数编码的方式进行编码,解码过程通过编码结果确定工件加工时间的过程,通过从左至右读取编码结果,得到加工的工件批次号,以编码结果的顺序模拟排产调度,得到的最大完工时间,即为该编码顺序下的加工完所有批次工件所需要的加工时间; 4.1.2、初始化设置 定义解决优化排产调度问题的头脑风暴优化算法参数,令迭代次数为,种群规模为,扰动概率参数为,以整数编码方式随机产生个代表调度问题方案的初始个体,按如下公式生成初始个体: 6 其中,,分别是初始种群参数的上限和下限; 4.1.3、种群评价设置 计算初始化的种群中每个初始个体的适应度值,表示为最大完工时间的倒数,具体计算公式如下: 7 其中,为适应度值,为加工完所有批次工件所需要的加工时间; 4.1.4、种群更新设置; 以预设的概率参数分别对种群中的初始个体进行更新,种群更新的具体过程为,将新生成的个体,与同一位置的旧个体进行比较,保留适应度值高的个体; 其中,为替代聚类中心的选择概率;为选择一个类还是两个类产生新个体的概率;分别为选择一个类的类中心还是两个类的类中心产生新个体的概率; 4.1.5、终止条件设置; 若初始个体更新达到最大迭代次数,则停止迭代,否则重复步骤4.1.2-步骤4.1.4重新初始化种群,进行新一轮迭代操作; 4.2、深度强化学习算法设置; 4.2.1、构造深度强化学习模型; 智能体状态空间的状态由种群的适应度值数组构成,深度强化学习模型表示为: 8 其中,为种群平均适应度值,为最大和最小适应度值,为适应度值的均方差,为标准差; 4.2.2、策略机制设置; 设动作空间为智能体可采取的动作的集合,对当前扰动概率进行调整,设置当前扰动概率为+0.05、+0、-0.05三个操作,每次以策略,从动作空间中选取一个动作,用于调整当前扰动概率; 4.2.3、奖励机制设置; 设时刻的奖励函数为: 9 其中,为时刻的奖励函数,为价值函数,价值函数为奖励函数的累计; 以即时奖励rt作为当前状态下选取动作的反馈值,智能体根据反馈值不断优化策略选择合适的动作,保存当前状态、选取的动作、获得的即时奖励rt和下一个状态,定义存储的四元组为,其中,表示当前状态,表示当前动作,rt表示即时奖励,表示下一时刻状态; 4.2.4、更新智能体策略设置; 智能体更新策略采用策略方式,以1-的概率根据记忆池中存储的四元组选择奖励值大的动作,以的概率选择随机动作权衡探索和利用之间的概率,并设置随迭代次数递增的更新策略; 10 其中,表示初始值,设置为0.9;表示当前迭代次数;表示最大迭代数; 4.2.5、终止条件设置; 结束智能体更新的条件是达到最大迭代值,当前幕次达到最大迭代幕次,则完成深度强化学习的训练,得到一个理论最优决策方案;否则,初始化当前状态,继续训练; 步骤5、评估理论最优决策方案,确定最优决策方案; 步骤6、将最优决策方案带入数字孪生模型,进行生产线的仿真,并在数字孪生模型中同步实时物理车间状态,完成复杂重型装备工艺优化; 步骤7、存储复杂重型装备实际物理车间实施状态、故障状态、头脑风暴优化算法参数,强化学习模型及启用的最优决策方案信息,为相应故障状态采取的强化学习模型和调度方案提供历史资料。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安理工大学,其通讯地址为:710048 陕西省西安市碑林区金花南路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励