广东工业大学伦嘉铭获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东工业大学申请的专利一种基于强化学习的公交站场服务中断防治方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116127839B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310007411.2,技术领域涉及:G06F30/27;该发明授权一种基于强化学习的公交站场服务中断防治方法是由伦嘉铭;姜海明;李锦豪;谢康设计研发完成,并于2023-01-04向国家知识产权局提交的专利申请。
本一种基于强化学习的公交站场服务中断防治方法在说明书摘要公布了:本发明公开了一种基于强化学习的公交站场服务中断防治方法,包括以下步骤:S1、建立车流与客流相结合的公交运行仿真模型,将仿真模型作为强化学习的环境,并设计状态空间与动作空间;S2、采集公交系统的当前运行状态,根据运行状态对强化学习算法下的无效动作进行遮蔽;S3、利用长短期记忆模型预测环境状态,使智能体不断与环境进行交互以学习最优策略,并对算法参数进行更新,直到完成设定训练回合数;S4、采用训练完成的强化学习算法对公交系统进行模拟计算,智能体通过控制车辆驻留站场,延迟发车时间,达成公交站场服务中断防治。本方法与传统技术相比,通过实时感知公交系统中的客流与车辆位置信息,对公交站场发车进行动态决策。
本发明授权一种基于强化学习的公交站场服务中断防治方法在权利要求书中公布了:1.一种基于强化学习的公交站场服务中断防治方法,其特征在于,包括以下步骤: S1、建立车流与客流相结合的公交运行仿真模型,将仿真模型作为强化学习的环境,并设计状态空间与动作空间; S2、采集公交系统的当前运行状态,根据运行状态对强化学习算法下的无效动作进行遮蔽; S3、利用长短期记忆模型预测环境状态,使智能体不断与环境进行交互以学习最优策略,并对算法参数进行更新,直到完成设定训练回合数;设定强化学习算法的算法参数具体为:设置最大训练回合数、每个回合的时间步数、批量大小,初始化经验回放库、Actor网络与Critic网络的参数;强化学习算法使智能体不断与环境进行交互以学习最优策略,其训练过程具体为: S31、根据状态采样动作,并在公交运行仿真环境中执行,使智能体与环境交互; S32、根据步骤S1设计的状态空间,利用长短期记忆模型对公交行程时间进行预测,得到执行之后的环境状态; S33、根据奖励函数计算执行后所得的奖励,并将元组存储至经验回放库;所述奖励函数包括有发车间隔与驻站时长;其数学表达方式具体为: 其中,和为权重超参数;为第个发车站场;为第辆车;为防止因发车间隔过大而出现服务中断的惩罚项;为站场在时间步时相邻两趟车的发车间隔;为站场服务中断的时间间隔阈值,当发车间隔大于该值则判定为服务中断;为松弛时间,即对临近服务中断条件的发车间隔进行惩罚,使智能体更好地学习避免出现服务中断;为车辆驻站的惩罚项,该项一方面能够防止智能体为了避免服务中断而选择将车辆长时间驻留站场,另一方面能够提升车辆利用效率,减少乘客候车时长; S34、若经验回放库中的元组数量达到批量大小,则计算优势函数,更新Actor网络与Critic网络的参数,并清空经验回放库;否则,转到步骤S2; S35、若当前回合数达到最大训练回合数,则算法模型训练结束;否则,转到步骤S2; S4、采用训练完成的强化学习算法对公交系统进行模拟计算,智能体通过控制车辆驻留站场,延迟发车时间,达成公交站场服务中断防治。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学,其通讯地址为:510060 广东省广州市越秀区东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励