Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京航空航天大学任毅龙获国家专利权

北京航空航天大学任毅龙获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京航空航天大学申请的专利一种面向不同类型交叉口的大语言模型控制交通信号方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120766523B

龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511059226.3,技术领域涉及:G08G1/01;该发明授权一种面向不同类型交叉口的大语言模型控制交通信号方法是由任毅龙;付翔;于海洋;姜涵;陈思祺设计研发完成,并于2025-07-30向国家知识产权局提交的专利申请。

一种面向不同类型交叉口的大语言模型控制交通信号方法在说明书摘要公布了:本申请属于交通控制系统技术领域,具体而言涉及一种面向不同类型交叉口的大语言模型控制交通信号方法,包括:获取历史交通口环境集合;并进行统一的状态和动作表示形成第一矩阵;基于第一矩阵中随机采样的状态,训练近端策略优化的强化学习模型,并基于第一矩阵形成交通信号控制序列轨迹;通过卷积神经网络提取交通信号控制序列轨迹的状态数据中包含的时间序列信息,形成潜空间特征;通过线性层分别处理潜空间特征、交通信号控制序列轨迹的动作和奖励,得到输入特征;并经过训练过的微调大语言模型的运算后,形成预测特征;微调大语言模型通过损失函数和双模拟度量学习的编码器更新和优化以进行训练,预测特征包括预测状态、预测动作和预测奖励。

本发明授权一种面向不同类型交叉口的大语言模型控制交通信号方法在权利要求书中公布了:1.一种面向不同类型交叉口的大语言模型控制交通信号方法,其特征在于,包括: 获取历史交通口环境集合,并进行统一的状态和动作表示形成第一矩阵; 基于第一矩阵中随机采样的状态,训练近端策略优化的强化学习模型,并将第一矩阵全部输入至训练完的强化学习模型中,形成专家经验数据; 基于专家经验数据形成交通信号控制序列轨迹; 通过卷积神经网络提取交通信号控制序列轨迹的状态数据中包含的时间序列信息,形成潜空间特征; 通过线性层分别处理潜空间特征、交通信号控制序列轨迹的动作和奖励,得到输入特征; 输入特征经过训练过的微调大语言模型的运算后,形成预测特征;包括:初始化可学习低秩矩阵,所述可学习低秩矩阵包括第一可学习低秩矩阵和第二可学习低秩矩阵,其中,初始化后的第一可学习低秩矩阵内的元素满足高斯分布,表示为:,其中为第一可学习低秩矩阵内第i行第j列的元素,为方差;初始化后的第二可学习低秩矩阵内的元素均为0,表示为:,其中为第二可学习低秩矩阵内第i行第j列的元素; 所述大语言模型包括多层Transformer模块,输入特征经过一层Transformer模块的输出为:,其中,W为权重,为输入特征,α为一个超参数,主要用于调整权重矩阵占最终模型参数的比例,A和B为可学习低秩矩阵;经过L层Transformer模块的输出为:,其中,为经过L层Transformer模块的大语言模型输出的最终特征,为输入特征,表示具有L层Transformer模块的GPT-2模型,为经过LoRA的微调过程; 最终特征依次输入至动作预测网络、状态预测网络和奖励预测网络中,得到包括预测状态、预测动作和预测奖励的预测特征,其中,所述动作预测网络和奖励网络均包括线性层,状态预测网络包括线性层和反卷积层,预测特征表示为:,,,其中,为预测动作,为预测状态,为预测奖励,为线性函数,为双曲正切函数,为反卷积函数; 所述微调大语言模型通过损失函数和双模拟度量学习的编码器更新和优化以进行训练,所述预测特征包括预测状态、预测动作和预测奖励;所述损失函数表示为:其中,为交通信号控制序列轨迹中第t时刻的动作数据,为对应的预测动作,为交通信号控制序列轨迹中第t时刻的奖励数据,为对应的奖励动作,为交通信号控制序列轨迹中第t时刻的状态数据,为对应的状态动作; 通过双模拟度量同一指标的不同数据,计算两个数据之间的相似性,用于训练编码器,所述编码器包括状态线性层、动作线性层和奖励线性层; 当该指标为状态数据时,两个状态数据之间的行为相似性表示为:其中,为状态和这2个状态之间的行为相似性,表根据当前状态对应的奖励值,表示二阶Wasserstein距离;表示概率动力学模型的高斯分布; 训练编码器得到的期望关系表示为:其中,为编码器;通过多个状态数据对,达到最小化双模拟度量指标以及潜空间之间的距离的学习目标,表示为: 其中,表示编码器的停止梯度; 获取实时交叉口数据; 基于实时交叉口数据经过微调大语言模型得到对应的实时预测数据。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100083 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。