Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜天津大学温家宝获国家专利权

恭喜天津大学温家宝获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜天津大学申请的专利基于多模态信息融合的智能体强化路径规划算法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117784776B

龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311670287.4,技术领域涉及:G05D1/43;该发明授权基于多模态信息融合的智能体强化路径规划算法是由温家宝;李文杰;肖帅;奚萌;杨嘉琛设计研发完成,并于2023-12-07向国家知识产权局提交的专利申请。

基于多模态信息融合的智能体强化路径规划算法在说明书摘要公布了:本发明涉及一种基于多模态信息融合的智能体强化路径规划方法,可解决目前强化学习中环境信息利用不足的问题。旨在针对复杂环境下的路径规划任务进行Gazebo的精细建模,同时利用网络映射出状态信息空间的内在联系,实现多模态信息融合,以此辅助强化学习的策略学习,在既定任务场景下找到最优路径。本发明充分利用了复杂环境的诸多信息,避免了信息误差,在一定程度上规避了人为考虑的片面性和不准确性,同时有助于复杂场景诸多任务的开发与实现。

本发明授权基于多模态信息融合的智能体强化路径规划算法在权利要求书中公布了:1.一种基于多模态信息融合的智能体强化路径规划算法,其特征在于,第一步,复杂环境及智能体模型构建;1将某经纬度范围内的信息下载存储,包括经纬度范围、深度、密度、地形、环境动力大小方向的信息,对现有的环境动力数据进行插值计算,填补空缺部分的信息;2利用Gazebo平台在智能体上搭载GPS传感器、红外传感器、姿态传感器、速度传感器,同时定义好碰撞属性、重力、浮力,计算相应的环境动力系数,与环境信息一同加载到Gazebo平台中,通过Python算法以及ROS控制机制实时调用;第二步,多模态信息融合网络结构设计;在传感器采集到环境信息之后,将红外图片信息经过卷积神经网络进行池化,再将其输出的数据同智能体获得的姿态角度、速度、位置这九个维度的信息组成多维向量,输入到一个全连接网络中获得最终的输出;第三步,任务场景设置;定义场景下的具体任务,包括起始点、目标点、障碍物数量、障碍物类型、任务目标;同时设置智能体基本属性,包括初始位置、速度、姿态信息;初始化环境数据;第四步,强化学习算法架构设置;1状态空间通过多模态信息融合网络获得;2网络结构;强化学习可以概况为智能体采取行为对环境造成影响并给予反馈,争取奖励最大化的过程,在A2C算法中,包括决策者和评价者,分别对应着策略网络和价值网络,策略网络指导智能体执行动作,价值网络给予评价,网络架构中加入了类残差结构,将归一化后的状态信息同网络各层的特征向量输入到下一层网络中;3动作空间;考虑到与真实环境更加相似,智能体所采取的动作分为roll、yaw、pitch、上浮、下潜、前进六个维度;4经验池的设计;针对任务场景设置合适的容量大小、BatchSize以及经验池的更新频率,此外对高奖励的动作价值对进行标记,增大其每次被采样的概率;第五步,训练与超参数调节;通过网络状态输入,动作输出过程的交替进行直到任务结束或者训练步数完毕,将每一条经验数据放入经验池,从中采样更新迭代策略网络和价值网络,权衡训练结果是否符合既定的任务条件,综合利用回合结束的奖励值、完成任务的单次回合的步数、实际路线效果进行策略评估,表征当下策略的好坏情况,与此同时,针对网络结构中的超参数进行调节,实现效果优化。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学,其通讯地址为:300072 天津市南开区卫津路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。