恭喜广州杰赛科技股份有限公司;华南理工大学;广东工业大学杜翠凤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜广州杰赛科技股份有限公司;华南理工大学;广东工业大学申请的专利一种机器人自主学习方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114529010B 。
龙图腾网通过国家知识产权局官网在2025-03-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210109610.X,技术领域涉及:G06N3/045;该发明授权一种机器人自主学习方法、装置、设备及存储介质是由杜翠凤;杜广龙;滕少华;蒋仕宝设计研发完成,并于2022-01-28向国家知识产权局提交的专利申请。
本一种机器人自主学习方法、装置、设备及存储介质在说明书摘要公布了:本发明公开一种机器人自主学习方法、装置、设备及存储介质,该方法包括:基于预先构建的虚拟环境,获取由虚拟环境自动生成的环境参数;根据环境参数,通过深度学习模型生成训练数据;根据训练数据,采用分层强化学习框架生成至少一个机器人技能;根据待执行任务确定机器人的状态空间,基于状态空间,采用变分推理方法预测待执行任务的潜在技能向量,潜在技能向量与至少一个机器人技能中的其中一个机器人技能具有一一对应的关系;根据机器人技能和潜在技能向量,采用强化学习算法获得用于完成待执行任务的机器人控制策略。本发明在面对不同类型的任务时,无需重复针对不同类型的任务对机器人进行技能训练,提高了机器人进行自主学习的泛化性。
本发明授权一种机器人自主学习方法、装置、设备及存储介质在权利要求书中公布了:1.一种机器人自主学习方法,其特征在于,包括:基于预先构建的虚拟环境,获取由所述虚拟环境自动生成的环境参数;根据所述环境参数,通过深度学习模型生成训练数据;根据所述训练数据,采用分层强化学习框架生成至少一个机器人技能;根据待执行任务确定机器人的状态空间,基于所述状态空间,采用变分推理方法预测所述待执行任务的潜在技能向量,其中,所述潜在技能向量与所述至少一个机器人技能中的其中一个机器人技能具有一一对应的关系;根据所述机器人技能和所述潜在技能向量,采用强化学习算法获得用于完成所述待执行任务的机器人控制策略;其中,所述分层强化学习框架包括上层决策模型和下层决策模型;则,所述根据所述训练数据,采用分层强化学习框架生成至少一个机器人技能,具体包括:根据所述训练数据,基于所述上层决策模型,通过MPC算法对每个时刻的任务序列进行规划;基于所述下层决策模型,通过DQN算法对所述每个时刻的任务序列进行运动规划,生成所述至少一个机器人技能。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州杰赛科技股份有限公司;华南理工大学;广东工业大学,其通讯地址为:510310 广东省广州市海珠区新港中路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。