一种基于元模仿学习的双臂机器人智能搬运方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：哈尔滨理工大学

摘要：本发明提供了一种基于元模仿学习的双臂机器人智能搬运方法。该方法包括以下步骤：首先，根据搬运难度进行分级，越光滑、越重的物体等级越高，搬运使用的力越大，由操作者操控双臂机器人执行搬运任务，获取示教数据集，对示教数据集进行预处理，合成专家数据集；其次，运用专家示教数据集进行最大熵逆强化学习训练奖励函数；再次，使用训练出来的奖励函数作为动作指导，采用MAML元强化学习方法，训练出一个泛化能力足够强的双臂搬运策略模型。本发明使双臂机器人可在保持一定效率的情况下，既能成功执行样本之内物块搬运，又能通过少量数据样本的适应，成功执行样本之外物体的搬运任务，相较于传统的双臂机器人搬运规划方法和一般的强化学习机器人搬运算法，提升了双臂机器人在搬运任务上的泛化能力并降低了训练成本。

主权项：1.一种基于元模仿学习的双臂机器人智能搬运方法，其特征在于，该方法包括以下步骤：步骤1：示教数据收集与专家数据库创建：根据搬运难度进行分级，越光滑、越重的物体等级越高，搬运使用的力越大，由操作者操控机器人执行搬运任务，搬运多种的物体。获取示教数据集，表示为机器人状态数据包括关节角、手臂末端力、期望关节角、被搬运物体的位姿和掉落次数。对收集的示教数据集进行预处理，并将处理过的数据集成专家示教数据集，表示为其中s表示观测到的信息，a表示当前状态映射的机器人动作；步骤2：基于最大熵逆强化学习的奖励函数训练：采用MLP网络来近似这个未知的奖励函数，网络的输入是专家数据库中的状态特征，即收集到的关节角、手臂末端力、期望关节角、被搬运物体的位姿和掉落次数这些机器人状态数据，输出是奖励值rφ＝gf,φ，其中g表示非线性奖励函数，f表示状态特征，φ为神经网络参数。优化神经网络的网络参数，提高在使用该奖励函数下训练策略执行专家行为的概率，并引入最大熵约束，鼓励策略的多样性；步骤3：基于MAMLModel-AgnosticMeta-Learning，即模型无关的元学习的双臂搬运策略训练：从多样化的搬运任务中进行任务抽样，涵盖不同物体质量和摩擦系数不同的特性，以确保任务具有代表性和多样性。使用训练好的奖励函数模型来指导双臂机器人的行为，通过MAML的快速适应能力，提高机器人在多变环境中搬运任务的泛化性能。利用训练好的策略模型执行多样化搬运，通过MAML的适应能力和逆强化学习的快速学习能力优化搬运任务的泛化效果并减少训练时间。

全文数据：

权利要求：

百度查询：哈尔滨理工大学一种基于元模仿学习的双臂机器人智能搬运方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种种子栽培种植开沟装置

下一篇：一种高浓度含氟废水治理设备

相关技术

一种种子栽培种植开沟装置

一种高浓度含氟废水治理设备

一种便携式气动执行机构弹簧调整装置

一种适用于垂直起降无人机的可折叠起落架

一种金属制品加工用数控刀头

一种市政道路铺砖装置

一种刹车盘保护盖

一种非封闭交通条件下基于动应变的桥梁承载能力评定方法及系统

一种骨科肢体创伤急救固定装置

表单页面动态渲染方法、系统、存储器及存储介质

一种电炉铁液随流孕育装置

用于治疗三尖瓣功能不全的系统、方法和装置

机器人相关技术

机器人底盘及搬运机器人_芜湖纽浩智能装备有限责任公司_202322807064.X

堆垛机器人_天隼(武汉)科技有限公司_202410898617.3

机器人_日东电工株式会社_202380019526.1

清洁机器人_深圳银星智能集团股份有限公司_202323159690.9

机器人_腾讯科技(深圳)有限公司_202111347049.0

清洁机器人_深圳银星智能集团股份有限公司_202210530891.6

手术机器人_深圳康诺思腾科技有限公司_202323456229.X

巷道巡检机器人_中煤科工集团上海有限公司_201910462851.0

管道检测机器人_西南科技大学_202421934544.0

轮式足球机器人_福建工程学院_202010858385.0

智能相关技术

智能蜂箱_北京农学院_202323448144.7

智能推车_上海德致伦电子科技有限公司_202420189518.3

智能衣柜及智能衣柜的控制方法_宁波方太厨具有限公司_202410754582.6

智能配送策略规划方法及智能配送装置_浙江辉驿网络科技有限公司_202410411321.4

一种智能汽车专用智能锁扣_苏州崴骏精密模具有限公司_202420239206.9

智能门锁的控制方法及智能门锁_浙江德施曼科技智能股份有限公司_202410680944.1

轻型智能恒压水泵_元井泵业有限公司_202420086208.9

智能割草机_未岚大陆(北京)科技有限公司_202310257273.3

智能立体仓储系统_苏州江天包装科技股份有限公司_202411098282.3

智能测温线夹_红光电气集团有限公司_202111054923.1

双臂相关技术

一种用于闭合消化道穿孔的内镜双臂闭合夹_厦门伟景医疗科技有限公司_201911246409.0

一种基于双臂机器人侧向抓取箱体方法、装置、设备和介质_中电科机器人有限公司_202410812138.5

一种基于双臂机器人结构的磁瓦卡簧嵌装单元_南京信息职业技术学院_201811277485.3

基于双臂机器人的抓取方法、装置及双臂机器人_中国科学院自动化研究所_202110594376.X

一种远程操作平台多功能检测与维护双臂执行器_中国科学院合肥物质科学研究院_202410998219.9

一种全自动乳腺超声双臂扫查方法、装置及控制系统_合肥合滨智能机器人有限公司_202410844105.9

一种双臂机器人多任务作业协调运动控制方法_北京凡川智能机器人科技有限公司_202410233155.3

一种基于元模仿学习的双臂机器人智能搬运方法_哈尔滨理工大学_202410743470.0

一种双臂上下协作拉花的结构及拉花方法、拉花系统_大赏(北京)科技股份有限公司_202410992410.2

固定双臂显示器悬挂系统_苏州三丰原创医疗科技有限公司_202420283037.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于元模仿学习的双臂机器人智能搬运方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务