一种基于生成对抗模仿学习的操作人员运动技能训练方法

导航：龙图腾网> 最新专利技术> 一种基于生成对抗模仿学习的操作人员运动技能训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西北工业大学

摘要：本发明公开了一种基于生成对抗模仿学习的操作人员运动技能训练方法，基于一专家在环的遥操作训练框架，所述专家在环的遥操作训练框架包括专家和学员，通过在学员端施加引导力，在遥操作设备上模拟出专家对学员教导；在所述专家在环的遥操作训练框架中引入一训练者，所述训练者用于采用生成对抗模仿学习对其操作进行模仿；其中，训练过程包括以下步骤：步骤一、建立学员训练数据库；步骤二、基于训练数据库训练智能体来模拟操作员的行为；步骤三、基于训练好的智能体，设计学员运动技能训练方法。其解决了遥操作任务中操作人员技能水平提升较慢的问题。

主权项：1.一种基于生成对抗模仿学习的操作人员运动技能训练方法，其特征在于，基于一专家在环的遥操作训练框架，所述专家在环的遥操作训练框架包括专家和学员，通过在学员端施加引导力，在遥操作设备上模拟出专家对学员教导；在所述专家在环的遥操作训练框架中引入一训练者，所述训练者用于采用生成对抗模仿学习对其操作进行模仿；其中，训练过程包括以下步骤：步骤一、建立学员训练数据库；步骤二、基于训练数据库训练智能体来模拟操作员的行为；所述步骤二基于训练数据库训练智能体来模拟操作员的行为的具体方法为：对步骤一中得到的学员训练数据库进行处理，得到操作员轨迹和正确轨迹的差值Δmet＝xmt-xet，操作员轨迹和学员轨迹的差值Δmtt＝xmt-xtt；令状态st＝Δmtt,kt，动作at＝Δmet；将所述学员训练数据库中处理好的状态-动作对作为专家样本τE，利用基于变分自编码器的生成对抗模仿学习训练框架进行训练；最终得到可以模仿操作员行为的策略π，该策略可以根据状态st生成动作at；步骤三、基于训练好的智能体，设计学员运动技能训练方法；所述步骤三的具体方法为：最终训练阶段，专家端轨迹为xEt，学员端轨迹为xTt，虚拟操作员轨迹为xMt，虚拟操作员轨迹由步骤二中得到的操作员行为策略π计算得到；虚拟操作员轨迹和学员轨迹的差值ΔMTt＝xMt-xTt，则：xMt＝πΔMTt-1,kt-1+xEt-1＝πxMt-1-xTt-1,kt-1+xEt-1，训练过程中仅在学员端施加引导力学员受到的引导力表示为ft＝ktxMt-xTt；其余与专家在环的遥操作的框架相同。

全文数据：

权利要求：

百度查询：西北工业大学一种基于生成对抗模仿学习的操作人员运动技能训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种恒流源电路和恒流源

下一篇：油烟处理设备

相关技术

一种恒流源电路和恒流源

油烟处理设备

一种液体原液调试装置

一种液压破碎锤的缸体吊运工具

一种空调柜机接线结构及空调器

一种肉类风味制品加工装置

一种石英砂酸洗设备

一种管道支撑平台

3D打印内支撑条去除工具

一种全自动胶塞清洗机

一种新型电子产品木制外壳

一种带有灭虫功能的广告灯箱

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于生成对抗模仿学习的操作人员运动技能训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务