恭喜南京大学袁雷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京大学申请的专利一种基于自然语言指令的高效人机协作策略部署方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119129638B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411624958.8,技术领域涉及:G06N3/006;该发明授权一种基于自然语言指令的高效人机协作策略部署方法是由袁雷;俞扬;周志华;林锟珉;张子谦;李立和设计研发完成,并于2024-11-14向国家知识产权局提交的专利申请。
本一种基于自然语言指令的高效人机协作策略部署方法在说明书摘要公布了:本发明公开一种基于自然语言指令的高效人机协作策略部署方法,该方法借助于自然语言指导的条件扩散模型的强大表征能力,将多样化队友的最优协作策略参数压缩为单个条件扩散模型,在部署阶段基于人类队友提供的自然语言指令,为队友生成定制化的协作策略。该方法能够在试错成本较高的实际场景中仅通过少量自然语言指令实现协作策略的生成和部署,能够保证人机协作策略部署的高效性。
本发明授权一种基于自然语言指令的高效人机协作策略部署方法在权利要求书中公布了:1.一种基于自然语言指令的高效人机协作策略部署方法,其特征在于,包括如下步骤:步骤1:根据协作场景,定义任务相关的事件,用于构造任务语言表征;步骤2:通过种群训练方法或行为克隆构建多样化的队友种群,作为人类代理策略,并采集队友对应的任务语言表征数据集和自然语言指令数据集;步骤3:为多样化队友种群训练最优协作策略;首先为每个队友策略初始化一个协作策略,然后固定队友策略参数,通过PPO算法训练协作策略到最优协作策略;步骤4:训练策略参数编码模块和策略参数解码模块;策略参数编码模块和策略参数解码模块构成一个策略参数空间上的变分自编码器,通过最小化损失函数联合训练;步骤5:微调Bert模型;在Bert模型输出端添加全连接层,将Bert模型封装为一个自然语言指令分类器,使用自然语言指令数据集,通过最小化交叉熵损失函数进行微调;步骤6:训练语言转换模块;固定微调后的Bert模型的参数,仅训练语言转换模块中的变分自编码器,使其能够将Bert模型编码后的自然语言指令转换为对应的任务语言表征;步骤7:压缩最优协作策略;借助训练得到的策略参数编码模块,将队友种群的最优协作策略压缩为策略参数表征数据集;步骤8:训练条件扩散模型;使用任务语言表征数据集和策略参数表征数据集,通过最小化损失函数训练条件扩散模型,使条件扩散模型根据任务语言表征生成对应的协作策略参数表征;步骤9:人类队友使用自然语言指令表达其行为偏好或任务要求;步骤10:语言转换模块将自然语言指令转化为任务语言表征;步骤11:随机采样高斯噪声,借助条件扩散模型,反向去噪;步骤12:策略参数解码模块基于协作策略参数表征预测策略网络参数,初始化协作策略网络并加载策略网络参数,得到重构的最优协作策略。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。