首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种多机器人搜索方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:成都朴为科技有限公司

摘要:本发明公开了一种多机器人搜索方法及系统,应用于控制端,所述多机器人搜索方法包括:S1:获取交互环境内所有机器人在当前运行策略下的当前运行结果;S2:判断所述当前运行结果中是否包括搜索目标,若是,训练次数加1并进入步骤S4;否则,进入步骤S3;S3:根据所有机器人的历史运行结果对所有机器人的运行策略进行更新并将更新后的运行策略作为所述当前运行策略后返回步骤S1;S4:判断当前训练次数是否达到预设次数判断当前训练结果是否满足目标结果,若是,进入步骤S5;否则,返回步骤S1;S5:控制所有机器人根据各自当前运行策略执行搜索。本发明能够解决现有技术中目标搜索计算复杂,目标单一且效率低的问题。

主权项:1.一种多机器人搜索方法,基于多机器人搜索系统实现,所述多机器人搜索系统包括控制端,所述控制端包括:获取模块,所述获取模块用于获取交互环境内所有机器人在当前运行策略下的当前运行结果;第一判断模块,所述第一判断模块用于判断所述当前运行结果中是否包括搜索目标;更新模块,所述更新模块用于根据所有机器人的历史运行结果对所有机器人的运行策略进行更新;第二判断模块,所述第二判断模块用于判断当前训练次数是否达到预设次数或判断当前训练结果是否满足目标结果;和控制模块,所述控制模块用于控制所有机器人根据各自当前运行策略执行运行命令或搜索;第一接收模块,所述第一接收模块用于接收云端下发的初始运行策略或接收云端下发的搜索目标请求;和或第一运行策略生成模块,所述第一运行策略生成模块用于根据所述搜索目标请求生成初始运行策略;所述多机器人搜索系统还包括云端,所述云端包括:第二接收模块,所述第二接收模块用于接收用户下发的搜索目标请求;群发模块,所述群发模块用于将初始运行策略或搜索目标请求群发至交互环境内所有机器人;和或第二运行策略生成模块,所述第二运行策略生成模块用于根据所述搜索目标请求生成初始运行策略;所述多机器人搜索系统还包括执行端,所述执行端包括:执行模块,所述执行模块用于根据当前运行策略下的控制指令,执行运行或搜索,生成当前运行结果或搜索结果;传输模块,所述传输模块用于将所述当前运行结果传输至控制端;其特征在于,所述多机器人搜索方法应用于控制端、云端和执行端,当应用于控制端时,所述多机器人搜索方法包括:S1:获取交互环境内所有机器人在当前运行策略下的当前运行结果;S2:判断所述当前运行结果中是否包括搜索目标,若是,训练次数加1并进入步骤S4;否则,进入步骤S3;S3:根据所有机器人的历史运行结果对所有机器人的运行策略进行更新并将更新后的运行策略作为所述当前运行策略后返回步骤S1;S4:判断当前训练次数是否达到预设次数或判断当前训练结果是否满足目标结果,若是,进入步骤S5;否则,返回步骤S1;S5:控制所有机器人根据各自当前运行策略执行搜索;所述步骤S3中,利用集中训练式的值分布贝尔曼算子对所有机器人的运行策略进行更新;所述步骤S3包括:S31:获取目标机器人目标时刻的行为和目标时刻之前的历史观测值;S32:根据所述目标机器人目标时刻的行为和目标时刻之前的历史观测值,得到目标机器人的集中训练式的值分布贝尔曼算子;S33:利用具有记忆效果的神经网络对所述目标机器人的集中训练式的值分布贝尔曼算子进行求解,得到所述目标机器人下一时刻的概率密度函数值;S34:重复步骤S31-S33,直到得到所有机器人下一时刻的概率密度函数值;S35:根据所有机器人下一时刻的概率密度函数和对所有机器人下一时刻的概率密度函数值进行分解,得到分解结果;S36:利用所述分解结果对各所述机器人的捕获时间进行更新,得到更新后的捕获时间;S37:根据所述更新后的时间和各所述机器人的分布,得到各所述机器人更新后的运行策略;所述步骤S32中,所述目标机器人的集中训练式的值分布贝尔曼算子为: 其中,表示目标机器人t时刻的概率密度函数,表示目标机器人t时刻的行为,表示等价于,表示目标机器人t时刻之前的历史联合观测值,表示t时刻交互环境给的反馈,表示目标机器人t+1时刻的概率密度函数,表示目标机器人t+1时刻之前的历史联合观测值,表示目标机器人t+1时刻的行为;当应用于云端时,所述多机器人搜索方法包括:接收用户下发的搜索目标请求;根据所述搜索目标请求生成初始运行策略;将初始运行策略群发至交互环境内所有机器人;或者接收用户下发的搜索目标请求;将所述搜索目标请求群发至交互环境内所有机器人;当应用于执行端时,所述多机器人搜索方法包括:根据当前运行策略下的控制指令,执行运行或搜索,生成当前运行结果或搜索结果;将所述当前运行结果传输至控制端。

全文数据:

权利要求:

百度查询: 成都朴为科技有限公司 一种多机器人搜索方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。