Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京控制工程研究所王勇获国家专利权

恭喜北京控制工程研究所王勇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京控制工程研究所申请的专利基于知识嵌入强化学习的决策方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117115608B

龙图腾网通过国家知识产权局官网在2025-05-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311086572.1,技术领域涉及:G06V10/80;该发明授权基于知识嵌入强化学习的决策方法、装置、设备及介质是由王勇;解永春;李林峰;于欣欣;王敏;陈奥;王殿佑设计研发完成,并于2023-08-28向国家知识产权局提交的专利申请。

基于知识嵌入强化学习的决策方法、装置、设备及介质在说明书摘要公布了:本发明涉及人工智能技术领域,特别涉及一种基于知识嵌入强化学习的决策方法、装置、设备及介质。方法包括:获取目标环境待决策的原始图像;将所述待决策的原始图像输入至预先训练好的强化学习模型,输出与所述待决策的原始图像相对应的决策;所述预先训练好的强化学习模型包括策略网络、评价网络、回报函数和知识融合模块,所述知识融合模块用于将输入的原始图像与先验知识进行融合,以得到包含先验知识的图向量,所述策略网络用于基于所述图向量向所述目标环境输出决策。本发明,可以得到更加符合预期的决策。

本发明授权基于知识嵌入强化学习的决策方法、装置、设备及介质在权利要求书中公布了:1.一种基于知识嵌入强化学习的决策方法,其特征在于,包括:获取目标环境待决策的原始图像;将所述待决策的原始图像输入至预先训练好的强化学习模型,输出与所述待决策的原始图像相对应的决策;所述预先训练好的强化学习模型包括策略网络、评价网络、回报函数和知识融合模块,所述知识融合模块用于将输入的原始图像与先验知识进行融合,以得到包含先验知识的图向量,所述策略网络用于基于所述图向量向所述目标环境输出决策;所述知识融合模块包括场景理解模块和领域知识图谱;所述知识融合模块获取图向量的过程包括:将当前的原始图像输入至所述场景理解模块中,利用所述场景理解模块从当前的原始图像中识别出至少一个预设目标,并输出每个所述预设目标的类型和位置信息;基于每个所述预设目标的类型和位置信息,利用语义关系图网络生成当前的原始图像的前景图;基于所述前景图的本体关系,以及当前领域知识图谱提供的与所述前景图对应的先验知识,生成与所述前景图对应的背景图;将所述前景图和所述背景图进行融合,得到包含先验知识的场景图;基于图嵌入技术对所述场景图进行压缩,得到包含先验知识的图向量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京控制工程研究所,其通讯地址为:100080 北京市海淀区中关村南三街16号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。