首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向概率深度强化学习系统的形式化验证方法、系统及应用 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华东师范大学

摘要:本发明公开了一种面向概率深度强化学习系统的形式化验证方法,主要用于验证由非确定性深度强化学习算法训练获得的系统的安全问题,具体步骤包括:1抽象训练:基于现有的抽象训练技术离散化抽象并进行抽象训练;2概率模型建模:依据原系统动力学设计抽象状态空间上的状态迁移规则,构建离散马尔科夫链模型;3验证分析:给出描述系统安全性质的PCTL时序逻辑规范,利用STORM概率模型检查器验证系统安全。本发明能够自动完成对概率深度强化学习系统的概率安全性质的检查,提供深度强化学习应用中的安全性。本发明还公开了一种实现所属概率系统形式化验证方法的工具。

主权项:1.一种面向概率深度强化学习系统的形式化验证方法,其特征在于,包括如下步骤:步骤一、状态抽象及抽象训练:将系统实际状态空间抽象到抽象状态空间上,并建立映射关系;修改神经网络结构以适应抽象状态输入,利用概率强化学习算法进行训练,获得强化学习控制器;步骤二、系统行为建模:构建步骤一中训练的强化学习控制器在抽象状态空间上行为的离散马尔科夫链模型;步骤三、验证分析:给出描述系统安全性质的PCTL时序逻辑规范,对步骤二构建的抽象系统行为的所述离散马尔科夫链模型利用STORM概率模型检查器进行概率模型检查满足安全性质的概率。

全文数据:

权利要求:

百度查询: 华东师范大学 一种面向概率深度强化学习系统的形式化验证方法、系统及应用

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。