首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于强化学习的圆形重建系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:集美大学

摘要:本发明涉及圆形重建算法技术领域,公开了一种基于强化学习的圆形重建系统,该系统运用马尔可夫决策过程来描述多圆弧的重建过程,即估计一条圆弧的参数即对应做一个决策,估计多条圆弧的参数则对应做多个决策。本发明通过环境模块接收智能体模块输出的动作,使用平均测度估计子来计算该动作产生的奖励,根据该动作转变环境状态,并将产生的奖励和转变后的状态反馈给智能体;通过智能体模块接收环境模块输出的奖励和状态,产生新的动作并反馈给环境模块,并使用PPO强化学习算法优化更新智能体的动作策略;通过记录模块记录智能体和环境交互过程中的最佳分幕,最佳分幕里包含的各个动作。得益于平均测度估计子的高鲁棒性和PPO算法的高稳定性。

主权项:1.一种基于强化学习的圆形重建系统,其特征在于:包括环境模块、智能体模块以及记录模块;所述环境模块用于接收智能体模块输出的动作,计算该动作产生的奖励,并根据该动作转变环境状态,然后将产生的奖励和转变后的状态反馈给智能体,在时刻时,环境的状态为接收到的动作为产生的奖励为转变后的环境状态为其中为状态空间,为动作空间;所述智能体模块用于接收环境模块输出的奖励和状态,产生新的动作,将新的动作反馈给环境模块,并优化更新智能体的策略函数;所述记录模块用于记录智能体模块和环境模块的交互过程,环境从初始状态开始,经过与智能体进行的若干次交互后,将达到终止状态,这样的从初始状态到终止状态的过程称为一分幕,当一分幕结束后,环境将重置为初始状态,智能体得到的累积奖励也将清零,时刻t也清零,然后开始下一分幕,每一分幕都有对应的累积奖励,最高累积奖励所对应的那一分幕称为最佳分幕,最佳分幕即代表了本圆形重建系统重建出来的结果。

全文数据:

权利要求:

百度查询: 集美大学 一种基于强化学习的圆形重建系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。