买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:苏州科技大学
摘要:本发明公开深度强化学习驱动的可移动变形杆件的拓扑优化设计方法,在MATLAB程序中指定设计域并初始化建模,计算杆件组的初始柔度、设置目标函数;搭建深度强化学习仿真环境,搭建深度强化学习智能体,然后进行训练智能体,智能体根据目标函数调整杆件组中每个杆件的相关参数,并不断与仿真环境交互获得奖励,从而输出得到最优布局;其中,采用步函数通过动作值赋予杆件组中各个杆件产生新状态,并计算新状态的当前柔度,根据当前柔度与初始柔度、当前体积与初始体积比较确定当前回合终结结果和奖励的赋予。本发明将深度强化学习和可移动变形杆件引入到拓扑优化问题的求解中,以消除设计人员主观因素的影响,得到一种轮廓清晰易于制造的优化模型。
主权项:1.一种深度强化学习驱动的可移动变形杆件的拓扑优化设计方法,其特征在于,包括以下步骤:步骤1、在MATLAB程序中指定设计域,在设计域中对杆件组进行初始化建模,计算模型中杆件组的初始柔度、设置目标函数为最小化杆件组的柔度、设置约束为限定杆件组的初始柔度和杆件组的初始体积;步骤2、搭建深度强化学习仿真环境,深度强化学习仿真环境搭建包括步函数的设定和重置函数的设定,所述步函数包括动作的添加、当前柔度的计算、回合终结的判断以及奖励的赋予;步骤3、搭建深度强化学习智能体,深度强化学习智能体的搭建包括搭建演员网络、评论员网络以及设定智能体参数;步骤4、训练智能体,智能体根据目标函数调整杆件组中每个杆件的相关参数,并不断与深度强化学习仿真环境交互获得奖励,最终实现奖励最大化,即实现可移动变形杆件组的柔度最小化,从而输出得到最优布局;其中,智能体获取到当前杆件组的状态,通过评论员网络对当前杆件组的状态进行评估并获得估计值,通过演员网络给出对应的动作值;步函数通过动作值赋予杆件组中各个杆件产生新状态,并计算新状态的当前柔度,根据当前柔度与初始柔度、当前体积与初始体积比较确定当前回合终结结果和奖励的赋予;重置函数用于将智能体获取到的当前杆件组的状态重置。
全文数据:
权利要求:
百度查询: 苏州科技大学 深度强化学习驱动的可移动变形杆件的拓扑优化设计方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。