双loss价值网络深度强化学习KVFD模型力学参数全局优化方法及系统

导航：龙图腾网> 最新专利技术> 双loss价值网络深度强化学习KVFD模型力学参数全局优化方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西安交通大学

摘要：本发明公开了一种双loss价值网络深度强化学习KVFD模型力学参数全局优化方法及系统，所述方法包括以下步骤：S1，将预获取的纳米压痕测量曲线输入训练好的预测值获取网络，获得所述纳米压痕测量曲线的参数预测值；S2，将所述参数预测值作为深度强化学习算法的迭代初值进行迭代，获得预获取的纳米压痕测量曲线的全局参数解的逼近；所述全局参数解的逼近达到预设收敛条件时，将所述全局参数解的逼近作为KVFD模型的力学参数进行输出。本发明的方法，在迭代中引入了参数预测值进行参数指导，能够较好地逼近全局最优解。

主权项：1.一种双loss价值网络深度强化学习KVFD模型力学参数全局优化方法，其特征在于，包括以下步骤：S1，将预获取的纳米压痕测量曲线输入训练好的预测值获取网络，获得所述纳米压痕测量曲线的参数预测值；其中，训练好的预测值获取网络是基于LSTM隐层的循环神经网络，所述循环神经网络在训练时使用的LOSS函数值由输入网络的曲线与曲线对应参数和网络输出的参数与参数对应曲线共同计算；S2，将所述参数预测值作为深度强化学习算法的迭代初值进行迭代，获得预获取的纳米压痕测量曲线的全局参数解的逼近；其中，所述深度强化学习算法的奖励值预测网络通过当前迭代参数对应曲线与真实曲线的差值，给出当前参数向不同方向变化时的奖励值，指导参数向全局参数逼近；所述全局参数解的逼近达到预设收敛条件时，将所述全局参数解的逼近作为KVFD模型的力学参数进行输出；其中，步骤S1中，所述预获取的纳米压痕测量曲线包括时间序列、受力序列和压痕深度序列；步骤S2中，所述将步骤S1获得的参数预测值作为深度强化学习算法的迭代初值进行迭代，获得预获取的纳米压痕测量曲线的全局参数解的逼近的过程中，每一次迭代的具体步骤包括：1使用奖励评价规则和所述奖励值预测网络分别对当前迭代参数的备选参数集进行奖励值预测，将二者加权相加后作为对当前迭代参数的备选参数集的奖励评价；所述奖励评价规则为，对于某个备选参数的评价，先计算备选参数对应曲线与预获取的纳米压痕测量曲线的曲线差值Δ，之后计算曲线差值的绝对平均值奖励值r的评价公式表示为： 2根据步骤1获得的奖励评价与深度强化学习算法中的Q表当前行的内容，计算Q表的新一行，找到Q表新一行中最大值，将其对应的备选参数作为当次迭代结果参数。

全文数据：

权利要求：

百度查询：西安交通大学双loss价值网络深度强化学习KVFD模型力学参数全局优化方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种电网高影响天气特征与模式识别方法及系统

下一篇：一种多光子显微镜中光亮强度的自动调节装置

相关技术

一种电网高影响天气特征与模式识别方法及系统

一种多光子显微镜中光亮强度的自动调节装置

一种高纯锆靶材及其制备方法和应用

一种1-溴乙基乙酸酯的制备方法

大语言模型生成SQL查询语句中的数据权限控制方法及设备

马达

一种铸造用固化剂及其制备方法和使用方法

一种塑料导气管成型设备

高端计算机处理器用散热器及其制造方法

一种稠油工况螺杆泵控制系统

电信网元实时处理方法、装置、设备、介质及程序产品

一种线性工程快速出图方法及系统

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

双loss价值网络深度强化学习KVFD模型力学参数全局优化方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务