基于联邦强化学习的盾构掘进仿真模型参数辨识方法系统

导航：龙图腾网> 最新专利技术> 基于联邦强化学习的盾构掘进仿真模型参数辨识方法系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华中科技大学

摘要：本发明属于盾构仿真建模领域，涉及一种基于联邦强化学习的盾构掘进仿真模型参数辨识方法。该方法包括：各客户端依据本地的原始数据建立参数化的盾构掘进仿真模型；中心协调器下放强化学习模型至各客户端进行盾构掘进仿真模型参数辨识的强化学习训练；客户端将强化学习训练过程中得到的相关数据进行同态加密后上传至中心协调器；中心协调器选择性地聚合具有更大收敛潜力的客户端模型参数并构建新的全局梯度信息，然后返回最新的模型数据至各客户端；各客户端更新本地模型然后进行强化学习训练得到待定的参数值并进行仿真模拟和迭代训练直至误差在可接受的范围内。本发明对辅助盾构机安全且高效地进行掘进具有重要的作用。

主权项：1.一种基于联邦强化学习的盾构掘进仿真模型参数辨识方法，其特征在于，包括：S1.各客户端根据本地的工况、地质条件、盾构参数以及原始的监测数据，分别初步拟定待辨识的数值模型中的待定参数值，赋予其初始值，建立参数化的盾构掘进仿真模型，并对模型待辨识参数进行灵敏度分析；S2.中心协调器下放强化学习模型至各客户端，各客户端分别建立本地决策模型，并根据各客户端收集到的本地区盾构掘进过程的原始数据和仿真模拟结果建立环境模型，用于模拟当前的状态St；S3.各客户端独立根据当前的状态St确定私有策略，同时根据私有策略选择相应的动作获得下一个状态St+1，并根据目标函数对St+1进行评估，各客户端在状态-动作-奖励-状态的循环中训练各自的模型，同时将强化学习训练过程中得到的模型梯度信息、训练数据数目及其评价结果进行同态加密后上传至中心协调器；S4.中心协调器对各客户端上传的模型梯度信息、训练数据数目及其评价结果进行解密后，选择性地聚合具有更大收敛潜力的客户端模型参数，构建新的全局梯度信息并获得新的强化学习模型数据；S5.中心协调器返回最新的强化学习模型数据至各客户端，各客户端通过融合中心协调器下发的最新的强化学习模型数据更新本地的强化学习模型，根据最新的强化学习模型进行强化学习训练得到待定的参数值，之后进行仿真模拟，并将本地监测数据与仿真结果进行比较同时分析两者之间的误差，重复步骤S3-S5直至误差在可接受的范围内时，所辨识得到的参数值即为模型待辨识参数的最终值；所述环境模型由仿真模拟数据结果与原始监测数据建立，并设目标函数，所述目标函数为：其中，G为当前待辨识参数值下的目标函数，Zsim为所需观测的某一指标的模型仿真值，Zrea为所需观测的本地监测数据中的某一指标的实测值；下标1、2、3…表示本地监测数据中的监测指标总数；根据所述的目标函数G构建奖励函数r：当目标函数G’G时，r=r+1，当目标函数G’G时，r=r，其中G’为上一步迭代时待辨识参数值下模型的目标函数，G为当前迭代步骤中待辨识参数值下的目标函数；所设置的奖励函数r的初始值为0，训练目的是让奖励函数最大化；将在待辨识的参数取值区间范围内随机选取一个数值作为强化学习模型的一个动作，当r=r+1时，决策模型会根据当前的待辨识的参数值的波动范围∆AmSTm对所有的待辨识参数进行改变以确定下一次待辨识参数的数值，或者，随机变化某一待辨识参数值而固定其他待辨识参数值；当r=r时，决策模型会将当前待辨识的参数值变回上一步的参数值，在此基础上再重新改变待辨识参数值，直到r=r+1；当r=R时，模型停止训练，R为预设阈值；所述的当前的待辨识参数值的波动范围∆AmSTm具体为，根据各待辨识参数的影响系数，设置N个待辨识参数的变化值∆AmSTm，m=1~N，其中STm是第m个待辨识参数的影响系数，下一步的参数搜索范围会根据影响系数的大小来确定，待辨识参数影响系数越大，之后所设置的参数搜索范围越精细，即∆AmSTm的取值越小；之后，根据奖励函数r进行待辨识参数的改变，具体为：当奖励函数r=r+1时，选取N个待辨识的仿真模型参数值为AmSTm+∆AmSTm，或者，随机变化某一待辨识参数值而固定其他待辨识参数值；当r=r时，决策模型会将当前待辨识的参数值变回上一步的参数值，再在此基础上重新改变待辨识参数值，直到r=r+1；然后将N个待辨识的仿真模型参数值输入到仿真模型中得到新的仿真结果，更新到新的状态St+1并给出奖励r；以新的状态St+1作为输入，采用策略网络π计算每个动作的概率分布，然后根据概率分布随机抽样得到新的动作。

全文数据：

权利要求：

百度查询：华中科技大学基于联邦强化学习的盾构掘进仿真模型参数辨识方法系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：内窥镜管路的堵塞判定装置及堵塞判定方法

下一篇：福利额度管理方法、装置、设备、存储介质及计算机程序产品

相关技术

内窥镜管路的堵塞判定装置及堵塞判定方法

福利额度管理方法、装置、设备、存储介质及计算机程序产品

一种拔插式安装的矿灯

一种基于磁控溅射法制备的Mxene复合Ni/Co纳米薄膜、制备方法及应用

一种基于网状拓扑自组网的时间同步方法及系统

一种CrMoNbV难熔高熵合金及其制备方法和应用

一种催化氧化陶粒及其制备方法和应用

流体供应系统

一种柔性多线圈电感式压力传感检测系统及制作方法

靶向铁蛋白的铁死亡诱导型纳米剂型及其制备方法、应用

用于检测青光眼的系统和方法

皮肤图像识别模型训练方法、皮肤图像识别方法及装置

模型相关技术

一种跨模态视触觉数据仿真生成模型及模型训练装置_华南师范大学_202410944861.9

用于节点故障管理的管理模型_瑞典爱立信有限公司_202080027348.3

一种人体模型_宁波弥鹿创意科技有限公司_202420552092.3

老年乳腺癌预测模型_中国医学科学院北京协和医院_202410920896.9

使用扩散模型进行视频编辑_谷歌有限责任公司_202480001938.7

用于预测模型的数据泛化_国际商业机器公司_202010783314.9

用于训练机器学习模型的方法_罗伯特·博世有限公司_202410537639.7

用于CAD模型检索的机器学习_达索系统公司_202410500489.2

一种基于目标检测的下边缘检测模型的训练方法、模型和存储介质_纵目科技(上海)股份有限公司_201910158356.0

基于hNPY与hAgRP的基因过表达嵌合动物模型、工程猴模型及应用_四川横竖生物科技股份有限公司_202110886127.8

掘进相关技术

可变径竖井掘进设备_中铁工程装备集团有限公司_202420286575.3

一种煤岩掘进机履带架_佳木斯元久机械设备制造有限公司_202420776079.6

一种双护盾煤矿掘进机_江苏科煤重工有限公司_202420748628.9

一种巷道/隧道掘进辅助保护装置_河海大学_202420008450.4

基于联邦强化学习的盾构掘进仿真模型参数辨识方法系统_华中科技大学_202310188885.1

一种在TBM掘进巷道中用的全站仪快速安装支座_陕西彬长小庄矿业有限公司_202420755871.3

一种刀盘清洗机构及隧道掘进机构_山东建大建设集团有限公司_202420544412.0

一种泥水盾构掘进用抗盐泥浆及其方法_中铁四局集团有限公司_202411381562.5

盾构掘进装备的姿态预测方法、装置、设备、介质及产品_湖南大学_202411398158.9

一种用于悬臂式掘进机耐磨性强的钻头_安徽澳德矿山机械设备科技股份有限公司_202310488981.8

仿真相关技术

心电波形动态仿真方法_天津天堰科技股份有限公司_202411155100.1

一种锁边仿真草坪_江苏品冠人造草坪有限公司_202323518168.5

基于数字孪生技术的支架仿真方法_北京天玛智控科技股份有限公司_202111089035.3

堆叠芯片的信号仿真测试方法及装置_深圳中科系统集成技术有限公司_202411037401.4

一种机械臂及仿真机器人_乐聚(深圳)机器人技术有限公司_202420336142.4

一种机械臂及仿真机器人_乐聚(深圳)机器人技术有限公司_202420337619.0

一种防火仿真花干燥装置_夏津创赢工艺制品有限公司_202420111046.X

一种电缆故障仿真装置及培训装置_探博士电气科技(杭州)有限公司_202323628350.6

基于虚实联动的电能表检定仿真方法_国网上海市电力公司_202411097785.9

具有仿真模式的磁共振成像系统_皇家飞利浦有限公司_201980031651.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于联邦强化学习的盾构掘进仿真模型参数辨识方法系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务