一种永磁直驱型风电机组的深度强化学习控制方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：曲阜师范大学

摘要：本发明一种永磁直驱型风电机组的深度强化学习控制方法，属风电领域。采用深度强化学习TD3算法，设计转速跟踪控制器：根据永磁同步风力发电机的环境状态构建基于TD3算法的智能体，环境状态包括发电机转速及其参考值、定子电流、定子电压、定子电感、定子电阻、永磁体转子磁链、定子绕组温度、风速及其变化率，设计奖励函数，确定风速和发电机训练条件，对智能体进行训练，将训练好的智能体模型移植入机侧变流器的主控芯片，建立实际转速跟踪控制系统，实现转速跟踪控制。本发明可有效应对风速波动及发电机自身参数变化对风电机组控制的影响，实现永磁同步风力发电机的快速稳定安全控制。

主权项：1.一种永磁直驱型风电机组的深度强化学习控制方法，所述永磁直驱型风电机组，包括：永磁同步风力发电机、机侧变流器；所述永磁同步风力发电机的定子与所述机侧变流器相连；其特征在于，采用如下步骤：步骤1，确定所述永磁同步风力发电机的环境状态：所述环境状态包括所述永磁同步风力发电机的转子旋转角速度ωt及其参考值ωm,r，所述永磁同步风力发电机的定子电流的d轴分量id及q轴分量iq，所述永磁同步风力发电机的定子电压的d轴分量ud及q轴分量uq，所述永磁同步风力发电机的定子电感L、定子绕组电阻R、转子永磁体磁链ψf，所述永磁同步风力发电机的定子绕组的温度Tst，风速vw及风速变化率将所述环境状态记为St，则有步骤2，设计奖励函数：所述奖励函数Rt设计为：Rt＝Rfast+Rsmooth+RT1式中，Rfast为转速跟踪奖励函数，Rsmooth为转速波动抑制及畸变率奖励函数，RT为温升奖励函数；Rfast定义为：Rfast＝R1|ωm,r-ωt|,|ωm,r-ωt|≥0.2rads2式中，R1为转速跟踪权重系数，用来实现快速减小转速跟踪误差；Rsmooth定义为：式中，R2为畸变率速动权重系数，用来实现畸变率最小化，id*、iq*分别为所述永磁同步风力发电机的定子电流的d轴分量id及q轴分量iq的参考值，Ad1为电流差值的基准值；R3为稳定权重系数，用来减小发电机的转速波动；ωt-l为所述永磁同步风力发电机的前第l时刻的转速，L为抑制波动的时间上限，l和L均为正整数；RT定义为：RT＝R4Tal-TstAd24式中，R4为定子绕组温度权重系数，Tst为所述永磁同步风力发电机的定子绕组的温度，Tal为所述永磁同步风力发电机的定子绕组的允许温度，Ad2为温度差值的基准值；步骤3，根据所述环境状态构建基于TD3算法的智能体：所述智能体由策略网络和策略评价网络构成；所述策略网络由Actor网络及ActorTarget网络组成，分别通过对应的网络策略πSt|θ和πtaSt|θta实现所述智能体的动作输出AtSt|θ；所述策略评价网络由Critic网络及CriticTarget网络组成，分别通过对应的价值函数和h＝1,2，评估用于实现动作输出的策略并对其进行提升，其中θ，θta，分别表示Actor网络、ActorTarget网络、Critic网络和CriticTarget网络的权重系数；步骤4，对所述智能体进行训练：A1.确定训练环境，包括风速训练条件和发电机参数训练条件，其中，风速训练条件：在实际风速曲线中每隔1s插入随机风速噪声δvw，按式5计算得到训练风速v’w，并在一个新训练回合开始时通过δvw按式5重置v’w；式中，δvw服从平均分布U；vwn为额定风速；wd为偏差宽度，wd≥1；发电机参数训练条件：为了保证所述智能体能够在发电机参数变化的情况下仍具有优异性能，每训练回合开始时，按式6训练所述永磁同步风力发电机的参数G’s，其中，s＝1,2,3，分别代表所述永磁同步风力发电机的定子电感L、定子绕组电阻R及转子永磁体磁链ψf，通过对Gs添加随机参数变化附加项δGs，按式6计算得到G’s；同样在新训练回合开始时通过δGs按式6更新G’s，并通过最大附加因子gmax和最小附加因子gmin确定Gs的上限和下限；式中，δGs服从平均分布U；wg为偏差宽度，wg≥1；A2.创建所述智能体与环境信息交互的接口，对所述智能体的网络权值参数进行初始化，设置所述智能体训练的相关参数，具体如下：初始化所述Actor主网络、所述Critic主网络的权值参数θ、以及其对应的目标网络ActorTarget网络、目标网络CriticTarget网络的权值参数θta、h＝1,2；设置所述Actor主网络的学习率α；设置深度强化学习的折扣因子γ；设置训练的最大回合数N，每个训练回合中的最大步数T，目标网络ActorTarget网络和CriticTarget网络的更新频率I，Critic网络的权值更新频率Ip、Ita；加载实际风速vw、风速偏差噪声δvw、所述永磁同步风力发电机的参数Gs及其随机参数变化附加项δGs；设置并初始化经验数据库；A3.在每一个训练回合开始后，首先根据实际风速vw、风速偏差噪声δvw、所述永磁同步风力发电机的参数Gs及其随机参数变化附加项δGs分别按式5、式6确定本训练回合的风速训练条件v’wk和发电机参数训练条件G’sk，k＝1,2,…,N；v’wk为第k个训练回合的v’w；G’sk为第k个训练回合的Gs；A4.基于所述当前状态St，为防止网络策略πSt|θ陷入局部最优，对所述Actor主网络的输出添加动作探索噪声Nt，得到动作AtSt|θ，提供了向“更优”探索的机会，即：AtSt|θ＝πSt|θ+Nt7式中，πSt|θ所述Actor网络的输出；Nt为期望为0、方差为σ2的正态分布，即：Nt满足： A5.每一步动作执行后，得到下一时刻的环境状态St+1，同时按式1计算得到奖励函数Rt，随后所述智能体观测得到下一时刻的状态St+1，并将环境状态St、动作AtSt|θ、奖励函数值Rt、下一时刻的环境状态St+1作为一个经验数据组存储至所述经验记忆库中；A6.从经验数据库中随机均匀采样M个小批量样本，即M个经验数据组Sti,Ati,Rti,Sti+1，其中i＝1,2,3,…,M；A7.以最小化误差的方式更新Critic主网络的权值参数即式中，Yti为期望目标价值函数，定义为：式中，ε表示目标平滑噪声，是被截断的正态分布噪声，即：式中，σclip为标准差，c为截断因子；A8.以延迟更新方式更新所述Actor网络、ActorTarget网络、CriticTarget网络的权值参数θ、θta和具体来说，Critic网络的权值每更新Ip次，Actor网络权值参数θ更新一次。Critic网络的权值每更新Ita次，ActorTarget网络、CriticTarget网络的权值参数θta和更新一次；如果训练步数为所述Critic网络的更新频率Ip的倍数，则进入步骤A9，否则进入步骤A11；Ip、Ita为更新频率，均为正整数，且ItaIp；A9.通过对预期期望J进行梯度上升更新所述Actor网络的权值参数θ，即式中，J的表达式为：表示J对θ求导：式中，表示πSti|θ对θ求导；A10.如果训练步数为所述Critic网络的更新频率Ita的倍数，则通过指数平滑方式按式15对所述ActorTarget网络的权值参数θta和所述CriticTarget网络的权值参数进行更新，即：式中，τ为更新因子，τ≤1；A11.如果训练步数未达到每个训练回合的最大步数T，则返回步骤A4；否则当前训练回合结束，同时保存本次训练回合得到的智能体模型，且计算并保存本次训练回合的平均奖励函数值Re；A12.如果连续n个训练回合的平均奖励函数值Re的绝对值均小于等于Rset，其中Rset是一个接近于0的正实数，则结束整个训练过程；否则进入步骤A13；A13.判断是否达到最大训练回合数N，如果达到，则结束整个训练过程，重新训练；如未达到，则返回步骤A3并开始下一训练回合；步骤5，将训练好的所述智能体模型移植入所述机侧变流器的主控芯片，建立基于所述机侧变流器的主控芯片的实际转速控制系统，实现转速控制，输出所述永磁同步风力发电机的定子电流q轴分量iq的参考值iq*；步骤6，采用零d轴电流控制策略和电流前馈解耦控制策略，设计所述机侧变流器的内环电流跟踪控制器，实现所述永磁同步风力发电机的电流跟踪控制，具体过程为：61将步骤5得到的输出AtSt|θ，即所述永磁同步风力发电机的定子电流q轴分量iq的参考值iq*，将之与其实际值iq作差输入第一PI控制器，所述第一PI控制器的输出与q轴前馈解耦补偿项-Riq-ωeLdid+ωeψf相加，得到所述永磁同步风力发电机的定子电压的q轴分量uq的参考值uq*；其中，ωe为所述永磁同步风力发电机的转子电角速度，Ld是定子电感的d轴分量；62令所述永磁同步风力发电机的定子电流的d轴分量id的参考值id*＝0，并将之与其实际值id作差输入第二PI控制器，所述第二PI控制器与d轴前馈解耦补偿项-Rid+ωeLqiq相加，得到所述永磁同步风力发电机的定子电压的d轴分量ud的参考值ud*；其中，Lq是定子电感的q轴分量；步骤7，将步骤6得到的所述永磁同步风力发电机的定子电压参考值ud*、uq*经dqαβ坐标变换得到uα*、uβ*；然后，将uα*和uβ*经SVPWM模块调制后产生驱动信号，驱动所述机侧变流器的功率开关管，控制所述永磁同步风力发电机工作。

全文数据：

权利要求：

百度查询：曲阜师范大学一种永磁直驱型风电机组的深度强化学习控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种红松生长影响因素获取系统

下一篇：一种飞机液压牵引系统横向稳定性实验平台

相关技术

一种红松生长影响因素获取系统

一种飞机液压牵引系统横向稳定性实验平台

一种可降解咖啡渣复合材料及其制备方法与制品

一种考虑可靠性及经济性的配电网承载力精细化评估方法

基于WO₃@AuNPs和聚合物PAMAM双信号放大的DR1检测试剂盒及应用

一种建筑工程结构缝隙灌浆装置

核酸探针及利用核酸探针进行DNA检测的方法

基于私有传输协议的文件传输方法、装置和存储介质

一种覆铜板加工用表面整平装置

一种用于刺五加深加工的吸附式提纯设备

一种带有光路定向机构的车载顶灯

局域共振型声子晶体原胞

风电相关技术

风电并网的电网控制方法、装置_武汉大学_202410993046.1

一种风电螺栓巡检机器人_中电海康集团有限公司_202420196229.6

一种风电变流器风道装置及变流器_深圳市禾望电气股份有限公司_202322976222.4

一种格构式风电塔架_建华建材(中国)有限公司_202322258877.8

一种风电塔筒限位对接装置_华能阿拉善盟新能源发电有限公司_202410984090.6

一种风电轮毂运输支架_深圳佳利达供应链管理有限公司_202420532048.6

一种大型风电轮毂铸件用超高纯生铁的生产方法_河北龙凤山铸业有限公司_202310281188.0

一种风电叶片再生复合材料及其制备方法和应用_橙志(上海)环保技术有限公司_202411194482.9

一种风电叶片前缘防护材料的制备方法_吉林成飞新材料有限公司_202410968844.9

一种风电塔筒养护用外壁防锈漆涂抹装置_湖南信而立新能源科技有限公司_202323623511.2

深度相关技术

深度补全视觉惯性定位方法、深度补全模型及视觉装置_电子科技大学(深圳)高等研究院_202410799529.8

多深度电治疗注射仪_深圳半岛医疗集团股份有限公司_202323639876.4

一种打磨深度控制装置_昆山奥马热工科技有限公司_202322840416.1

一种井下深度探测装置_山东省煤田地质局第三勘探队_202411194747.5

一种矿洞勘探用深度测量装置_山东省地矿工程集团有限公司_202410813160.1

一种棉壳深度发酵设备_新疆前海农场生物科技发展有限公司_202323296543.6

基于深度学习的肿瘤组织溯源方法及设备_苏州可帮基因科技有限公司_202411196097.8

用于确定钻井岩屑深度的方法和系统_斯伦贝谢技术有限公司_202211665995.4

一种电镀废水深度处理装置_金华华鑫涂层科技有限公司_202323471121.8

一种基坑监测用基坑深度测量装置_浙江中林勘察研究股份有限公司_202323654611.1

机组相关技术

冷凝单元、冷凝机组_珠海格力电器股份有限公司_202410820617.1

透平机组冷却装置_浙江九益机电有限公司_202420446679.6

一种制冷机组、机组控制方法及装置_珠海格力电器股份有限公司_202211055713.9

一种冷水机组和冷水机组的控制方法_益章自动化科技(上海)有限公司_202410781438.1

一种空调机组_青岛海信日立空调系统有限公司_202323520192.2

换热组件及空调机组_珠海格力电器股份有限公司_202323521281.9

离心式空氮组合机组_浙江开山离心机械有限公司_202323325686.5

压缩机及空调机组_珠海格力电器股份有限公司_202323195776.7

一种送风机组_苏州兴亚净化工程有限公司_202420199256.9

有保温密闭机壳的热泵机组_包头市爱能控制工程有限责任公司_202420527891.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种永磁直驱型风电机组的深度强化学习控制方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务