首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种带式输送机物料火焰或火花的快速熄灭系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:霍威克(天津)科技有限公司

摘要:本发明涉及自动灭火技术领域,具体公开了一种带式输送机物料火焰或火花的快速熄灭系统,包括火情检测模块、控制传输模块和细水雾喷淋模块。本方案使用高速探测器和温度传感器实时监测运输环境,通过与控制传输模块和细水雾喷淋模块的智能联动,高效排查火情,执行快速精准的喷淋操作,有效实现熄灭火花、火焰和降温目的;基于策略梯度算法对细水雾喷淋模块制定控制策略,通过迭代探索结合PPO算法不断完善策略网络,最大化累积奖励,实现节能高效、范围精准的喷淋操作,有效避免了水资源浪费和火灾蔓延,保证了生产的连续性,避免了运输流程工艺的停机损失。

主权项:1.一种带式输送机物料火焰或火花的快速熄灭系统,其特征在于:包括火情检测模块、控制传输模块和细水雾喷淋模块;所述火情检测模块实时监测带式输送机输送的物料,使用高速探测器检测火焰和火花产生的光信号,使用温度传感器监测物料的积热信号,将光信号和积热信号转换为电信号传输给控制传输模块;所述控制传输模块接收电信号判断物料的积热是否超出安全范围和是否产生火焰和火花,基于策略梯度算法制定控制策略生成控制信号发送给细水雾喷淋模块;所述细水雾喷淋模块接收控制信号执行喷淋操作,直到熄灭火花和火焰,并将温度降低到安全范围内;所述控制传输模块基于策略梯度算法制定控制策略实现对细水雾喷淋模块的自主控制,基于策略梯度算法制定控制策略的方法包括以下步骤:步骤S1:状态定义,对带式输送机的物料输送环境确定状态空间,状态包括物料类型、输送速度、光信号和积热信号四个维度;步骤S2:动作定义,确定细水雾喷淋模块的动作空间,动作包括细水雾喷淋模块的启闭、喷淋的持续时间、喷淋强度三个维度;步骤S3:设计奖励信号,根据成功灭火和成功降温的次数设置奖励函数,用于对每个状态下采取的动作进行评估;步骤S4:策略网络设计,使用多层感知机模型表示策略函数,用于将状态空间映射到动作空间;步骤S5:采样数据收集,使用策略网络在当前环境中进行探索,收集采样数据完善策略网络,采样数据包括状态、采取的动作和相应的奖励信号;步骤S6:策略梯度优化,使用采样数据基于PPO算法更新策略网络的参数,最大化累积奖励;步骤S7:策略评估与调优,与环境交互进行多次迭代和参数调整,评估更新后的策略性能;在步骤S3中,设计奖励信号,具体包括以下步骤:步骤S31:降温成功奖励,设定温度阈值,若细水雾喷淋模块在一组状态下执行了一组动作,温度传感器监测到执行动作后的环境温度降低到温度阈值以下,并且一段时间内都保持在该阈值之下,则提供一次正奖励;步骤S32:灭火成功奖励,若细水雾喷淋模块在一组状态下执行了一组动作,高速探测器监测到火焰或火苗被成功熄灭,且温度在安全范围内,则提供一次额外的正奖励;步骤S33:未成功降温惩罚,设置时间阈值,若细水雾喷淋模块在一组状态下执行了一组动作,在时间阈值内未能将环境温度降低到温度阈值以下,则施加负奖励惩罚该动作;在步骤S4中,策略网络设计,具体包括以下步骤:步骤S41:定义结构,多层感知机模型包括输入层、隐藏层、输出层,输入层设置4个输入节点表示4个维度的状态,隐藏层包含64个隐藏节点,输出层设置3个输出节点表示3个维度的动作;步骤S42:初始化参数,随机初始化多层感知机模型的权重和偏置参数;步骤S43:前向传播,将状态空间中的一组状态作为多层感知机模型的输入,通过前向传播输出动作空间中每个维度动作的取值;步骤S44:确定损失函数,根据执行的动作和获得的奖励信号计算损失函数,使用被裁剪的策略梯度作为损失函数衡量策略的优劣,所述策略是指在特定状态下从动作空间中选择一组特定的动作,所用公式如下: ;式中,表示状态,表示动作,表示策略;步骤S45:反向传播,根据损失函数的计算结果使用优化算法更新策略网络的参数,使得损失函数最小化;在步骤S6中,策略梯度优化,具体包括以下步骤:步骤S61:计算优势估计,计算每个时间步的累积奖励和优势函数,表示所执行的动作对于策略的优势,所用公式如下: ; ;式中,表示时间步,表示时间步的索引,表示总时间步数,表示奖励信号,表示折扣因子,表示累积奖励,表示状态值函数,表示优势函数;步骤S62:计算策略梯度,根据优势函数和策略网络的输出计算策略梯度,所用公式如下: ; ;式中,表示期望,表示策略网络的参数,表示时刻的优势函数,表示新旧策略之间的概率比率,表示控制策略梯度剪辑幅度的超参数,表示新策略,表示旧策略,表示策略梯度损失函数,表示剪切函数;步骤S63:执行策略更新,使用梯度下降法更新策略网络的参数,所用公式如下: ;式中,表示第次迭代时的参数,表示第次迭代时的参数,表示学习率,表示损失函数关于参数的梯度向量;步骤S64:重复迭代,重复步骤S61至步骤S63,直到策略网络收敛。

全文数据:

权利要求:

百度查询: 霍威克(天津)科技有限公司 一种带式输送机物料火焰或火花的快速熄灭系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。