首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法 

申请/专利权人:中建八局第一数字科技有限公司

申请日:2023-12-26

公开(公告)日:2024-07-05

公开(公告)号:CN117669988B

主分类号:G06Q10/0631

分类号:G06Q10/0631;G06Q10/0633;G06Q50/04;G06F18/214

优先权:

专利状态码:有效-授权

法律状态:2024.07.05#授权;2024.03.26#实质审查的生效;2024.03.08#公开

摘要:本发明公开了一种基于Q‑Learning算法改进NEH的装配式预制构件生产调度方法,涉及生产调度技术领域。为了改进NEH启发式算法中的插入规则,从而能够搜索更为广阔的可行解空间进而更好的适用不同的PFS问题实例。本发明提出了一种基于Q‑Learning算法改进NEH的装配式预制构件生产调度方法,通过构建一个PDR库,用强化学习算法Q‑Learning来持续的选择PDR,逐个确定每一个作业的加工优先级,调度目标是最小化作业最大完工时间Makespan。本发明的有益效果为:以被广泛应用于工程领域的NEH启发式算法为基础,提高了其对不同实例的适应能力,降低了调度目标Makespan,从而提高生产效率。

主权项:1.一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法,其特征在于,包括:插入规则库的构建;基于NEH调度过程确定Q-Learning训练所需要的元素;通过Q-learning算法训练得到为作业序列提供依据的Q表格;依据Q表格进行作业序列的确定;所述插入规则库的构建包括作业参数的选择和PDR库的组建;所述作业参数的选择是选择与作业在工序上被处理时间相关的作业属性,包括每个工序处理作业的时间和整个工艺流程处理作业的总时间;所述PDR库的组建是选择已确定好的作业属性为参数的PDR,每个作业属性对应两个PDR,分别为最短时间优先规则和最长时间优先规则;所述基于NEH调度过程确定Q-Learning训练所需要的元素包括状态、动作、奖励、智能体与环境的交互过程;所述状态是确定一个作业的加工优先级时定义为一个状态;动作是在每一个状态下,从插入规则库中选择一个PDR对剩余作业设定优先级,选择优先级高的作业处理;奖励是确定一个作业加工优先级后,已确定的作业优先级的作业序列的Makespan的相反数定义为奖励;智能体与环境的交互过程是:智能体是选择动作的Q表格,环境为NEH的调度过程,交互过程定义为当环境的处于某个状态时,智能体从插入规则库中选择一个PDR,使用该PDR确定未调度作业的加工优先级,从其中选择最高加工优先级的作业进而将该作业插入到已调度完成的作业序列中,然后环境转移到下一个状态;通过Q-learning算法训练得到为作业序列提供依据的Q表格,包括初始化Q表格、Q-learning训练和Q表格的更新;所述初始化Q表格是生成一个行、列的Q表格,Q表格中的元素全部为足够小的一个负数;所述Q表格的更新是根据下式进行更新,其中表示Q表格第在状态下选择动作对应的价值,表示学习率,表示折扣系数,其中,作业的索引比状态的索引少1表示作业的索引比Q表格行索引少1,公式为: ;依据Q表格进行作业序列的确定,包括根据最终确定的Q表格,按照Q表格每行最大值的列索引确定插入顺序:基于NEH调度过程获得作业序列,按顺序往已确定作业序列中插入作业,最终确定作业序列。

全文数据:

权利要求:

百度查询: 中建八局第一数字科技有限公司 一种基于Q-Learning算法改进NEH的装配式预制构件生产调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。