首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于图卷积的零部件供应循环包装箱配送调度方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:电子科技大学

摘要:本发明公开了一种基于图卷积的零部件供应循环包装箱配送调度方法,通过构建基于图卷积的编码器;构建基于注意力机制的解码器;强化学习训练循环包装箱配送调度模型;使用训练好的配送调度模型求解循环包装箱配送调度问题。

主权项:1.一种基于图卷积的零部件供应循环包装箱配送调度方法,其特征在于,包括以下步骤:1构建基于图卷积的编码器;2构建基于注意力机制的解码器;3强化学习训练循环包装箱配送调度模型,所述循环包装箱配送调度模型为编码器-解码器结构;4使用训练好的配送调度模型求解循环包装箱配送调度问题;所述编码器中1输入层:输入层接收配送调度问题实例中各节点位置posi和需求di,为不失一般性,定义di如下: 2嵌入层:嵌入层通过非线性变换把节点位置转换为向量表示sitei;3拼接层:xi表示第i∈{0,1,2,...,N}个节点的特征,其中第0个节点表示物流中心,节点的特征由节点的位置投影和需求投影拼接而成;由于物流中心没有配送需求,物流中心和客户节点特征xi分别定义如下: 4投影层:对于每个节点的特征xi,投影层通过一层线性映射,得到节点的嵌入为区分物流中心和客户节点,物流中心特征单独映射,其映射过程分别如下: 其中,Wx和bx表示线性映射层的参数;5图卷积层:得到节点的嵌入后,在图卷积层进行特征提取,图卷积层使用k邻近的自注意力机制进行计算,即选择距离第i个顶点最近的k个顶点进行对齐、注意力计算,限定节点只与它的邻居节点做信息交换以提高计算速度;6特征层:特征层将所有节点的嵌入取算数平均作为配送调度问题实例s的嵌入特征h,计算过程如下: 所述解码器中1拼接层:拼接层接受编码器编码的图嵌入,并把图嵌入、当前解序列最后一个节点的嵌入以及单前配送车辆剩余容量进行拼接,得到一个过程嵌入h'c: 其中,[.,.,.,]表示拼接操作;2多头注意力层:在多头注意力层,上述过程嵌入与各节点嵌入做多头归一化的点乘注意力机制;3注意力层:将上下文嵌入信息投影映射为查询矩阵,将各顶点映射为键矩阵和值矩阵;随后分别计算注意力值并经过tanh函数和缩放常数C进行缩放,得到解序列接下来可能的顶点j的嵌入表示uj,计算过程如下:qc=WQhc,ki=WKhi,vi=WVhi 4输出层:首先使用SoftMax函数将节点嵌入转化为各可能节点作为解序列下一节点的概率,概率的计算如下: 然后选取最大概率值对应的节点作为解序列的下一节点,更新当前车辆剩余容量并输出该节点嵌入及当前车辆剩余容量以进行下一步解码;所述强化学习训练的训练流程如下:①输入第三方循环包装箱提供商物流中心位置、零部件供应商节点位置及各节点循环包装箱需求,指定超参数;②初始化两个结构、参数均相同的模型Estimation-model和Target-model;③输入问题实例,以ε控制Estimation-model节点输出,增强对环境的探索能力;④输入相同问题实例,Target-model以最大概率输出节点;⑤根据Estimation-model和Target-model的输出计算参数梯度;⑥使用Adam优化器更新Estimation-model网络参数;⑦计算解的平均距离,若Estimation-model效果优于Target-model,对两模型参数进行单边t检验;若参数分布显著不同,进入⑧,否则转回③;⑧使用Estimation-model网络参数更新Target-model网络参数;⑨测试Target-model解的平均距离是否下降,下降则保存Target-model;⑩当前轮次是否到达超参数指定值,到达则结束训练,未到达则转回③。

全文数据:

权利要求:

百度查询: 电子科技大学 一种基于图卷积的零部件供应循环包装箱配送调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术