一种基于深度强化学习的货箱堆叠优化方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山东大学

摘要：本发明公开了一种基于深度强化学习的货箱堆叠优化方法，包括如下步骤：根据货箱堆叠顺序及提箱优先级，设计m个环境状态变量来代表每个栈的堆存状态，再根据当前步骤使用的n个栈状态及其待堆叠的货箱状态，计算得到当前时刻的状态矩阵S；通过设计特征提取网络，进一步提取状态矩阵S中的特征，得到特征矩阵T；将特征矩阵T作为堆叠决策网络的输入数据，输出为各个栈的概率分布，进而选择一个栈堆叠货箱；使用深度强化学习算法进行特征提取网络和堆叠决策网络的训练，训练时采用决策评价网络对输出进行评价，优化堆叠决策并更新参数。本发明所公开的方法能够适应货箱数和栈最高堆叠层数发生变化的情况，以达到提高货箱堆叠和提取效率的目的。

主权项：1.一种基于深度强化学习的货箱堆叠优化方法，其特征在于，包括如下步骤：步骤一，状态获取：根据货箱堆叠顺序及提箱优先级，设计m个环境状态变量来代表每个栈的堆存状态，再根据当前步骤使用的n个栈状态及其待堆叠的货箱状态，计算得到当前时刻的n×m维状态矩阵S，并将其传递给特征提取网络；步骤二，特征提取：通过设计特征提取网络，提取状态矩阵S中适合于堆叠决策网络决策的特征，得到n×p维的特征矩阵T，并将其传递给堆叠决策网络；步骤三，堆叠决策：首先设计堆叠决策网络的结构，然后再将特征矩阵T作为堆叠决策网络的输入数据，输出为各个栈的概率分布，进而选择一个栈堆叠货箱；步骤四，堆叠策略训练：使用深度强化学习算法进行特征提取网络和堆叠决策网络的训练，采用决策评价网络对特征提取网络和堆叠决策网络的输出进行评价，优化堆叠决策并更新特征提取网络和堆叠决策网络的参数，通过训练后的特征提取网络和堆叠决策网络进行特征提取和堆叠决策；步骤一中，环境状态变量的个数m=6，具体包括如下：（1）栈中已堆叠货箱数占最高堆叠层数的百分比；（2）下一个要堆放的货箱优先级；（3）待堆叠货箱中的最高优先级；（4）栈优先级，等于栈最顶部货箱的优先级；（5）待堆叠货箱中优先级高于栈优先级的个数；（6）栈中货箱的无序堆叠数；步骤二中，特征提取网络为基于自注意力机制的特征提取网络，将状态矩阵S进行变换得到特征矩阵T的计算公式如下：；；其中，为特征矩阵，Attention表示自注意力机制层，SoftMax为激活函数，Q、K和V分别是状态矩阵S通过不同的权重矩阵变换得到的矩阵；、和分别是用于生成Q、K和V的权重矩阵，均为可学习的参数；分别表示权重矩阵中最后一维的维度大小；步骤三中，堆叠决策网络包括多层感知机网络、Mask层和SoftMax函数，所述多层感知机网络包括输入层、隐层和输出层，隐层为三层，输入层神经元个数为64，隐层神经元个数分别为128、128和32，输出层的神经元个数为1；所述决策评价网络为多层感知机网络，包括输入层、隐层和输出层，隐层为三层，输入层神经元个数为64，隐层神经元个数分别为128、128和32，输出层的神经元个数为1。

全文数据：

权利要求：

百度查询：山东大学一种基于深度强化学习的货箱堆叠优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：服装热调节系统

下一篇：用于多聚甲醛的氨和氢氧化铵稳定剂

相关技术

服装热调节系统

用于多聚甲醛的氨和氢氧化铵稳定剂

非对称分布高架桥施工中钢盖梁与预制立柱的临时铰接结构及施工方法

热成型模具分流板

小动物在线无创肺功能监测仪

一种医疗保障骗保行为监管系统及方法

基于周期式吹吸气的机翼流动控制系统及方法

一种复合管连接器

一种舞台效果灯

一种互连线及其形成方法

一种伸缩式气流隔离机构

数据的安全识别方法及存储介质

堆叠相关技术

托盘用堆叠装置_唐山海泰新能科技股份有限公司_202421237302.6

晶片堆叠方法_力晶积成电子制造股份有限公司_202310487477.6

发光堆叠件和显示装置_首尔伟傲世有限公司_201911188415.5

堆叠存储器路由技术_北极星特许集团有限责任公司_202410815484.9

一种烘干盘堆叠装置_山东瑞达硅胶有限公司_202323113910.4

一种器件堆叠模块结构_江苏英特尼迪电子科技有限公司_202420221221.0

FinFET堆叠栅存储器的形成方法_美商矽成积体电路股份有限公司_202010776012.9

一种堆叠式储能系统_自由创新(深圳)能源科技有限公司_202420440804.2

一种成品吸塑盒堆叠装置_深圳市午阳国际包装制品有限公司_202420693791.X

一种混凝土切块堆叠码料装置_六盘水市红果绿缘科技环保建材有限公司_202420088566.3

货箱相关技术

一种车辆货箱纵梁切断装置_重庆市云奕机械制造有限公司_202411179290.0

一种物流车货箱快换结构_天津希兰物流有限公司_202420665852.1

一种应用于货箱的锁定装置_安徽中信货运有限公司_202420453641.1

一种电动四轮车货箱快拆支架_江苏永源电动科技有限公司_202420715559.1

一种对接机构、货箱底板加热装置及自卸车_长城重工有限公司_202420712419.9

一种带升降结构的汽车货箱_浙江创思汽车部件有限公司_202420217507.1

一种电动重型卡车飞翼货箱门状态检测装置_地上铁租车(深圳)有限公司_202323434985.2

一种基于深度强化学习的货箱堆叠优化方法_山东大学_202210149185.7

一种矿用车铆接车架匹配双缸中举货箱_内蒙古铁辰智能装备有限公司_202411151654.4

物流配送车及其货箱总成_中国人民解放军92228部队_202420524684.4

学习相关技术

生命进化学习拼图_张俏_202310408591.5

热源机系统、学习完毕模型的生成方法以及学习完毕模型_荏原冷热系统株式会社_202380025260.1

基于提示学习的鸟类细粒度识别增量学习方法及装置_北京信息科技大学_202410923287.9

基于自监督学习和深度学习的电能质量扰动视频识别方法_广东电网有限责任公司东莞供电局_202410953296.2

基于半监督学习和对抗学习的频谱感知方法_广东工业大学_202410907255.X

课程学习引导指令调优增强大语言模型学习能力的方法_天津大学_202410690779.8

一种新型学习椅结构_东莞市博士有成智能科技有限公司_202420003554.6

一种升降学习桌_王巧云_202420257573.1

群组个性化联邦学习_元平台技术有限公司_202410464544.7

基于深度学习的变体分类器_因美纳有限公司_201980003259.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度强化学习的货箱堆叠优化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务