买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京三快在线科技有限公司
摘要:本公开涉及一种预测配送状态信息的方法、装置、存储介质及电子设备,可以获取目标区域在预设时刻的配送服务数据和所述目标区域对应的区域特征数据,所述区域特征数据包括时间标识数据、第一天气数据以及用于表征对应区域的区域标识数据;根据所述配送服务数据和所述区域特征数据通过配送状态信息预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息。
主权项:1.一种预测配送状态信息的方法,其特征在于,所述方法包括:获取目标区域在预设时刻的配送服务数据和所述目标区域对应的区域特征数据,所述区域特征数据包括时间标识数据、第一天气数据以及用于表征对应区域的区域标识数据;根据所述配送服务数据和所述区域特征数据通过配送状态信息预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息;其中,所述区域特征数据还包括区域类型特征数据,所述区域类型特征数据包括:恶劣天气区域、高负载区域、既是恶劣天气也为高负载的区域、订单异常区域;其中,所述配送状态信息预测模型包括多个配送状态信息预测模型,不同的所述区域类型特征数据对应不同的所述配送状态信息预测模型;所述根据所述配送服务数据和所述区域特征数据通过配送状态信息预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息包括:从多个所述配送状态信息预测模型中确定与所述区域类型特征数据对应的目标预测模型;根据所述配送服务数据和所述区域特征数据通过所述目标预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息;其中,所述区域类型特征数据包括以下任一种:用于表征对应区域在所述预设时刻的天气信息符合恶劣天气条件的第二天气数据;用于表征对应区域在所述预设时刻的订单负载信息符合高负载条件的订单负载数据,所述订单负载数据用于表征在所述预设时刻平均分配给每个配送员的订单量;所述第二天气数据和所述订单负载数据;用于表征对应区域为订单异常区域的异常区域标识数据;其中,所述配送状态信息预测模型通过以下方式训练得到:获取预设样本区域在预设历史时刻的历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息;将所述预设历史时刻下所述预设样本区域对应的所述历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息作为模型训练样本进行训练,以得到所述配送状态信息预测模型;所述将所述预设历史时刻下所述预设样本区域对应的所述历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息作为模型训练样本进行训练,以得到所述配送状态信息预测模型,包括:将所述预设历史时刻下所述预设样本区域对应的所述历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息作为模型训练样本,对多任务模型进行训练,以得到所述配送状态信息预测模型,其中,平均配送时长信息作为所述多任务模型的主任务,订单量信息和平均订单负载信息作为所述多任务模型的辅助任务;所述主任务的损失函数为分段函数;所述分段函数包括第一子函数和第二子函数;所述第一子函数对应的第一分段区间为在所述预设历史时刻起的所述预设时长内的订单的实际平均配送时长小于预设时间阈值,并且所述第一子函数根据预先设置的第一参数调节系数和位于所述第一分段区间的实际平均配送时长得到;所述第二子函数对应的第二分段区间为所述实际平均配送时长大于或者等于所述预设时间阈值,并且所述第二子函数根据预先设置的第二参数调节系数和位于所述第二分段区间的实际平均配送时长得到;所述预设时间阈值表示预先设置的区域发生预设订单异常事件时平均配送时长的临界值;所述第一参数调节系数和所述第二参数调节系数不同,并且所述第一参数调节系数小于所述第二参数调节系数。
全文数据:预测配送状态信息的方法、装置、存储介质及电子设备技术领域本公开涉及互联网技术领域,具体地,涉及一种预测配送状态信息的方法、装置、存储介质及电子设备。背景技术即时配送业务是近几年兴起且在快速发展的业务模式,如果一个配送区域出现爆单情况,那就意味着这个区域处于供需失衡的状态,此时,应该采取相应的措施抑制用户的下单意愿,从而缓解该区域的配送压力,提升用户体验。通常情况下,可以采用未来预设时长内的配送状态信息如平均配送时长、订单量或者平均负载等作为触发区域爆单的主要依据,相关技术中,主要采用全局回归模型预测未来预设时长内的配送状态信息,但该全局回归模型是根据全部区域的配送服务数据训练得到的,这仅能解决全局优化的问题,即保证全部区域整体的准确度,当采用该全局回归模型对于极端区域如高负载区域、出现恶劣天气的区域等的配送状态信息进行预估时,预估的准确性较差。发明内容本公开的目的是提供一种预测配送状态信息的方法、装置、存储介质及电子设备。第一方面,提供一种预测配送状态信息的方法,所述方法包括:获取目标区域在预设时刻的配送服务数据和所述目标区域对应的区域特征数据,所述区域特征数据包括时间标识数据、第一天气数据以及用于表征对应区域的区域标识数据;根据所述配送服务数据和所述区域特征数据通过配送状态信息预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息。可选地,所述配送状态信息包括平均配送时长信息、订单量信息、平均订单负载信息;所述平均订单负载信息用于表征在所述预设时长内平均分配给每个配送员的订单量。可选地,所述配送服务数据包括以下数据项中的一项或多项:所述目标区域的区域单量数据、所述目标区域的区域订单负载数据、所述目标区域的区域配送员数据、所述目标区域在以所述预设时刻为结束时刻的预设历史时长内的订单服务时长数据以及所述目标区域在预设历史时间段内的历史订单统计数据。可选地,所述配送状态信息预测模型通过以下方式训练得到:获取预设样本区域在预设历史时刻的历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息;将所述预设历史时刻下所述预设样本区域对应的所述历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息作为模型训练样本进行训练,以得到所述配送状态信息预测模型。可选地,所述将所述预设历史时刻下所述预设样本区域对应的所述历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息作为模型训练样本进行训练,以得到所述配送状态信息预测模型,包括:将所述预设历史时刻下所述预设样本区域对应的所述历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息作为模型训练样本,对多任务模型进行训练,以得到所述配送状态信息预测模型,其中,所述平均配送时长信息作为所述多任务模型的主任务,所述订单量信息和所述平均订单负载信息作为所述多任务模型的辅助任务。可选地,所述主任务的损失函数为分段函数;所述分段函数包括第一子函数和第二子函数;所述第一子函数对应的第一分段区间为在所述预设历史时刻起的所述预设时长内的订单的实际平均配送时长小于预设时间阈值,并且所述第一子函数根据预先设置的第一参数调节系数和位于所述第一分段区间的实际平均配送时长得到;所述第二子函数对应的第二分段区间为所述实际平均配送时长大于或者等于所述预设时间阈值,并且所述第二子函数根据预先设置的第二参数调节系数和位于所述第二分段区间的实际平均配送时长得到;所述预设时间阈值表示预先设置的区域发生预设订单异常事件时平均配送时长的临界值;所述第一参数调节系数和所述第二参数调节系数不同,并且所述第一参数调节系数小于所述第二参数调节系数。可选地,所述区域特征数据还包括区域类型特征数据,所述配送状态信息预测模型包括多个配送状态信息预测模型,不同的所述区域类型特征数据对应不同的所述配送状态信息预测模型;所述根据所述配送服务数据和所述区域特征数据通过所述配送状态信息预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息包括:从多个所述配送状态信息预测模型中确定与所述区域类型特征数据对应的目标预测模型;根据所述配送服务数据和所述区域特征数据通过所述目标预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息。可选地,所述区域类型特征数据包括以下任一种:用于表征对应区域在所述预设时刻的天气信息符合恶劣天气条件的第二天气数据;用于表征对应区域在所述预设时刻的订单负载信息符合高负载条件的订单负载数据,所述订单负载数据用于表征在所述预设时刻平均分配给每个配送员的订单量;所述第二天气数据和所述订单负载数据;用于表征对应区域为订单异常区域的异常区域标识数据。第二方面,提供一种预测配送状态信息的装置,所述装置包括:获取模块,用于获取目标区域在预设时刻的配送服务数据和所述目标区域对应的区域特征数据,所述区域特征数据包括时间标识数据、第一天气数据以及用于表征对应区域的区域标识数据;预测模块,用于根据所述配送服务数据和所述区域特征数据通过配送状态信息预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息。第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开第一方面所述方法的步骤。第四方面,提供一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现本公开第一方面所述方法的步骤。通过上述技术方案,获取目标区域在预设时刻的配送服务数据和所述目标区域对应的区域特征数据,所述区域特征数据包括时间标识数据、第一天气数据以及用于表征对应区域的区域标识数据;根据所述配送服务数据和所述区域特征数据通过配送状态信息预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息,也就是说,本公开是根据目标区域的配送服务数据和目标区域的区域标识数据、第一天气数据以及时间标识数据等区域特征数据预测目标区域的配送状态信息,这样,可以对目标区域的区域特征数据进行学习,从而可以提高预测目标区域的配送状态信息的准确性。本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1是根据一示例性实施例示出的一种预测配送状态信息的方法的流程图;图2是根据一示例性实施例示出的一种配送状态信息预测模型的结构示意图;图3是根据一示例性实施例示出的一种配送状态信息预测模型训练方法的流程图;图4是根据一示例性实施例示出的一种预测配送状态信息的装置的框图;图5是根据一示例性实施例示出的一种电子设备的框图。具体实施方式以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。本公开的目的在于提供一种可以针对特定的目标区域该目标区域可以为高负载区域、恶劣天气区域等极端区域或者非极端区域中的任一区域未来一段时间的平均配送时长、订单量、平均订单负载等配送状态信息进行预估的方法,并作为衡量该目标区域运力紧张情况的主要参考依据,相关技术中,主要采用根据多个区域的配送服务数据训练得到的全局回归模型,预测未来预设时长内的配送状态信息,但这仅能保证多个区域整体的准确度,当采用该全局回归模型对于高负载区域、出现恶劣天气的区域等极端区域的配送状态信息进行预估时,预估的准确性较差。为解决上述存在的问题,本公开提供一种预测配送状态信息的方法、装置、存储介质及电子设备,在对目标区域的配送状态信息进行预测的过程中,可以先获取目标区域在预设时刻的配送服务数据和该目标区域对应的区域特征数据,然后根据该配送服务数据和该区域特征数据通过配送状态信息预测模型,得到该目标区域在自该预设时刻起的预设时长内的配送状态信息,其中,该区域特征数据包括时间标识数据、第一天气数据以及用于表征对应区域的区域标识数据,配送状态信息预测模型为根据多个预设样本区域的区域特征数据和配送服务数据训练得到的,这样,该配送状态信息预测模型可以对该目标区域的区域特征数据进行个性化的学习,从而可以提高预测目标区域的配送状态信息的准确性,另外,该目标区域可以为高负载区域、恶劣天气区域等极端区域或者非极端区域中的任一区域,因此,采用本公开提供的预测方法,也可以提高对极端区域的配送状态信息预估的准确性。图1是根据一示例性实施例示出的一种预测配送状态信息的方法的流程图,如图1所示,该方法包括以下步骤:在步骤101中,获取目标区域在预设时刻的配送服务数据和该目标区域对应的区域特征数据,该区域特征数据包括时间标识数据、第一天气数据以及用于表征对应区域的区域标识数据。其中,该目标区域可以为多个需要预测该配送状态信息的区域中的任一区域,并且该目标区域可以为高负载区域、恶劣天气区域等极端区域或者非极端区域中的任一区域,该预设时刻可以为当前时刻,该配送服务数据可以包括以下数据项中的一项或多项:该目标区域的区域单量数据、该目标区域的区域订单负载数据、该目标区域的区域配送员数据、该目标区域在以该预设时刻为结束时刻的预设历史时长内的订单服务时长数据以及该目标区域在预设历史时间段内的历史订单统计数据,进一步地,该区域单量数据可以为该目标区域在一段时间内产生的订单量、当前时刻未取餐的订单量、当前时刻已经取餐但未送达的订单量、当日累计完成订单量等数据,该负载数据可以理解为平均分配给每个配送员的订单量,该区域订单负载数据可以包括该目标区域的区域负载、一段时间内该目标区域的平均负载等数据,该区域配送员数据可以包括该目标区域当前的在岗骑手数量、该目标区域的总骑手数量等数据。下面以举例的形式对该订单服务时长数据进行说明,假设该预设时刻为当前时刻,该预设历史时长为以该当前时刻为结束时刻的过去十分钟,该订单服务时长数据即可以包括该目标区域过去十分钟已取餐订单的平均实际到店时长到店时间减去下单时间、该目标区域过去十分钟已取餐订单的平均实际等待时长取餐时间减去到店时间、该目标区域过去十分钟已送达订单的平均实际配送时长实际送达时间减去取餐时间、该目标区域过去十分钟已送达订单的平均实际送达时长实际送达时间减去下单时间、该目标区域过去十分钟已送达订单的平均预计送达时长预计送达时间减去下单时间、该目标区域过去十分钟已取餐订单的平均实际接单时长接单时间减去下单时间等数据。假设该预设历史时间段为以当前时刻为结束时刻的过去24小时,该历史订单统计数据可以包括该目标区域过去24小时内的总订单量,该目标区域过去24小时内的人均负载单量,该目标区域过去24小时内订单的平均取餐时间、平均送达时间等数据。需要说明的是,上述对该配送服务数据的说明仅是举例说明,本公开对此不作限定。另外,该时间标识数据用于表征该预设时刻在多个预设时间段中所处的时间段,在一种可能的实现方式中,可以将一天中的24小时划分成多个时间段,例如,可以每隔10分钟划分一个时间段,具体地,0:00-0:10表示零点至零点十分为第一个时间段,0:10-0:20为第二个时间段,以此类推,可以将一天中的24个小时划分为144个时间段,这样,该时间标识数据可以为当前时刻所在的时间段的标识信息,例如,当前时刻为0点15分,可以确定该时刻所在的时间段为第二个时间段0:10-0:20,此处仅是举例说明,本公开对此不作限定。该第一天气数据用于表征目标区域在该预设时刻的天气信息,例如,该第一天气数据可以包括该目标区域在该预设时刻的温度、风速、雨量等天气数据,该区域标识数据可以包括城市ID、区域ID等标识信息。在步骤102中,根据该配送服务数据和该区域特征数据通过配送状态信息预测模型,得到该目标区域在自该预设时刻起的预设时长内的配送状态信息。其中,该预设时长可以为实际预测场景中用户根据自己的需要预先设置的时长,例如,该预设时长可以为以当前时刻为起始时刻的未来20分钟、以当前时刻为起始时刻的未来一个小时等,该配送状态信息可以包括平均配送时长信息、订单量信息、平均订单负载信息,通常情况下,机器学习模型如本公开中的该配送状态信息预测模型都是单任务学习,例如,只预测平均配送时长、订单量以及平均订单负载三种数据中的其中一种数据,但考虑到各个任务之间也是相互关联的,相关联的多任务学习比单任务学习能取得更好的泛化效果,在本公开中,由于同一区域的平均配送时长、订单量以及平均订单负载之间呈强相关关系,基于这种相关关系,本公开可以通过一个该配送状态信息预测模型同时预测得到该目标区域在预设时长内的平均配送时长、订单量以及平均订单负载等多种信息可以理解为多任务学习,以此提高模型的预估准确率,其中,该平均订单负载信息用于表征在该预设时长内平均分配给每个配送员的订单量。该配送状态信息预测模型可以包括DeepFM模型,下面以该配送状态信息预测模型为该DeepFM模型为例,对本步骤的具体实施方式进行说明:示例地,图2是一种DeepFM模型结构示意图,如图2所示,该DeepFM模型包括特征数据输入层、词嵌入层、DeepFM层以及输出层,在本步骤中,可以将该目标区域的时间标识数据、该第一天气数据以及该区域标识数据输入该DeepFM模型的词嵌入层进行embedding表征学习,以将该目标区域的区域特征数据转换为词嵌入向量,然后将该词嵌入向量输入DeepFM层,并且,该配送服务数据属于连续型的特征数据,无需进行词嵌入的处理,可将该配送服务数据直接输入该DeepFM层进行特征学习,这样,可以通过该DeepFM层同时对该目标区域的区域特征数据和配送服务数据两种数据进行学习,从而可以通过输出层输出该目标区域在预设时长内的平均配送时长、订单量以及平均订单负载等配送状态信息,上述示例仅是举例说明,本公开对此不作限定。在执行步骤102后,可以基于该目标区域的上述配送服务数据和区域特征数据通过该配送状态信息预测模型,预测得到该目标区域在预设时长内的平均配送时长、订单量、以及平均订单负载等配送状态信息,这样,可以基于该配送状态信息判断该目标区域在该预设时长内是否会发生爆单,以便在预测到会发生爆单时可以及时采取有效的措施缓解该目标区域的配送压力。在本公开另一种可能的实现方式中,该区域特征数据还可以包括区域类型特征数据,该配送状态信息预测模型可以包括多个配送状态信息预测模型,不同的该区域类型特征数据对应不同的该配送状态信息预测模型,这样,在根据该配送服务数据和该区域特征数据通过该配送状态信息预测模型,得到该目标区域在自该预设时刻起的预设时长内的配送状态信息的过程中,可以从多个该配送状态信息预测模型中确定与该区域类型特征数据对应的目标预测模型,然后根据该配送服务数据和该区域特征数据通过该目标预测模型,得到该目标区域在自该预设时刻起的预设时长内的配送状态信息。其中,该区域类型特征数据可以包括以下任一种:用于表征对应区域在该预设时刻的天气信息符合恶劣天气条件的第二天气数据;用于表征对应区域在该预设时刻的订单负载信息符合高负载条件的订单负载数据,其中,该订单负载数据用于表征在该预设时刻平均分配给每个配送员的订单量;该第二天气数据和该订单负载数据;用于表征对应区域为订单异常区域的异常区域标识数据。例如,该第二天气数据可以为恶劣天气的标识信息比如可以用1表示恶劣天气,用0表示非恶劣天气,在一种可能的实现方式中,针对不同的天气类型可以预先设置多个符合恶劣天气条件的天气阈值,具体地,可以针对高温恶劣天气设置温度阈值,若该第一天气数据中的该目标区域在当前时刻的温度大于或者等于该温度阈值,可以将该目标区域确定为高温恶劣天气区域;可以针对强降雨恶劣天气设置降雨量阈值,若该第一天气数据中的该目标区域在当前时刻的降雨量大于或者等于该降雨量阈值,可以将该目标区域确定为强降雨恶劣天气区域;可以针对暴风恶劣天气设置风速阈值,若该第一天气数据中的该目标区域在当前时刻的风速大于或者等于该风速阈值,可以将该目标区域确定为暴风恶劣天气区域,需要说明的是,当确定该第一天气数据中的至少一种天气数据如温度、降雨量、风速等多种天气数据中的至少一种满足相应的上述阈值条件时,即可将该目标区域当前的天气确定为恶劣天气,此时,可以将该目标区域的区域类型确定为恶劣天气区域,上述示例仅是举例说明,本公开对此不作限定。另外,还可以预先设置符合高负载条件的负载阈值,这样,在获取到的该目标区域在当前时刻的该订单负载数据大于或者等于该负载阈值时,可以将该目标区域的区域类型确定为高负载区域。在一种可能的应用场景中,若根据该目标区域的该第一天气数据确定该目标区域为恶劣天气区域,并且根据该订单负载数据确定该目标区域为高负载区域,此时,可以将该目标区域的区域类型确定为即为恶劣天气区域也为高负载区域。在另一种可能的应用场景中,通常存在一些不明原因导致的订单异常的长尾区域,在一种可能的实现方式中,为提高长尾区域配送状态信息预估的准确率,可以根据多个长尾区域的配送服务数据及区域特征数据预先建立针对该长尾区域的配送状态信息预测模型,并且可以预先为此种类型的区域设置区域标识信息,这样,在获取的该区域特征数据中,包括该异常区域标识数据时,可以将该目标区域的区域类型确定为订单异常区域也可称之为长尾区域,这样,可以通过与该订单异常区域对应的该配送状态信息预测模型预测得到该目标区域的配送状态信息。上述列举了四种不同的区域类型,分别是恶劣天气区域、高负载区域、既是恶劣天气也为高负载的区域、订单异常区域,在本公开的实际应用场景中,也可能包括除上述四种区域类型以外的其它区域类型,本公开对此不作限定,这样,在预测该目标区域的配送状态信息时,可以先根据该区域类型特征数据确定该目标区域对应的区域类型,然后从预先设置的多个配送状态信息预测模型中确定与该目标区域的区域类型对应的模型为目标预测模型,这样,可以根据该配送服务数据和该区域特征数据通过该目标预测模型,得到该目标区域在自该预设时刻起的预设时长内的配送状态信息,具体预测方式已在图2所示的示例中进行描述,在此不再赘述。还需说明的是,若根据该目标区域的区域类型特征数据确定该目标区域的区域类型不属于上述任一区域类型,可以将该目标区域的区域类型确定为普通区域类型,然后获取与该普通区域类型对应的目标预测模型,以通过该目标预测模型预测该目标区域的配送状态信息。采用上述方法可以根据目标区域的配送服务数据和目标区域的区域标识数据、第一天气数据以及时间标识数据等区域特征数据预测目标区域的配送状态信息,这样,可以对目标区域的区域特征数据进行学习,从而可以提高预测目标区域的配送状态信息的准确性,并且由于该目标区域可以为高负载区域、恶劣天气区域等极端区域或者非极端区域中的任一区域,因此,采用本公开提供的预测方法,也可以提高对极端区域的配送状态信息预估的准确性。为了保证模型预测的实效性和准确性,需要对该配送状态信息预测模型按照预设周期如每天进行模型训练更新,下面对该配送状态信息预测模型的训练过程进行说明,图3是根据一示例性实施例示出的一种该配送状态信息预测模型的训练方法的流程图,如图3所示,该方法包括以下步骤:在步骤301中,获取预设样本区域在预设历史时刻的历史配送服务数据、该预设样本区域对应的历史区域特征数据以及该预设样本区域在该预设历史时刻起的该预设时长内的历史配送状态信息。其中,该预设样本区域可以包括多个样本区域,该预设历史时刻可以包括多个时刻,例如,在每隔十分钟将一天的24小时划分为多个时间段后,该预设历史时刻可以为每个该时间段内的任一时刻,另外,在训练该配送状态信息预测模型时,该预设时长要与图1所示的实施例1步骤102中的预设时长相等,这样训练得到的该配送状态信息预测模型才可用于预测目标区域在自该预设时刻起的预设时长内的配送状态信息,该历史配送服务数据、该历史区域特征数据以及该历史配送状态信息均可以从该模型训练日期之前的预设历史时间段内的数据中选取,例如,该预设历史时间段可以为模型训练日期前一天至模型训练日期的前两个星期。在步骤302中,将该预设历史时刻下该预设样本区域对应的该历史配送服务数据、该预设样本区域对应的历史区域特征数据以及该预设样本区域在该预设历史时刻起的该预设时长内的历史配送状态信息作为模型训练样本,对多任务模型进行训练,以得到该配送状态信息预测模型。在实际训练场景中,需要先构建模型训练的训练集和测试集,在一种可能的实现方式中,可以选用第一预设历史子时间段中的数据作为训练样本,选用第二预设历史子时间段中的数据作为测试样本,并且该预设历史时间段包括第一预设历史子时间段和该第二预设历史子时间段,例如,若该模型训练日期为6月15号,该预设历史时间段为6月1号至6月14号,该训练样本可以为在6月1号至6月13号获取的数据,该测试样本可以为6月14号获取的数据,上述仅是举例说明,本公开对此不作限定,另外,在训练样本或者测试样本中,每一条训练样本都包括特征和标签两部分,其中,该特征即为该历史配送服务数据和该历史区域特征数据,该标签即为该历史配送状态信息,如在该预设历史时刻起的该预设时长内的所有订单的平均配送时长、在该预设历史时刻起的该预设时长内的订单量以及在该预设时长内平均分配给每个配送员的订单量即为平均订单负载均为该标签。其中,每条样本中的该平均配送时长可以通过公式1计算得到,每条样本中的该平均订单负载可以通过公式2计算得到:其中,表示该平均配送时长,Finish_durationn表示在预设时长内的第n个订单的配送时长,表示该平均订单负载,loadt表示在预设时长内的第t个历史时刻的订单负载即为在t时刻平均分配给每个配送员的订单量,N表示该预设时长内订单的总数量,T表示该预设时长。需要说明的是,在选取该训练样本时,对于历史配送状态信息属于异常数据的样本例如,对于区域平均配送时长大于2小时的样本属于极端异常情况,可以从该训练样本中剔除,以保证训练得到的模型的预测准确率。另外,在模型训练的过程中,可以先构建预测模型的网络结构,如图2所示,假设该配送状态信息预测模型为该DeepFM模型,可以按照图2所示的结构进行构建,具体模型结构的构建方式可以参考相关文献中的描述,在此不再赘述。在构建完该模型结构后,还可以根据经验值对该模型结构进行模型参数的初始化设置,例如,可以将该词嵌入层的词嵌入向量长度设置为64,该DeepFM模型的DNN部分可以设置3层全连接层,对于FM部分的一阶项和二阶项以及DNN的每一层分别设置dropout,其中,FM部分的dropout系数可以设置为0.85,DNN部分的dropout系数可以设置为0.9,模型训练的初始学习率可以设置为0.015,每训练2000步,可以将学习率进行一次衰减,衰减系数可以设置为0.95。另外,由于本公开提供的预测方法可以对目标区域在自预设时刻起的预设时长内的平均配送时长、订单量、平均订单负载等多任务进行预测学习,因此,在本步骤中,也需要对多任务模型进行训练,考虑到实际的应用场景中,主要以预设时长内的平均配送时长作为衡量区域是否发生爆单的主要依据,因此,在本公开中,可以将该平均配送时长信息作为该多任务模型的主任务,该订单量信息和该平均订单负载信息作为该多任务模型的辅助任务,进行模型训练,并且,该主任务的损失函数可以采用分段函数进行模型优化,以改善高负载区域、恶劣天气区域等极端区域的预测准确性较低的问题。其中,该分段函数可以包括第一子函数和第二子函数,该第一子函数对应的第一分段区间为在该预设历史时刻起的该预设时长内的订单的实际平均配送时长小于预设时间阈值,并且该第一子函数根据预先设置的第一参数调节系数和位于该第一分段区间的实际平均配送时长得到;该第二子函数对应的第二分段区间为该实际平均配送时长大于或者等于该预设时间阈值,并且该第二子函数根据预先设置的第二参数调节系数和位于该第二分段区间的实际平均配送时长得到;其中,该预设时间阈值表示预先设置的区域发生预设订单异常事件时平均配送时长的临界值;该第一参数调节系数和该第二参数调节系数不同,并且该第一参数调节系数小于该第二参数调节系数。示例地,在一种可能的实现方式中,该分段函数可以表示为下述公式3:其中,ylabel表示实际平均配送时长,T表示该预设时间阈值,即为预先设置的区域发生爆单时该平均配送时长的临界值例如,T可以等于2400秒,ylabel<T表示该第一分段区间,ylabel≥T表示该第二分段区间,Lmain表示主任务的损失函数值,αlow表示该第一参数调节系数,αhigh表示该第二参数调节系数,并且由于实际平均配送时长小于该预设时间阈值时即ylabel<T,通常不会发生爆单的场景,相反,实际平均配送时长大于或者等于该预设时间阈值时即ylabel≥T,通常比较容易发生爆单,因此,为保证对于爆单场景赌赢的该平均配送时长预测的准确率,通常设置αlow小于αhigh,ΩW表示该主任务损失函数的正则化系数。另外,对于辅助任务的损失函数可以选用如公式4所示的平方损失函数:Laux=||ypred-ylabel||24其中,Laux表示该辅助任务的损失函数值,当该辅助任务为预测订单量信息时,该ylabel表示实际订单量,ypred表示模型预测输出的订单量;当该辅助任务为预测平均订单负载信息时,该ylabel表示实际平均订单负载,ypred表示模型预测输出的平均订单负载。在构建完该损失函数后,即可根据该历史配送服务数据、该历史区域特征数据以及该历史配送状态信息对多任务模型进行训练,在一种可能的实现方式中,可以采用交替训练的方式进行模型训练。示例地,首先可以生成一个0-1范围内的随机数,然后将该随机数作为当前训练轮次训练任务的依据,训练任务选取规则,如表1所示,从表中可以看出,针对主任务和辅助任务,可以分别设定不同的训练概率,例如,主任务可以设置为0.6、辅助任务可以设置为0.2,这样可以保证主任务在有限的训练次数下可以得到充分的训练,从而可以更准确的发出爆单预警,例如,与主任务预测平均配送时长对应的随机数区间可以设置为[0,0.6],与辅助任务预测平均订单负载对应的随机数区间可以设置为0.6,0.8],与辅助任务预测订单量对应的随机数区间可以设置为0.8,1],这样,当产生的随机数位于[0,0.6]区间时,当前训练轮次的训练任务为预测平均配送时长;当产生的随机数位于0.6,0.8]区间时,当前训练轮次的训练任务为预测平均订单负载;当产生的随机数位于0.8,1]区间时,当前训练轮次的训练任务为预测订单量,上述示例仅是举例说明,本公开对此不作限定。训练任务训练概率预测平均配送时长0.6预测平均订单负载0.2预测订单量0.2表1采用上述提供的模型训练方法,训练得到一个可以进行多任务学习的预测模型,并且将模型主任务的损失函数自定义为分段函数,可以改善高负载区域、恶劣天气区域等极端区域预测准确性较低的问题。图4是根据一示例性实施例示出的一种预测配送状态信息的装置的框图,如图4所示,该装置包括:获取模块401,用于获取目标区域在预设时刻的配送服务数据和该目标区域对应的区域特征数据,该区域特征数据包括时间标识数据、第一天气数据以及用于表征对应区域的区域标识数据;预测模块402,用于根据该配送服务数据和该区域特征数据通过配送状态信息预测模型,得到该目标区域在自该预设时刻起的预设时长内的配送状态信息。采用上述装置,可以根据目标区域的配送服务数据和目标区域的区域标识数据、第一天气数据以及时间标识数据等区域特征数据预测目标区域的配送状态信息,这样,可以对目标区域的区域特征数据进行学习,从而可以提高预测目标区域的配送状态信息的准确性,并且由于该目标区域可以为高负载区域、恶劣天气区域等极端区域或者非极端区域中的任一区域,因此,采用本公开提供的预测装置,也可以提高对极端区域的配送状态信息预估的准确性。图5是根据一示例性实施例示出的一种电子设备500的框图。例如,电子设备500可以被提供为一服务器。参照图5,电子设备500包括处理器522,其数量可以为一个或多个,以及存储器532,用于存储可由处理器522执行的计算机程序。存储器532中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器522可以被配置为执行该计算机程序,以执行上述的预测配送状态信息的方法。另外,电子设备500还可以包括电源组件526和通信组件550,该电源组件526可以被配置为执行电子设备500的电源管理,该通信组件550可以被配置为实现电子设备500的通信,例如,有线或无线通信。此外,该电子设备500还可以包括输入输出IO接口558。电子设备500可以操作基于存储在存储器532的操作系统,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM等等。在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的预测配送状态信息的方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器532,上述程序指令可由电子设备500的处理器522执行以完成上述的预测配送状态信息的方法。在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的预测配送状态信息的方法的代码部分。以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
权利要求:1.一种预测配送状态信息的方法,其特征在于,所述方法包括:获取目标区域在预设时刻的配送服务数据和所述目标区域对应的区域特征数据,所述区域特征数据包括时间标识数据、第一天气数据以及用于表征对应区域的区域标识数据;根据所述配送服务数据和所述区域特征数据通过配送状态信息预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息。2.根据权利要求1所述的方法,其特征在于,所述配送状态信息包括平均配送时长信息、订单量信息、平均订单负载信息;所述平均订单负载信息用于表征在所述预设时长内平均分配给每个配送员的订单量。3.根据权利要求1所述的方法,其特征在于,所述配送服务数据包括以下数据项中的一项或多项:所述目标区域的区域单量数据、所述目标区域的区域订单负载数据、所述目标区域的区域配送员数据、所述目标区域在以所述预设时刻为结束时刻的预设历史时长内的订单服务时长数据以及所述目标区域在预设历史时间段内的历史订单统计数据。4.根据权利要求2所述的方法,其特征在于,所述配送状态信息预测模型通过以下方式训练得到:获取预设样本区域在预设历史时刻的历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息;将所述预设历史时刻下所述预设样本区域对应的所述历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息作为模型训练样本进行训练,以得到所述配送状态信息预测模型。5.根据权利要求4所述的方法,其特征在于,所述将所述预设历史时刻下所述预设样本区域对应的所述历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息作为模型训练样本进行训练,以得到所述配送状态信息预测模型,包括:将所述预设历史时刻下所述预设样本区域对应的所述历史配送服务数据、所述预设样本区域对应的历史区域特征数据以及所述预设样本区域在所述预设历史时刻起的所述预设时长内的历史配送状态信息作为模型训练样本,对多任务模型进行训练,以得到所述配送状态信息预测模型,其中,所述平均配送时长信息作为所述多任务模型的主任务,所述订单量信息和所述平均订单负载信息作为所述多任务模型的辅助任务。6.根据权利要求5所述的方法,其特征在于,所述主任务的损失函数为分段函数;所述分段函数包括第一子函数和第二子函数;所述第一子函数对应的第一分段区间为在所述预设历史时刻起的所述预设时长内的订单的实际平均配送时长小于预设时间阈值,并且所述第一子函数根据预先设置的第一参数调节系数和位于所述第一分段区间的实际平均配送时长得到;所述第二子函数对应的第二分段区间为所述实际平均配送时长大于或者等于所述预设时间阈值,并且所述第二子函数根据预先设置的第二参数调节系数和位于所述第二分段区间的实际平均配送时长得到;所述预设时间阈值表示预先设置的区域发生预设订单异常事件时平均配送时长的临界值;所述第一参数调节系数和所述第二参数调节系数不同,并且所述第一参数调节系数小于所述第二参数调节系数。7.根据权利要求1至6任一项所述的方法,其特征在于,所述区域特征数据还包括区域类型特征数据,所述配送状态信息预测模型包括多个配送状态信息预测模型,不同的所述区域类型特征数据对应不同的所述配送状态信息预测模型;所述根据所述配送服务数据和所述区域特征数据通过所述配送状态信息预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息包括:从多个所述配送状态信息预测模型中确定与所述区域类型特征数据对应的目标预测模型;根据所述配送服务数据和所述区域特征数据通过所述目标预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息。8.根据权利要求7所述的方法,其特征在于,所述区域类型特征数据包括以下任一种:用于表征对应区域在所述预设时刻的天气信息符合恶劣天气条件的第二天气数据;用于表征对应区域在所述预设时刻的订单负载信息符合高负载条件的订单负载数据,所述订单负载数据用于表征在所述预设时刻平均分配给每个配送员的订单量;所述第二天气数据和所述订单负载数据;用于表征对应区域为订单异常区域的异常区域标识数据。9.一种预测配送状态信息的装置,其特征在于,所述装置包括:获取模块,用于获取目标区域在预设时刻的配送服务数据和所述目标区域对应的区域特征数据,所述区域特征数据包括时间标识数据、第一天气数据以及用于表征对应区域的区域标识数据;预测模块,用于根据所述配送服务数据和所述区域特征数据通过配送状态信息预测模型,得到所述目标区域在自所述预设时刻起的预设时长内的配送状态信息。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-8中任一项所述方法的步骤。11.一种电子设备,其特征在于,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-8中任一项所述方法的步骤。
百度查询: 北京三快在线科技有限公司 预测配送状态信息的方法、装置、存储介质及电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。