首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于学习和偏好的实时智能订单调度方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:吉林大学

摘要:本发明公开了基于学习和偏好的实时智能订单调度方法,涉及空间众包、任务分配、强化学习和实时匹配技术领域,包括:确定待测城市区域,将待测城市区域进行网格划分,确定司机和可能服务的乘客的位置;基于所述司机和乘客的位置评估偏好值,确定司机偏好列表;基于所述司机偏好列表和乘客偏好列表进行基于学习的匹配,获得匹配结果;基于所述匹配结果重新调整所述偏好值,直到获得最终匹配结果。本发明通过引入一种新的实时、未来导向且平衡双方偏好的任务分配算法,以提高空间众包平台的整体性能和应对能力。

主权项:1.基于学习和偏好的实时智能订单调度方法,其特征在于,包括:确定待测城市区域,将所述待测城市区域进行网格划分,每个网格包含司机位于位置的状态价值,利用矩阵保存;在一个时间批次中,确定司机当前的位置以及司机服务的全部乘客的目的位置,每个位置映射成一个网格来获取司机位于该位置的状态价值;基于所述司机和乘客的目的位置评估司机对乘客的偏好值,所述偏好值决定乘客带给司机的满意度和司机带给乘客的满意度,当确定完司机对所有服务的乘客的偏好值之后,确定司机偏好列表和乘客偏好列表,偏好列表第一位的乘客代表能带给司机总利润最大的乘客;基于司机偏好列表和乘客偏好列表进行基于学习的匹配,获得匹配结果;司机的状态价值函数利用匹配结果更新,然后进行下一时间批次的匹配,直到获得更优的匹配结果;获得偏好值的方法为: 其中,为司机对乘客的偏好值,为利润,为司机从当前位置到目的地的预期增长价值,是折扣率,表示司机在位置的状态价值,其中为由位置映射到状态的映射函数,表示司机在位置的状态价值,为乘客的集合,为成本因素,为乘客的整个旅程的长度;获得乘客的满意度的方法为: 其中,为乘客的满意度,为在时间批次中乘客偏好列表的长度,代表乘客对分配给它的司机的偏好值,为在批次时间分配给乘客的司机;获得司机的满意度的方法为: 其中,为司机的满意度,为司机被分配任务所处的时间批次集,为在时间批次中司机偏好列表的长度,被匹配给司机的乘客,为分配给的任务总数;获得司机的总利润的方法为: 其中,为司机获得的总利润,为乘客总数,为一个指标变量,表示乘客和司机是否匹配;为乘客的付款,为成本因素,为乘客的整个旅程的长度;基于所述司机偏好列表和所述乘客偏好列表进行基于学习的匹配,获得匹配结果的方法包括:为每位乘客准备了一个偏好列表,所述偏好列表用于记录乘客偏好的司机;将待匹配的乘客集合进行初始化,并定义一个变量用来存储最终的配对结果;司机与乘客不断进行配对,直到没有待匹配的乘客为止;设立一个临时的集合,用于跟踪下一周期进行处理的乘客;对于每一位乘客,寻找乘客最偏好的司机;若找不到合适的司机,则当前无法为乘客进行配对,乘客将从临时集合中移除;若找到一位空闲的司机,直接将乘客和司机进行配对,并从临时集合中移除乘客;若司机已经被分配给其他乘客,需要比较这两位乘客在司机偏好中的位置,决定是否需要重新进行配对;若司机倾向于当前正在考虑的乘客,将进行配对,并将原来的乘客返回到临时集合中,待未来重新配对;返回配对结果;基于所述司机偏好列表和所述乘客偏好列表进行基于学习的匹配中,每个匹配周期后状态值函数更新为: 其中,为在时间批次t时,司机在位置的状态价值,其中为由位置映射到状态的映射函数,为折扣率,为在时间批次t时,司机在位置的状态价值,α为学习速率,为乘客的付款,为司机的当前位置,为乘客的目的地,为司机。

全文数据:

权利要求:

百度查询: 吉林大学 基于学习和偏好的实时智能订单调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。