买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:大连交通大学
摘要:一种基于知识注入时空图卷积网络的大城市出租车需求预测方法,准备天气和周末外部数据、区域连通性及出租车需求时间序列文件;将天气与周末数据构造成实体三元组,空间依赖关系构建成区域连通性文件,时间依赖关系构建成时间序列文件;用TransR知识图谱模型挖掘天气和周末实体三元组本身及相互间的关系;用动态融合单元将出租车需求数据与TransR所得到的实体和关系语义嵌入文件进行融合感知,得到更新后的区域表示;将区域连通性文件与更新后的区域表示馈送到时空图卷积网络得到出租车需求时空依赖关系,将其馈送到全连接层预测未来出租车需求数量。本发明提高出租车需求预测精度,帮助政府和交通部门优化资源配置,减少乘客需求与供给不匹配现象发生。
主权项:1.一种基于知识注入时空图卷积网络的大城市出租车需求预测方法,是用来预测未来一个小时内起始点和终点区域之间的出租车需求数量,其特征在于,包括如下步骤:一、准备数据:准备天气、周末外部数据、区域联通关系文件和出租车需求时间序列文件;二、数据处理:1处理外部因素数据:首先,将天气与周末外部因素处理成实体三元组形式,其中天气三元组表示为区域对,时间,天气,其中头部实体为区域对,关系是时间,天气是尾部实体,可以表示此区域对在不同时间段,它的天气变化情况;周末三元组表示为周末早晚高峰期时间段,休息,区域对,其中头部实体为周末早晚高峰期时间段,关系为休息,尾部实体为区域对,可以说明此区域对在周末早晚高峰期时间段人们处于休息状态;区域邻接三元组表示为起始点区域,连接,终点区域,头部实体为起始点区域,关系为连接,尾部实体为终点区域,表达出租车需求流向情况,将上述三元组文件进行整合能够全面表示交通实体三元组关系;2处理时间数据:将出租车需求订单数据构建成时间序列文件T∈RH×N,其中H表示历史时间序列长度,表示历史时间序列长度中每个小时的不同区域对中的出租车需求订单数量,其中N表示节点数量,节点表示区域对;3处理空间数据:根据北京出租车订单数据来构建区域联通文件:我们将O∈RN×N视为一个邻接矩阵,若Oi,j=1,说明区域i与区域j之间存在关联,否则为0,其中i是起始点区域,j为终点区域;三、数据分析:为了验证天气和周末等外部因素对出租车需求的影响,并展示大城市如北京出租车需求的显著时空差异导致的供需不匹配现象,可以利用origin可视化分析软件进行全面分析,首先通过折线图展示一天中不同时段的天气变化和出租车需求量之间的关系,其次利用柱状图比较工作日与周末早晚高峰期例如7-9点和17-19点的出租车需求量差异,从中也可以发现某日出租车需求受到大雨极端天气和周末相互作用使出租车需求进一步减少,然后使用小提琴图展示大城市和小城市不同区域的出租车需求量分布情况,以揭示空间差异,接着通过立体折线图展示大城市和小城市在不同时段如早高峰和晚高峰的出租车需求分布情况,从而揭示时间差异,最后通过堆叠面积图展示北京大城市内热门区域的出租车供需情况,突出供需不平衡现象,通过这些可视化分析,可以深入理解大城市下出租车需求的时空动态,为城市规划和资源优化提供依据;四、数据挖掘:将步骤二1整合好的天气、周末和区域实体三元组文件输送到TransR知识图谱模型当中并进行训练1000次,从而获得天气、周末和区域实体三元组的语义文件xk,能够全面表示交通实体三元组之间的关联;首先,映射投影矩阵将实体投影向量定义为:hr=hMr,tr=tMr1其中h表示头部实体,t表示尾部实体,r表示头部实体与尾部实体之间的关系,实体嵌入设置h,t∈Rp,关系嵌入设置r∈Rg,将实体空间中的实体通过矩阵Mr投影到r关系空间当中,分别由hr和tr满足hr+r≈tr,对于每个关系r,相应设置一个投影矩阵Mr∈Rp*g,可以将实体从实体空间投影到关系空间;其次,为了衡量实体和关系之间的相似度以及相关程度,使用得分函数定义为: 最后,在TransR知识图模型训练过程中,此模型会约束实体与关系嵌入向量的范数,因此将||h||2≤1,||r||2≤1,||t||2≤1,||hr||2≤1,||tr||2≤1,因此,TransR模型可以对实体三元组所表示外部因素之间复杂相关性进行训练1000次来生成实体与关系语义嵌入文件为xk;五、数据融合:此阶段采用动态因素融合单元是为了使交通需求信息来感知外部语义信息动态变化,采用动态融合单元可以将步骤步骤二2得到乘客对出租车需求信息T∈RH×N和步骤四得到外部因素内部之间复杂相关性xk进行融合,使二者产生关联,得到更新后的区域表示x′t,动态因素融合单元公式如下所示:Xs=LeakyReluxk.T.w+bx′t=[Xs]3其中,LeakyRelu是激活函数,w是线性变换,b是偏置项,x′t表示时间t的交通需求信息T与外部语义信息xk融合所得到更新后的区域特征表示。六、提取时空特征:为了捕获出租车需求时空依赖,首先,使用步骤步骤二3得到的区域联通关系表示O与步骤五得到更新后的区域特征表示x′t作为图卷积神经网络的输入,它可以根据步骤步骤二3所构建邻接矩阵Oi,j来捕捉起始点区域与终点区域之间的关联进而挖掘乘客有价值的流向模式,从而得到每个区域的向量表示,其公式为: 其中σ是激活函数,O是邻接矩阵,是具有自连接的邻接矩阵,是的度矩阵,Wl是l-th个卷积层的权重矩阵,Hl是第l-th层的节点特征非线性组合的输出;其次,为了将知识图谱模型所导出外部因素知识表示与OD需求时间相关性进行集成,我们进一步使用门控递归单元GRU来展示知识注入交通需求预测的整个工作流程,从而得到每个区域对的出租车需求预测结果,门控循环单元具体公式为:rt=σWr.H[X′t,ht-1],O+brzt=σWz.H[X′t,ht-1],O+bznt=tanhWn.H[X′t,rt⊙ht-1],O+bnht=rt⊙ht-1+1-rt⊙nt5其中[.]表示将更新后的区域特征X′t与t-1时刻交通需求信息ht-1进行串联达到融合目的;rt表示更新门,它控制过去记忆信息对当前时间步的影响,既可以保留当前时刻输入,也可以丢弃无关交通需求预测的历史信息,有助于捕捉时间序列里的短期依赖关系,zt是重置门,可以控制前一时刻状态信息带入到当前状态以此用于更新记忆,Wr、Wz、Wn和br,bz,gn分别代表权重和偏置项,状态ht表示更新门和新的候选隐藏状态来计算当前时间步的隐藏状态,⊙表示逐元素相乘,O表示邻接矩阵;七、校准预测结果:在模型训练阶段,我们致力于最小化预测值和实际值之间的误差,来提高模型鲁棒性,因此将步骤六当中时空预测模型学习到的外部因素语义特征以及交通需求时空特征等馈送到全连接层,来预测未来一个小时乘客对出租车的交通需求.其中,损失函数公式为: 其中,Y和代表真实交通需求与预测交通需求信息,||.||用于最小化两者之间差异,Lreg代表回归损失函数,避免过度拟合的正则项,λ是一个超参数;八、预测结果评估:基于步骤七得到的校正预测结果,利用均方根误差RMSE,平均绝对误差MAE以及平均绝对百分比误差MAPE作为衡量指标,并以其他基线模型相比较来评估模型预测效果,其衡量指标公式如下: 其中和第i时刻乘客出租车需求的真实值和预测值,M是时间样本数,N代表OD对的数量,均方根误差和绝对平均误差是为了测量真实值与预测值之间的误差,当误差值越小,说明模型预测精度效果越好,经实验验证,我们提出的ODT-GCN模型在RMSE和MAPE评估指标优于其它8个预测模型,分别为两个传统时间序列模型,其包括历史平均模型HA和差分整合移动平均自回归模型ARIMA;三个深度学习模型,其包括长短期记忆网络LSTM、门控循环单元GRUs和图卷积神经网络GCNs;三个先进深度学习模型,其包括时间图卷积网络T-GCN、属性增强时空图卷积网络AST-GCN以及自适应图卷积递归网络AGCRN。
全文数据:
权利要求:
百度查询: 大连交通大学 一种基于知识注入时空图卷积网络的大城市出租车需求预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。