买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于全链式空铁联程出行的个性化方案生成方法,该方法包括旅客出行数据采集、确定旅客出行选择的最大影响因素、获取空铁联程旅客出行需求、采集联程出行信息、出行方案生成及排序、制定个性化出行方案六大步骤。本发明通过采集旅客的历史出行数据和个人偏好属性,运用基于决策树的随机森林算法预测不同旅客出行选择的最大影响因素,考虑旅客的全链式空铁联程出行需求,为旅客定制个性化联程出行方案。
主权项:1.一种基于全链式空铁联程出行的个性化方案生成方法,其特征在于:该方法包括以下步骤:步骤一:旅客出行数据采集;包括采集N名旅客的一年内关于空铁联程的城内和城际的历史出行数据和感知数据;第i名旅客历史出行数据包括旅客收入水平Ai、程前交通方式Bi、旅客出发城市Ci、旅客目的城市Di、换乘城市Ei、旅客的出行目的Fi、旅客一年内一次出行的平均距离Gi、旅客一年内一次出行的平均总成本Hi;第i名旅客的感知数据包括出发时间偏好Ii、购票时间偏好Ji、旅客出行方式选择时的最大影响因素Yi,i=1,2,3…,N;步骤二:确定旅客出行选择最大影响因素;将步骤一获取到的N名旅客的数据划分成训练集Xtrain和检验集Xtest;构建旅客出行选择最大影响因素分类模型,十个属性参量Ai~Ji作为模型的自变量,最大影响因素Yi作为模型的因变量,采用随机森林算法结合决策树算法训练得到最终的分类模型,过程如下:对于训练集Xtrain采用随机森林算法,即随机有放回地选择T个训练子集UT;在每个子集中根据决策树算法对数据进行分类,根据信息增益比确定分裂节点的顺序,建立决策树,具体包括:1计算训练子集UT的信息熵EntUT: 式中,pk为子集UT中第k类样本所占比例,k=1,2,3,…,n,n为UT中样本种类数量;2计算子集UT中每个属性的信息增益GainUT,a:设属性A有V个可能取值{A1,A2,…,AV},其中属性A上取值为AV的样本量为UTV,属性A的条件概率分布则为|UTV||UT|,则属性A的信息增益GainUT,A表达为:GainUT,A=EntUT-EntUT,A其中,EntUT,A为属性A的信息熵;3遍历所有属性,获取不同属性的不同信息增益;4计算所有属性的信息增益比gRUT,a;对于属性A的信息增益比为gRUT,A,其定义为信息增益GainUT,A与训练子集UT关于A的信息熵EntUT,A之比,即gRUT,A=GainUT,AEntUT,A5遍历所有属性的信息增益比gRUT,a,找到最大的信息增益比,将该最大信息增益比对应的属性作为分支节点;6循环步骤2-步骤5,找到下一个最大信息增益比的属性作为下一分支节点,直至对所有属性遍历结束;对于检验集Xtest的所有数据,单独将每组数据代入T个子集的决策树中,得到T个关于旅客出行选择的最大影响因素分类结果;利用随机森林算法对分类结果进行投票并统计投票结果,将出现次数最高的因变量Y作为该数据的分类结果;对分类模型进行测试,判断该分类模型预测得到的因变量Yi与该名旅客实际出行选择的最大影响因素是否一致;当准确率高于一定阈值,则判定该分类效果满足预期值,结束模型训练,否则返回重新随机挑选T个子集进行分类训练,不断重复直至准确率满足要求;步骤三:获取空铁联程旅客出行需求,即该旅客的十个属性参量Ai~Ji;步骤四:采集联程出行信息;出行由城内交通和城际交通两部分组成,城内交通由巴士负责,城际交通由航空和高铁提供服务;采集航班价格PA、高铁价格PR、城内巴士价格PB、空铁旅客优惠补贴S、航班时长TA、高铁时长TR,换乘时长TT、程前城后交通时长TC、以及航班和高铁的班次表;步骤五:出行方案生成及排序;根据步骤三获取的旅客出行需求,利用步骤二训练得到的分类模型得到旅客出行选择最大影响因素,查询出发日期、出发城市至目的地城市所有可行出行方案并进行排序,具体如下:计算每个可行出行方案的旅客空铁联程总出行费用C=PA+PR+PB-S、旅客空铁联程出行总时长T=TA+TR+TT+TC;按照总费用从低到高、总时长由低到高、出发时刻由早到晚、换乘时间由低到高四种方法将可行出行方案进行排序,形成按照总费用、总时长、出发时刻、换乘时间四种方式划分的出行方案;步骤六:制定个性化出行方案;包括根据旅客出行选择最大影响因素和步骤五的所有出行方案排序寻找最合理的出行方案,完成空铁联程旅客的个性化出行方案推荐。
全文数据:
权利要求:
百度查询: 东南大学 基于全链式空铁联程出行的个性化方案生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。