买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京保险服务中心股份有限公司
摘要:本发明涉及车辆行为识别技术领域,具体地说,涉及基于大数据的非营业性质车辆从事营业行为的识别方法。其包括S1、获取营运车的运行特征向量;S2、基于营运车的运行特征向量训练逻辑回归模型;S3、获取待识别车辆的运行特征向量;S4、将待识别车辆的运行特征向量传入逻辑回归模型中进行评分。本发明中通过对营运车数据进行从事营业行为车辆特征数据探查,确定从事营业行为车辆识别特征及相应阈值;然后判断待识别车辆各个特征是否达到阈值,基于从事营业行为车辆特征数据阈值及对应权重,最终判定待识别车辆是否为从事营业行为的车辆,从而达到快速识别从事营业行为车辆的效果。
主权项:1.基于大数据的非营业性质车辆从事营业行为的识别方法,其特征在于,其包括如下方法步骤:S1、获取营运车的运行特征向量;S2、基于营运车的运行特征向量训练逻辑回归模型;S3、获取待识别车辆的运行特征向量;S4、将待识别车辆的运行特征向量传入逻辑回归模型中进行评分,其中:逻辑回归模型将待识别车辆用于非法营运车的得分而设定的分值刻度,通过将分值表示为比率对数的线性表达式来定义,即: ;式中,为待识别车辆用于非法营运车的得分;A为分值补偿,B为分值刻度,A和B均为常数;为发生比;所述S1中以营运车使用性质为索引,获取营运车的运行数据,并将运行数据提取加工为特征向量,所述特征向量的特征属性包括日均行驶里程、日均行驶时长、日均充电次数、驾驶时间的分散度和车辆轨迹的分散度;营运车的运行特征向量α=[M,T,C,D,L],其中M表示日均行驶里程,T表示日均行驶时长,C表示日均充电次数,D表示驾驶时间的分散度,L表示轨迹的分散度;待识别车辆的运行特征向量αt=[M,T,C,D,L],其中M表示日均行驶里程,T表示日均行驶时长,C表示日均充电次数,D表示驾驶时间的分散度,L表示轨迹的分散度;M,T,C,D,L的计算过程如下:计算日均行驶里程M:通过国家平台的大数据存储平台Star-rocks,按照车架号vin检索于训练模型、测试模型和验证模型的近1个月的行驶里程数据,并将数据进一步加工处理成计算日均行驶里程M;计算日均行驶时长T:通过国家平台的大数据存储平台Star-rocks,按照车架号vin检索于训练模型、测试模型和验证模型的近1个月的行驶时长数据,并将数据进一步加工处理成计算日均行驶时长T;计算日均充电次数C:通过国家平台的大数据存储平台Star-rocks,按照车检索于训练模型、测试模型和验证模型的近1个月的充电数据,并将数据进一步加工处理成计算日均充电次数C;计算驾驶时间的分散度D:通过国家平台的大数据存储平台Star-rocks,按照车架号检索于训练模型、测试模型和验证模型的近1个月的行驶时长数据;首先将时间分为24个驾驶时间段,每个时间段为1小时,然后按照车辆每天是否在该时间段行驶过对其打标签,存在行驶行为的标签为1,不存在行驶行为的标签为0,统计近1个月每个时段存在驾驶行为的天数,如果这个时段的驾驶天数超过20天,则这个时段的标签f记为1,统计24个时段的标签的和,即为驾驶时间的分散度D,其表达式为: ;计算车辆轨迹的分散度L:通过国家平台的大数据存储平台Star-rocks,按照车架号检索于训练模型、测试模型和验证模型的近1个月的车辆位置数据,在所有位置数据中,找到最东,最西,最南和最北的位置围成一个矩形区域,将每天的位置放到矩形区域中,形成轨迹图像,利用RMSE比较近一个月轨迹图像的相似度,RMSE即为车辆轨迹的分散度L,RMSE的表达式为: ;n为一个月的天数;将α放入逻辑回归模型中训练,使逻辑回归模型中具备M,T,C,D,L这五个从事营业行为车辆识别特征以及相应的阈值,计算出不同识别特征下的从事营业行为车辆特征权重;后续传入逻辑回归模型的αt与阈值比较,基于从事营业行为车辆特征数据阈值及对应权重,得出车辆用于非法营运车的概率;将车辆用于非法营运车的概率表示为p,则正常的概率为1−p; ;Odds表示发生比;将车辆用于非法营运车的p可表示为: ;其中,分值越高代表待识别车辆用于非法营运车的可能性越低。
全文数据:
权利要求:
百度查询: 北京保险服务中心股份有限公司 基于大数据的非营业性质车辆从事营业行为的识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。