买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种公交站点及线路数据清洗方法,主要包括:通过互联网地图服务商提供的API检索服务,获取原始公交线路和原始公交站点数据;采用DBSCAN聚类方法进行公交站点一次聚类;采用K‑Means聚类方法进行公交站点的二次聚类;针对二次聚类结果,对存在重复线路名称的站点所属聚类分组进行校核重分组,得到最终聚类结果;计算每个公交站点对应的最终聚类结果的簇中心坐标,得到更新的公交站点数据;利用更新的公交站点更新原始公交线路数据,得到更新的公交线路数据。本发明可以对公交站点进行精准聚类,道路两侧的公交站点分别归为两个不同的类,且对公交线路站点坐标进行更新,可以应用于城市公交规划和管理。
主权项:1.一种公交站点及线路数据清洗方法,其特征在于,包括以下步骤:步骤1)通过互联网地图服务商提供的API检索服务,获取原始公交线路和原始公交站点数据,所述原始公交站点数据包含站点名称、站点坐标,站点所属的公交线路名称;所述原始公交线路数据包含线路名称和线路坐标;步骤2)采用DBSCAN聚类方法进行公交站点一次聚类,其中,聚类半径阈值的选取考虑的因素是略大于两侧的相同站点名称的站点之间的距离和道路一侧相同站点名称的站点之间的距离中较大的距离范围,聚类半径阈值为30-60米,一次聚类后得到的结果包括分别具有相同站点名且距离为0~60米的多组公交站点,记为聚类结果Cluster1;步骤3)采用K-Means聚类方法进行公交站点的二次聚类,包括:针对步骤2)聚类结果Cluster1中的每组公交站点的公交线路名称进行检索,若该组公交站点中不存在相同的公交线路名称,则保持该组公交站点原有的一次聚类结果,将保持该组公交站点原有的一次聚类结果记为聚类结果Cluster2.1;若该组公交站点中存在相同的公交线路名称,则采用K-Means聚类方法对该组公交站点进行二次聚类,簇数设置为2,根据该组中的各个公交站点到两个簇中心的距离远近,将这组公交站点分成两个分组,该部分聚类结果记为聚类结果Cluster2.2;步骤4)针对步骤3)得到的聚类结果Cluster2.2中每个分组所有公交站点的公交线路名称进行检索,若存在相同的公交线路名称的两个公交站点,对这些站点进行校核重分组操作,比较两个公交站点的坐标位置与所属聚类结果Cluster2.2分组的簇中心的距离,将其中坐标位置与所属聚类结果Cluster2.2分组簇中心距离大的公交站点划分至另外一个Cluster2.2分组中,该两个Cluster2.2分组同属聚类结果Cluster1中的一个分组;将该组公交站点校核后的聚类结果记为聚类结果Cluster3.1;若不存在相同的公交线路名称,则保持该组公交站点原有的聚类结果Cluster2.2,该部分聚类结果记为聚类结果Cluster3.2;将聚类结果Cluster2.1、聚类结果Cluster3.1和聚类结果Cluster3.2合并为最终聚类结果;步骤5)计算每个公交站点对应的最终聚类结果的簇中心坐标,方法是:分别计算所有属于最终聚类结果同一分组的站点坐标经度、纬度平均值,得到清洗后每个公交站点对应的校正的统一坐标,依次作为更新后的站点坐标;步骤6)利用每个公交站点对应的校正的统一坐标更新原始的线路坐标,得到清洗后的公交线路数据,方法是:按照线路名称逐条提取原始公交线路数据的途经点坐标,采用欧氏距离公式计算原始公交线路中每个途经点的坐标与该线路原始公交站点坐标之间的距离,每条原始公交线路,选取出与该线路原始公交站点最近的途经点,将该途经点其坐标替换为原始公交站点对应的校正后的公交站点的坐标,得到更新后的公交线路坐标;步骤7)将更新的公交线路、公交站点数据存储和输出,应用于后续城市公交规划和管理。
全文数据:
权利要求:
百度查询: 天津市城市规划设计研究总院有限公司 一种公交站点及线路数据清洗方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。