首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于大数据分析的建筑工程造价分析方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:辽宁云也智能信息科技有限公司

摘要:本发明涉及数据处理技术领域,具体涉及基于大数据分析的建筑工程造价分析方法及系统,包括:从若干份建筑工程造价文件中,获取若干个信息维度序列再获取每个信息维度序列对建筑工程造价的影响因子和重要程度,以此对所有建筑工程造价文件进行聚类操作,得到聚类结果,根据聚类结果、所有信息维度序列以及所有建筑工程造价文件中的建筑工程造价值,构建一个随机森林模型,将未来建筑工程中的所有信息维度输入到随机森林模型中,输出未来建筑工程的建筑工程造价预测值。本发明通过获取建筑工程造价文件之间的优选聚类距离,计算合适的邻域半径与最小样本数,从而得到准确的聚类结果,用以保障后续求取的建筑工程造价预测值的准确性。

主权项:1.基于大数据分析的建筑工程造价分析方法,其特征在于,该方法包括以下步骤:从若干份建筑工程造价文件中,获取每个维度下的信息维度序列;其中,每份建筑工程造价文件对应每个信息维度序列中的一个数据值以及一个建筑工程造价值;所述信息维度包括项目地点、工程规模、项目工期、工程设备成本、材料选配情况、工程量清单以及施工方法;根据每个信息维度序列中数据值之间的差异以及所有建筑工程造价文件中建筑工程造价值之间的差异,得到每个信息维度序列对建筑工程造价的影响因子;根据所有信息维度序列之间的差异以及每个信息维度序列对建筑工程造价的影响因子,得到每个信息维度序列对建筑工程造价的重要程度;根据每个信息维度序列对建筑工程造价的重要程度,对建筑工程造价文件之间的初始聚类距离进行调整,得到建筑工程造价文件之间的优选聚类距离;所述初始聚类距离为欧几里得距离;根据建筑工程造价文件之间的优选聚类距离,分别得到邻域半径与最小样本数;根据邻域半径与最小样本数以及建筑工程造价文件之间的优选聚类距离,使用密度聚类算法对所有建筑工程造价文件进行聚类操作,得到聚类结果;根据聚类结果、所有信息维度序列以及所有建筑工程造价文件中的建筑工程造价值,构建一个随机森林模型,使用所述随机森林模型预测出未来建筑工程的建筑工程造价预测值;所述根据每个信息维度序列中数据值之间的差异以及所有建筑工程造价文件中建筑工程造价值之间的差异,得到每个信息维度序列对建筑工程造价的影响因子,包括的具体步骤如下:将每份建筑工程造价文件,记为一个数据点;在所有信息维度序列中,将任意一个信息维度序列,记为目标序列,将除目标序列之外其它的信息维度序列,记为参考序列;使用手肘法对第个参考序列进行运算,得到第个参考序列的最佳类簇数量;根据第个参考序列的最佳类簇数量,使用K-means聚类算法对第个参考序列中的所有数据值进行聚类操作,得到若干个类簇;在所有参考序列中,从每个参考序列对应的所有类簇中任意选取一个类簇,构成一个类簇组合,对所有参考序列对应的所有类簇进行全排列组合,得到若干个不同的类簇组合;当第个数据点对应的所有参考列中的数据值均处于第个类簇组合中所有参考序列对应的类簇中时,将第个数据点,记为第个类簇组合的映照数据点;从每个类簇组合的所有映照数据点中筛选出若干个主映照数据点;根据每个类簇组合的主映照数据点对应的建筑工程造价值之间的差异以及主映照数据点对应的目标序列中的数据值之间的差异,得到目标序列对建筑工程造价的影响因子;所述从每个类簇组合的所有映照数据点中筛选出若干个主映照数据点,包括的具体步骤如下:使用一阶导数法对目标列进行求导,得到目标列中的若干个极值;在每个类簇组合的所有映照数据点对应的目标序列中的数据值中,将为极值的数据值对应的映照数据点,记为主映照数据点;所述根据所有信息维度序列之间的差异以及每个信息维度序列对建筑工程造价的影响因子,得到每个信息维度序列对建筑工程造价的重要程度,包括的具体步骤如下:以数据点对应的目标序列的数据值为横轴,以数据点对应的第个参考序列的数据值为纵轴,以数据点对应的建筑工程造价值为竖轴,构建所有数据点对应的目标序列与第个参考序列的三维数据空间;在目标序列与每个参考序列的三维数据空间中,以横坐标值相同的所有数据点,构成一个二维数据空间;根据每个信息维度序列对建筑工程造价的影响因子以及目标序列与每个参考序列的三维数据空间划分的二维数据空间中的数据点数量,得到目标序列对建筑工程造价的重要程度;所述根据每个信息维度序列对建筑工程造价的重要程度,对建筑工程造价文件之间的初始聚类距离进行调整,得到建筑工程造价文件之间的优选聚类距离,包括的具体步骤如下:以数据点对应的每个信息维度序列的数据值为纵轴,以数据点对应的建筑工程造价值为横轴,构建所有数据点对应的每个信息维度序列的平面坐标系;根据每个信息维度序列对建筑工程造价的重要程度以及每个信息维度序列的平面坐标系上任意两个数据点的初始聚类距离,得到任意两个数据点之间的聚类距离;所述任意两个数据点之间的聚类距离,包括的具体计算公式如下: 其中,为第个和第个数据点的优选聚类距离,为第个信息维度序列对建筑工程造价的重要程度,为信息维度序列的个数,为第个信息维度序列的平面坐标系上第个和第个数据点的初始聚类距离;所述根据建筑工程造价文件之间的优选聚类距离,分别得到邻域半径与最小样本数,包括的具体步骤如下:将所有任意两个数据点的优选聚类距离的均值,记为邻域半径;将与第个数据点的优选聚类距离小于邻域半径的所有其它的数据点,记为第个数据点的邻域数据点;统计每个数据点的邻域数据点的个数,将所有数据点的邻域数据点的个数的均值的向上取整值,记为最小样本数。

全文数据:

权利要求:

百度查询: 辽宁云也智能信息科技有限公司 基于大数据分析的建筑工程造价分析方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。