首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于燃气用户分类模型的用气异常判断方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中科盖思数字科技有限公司;北京盖思数字科技有限公司;唐山学院

摘要:本发明涉及一种基于燃气用户分类模型的用气异常判断方法,采集群体燃气用户数据,提取用气数据构建样本数据集,去除脏数据;提取用气特征并对特征进行归一化处理;利用KMO检验和Bartlett检验检验数据变量之间的相关性;主成分分析;聚类分析;引入用户属性数据构建用户标签,对每个用户打标签后,利用随机森林算法建立用户分模型,随机森林结果为产生多个用户分类模型,对用户分类模型进检验后用于分析用户用气异常。本发明建立用户群体画像模型,解决无历史用气信息的新用户无法进行用气行为异常分析的问题。

主权项:1.基于燃气用户分类模型的用气异常判断方法,其特征在于,按下列步骤进行:第一步,样本数据收集:收集群体燃气用户至少一年的用户数据,从用户数据中提取用气数据构建样本数据集;第二步,数据探索及预处理得到净化后的样本数据集:1)遍历样本数据集,对数据中的变量做一个描述性统计,通过查阅去除部分不合理的异常数据以及明显的错误数据;2)采用3σ原则去除部分异常值;3采用箱型图分析去除部分离群数据;4)针对时序数据的处理,步骤是:a统一时序数据格式;b)删除时序重复的数据;c)重建索引;d)对缺失的时序数据进行填充;e)对累计数据做差分处理,得到单日实际发生值;第三步,提取用气特征:对净化后的样本数据集进行用气特征提取,并对提取的所有特征进行归一化处理;第四步、利用KMO检验和Bartlett检验检验数据变量之间的相关性,根据相关性分析结果进行降维处理规划;第五步、主成分分析:S1、对归一化后的数据计算其相关系数矩阵;S2、计算相关系数矩阵的特征值和特征向量;S3、计算累计贡献度,达到80%以上则停止,选取相应的特征值以及对应的特征向量;S4、修改特征向量的正负号,使得每个特征向量的分量和为正,即为最终的特征向量;S5、利用最终特征向量对原特征进行线性组合,得到新特征,即完成降维过程;第六步、利用K-Means进行聚类分析;第七步、利用随机森林算法建立用户分类模型:从用户数据中提取用户属性数据,以用户属性数据为自变量,以第六步聚类结果为因变量,构建多个分类模型;第八步:利用交叉验证检验模型准确性;第九步:分析用户异常数据:每个分类模型对应一个箱线图;对于老用户,提取其日用气量,并输入模型,得到当日异常判断结构;对于新用户,根据得到的分类模型进行归类,若新用户的日用气量超过该类模型箱线图的上下限,则判断为用气异常;若新用户日用气量超过该分类模型箱线图四分之一与四分之三分位数,则判断为异常;其它为用气正常。

全文数据:

权利要求:

百度查询: 中科盖思数字科技有限公司 北京盖思数字科技有限公司 唐山学院 基于燃气用户分类模型的用气异常判断方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。