首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法 

申请/专利权人:广东电网有限责任公司广州供电局;西安交通大学

申请日:2021-11-30

公开(公告)日:2022-03-01

公开(公告)号:CN114118588A

主分类号:G06Q10/04(20120101)

分类号:G06Q10/04(20120101);G06Q50/06(20120101);G06K9/62(20220101)

优先权:

专利状态码:在审-实质审查的生效

法律状态:2022.03.18#实质审查的生效;2022.03.01#公开

摘要:一种聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法,首先对变压器的历史负荷数据进行清洗,然后基于配电变压器的历史负荷数据和停电记录,结合地区历史气象,在遍历聚类结果过程中选择评价值最高的特征加入已选特征集合并自上而下剔除贡献最低的特征,重复进行动态选择和自上而下剔除,直至支付效用最大化达到帕累托最优状态,完成重复‑动态博弈过程;接着采用python生成带有停电和不停电标签的特征数据集,并对特征数据集划分训练集和测试集;采用基于OPTICS聚类的欠采样方法得到平衡数据集;建立AdaBoost集成学习模型,并利用训练数据集训练模型得到预测停电和不停电分类器;最后利用测试集验证停电预测模型。

主权项:1.聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法,其特征在于:步骤如下:步骤1:数据清洗:对变压器的历史负荷数据进行缺失值处理以及异常值处理;步骤2:基于重复-动态博弈的停电前特征提取:基于变压器的历史负荷数据、停电记录和气象数据,选取分类器的分类精度为特征数据合作博弈的共同利益;利用聚类结果进行重复-动态博弈特征选择,每次博弈分为动态博弈特征选择和自上而下特征剔除两个阶段,在遍历聚类结果过程中利用改进夏普利值选择评价值最高的特征加入已选特征集合,对已选特征集合自上而下剔除贡献最低的特征,重复进行动态选择和自上而下剔除,直至支付效用最优达到帕累托最优状态;步骤3:生成数据集:根据变压器的历史负荷数据、停电记录和气象数据,结合停电前的特征信息,基于Pycharm的集成环境,利用python生成带有停电和不停电的特征数据集D,其中停电,记y=1,不停电,记y=0;D={x1,y1,x2,y2,...,xn,yn},xi∈R,yi∈{0,1}步骤4:将特征数据集D进行切分,选取其中的80%为训练数据集D1,20%为测试数据集D2;步骤5:对训练数据集D1中的不停电数据集T0进行OPTICS聚类,设置所有数据点初始参数,包括半径ε、最少点数MinPts、可达距离和核心距离MAC,遍历不停电数据集T0的元素,将所有核心对象元素加入到核心对象集合Ω中,其中核心对象的定义为:ε-邻域对应的子样本集Nεxi至少包含MinPts个样本的xi为核心对象;步骤6:在核心对象集合Ω中,选取一个未被选择过的核心对象存入结果队列中,获取该核心点的所有直接密度可达点存入有序队列,按照可达距离对有序队列中的数据点进行升序排列,其中密度可达为密度直达的传递结果,可达距离rdy,x表示使得“y对于x密度直达”与“x为核心对象”同时成立的最小邻域半径;rdy,x=min{η:y∈Nηx|Nηx|≥MinPts}其中,η为某一邻域半径,y为样本数据点,Nηx为核心点x的η-邻域对应的样本集,|Nηx|为样本集Nηx的样本个数;步骤7:若有序队列中无数据点,跳转到步骤6执行,否则从有序队列中选择队列中第一位即可达距离最近的数据点存入结果队列,将其所有直接密度可达点存入有序队列,按照重新计算的可达距离对有序队列中的数据点重新排序,跳转到步骤7执行;步骤8:如果核心对象集合Ω中元素都已经被处理,则聚类结束,聚类结果由结果队列给出,否则跳转到步骤6执行;步骤9:对上述聚类结果的每一簇按照比例α进行随机欠采样,最终得到平衡训练数据集D′0;步骤10:初始化平衡训练数据集D′0分布权重W,并设置迭代次数m=1,2,...,M; 其中,N为平衡训练数据集D′0的数据量;步骤11:利用平衡训练数据集D′0训练决策树,得到基本分类器Gm;Gmx:R→{0,1}步骤12:计算基本分类器Gmx在平衡训练数据集D′0上的分类误差em; 其中,Gmxi为分类器对xi的预测分类结果,yi为样本实际值,PGmxi≠yi为分类器Gmx分类错误样本的权值之和,为第m次迭代中xi的分布权重;步骤13:计算基本分类器Gmx的系数αm; 步骤14:更新训练数据集的分布权重; 其中,Zm是规范化因子; 步骤15:依次取m=1,2,...,M迭代完步骤11~步骤14,利用基本分类器线性组合得到最终分类器fx; 步骤16:输入测试数据集D2,验证分类器fx模型,输出测试结果。

全文数据:

权利要求:

百度查询: 广东电网有限责任公司广州供电局 西安交通大学 聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。