买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海合印网络科技有限公司
摘要:本发明公开一种基于混合采样的客户流失预测方法,首先对客户数据同时进行欠采样和过采样:在欠采样时,通过现有的欠采样算法对分类无帮助的样本。在进行过采样时,采用QCSOMTE算法合成新的样本。然后利用上述采用欠采样和过采样所得到的数据对SVM进行监督学习,得到客户流失预测模型。最后利用该客户流失预测模型即可预测客户属于流失客户还是非流失客户。本发明能够避免客户数据不平衡影响预测效果的问题,具有算法效率高和预测准确率高的特点。
主权项:1.基于混合采样的客户流失预测方法,其特征是,包括步骤如下:步骤1、收集已知的流失客户和非流失客户的多属性数据,并根据客户的类型在其多属性数据上加上流失客户或非流失客户的标签,以形成样本数据;步骤2、将标签为流失客户的样本数据归入少数类样本集中,将标签为非流失客户的样本数据归入多数类样本集中;步骤3、对多数类样本集进行欠采样,得到采样多数类样本集;步骤4、计算采样多数类样本集的样本数据个数与少数类样本集的样本数据个数的差值,并将该差值作为所需的合成样本个数P;步骤5、遍历少数类样本集的每个样本数据,计算当前样本数据与少数类样本集中其他样本数据的欧式距离,并将当前样本数据及其欧式距离最近的Q个其他样本数据归入当前样本数据的相似样本集;其中Q为设定的大于等于4的正整数;步骤6、遍历少数类样本集的每个样本数据,从当前样本数据的相似样本集中随机选择4个样本数据,先计算这4个样本数据的质心,再将质心分别与这4个样本数据进行合并得到4个合成样本数据,后将合成样本数据归入合成样本数据集;步骤7、判断合成样本数据集的合成样本数据个数是否等于合成样本个数P:如果合成样本数据集的合成样本数据个数等于合成样本个数P,则将合成样本数据集的合成样本数据全部归入到采样少数类样本集中;如果合成样本数据集的合成样本数据个数大于合成样本个数P,则从合成样本数据集中随机选择P个合成样本数据归入到采样少数类样本集中;如果合成样本数据集的合成样本数据个数小于合成样本个数P,则返回步骤6;步骤8、将采样多数类样本集和采样少数类样本集作为最终的训练集,并将最终的训练集送入到支持向量机中进行训练,得到客户流失预测模型;步骤9、采集待预测客户的多属性数据,并将其送入到客户流失预测模型中进行分类预测,以确定待预测客户属于流失客户还是非流失客户。
全文数据:
权利要求:
百度查询: 上海合印网络科技有限公司 基于混合采样的客户流失预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。