首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于不平衡数据处理的信贷风险评估方法与系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京工业大学

摘要:本发明公开了一种基于不平衡数据处理的信贷风险评估方法与系统,方法包括:在接收到用户通过客户端发起的申请信贷请求时,获取用户填写的客户信息;根据客户信息,获取用户的信用数据中的特征变量;将特征变量输入训练完成的基于不平衡数据处理的信贷风险评估模型;根据信贷风险评估模型输出的预测结果,判断是否通过用户的信贷请求,并将判断结果返回至客户端。通过本发明的技术方案,解决了信贷数据集不平衡类别分类的问题,避免出现对少数类样本预测精度较差的情况,提升了信贷风险评估模型对违约客户的识别准确度。

主权项:1.一种基于不平衡数据处理的信贷风险评估方法,其特征在于,包括:在接收到用户通过客户端发起的申请信贷请求时,获取所述用户填写的客户信息;根据所述客户信息,获取所述用户的信用数据中的特征变量;将所述特征变量输入训练完成的基于不平衡数据处理的信贷风险评估模型;根据所述信贷风险评估模型输出的预测结果,判断是否通过所述用户的信贷请求,并将判断结果返回至所述客户端;所述基于不平衡数据处理的信贷风险评估模型的训练方法包括:获取客户信用数据样本集,并对所述信用数据样本集进行数据清洗;利用随机森林方法对数据清洗后的所述信用数据样本集进行特征筛选,获得特征数据集;利用不平衡数据处理方法对所述特征数据集进行类别平衡,得到训练数据集;基于逻辑回归算法和xgboost机器学习算法构建集成分类器;将所述训练数据集输入所述集成分类器对训练数据进行机器学习,在损失函数达到最小值时得到训练完成的所述信贷风险评估模型;所述利用不平衡数据处理方法对所述特征数据集进行类别平衡的具体过程包括:针对所述特征数据集计算多数类样本中心和少数类样本中心,具体过程包括:对所述特征数据集中的数据进行归一化处理;将归一化处理后的所述特征数据集划分为多数类数据集和少数类数据集;计算所述多数类数据集的样本数量、所述少数类数据集的样本数量以及待生成少数类样本的个数;根据所述多数类数据集和样本数量计算得到多数类样本中心,根据所述少数类数据集和样本数量计算得到少数类样本中心;为靠近所述多数类样本中心的父样本增加过采样权重,具体包括:选取所述少数类数据集中的样本作为父样本,并添加至父样本集合中;遍历所述父样本集合,并计算得到每个所述父样本到所述多数类样本中心的欧氏距离;根据所述欧氏距离计算得到每个所述父样本的过采样权重,并添加至权重集合中;遍历所述权重集合,根据所述过采样权重与所述待生成少数类样本的个数的乘积计算每个所述父样本的过采样数量;选取靠近所述少数类样本中心的近邻样本作为过采样的辅助样本,具体过程包括:利用KNN算法获取所述父样本的少数类K近邻集合;遍历所述K近邻集合,计算所述K近邻集合中每个样本达到所述少数类样本中心的欧氏距离,并添加至距离集合中;对所述距离集合进行由小到大排序,选取所述距离集合中最小的欧氏距离对应的样本作为辅助样本;根据每个所述父样本的过采样数量,在所述父样本和所述辅助样本之间插值生成相应数量的新样本,并将所述新样本与所述特征数据集进行融合,生成均衡后的数据集并输出。

全文数据:

权利要求:

百度查询: 北京工业大学 基于不平衡数据处理的信贷风险评估方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术