买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海晓途网络科技有限公司
摘要:本申请提供了一种逾期预测方法、装置、电子设备及存储介质,属于大数据技术领域。本申请通过获取对象预设时间段内的第一信息数据;基于预设分词数据库对所述第一信息数据进行分词处理,得到与所述第一信息数据对应的第一分词集合;将所述第一分词集合划分为多组第一子集合和第二子集合,将每组所述第一子集合和所述第二子集合输入至预设词向量模型,以使所述预设词向量模型输出与每个所述第一子集合对应的第一词向量;基于所述第一词向量和预设主题模型,构建与所述第一信息数据对应的主题向量;将所述主题向量输入至预设逾期预测模型,以使所述预设逾期预测模型输出与所述对象对应的预测结果。从而提高逾期预测的效率。
主权项:1.一种逾期预测方法,其特征在于,所述方法包括:获取对象预设时间段内的第一信息数据,所述第一信息数据是消费信贷用户授权的文本数据;基于预设分词数据库对所述第一信息数据进行分词处理,得到与所述第一信息数据对应的第一分词集合;将所述第一分词集合划分为多组第一子集合和第二子集合,将每组所述第一子集合和所述第二子集合输入至预设词向量模型,以使所述预设词向量模型输出与每个所述第一子集合对应的第一词向量,得到多个第一词向量,所述第一子集合包括所述第一分词集合中的任意一个第一分词,所述第二子集合包括所述第一分词集合中除所述第一子集合外的全部第一分词,其中,针对每一组中的第一子集合和第二子集合,所述第二子集合表示所述第一子集合的上下文信息;基于所述第一词向量和预设主题模型,构建与所述第一信息数据对应的主题向量;将所述主题向量输入至预设逾期预测模型,以使所述预设逾期预测模型输出与所述对象对应的预测结果;其中,所述分词数据库通过以下方式构建:获取第一文本数据和多个历史用户的第二信息数据,所述第一文本数据为所述逾期预测模型对应的行业文本数据,所述第二信息数据是指已经完成消费信贷申请的历史用户授权的文本数据;基于所述第一文本数据和所述第二信息数据中的标点符号,对所述第一文本数据和所述第二信息数据进行分句处理,得到多个分句;针对每个分句,基于预设分词规则对所述分句进行分词处理,得到多个第二分词;基于所述多个第二分词构建所述分词数据库;所述基于所述多个第二分词构建所述分词数据库,包括:计算每个候选第二分词的左邻接熵值和右邻接熵值;将左邻接熵值大于或等于预设左邻接阈值且右邻接熵值大于或等于预设右邻接阈值的候选第二分词,确定为第一目标分词;基于所述第二分词集合和所述第一目标分词,构建分词数据库;所述基于预设分词规则对所述分句进行分词处理,得到多个第二分词,包括:利用分词器对每个分句进行分词,得到第二分词集合;针对每个分句,计算所述分句中每个第一字符块与其相邻的第一文字的互信息,所述字符块包括至少一个文字,其中,所述互信息表征两个物体相互依赖的程度;若所述互信息大于或等于预设阈值,则将所述第一字符块和所述第一文字组成第二字符块;若所述互信息小于预设阈值,则确定所述第一字符块为候选第二分词。
全文数据:
权利要求:
百度查询: 上海晓途网络科技有限公司 一种逾期预测方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。