买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国平安财产保险股份有限公司
摘要:本发明涉及大数据技术,揭露了一种用户数据画像生成方法,包括:获取原始数据集,对所述原始数据集进行预处理操作,得到标准数据集,获取目标信息集,提取所述目标信息集中的目标信息,根据所述目标信息得到目标因子,查找预设数据库中所述目标因子对应的浮动项,根据所述浮动项计算得到浮动目标,汇总所述浮动目标得到浮动目标集合,根据所述浮动目标集合及所述标准数据集生成所述目标信息集中用户对应的数据画像。此外,本发明还涉及区块链技术,所述数据画像可存储于区块链的节点。本发明还提出一种用户数据画像生成装置、电子设备以及计算机可读存储介质。本发明可以解决计算机资源占用过多的问题。
主权项:1.一种用户数据画像生成方法,其特征在于,所述方法包括:获取原始数据集,对所述原始数据集进行预处理操作,得到标准数据集,所述预处理包括去重处理、去异常处理以及缺失值检测,并检测所述去异常处理后的所述原始数据集是否存在数据缺失值,若检测出存在所述数据缺失值,则通过预设的填充算法对所述数据缺失值进行填充;将目标信息中包含的文本进行分词处理,并除去停用词,得到分词结果,从所述分词结果中提取一个或者多个关键词作为风险信息,获取所述标准数据集中的历史风险信息,当所述风险信息与所述历史风险信息相同时,确定所述风险信息为目标因子;当在预设数据库中查找到与所述目标因子相同的因子时,将查找到的因子对应的浮动项确定为所述目标因子的浮动项,利用所述浮动项计算得到所述目标因子的浮动目标,汇总所述浮动目标得到浮动目标集合,其中,采用下述公式利用所述浮动项计算得到所述目标因子的浮动目标: 其中,Bi为第i个目标因子的浮动目标,i为大于0的整数,为相应的浮动项,ai为第i个目标因子,k为所述浮动项的个数;获取所述标准数据集中的历史浮动目标集合,计算所述历史浮动目标集合中各历史浮动目标的平均值,得到历史浮动目标平均值集,利用预设的映射关系将所述浮动目标集合与所述历史浮动目标平均值集进行匹配,得到匹配成功后的浮动目标和历史浮动目标平均值,计算各项所述浮动目标与对应的所述历史浮动目标平均值的比值结果,获取预设的数据标签,根据所述比值结果及所述数据标签得到数据画像。
全文数据:
权利要求:
百度查询: 中国平安财产保险股份有限公司 用户数据画像生成方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。