买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:天元大数据信用管理有限公司
摘要:本发明提供一种基于数据挖掘的企业融资基金匹配方法,属于数据挖掘技术领域,本发明基于大量的中小微企业数据,通过数据挖掘方法构建企业画像,形成基于企业画像的企业融资和信用标签;然后,基金公司等投资机构能够查看企业画像标签展示并以查询检索的方式便捷地获取企业信息;最后,通过更新机制,保障企业数据、指标、画像、标签等信息的实时性与准确性。
主权项:1.一种基于数据挖掘的企业融资基金匹配方法,其特征在于,包括如下步骤:S1:企业征信数据标准化:依据企业名称采集目标企业的征信信息,将海量征信信息数据进行融合,标准化处理;S2:企业征信数据指标化:对企业征信数据进行指标化处理,根据RFM和无监督聚类算法对指标进行衍生和筛选,确立初步的指标库;S3:企业画像构建与计算:构建通过企业画像描述企业特征的维度体系,并通过维度权重计算形成企业画像标签;S4:企业画像标签展示与检索:企业画像标签的展示包括单个企业画像与标签展示和企业群画像与标签展示;企业画像标签检索支持金融机构通过画像标签筛选的方式检索符合要求的潜在投资对象;S5:企业画像标签内容维护:画像系统根据企业发展数据的变化不断更新企业特征;采用滑动窗过滤算法,周期性地更新企业画像系统;企业征信数据标准化,其数据处理步骤包含:征信数据的获取完成数据仓库模型建设、数据源的定义、数据抽取、转换清洗及加载ETL工作;具体步骤包括:数据源的定义:将接口数据、库表数据、非结构化数据统一管理和加工成便于存储、管理和使用的统一结构化数据;通过交叉比对、规则校验把结构不统一、数据信息不完整的数据源变成符合统一结构标准的,放到数据仓库中;数据抽取、转换清洗及加载:在数据抽取、转换清洗及加载ETL的过程中,根据本次建模中征信数据系统的特点建立ETL策略,包括征信数据抽取频率、征信数据颗粒度、征信数据维度;ETL结束后,对于整个过程的监控及跟踪处理也是必不可少的步骤;其中,在数据抽取阶段,针对接口形式的数据采用触发器更新的方式;库表形式的数据中,针对每年、每月更新一次的数据,采用全量更新的方式;针对实时更新、每日更新、每周更新的数据,采用基于数据时间戳的增量抽取机制;在数据转换阶段,将上述过程抽取的原始企业征信数据转换为以时间、地域、行业的数据维度,进而运用相关规则进行数据质量校验,排除不符合分析质量要求的数据;征信数据的治理将取自一个以上数据源系统的详细数据,以及用于分析的集成汇总数据都存储在中心数据库;它在逻辑上是一个完整的库;从层次上来看,征信数据管理分为源数据层、校验数据层、基础数据层、产品数据层4个层次:源数据层:是其它各层的数据的基础,源数据层将来源于各个数据源的数据进行统一规范化加工与存储,并运用适当的策略进行更新;校验数据层:当源数据层数据到达后,通过既定的数据校验规则和校验流程对数据内容进行校验,通过校验的数据加载到中心数据库中,未通过校验的数据返回到下一层,错误的数据形成数据反馈报文反馈给与其对应的数据源的管理机构;基础数据层:存储的是通过校验的关键征信业务数据;中心数据库是存储校验通过的数据,并将通过事后校验查出的错误数据退回到下一层,并最终形成错误反馈报文反馈给上报机构;产品数据层:基础数据入库和整理完毕后,按照服务产品的种类、既定的数据抽取逻辑和挖掘分析加载到产品数据层,为用户准备好服务所需要的产品数据;征信数据的应用建立企业征信数据库,在其基础上进行数据治理、建模模型后,所提供的信用产品就是企业整体画像展示、企业标签及企业画像标签检索;企业画像标签检索将基于企业画像生成的企业标签结果通过No-sql的数据形式存在于数据库中,支持高速缓存,适用于对企业画像数据的快速查询,其输出的记过能够被能够通过Web页面进行展示,用于基金公司的获客分析与投资决策。
全文数据:
权利要求:
百度查询: 天元大数据信用管理有限公司 一种基于数据挖掘的企业融资基金匹配方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。