首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于大数据分析的人才信息处理方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:工业和信息化部人才交流中心

摘要:本发明公开了一种基于大数据分析的人才信息处理方法和系统。所述系统包括数据整合模块、数据处理模块、数据展示模块;所述数据整合模块包括基本数据采集单元、行为数据采集单元、数据清洗单元、数据挖掘单元;所述数据处理模块包括网络创建单元、字段相关性计算单元、标签程度计算单元;所述标签程度计算单元用于计算满足标签信息的标签程度;所述数据展示模块包括用户输入输出单元、可视化数据生成单元、显示单元;所述可视化数据生成单元用于根据人才基本信息数据、人才行为数据、标签信息、标签程度,生成可视化数据。

主权项:1.一种基于大数据分析的人才信息处理系统,其特征在于,所述系统包括数据整合模块、数据处理模块、数据展示模块;所述数据整合模块包括基本数据采集单元、行为数据采集单元、数据清洗单元、数据挖掘单元;所述数据处理模块包括网络创建单元、字段相关性计算单元、标签程度计算单元;所述标签程度计算单元用于计算满足标签信息的标签程度;所述数据展示模块包括用户输入输出单元、可视化数据生成单元、显示单元;所述可视化数据生成单元用于根据人才基本信息数据、人才行为数据、标签信息、标签程度,生成可视化数据;所述基本数据采集单元用于接收录入表单,采集人才基本信息数据,发送到所述数据清洗单元;所述行为数据采集单元使用爬虫方式通过网络采集人才行为数据,发送到所述数据清洗单元;所述人才基本信息数据和所述人才行为数据均为脱敏数据,分别包括多个字段信息;所述数据清洗单元接收所述人才基本信息数据、人才行为数据,将具有相同人员标识的人才基本信息数据、人才行为数据合并,并对其中各个字段,按照相同字段的各数据使用相同长度和格式的方式,对数据进行清洗操作,得到人才标准数据,发送到数据挖掘单元;所述数据挖掘单元对所述人才标准数据进行编码和归一化处理,将人才标准数据的各字段数据集合进行归一化处理,将各个字段的数据集合中的各数据处理为具有最大、最小值的指标数据,并将指标数据重新映射到各个字段的指标数据集合中,得到人才整合数据;所述网络创建单元用于基于上述人才整合数据,构建网络G, ;其中,U为人才整合数据中的人员标识的集合,V为人才整合数据中的字段的集合,E为人员标识与各字段的连接关系集合;所述字段相关性计算单元计算网络G中任意两个字段,字段和字段的相关性,具体为: ;其中,为人员标识数量,为与字段i和字段j均具有连接关系的人员标识数量,为与字段i具有连接关系的人员标识数量,为与字段j具有连接关系的人员标识数量;所述标签程度计算单元计算满足标签信息的标签程度,具体为, ;其中,为字段数量,为字段在标签中所占权重值,为字段在标签中所占权重值;所述用户输入输出单元用于进行用户操作,包括向数据采集单元发出录入表单的控制命令、发起爬取数据的控制命令,以及用户输入标签信息、设置权重值;所述可视化数据生成单元用于根据人才基本信息数据、人才行为数据、标签信息、标签程度,生成可视化数据;所述显示单元显示所述可视化数据。

全文数据:

权利要求:

百度查询: 工业和信息化部人才交流中心 一种基于大数据分析的人才信息处理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。