买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广州汉申信息科技有限公司
摘要:本发明涉及数据处理技术领域,公开了一种基于科技项目的实时推送方法及系统,用于提高基于科技项目的实时推送的准确率。方法包括:对目标企业用户进行用户信息提取,得到目标企业用户的用户数据信息;通过用户数据信息对目标企业用户进行企业用户画像构建,得到用户数据信息的目标企业用户画像;从多个科技信息源中采集科技项目数据,并通过预置的LDA主题模型对科技项目数据进行信息拆分,得到多组子项目数据;通过预置的宽度优先搜索算法对多组子项目数据进行项目群组分类,得到多个项目群组数据;基于目标企业用户画像数据,对多个项目群组数据进行项目匹配,得到目标项目群组,并将目标项目群组实时推送至目标企业用户的数据端。
主权项:1.一种基于科技项目的实时推送方法,其特征在于,包括:对目标企业用户进行用户信息提取,得到所述目标企业用户的用户数据信息;通过所述用户数据信息对所述目标企业用户进行企业用户画像构建,得到所述用户数据信息的目标企业用户画像;从多个科技信息源中采集科技项目数据,并通过预置的LDA主题模型对所述科技项目数据进行信息拆分,得到多组子项目数据,具体包括:对多个所述科技信息源进行数据接口匹配,得到每个所述科技信息源对应的数据采集接口;通过每个所述科技信息源对应的数据采集接口,从多个所述科技信息源中采集所述科技项目数据;对所述科技项目数据进行数据清洗,得到所述科技项目数据对应的清洗项目数据;对所述清洗项目数据进行向量化处理,得到所述清洗项目数据对应的向量化数据;将所述向量化数据输入所述LDA主题模型进行主题分布数据分析,得到目标主题分布数据;对所述目标主题分布数据进行主题数量提取,得到目标主题数量;基于所述目标主题数量,对所述目标主题分布数据进行主题信息分析,得到多个目标主题信息;对每两个所述目标主题信息进行主题相关性分析,得到每两个所述目标主题信息对应的主题相关性数据;基于每两个所述目标主题信息对应的主题相关性数据对所述科技项目数据进行子项目数据提取,得到多组子项目数据;通过预置的宽度优先搜索算法对多组所述子项目数据进行项目群组分类,得到多个项目群组数据,具体包括:对多组所述子项目数据进行子项目节点标注,得到多个子项目节点;基于每两个所述目标主题信息对应的主题相关性数据,对每两个子项目节点进行连接边构建,得到每两个所述子项目节点对应的连接边信息;基于多个所述子项目节点以及每两个所述子项目节点对应的连接边信息构建项目关系图;通过所述宽度优先搜索算法对所述项目关系图进行节点连接性分析,得到节点连接性数据;基于所述节点连接性数据,对每个所述子项目节点进行遍历,得到每个所述子项目节点可到达的目标项目节点集;基于每个所述子项目节点可到达的目标项目节点集对多组所述子项目数据进行项目群组分类,得到多个项目群组数据;所述基于每个所述子项目节点可到达的目标项目节点集对多组所述子项目数据进行项目群组分类,得到多个项目群组数据步骤,具体包括:基于每个所述子项目节点可到达的目标项目节点集,分别对多个目标项目节点集进行项目数据提取,得到多个项目数据集;分别对每个所述项目数据集进行项目特征提取,得到每个所述项目数据集对应的项目特征集合;基于每个所述项目数据集对应的项目特征集合生成每个所述项目数据集对应的项目群组标签;通过每个所述项目数据集对应的项目群组标签对多组所述子项目数据进行项目群组分类,得到多个项目群组数据;基于所述目标企业用户画像数据,对多个所述项目群组数据进行项目匹配,得到目标项目群组,并将所述目标项目群组实时推送至所述目标企业用户的数据端,具体包括:对所述目标企业用户画像数据进行画像特征提取,得到画像特征集;对多个所述项目群组数据进行项目标签特征提取,得到标签特征集;对所述画像特征集以及所述标签特征集进行元素交集识别,得到交集元素集合;对所述画像特征集以及所述标签特征集进行元素并集识别,得到并集元素集合;基于所述交集元素集合以及所述并集元素集合对多个所述项目群组数据进行元素相似度计算,得到相似度计算数据;基于所述相似度计算数据对多个所述项目群组数据进行项目排序,得到项目排序列表;基于预置的项目筛选数量,对所述项目排序列表进行项目筛选,得到目标项目群组,并将所述目标项目群组实时推送至所述目标企业用户的数据端。
全文数据:
权利要求:
百度查询: 广州汉申信息科技有限公司 基于科技项目的实时推送方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。