买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:同方知网数字出版技术股份有限公司
摘要:本申请公开了基于LDA主题模型的数据挖掘方法、装置、设备及介质,涉及数据分析技术领域,其中方法包括:通过对采集的文本信息进行时间切片处理,得到基于时序标签的文本集;利用训练得到的自适应LDA主题模型,确定所述文本集的主题—关键词分布矩阵;根据所述主题—关键词分布矩阵,利用主题归约算法生成针对每个主题的主题连通图;根据所述每个主题的主题连通图,确定所述每个主题的主题关键词。本申请适用于对前沿主题技术信息的准确挖掘。
主权项:1.一种基于LDA主题模型的数据挖掘方法,其特征在于,包括:通过对采集的文本信息进行时间切片处理,得到基于时序标签的文本集;利用训练得到的目标自适应LDA主题模型,确定所述文本集的主题—关键词分布矩阵;根据所述主题—关键词分布矩阵,利用主题归约算法生成针对每个主题的主题连通图;根据所述每个主题的主题连通图,确定所述每个主题的主题关键词。
全文数据:
权利要求:
百度查询: 同方知网数字出版技术股份有限公司 基于LDA主题模型的数据挖掘方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。