买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:四川警察学院
摘要:本发明公开了计算机自然语言处理领域的一种融合主题特征的短文本分类方法。该方法首先从短文本中提取主题特征,通过将LDA模型获取的主题特征与Word2vec生成的词向量进行加权求和来捕捉短文本的核心主题。其次,再将短文本数据集建模为由词图、词性标签图、实体图三个特征图组成的词级组件图,以获得短文本的文本特征。最后,将主题特征与文本特征进行融合,然后动态学习一个短文本图,以编码短文档之间的相似性,从而使更有效的标签传播之间的连接相似的短文档。该方法同时考虑了短文本身的文本特征信息和主题特征信息,丰富了短文本的语义,这极大地促进了分类任务。
主权项:1.一种融合主题特征的短文本分类方法,其特征在于:将短文本进行主题特征获取和文本特征获取,对于主题特征获取中利用LDA主题模型与词向量的加权求和,对于文本特征获取中利用特征图的构建,最后将主题特征与文本特征进行融合,达到短文本特征扩展的目的,以实现短文本的分类。
全文数据:
权利要求:
百度查询: 四川警察学院 一种融合主题特征的短文本分类方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。