买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于语义分析的文献相似度确定方法及装置,其中该方法包括:将每一待比较文献划分为多个部分;对每一部分进行语义分析得到每一部分的语义分析结果;根据每一部分的语义分析结果,确定每一待比较文献的每一部分的权重值;根据每一待比较文献的每一部分的权重值,得到每一待比较文献的加权平均结果;根据每一待比较文献的加权平均结果,确定待比较文献之间的相似度。本发明可以实现基于语义分析准确地确定文献不同部分的权重,进而准确地确定文献相似度。
主权项:1.一种基于语义分析的文献相似度确定方法,其特征在于,包括:将每一待比较文献划分为多个部分;对每一部分进行语义分析得到每一部分的语义分析结果,其包括:利用一个预先训练好的切词模型对每一部分进行分词处理,得到每一部分对应的多个关键词,训练切词模型时利用消歧算法调整了前后词的数目、单字词数目和字在词中的位置特征;根据每一部分对应的多个关键词,以及预设的文献特征提取策略,从每一部分中提取出多个类型的关键特征,构成每一部分对应的特征集合;根据每一部分对应的特征集合,对每一部分进行词级、句法级和篇章级的语义分析,得到每一部分的语义分析结果;根据每一部分的语义分析结果,确定每一待比较文献的每一部分的权重值;根据每一待比较文献的每一部分的权重值,得到每一待比较文献的加权平均结果;根据每一待比较文献的加权平均结果,确定待比较文献之间的相似度。
全文数据:
权利要求:
百度查询: 北京中知智慧科技有限公司 基于语义分析的文献相似度确定方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。