买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京工业大学
摘要:本申请实施例提供了一种文献识别方法、装置、电子设备和存储介质,涉及数据挖掘和技术情报分析领域。该方法包括:确定文献集的语料集,所述文献集包括多篇原始文献,多篇原始文献包括待识别的第一原始文献;将每篇第一原始文献的术语集作为第一术语集,对每个第一术语集,根据语料集中的各个术语集,确定第一术语集的预设参考指标的指标值;向预设分类模型发送每个第一术语集的预设参考指标的指标值,获得识别结果,识别结果表征每个第一术语集所属的第一原始文献是否涉及目标技术。本申请实施例实现了基于术语集识别一个文献是否涉及创新程度和技术影响程度达到预设条件的目标技术的目的。
主权项:1.一种文献识别方法,其特征在于,包括:确定文献集的语料集,所述文献集包括多篇原始文献,所述多篇原始文献包括待识别的第一原始文献,所述语料集包括每篇原始文献各自的术语集和各自关联的文献的术语集;将每篇第一原始文献的术语集作为第一术语集,对每个第一术语集,从所述语料集中的各个术语集中确定第二术语集,所述第二术语集所属的文献在所述第一术语集所属的文献之前公开;确定所述第一术语集中的新术语和新术语组合,所述新术语和新术语组合均不在所述第一术语集和所述第二术语集的交集中;将所述新术语的数量与所述第一术语集中术语的总数的第一比值作为所述第一术语集的第一参考指标的指标值,所述第一参考指标表征创新程度;将所述新术语组合的数量与所述第一术语集中术语组合的总数的第二比值作为所述第一术语集的所述第一参考指标的指标值;对每个第一术语集,从所述语料集中的各个术语集中确定第三术语集,所述第三术语集所属的文献在所述第一术语集所属的文献之后公开;根据所述第三术语集确定所述第一术语集中的复用术语和复用术语组合,所述复用术语和复用术语组合在所述第一术语集和所述第三术语集的交集中;将所述复用术语的数量与所述第一术语集中术语的总数的第三比值作为所述第一术语集的第二参考指标的指标值,所述第二参考指标表征技术影响程度;将所述复用术语组合的数量与所述第一术语集中术语组合的总数的第四比值作为所述第一术语集的所述第二参考指标的指标值;对于每个第一术语集,根据所述语料集中的各个术语集,确定所述第一术语集的第三参考指标的指标值,所述第三参考指标表征技术影响程度;向预设分类模型发送每个第一术语集的第一参考指标、第二参考指标和第三参考指标的指标值,获得识别结果,所述识别结果表征每个第一术语集所属的第一原始文献是否涉及目标技术,所述目标技术为创新程度和技术影响程度符合预设条件的技术。
全文数据:
权利要求:
百度查询: 北京工业大学 文献识别方法、装置、电子设备和存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。