恭喜北京市科学技术研究院;北京若本机器人科技有限公司吕志坚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京市科学技术研究院;北京若本机器人科技有限公司申请的专利一种中文文本语义解析与重构系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117034946B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310727880.1,技术领域涉及:G06F40/30;该发明授权一种中文文本语义解析与重构系统是由吕志坚;徐冠宁;熊蕊;杜丽萍;李瑛;何余良设计研发完成,并于2023-06-19向国家知识产权局提交的专利申请。
本一种中文文本语义解析与重构系统在说明书摘要公布了:本发明公开了一种中文文本语义解析与重构系统,包括:文本预处理模块用于生成文本向量,字体查询模块用于处理概念相关度查询和词项的概念判断,以支撑查询语义扩展和概念检索的需求,语义资源模块用于对同义词词林资源进行包装,回应有关同义词的查询请求,查询模块和语义搜索模块与语义资源模块发生交互,查询模块用于实现概念扩展和非概念内容的关键词扩展,语义搜索模块用于针对用户的查询请求,进行查询和相关文本的相关性计算并按照相关性大小对相关文本进行排序,交互模块用于与用户交互。本发明支持检索系统对半结构化文本的统一文本表示和统一处理,弥补了传统的检索系统忽略文本结构信息的不足。
本发明授权一种中文文本语义解析与重构系统在权利要求书中公布了:1.一种中文文本语义解析与重构系统,其特征在于,包括:文本预处理模块、字体查询模块、语义资源模块、查询模块、语义搜索模块以及交互模块;所述文本预处理模块用于生成文本向量,首先将抓取的网络文本统一转化为XML描述文本,然后对XML描述文本进行分词和密度扩散处理,得到每个文本词项的合理权重,最终将文本表示为文本向量,并将文本向量存入索引;其中,XML描述文本基于半结构化文本的结构特点的信息抽取方案生成;所述字体查询模块用于处理概念相关度查询和词项的概念判断,以支撑查询语义扩展和概念检索的需求;所述查询模块用于对查询的概念部分进行概念扩展,得到经过扩展之后的查询向量,对非概念部分进行同义词扩展;所述语义资源模块用于对同义词词林资源进行包装,回应有关同义词的查询请求,所述查询模块和所述语义搜索模块与所述语义资源模块发生交互,所述查询模块用于实现概念扩展和非概念内容的关键词扩展,所述语义搜索模块用于针对用户的查询请求,进行查询和相关文本的相关性计算并按照相关性大小对相关文本进行排序,所述交互模块用于与用户交互;所述语义搜索模块用于针对扩展后的查询向量,语义搜索模块首先通过索引得到相关文本和相关文本对应的文本查询相关概念集合和文本查询相关关键词集合,然后针对每个相关文本计算其与查询概念向量和查询关键词向量的相关性,最后对计算出的查询概念相关性和查询关键词相关性进行融合,最终得到相关文本与查询的相关性得分并按照相关性得分大小将相关文本排序;所述语义资源模块利用同义词词林扩展版提供有关同义词的查询操作,在查询关键词扩展操作中,对非概念关键词得到其同义词集,在语义搜索模块中的文本查询概念集的生成过程中,将一个查询概念的同义概念的按比例把权重叠加到一起以组成合理的查询文本概念向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京市科学技术研究院;北京若本机器人科技有限公司,其通讯地址为:100089 北京市海淀区西三环北路27号北科大厦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。