买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳思特顺科技有限公司
摘要:本发明公开了一种基于自然语言分析的企业服务政策标签提取方法及系统,其包括政策文本采集、建立图谱和信息提取;建立图谱包括:定义信息图谱;基于入库的政策数据生成对应的政策信息图谱,并存入图谱数据库;信息提取包括:定义待提取信息所对应的问题数据;基于问题数据查找图谱数据库,得到匹配的政策信息图谱和疑似需求信息;基于政策信息图谱调用政策数据库中的政策文本,并基于疑似需求信息在政策文本中进行定位;提取定位的字、词及紧随其后的数据、逻辑表述,并根据预设的标签建立规则,形成规则标签;规则标签基于逻辑表述对应的逻辑关系,形成规则体系。本申请具有更好的满足当前多样化政策信息下的企业政策匹配服务需求的效果。
主权项:1.一种基于自然语言分析的企业服务政策标签提取方法,其特征在于:包括政策文本采集、建立图谱和信息提取;其中,所述政策文本采集包括:获取政策文本,并基于政策数据库中的已有记录进行查重处理;以及,若查重处理结果符合预设的入库标准,则存入政策数据库;所述建立图谱包括:定义信息图谱;以及,基于入库的政策数据生成对应的政策信息图谱,并存入图谱数据库;所述信息提取包括:定义待提取信息所对应的问题数据;基于问题数据查找图谱数据库,得到匹配的政策信息图谱和疑似需求信息;基于政策信息图谱调用政策数据库中的政策文本,并基于疑似需求信息在政策文本中进行定位;以及,提取定位的字、词及紧随其后的数据、逻辑表述,并根据预设的标签建立规则,形成规则标签;其中,规则标签包括标签名、标签逻辑运算符和标签值,且规则标签基于逻辑表述对应的逻辑关系,形成规则体系;所述建立图谱包括:对基于同一政策文本得到的政策信息图谱进行标识;以及,根据政策文本、政策信息图谱中展示的发布人单位、对接人单位对政策信息图谱进行分类,得到各个主管口径政策目录及对应的图谱;根据各个主管口径政策目录对政策数据库中的政策文本分类存储;所述提取定位的字、词及紧随其后的数据、逻辑表述,其包括:以各个主管口径政策目录分别匹配对应的词库;当新的政策文本的查重结果符合预设的词库更新标准,则以新的政策文本为样本;比对词库,对样本中新出现的词语进行提取,并查找词典,获取释义;根据释义将新出现的词语添加至词库中对应的词组;所述提取定位的字、词及紧随其后的数据、逻辑表述,其还包括:定位样本中新出现的词语,判断其前n个和或后m个字符中是否出现表示释义的词语,如果是,则:比较释义后紧随的内容与对应词库中的词组的释义,如果相同,则加入词组;如果不相同,则根据释义后紧随的内容,生成新的词组;将词库中的词组中的更新信息和或新增信息发送至指定用户终端,并接收用户反馈,根据用户反馈确定是否实施词库更新新增动作;或,在预设反馈限期T内未接收反馈,则实施词库更新新增动作。
全文数据:
权利要求:
百度查询: 深圳思特顺科技有限公司 基于自然语言分析的企业服务政策标签提取方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。