首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于Ernie模型的案件线索要素抽取方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海交通大学

摘要:本发明提供一种基于Ernie模型的案件线索要素抽取方法及系统,涉及计算机技术领域,该方法包括:将线索文本输入到线索分类单元,获取线索文本的线索类型;线索分类单元由Ernie模型和关键词匹配构成,调整Ernie模型输出的权重,并根据权重进行分类;将线索文本划分为单句集合S1并将其依次输入命名实体识别单元,识别其中的实体;将单句集合S1中的元素依次输入违法行为与违法后果抽取单元,获取违法行为要素和违法后果要素;根据要素组织整合信息,将线索类型、实体、违法行为要素和违法后果要素组织整合,获取要素抽取结果。本发明能够克服现有技术抽取精度低、容易遗漏线索要素或错误抽取线索要素的缺点,且能够提高违法行为和违法后果要素的抽取效果。

主权项:1.一种基于Ernie模型的案件线索要素抽取方法,其特征在于,包括:步骤1:将线索文本输入到线索分类单元,获取线索文本的线索类型;线索分类单元由Ernie模型、全连接层和关键词匹配构成,根据线索文本中匹配到关键词的次数调整Ernie模型输出的权重,并根据所述权重进行分类;步骤2:将所述线索文本划分为单句集合S1;步骤3:将单句集合S1中的元素依次输入命名实体识别单元,识别出线索文本中的实体;命名实体识别单元由Ernie模型、全连接层和条件随机场构成,条件随机场根据词性规律从Ernie模型的输出结果中找到最合适的标注;步骤4:将所述单句集合S1中的元素依次输入违法行为与违法后果抽取单元,获取线索文本中的违法行为要素和违法后果要素;违法行为与违法后果抽取单元由Ernie模型和全连接层构成;Ernie模型的输入包括单句的位置特征;Ernie模型的损失函数为多分类Focal-Loss,多分类Focal-Loss能够让Ernie模型更加关注难分类的样本;步骤5:根据要素组织整合信息,将所述线索类型、实体、违法行为要素和违法后果要素组织整合,获取要素抽取结果。

全文数据:

权利要求:

百度查询: 上海交通大学 基于Ernie模型的案件线索要素抽取方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。