首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于相似文本的案件繁简分流方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民大学

摘要:本发明涉及一种基于相似文本的案件繁简分流方法,包括如下步骤:1建立数据库,并在数据库中储存样本案件的文本信息;2获取待分流案件的文本信息,并与数据库中的各样本案件进行相似度分析,得到待分流案件的相似度比例值;3根据得到的相似度比例值以及预设的相似度比例阈值,对待分流案件进行分流。本发明提供的基于相似文本的案件繁简分流方法,解决了案件繁简分流中存在的繁简程度无法量化、繁简划分标准不固定、繁简分类无法适应现实需要等难点,可以广泛应用于案件分流领域。

主权项:1.一种基于相似文本的案件繁简分流方法,其特征在于,包括以下步骤;1建立数据库,并在数据库中储存样本案件的文本信息;2获取待分流案件的文本信息,并与数据库中的各样本案件进行相似度分析,得到待分流案件的相似度比例值;3根据得到的相似度比例值以及预设的相似度比例阈值,对待分流案件进行繁简分流;所述步骤2中,获取待分流案件的文本信息,并与数据库中的各样本案件进行相似度分析,得到待分流案件的相似度比例值的方法,包括以下步骤:2.1获取待分流案件的文本信息,并与数据库中的任一样本案件进行比较,计算待分流案件与该样本案件的文本相似度;2.2设定相似度阈值,若待分流案件与该样本案件的文本相似度不小于相似度阈值,则认为该样本案件为待分流案件的相似文本案件;2.3重复步骤2.1~2.2,判断数据库中所有样本案件是否为待分流案件的相似文本案件,得到所有样本案件中的相似文本案件的数量;2.4计算相似文本案件在所有样本案件中所占的比例,作为待分流案件的相似度比例值;所述步骤2.1中,获取待分流案件的文本信息,并与数据库中的任一样本案件进行比较,计算待分流案件与该样本案件的文本相似度的方法,包括以下步骤:2.1.1建立文本相似度计算模型,所述文本相似度计算模型包括嵌入层、长短期记忆神经网络层、卷积神经网络层、额外特征层和输出层;2.1.2将待分流案件与该样本案件的文本信息分别映射到嵌入层,得到待分流案件和样本案件的文本特征矩阵,并输出到长短期记忆神经网络层和卷积神经网络层;2.1.3在长短期记忆神经网络层中分别提取待分流案件与样本案件的第一文本特征信息,同时在卷积神经网络层中分别提取待分流案件与样本案件的第二文本特征信息,并将长短期记忆神经网络层与卷积神经网络层中提取得到的第一文本特征信息和第二文本特征信息均输出到额外特征层;2.1.4在额外特征层中,分别根据待分流案件和样本文件的第一文本特征信息和第二文本特征信息得到二者的总的文本特征信息,根据二者的总的文本特征信息,计算得到待分流案件和样本文件的法律重叠词分数和法律要素对比向量;2.1.5在输出层中,综合考虑待分流案件的文本特征信息、样本案件的文本特征信息、法律重叠词分数及法律要素对比向量,计算得到待分流案件与样本案件的文本相似度;所述步骤2.1.2中,将待分流案件与该样本案件的文本信息分别映射到嵌入层的高维向量空间,得到待分流案件和样本案件的文本特征矩阵的方法,包括以下步骤:首先,去掉待分流案件和样本案件中对后续处理可能造成干扰的字符;其次,根据预设的文本向量维度阈值,对去除干扰后的待分流案件和样本案件进行处理,使得待分流案件和样本案件的向量维度统一;最后,使用Google中的Word2vec模型和相应的参数,将待分流案件和样本案件映射成数值矩阵,作为待分流案件和样本案件的文本特征矩阵;所述步骤2.1.4中,获取待分流案件和样本文件的总的特征向量信息、法律重叠词分数和法律要素对比向量的方法为:首先,将长短期记忆神经网络层与卷积神经网络层的输出结果拼接到一起,得到待分流案件和样本文件的总的特征向量,即文本特征信息;然后,基于待分流案件和样本文件的文本特征信息,利用法律语言库,得到二者的法律重叠词分数;最后,根据法律文本的描述,按照法律上的规则提取相应的事实要素,比较待分流案件和样本文件描述的事实要素是否相同,形成一个0-1向量,作为法律要素对比向量;所述基于待分流案件和样本文件的文本特征信息,利用法律语言库,得到二者的法律重叠词分数的方法,包括以下步骤:首先,根据待分流案件与样本案件的文本特征信息,获得二者的文本特征信息中的重叠词;其次,根据法律语言库,去除重叠词中不在法律语言库中的部分,得到的法律重叠词;最后,计算法律重叠词占二者的文本特征信息中的总词数的比例,该比例即为法律重叠词分数。

全文数据:

权利要求:

百度查询: 中国人民大学 一种基于相似文本的案件繁简分流方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。