买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:银江技术股份有限公司
摘要:一种基于司法文本的涉案财物计算方法,其具体步骤包括:S1,获取需要计算涉案财物的待求解司法文本,进行预处理,预处理包括分词处理、词性标注、动词操作类别标注;S2,对预处理后的待求解司法文本进行编码,包括:构建司法文本的实体图G=N,A,实体图由节点列表N和节点的邻接矩阵A组成,节点包括词语、词语类别,邻接矩阵为词语和词语类别的归属关系矩阵;计算待求解司法文本的向量表示;S3,对编码后的待求解司法文本进行解码,包括:构建解码器的表达式树,其中数值为叶子节点,运算符为非叶子节点,得到基于树结构的解码器的预测模型;将待求解司法文本的向量表示输入预测模型,生成待求解司法文本的涉案财物的计算表达式。
主权项:1.一种基于司法文本的涉案财物计算方法,其具体步骤包括:S1,获取需要计算涉案财物的待求解司法文本,进行预处理,所述预处理包括分词处理、词性标注、动词操作类别标注;其中词性标注的具体步骤如下:S1.2.1,用词性标注器M1,进行初步词性标注,其中词性标注器M1采用监督学习模型在词性标注训练集的基础上进行优化获得;S1.2.2,用词性修正规则集S,修正词性,其中词性修正规则集S获得方法:用词性标注器M1获得词性初步标注,根据词性初步标注和真实标注进行修正规则设置;其中词性修正规则集S获得方法:1用词性标注器M1,进行词性初步标注;词性标注器M1的获取方法:采用如CNN、LSTM、或RNN监督学习模型作为词性标注器基础模型,词性标注训练集Data_M1,包括词语及词语真实词性,提取词语及词语真实词性的向量表示,输入基础模型进行训练,采用梯度下降方法对基础模型进行优化,当基础模型输出的预测词性与真实词性之间的差距满足基础模型训练要求时,该基础模型作为词性标注器M1;2用词性修正规则集S,修正词性;词性修正规则集S的获取方法:词性修正训练集Data_S1、Data_S2、…、Data_Sn,Data_S1包括词语X_S1及词语真实词性Y_S1,提取词语及词语对应的词性的向量表示,1词性修正训练集Data_S1的词语X_S1输入词性标注器M1,获得词性初步标注M1X_S1,比对词性初步标注M1X_S1和词语真实词性Y_S1,输出与词语真实词性Y_S1不相同的词性初步标注M1X_S10,X_S10表示词性初步标注与真实词性不同的词语;2基于词性初步标注与真实词性不同的词语X_S10和词语真实词性Y_S10,人工编写修正规则f1、f2、…、fn,作为词性修正规则预备集S0;3词性修正训练集Data_S2的词语X_S2输入词性标注器M1,获得词性初步标注M1X_S2,利用词性修正规则集S修正词性,获得修正词性M1X_S2,S,根据贝叶斯公式PXc|Yc=Pxc1|yc1*Pxc2|yc2,yc1...Pxci|yci,yci-1,...,yc1和一阶HMM独立性假设,可得到PXc|Yc=Pxc1|yc1*Pxc2|yc2,...,Pxci|yci为计算修正词性的正确率为所有词性类别正确率的乘积,又根据即对应公式为PX_S2|Y_S2为词语X_S2和其对应真实词性Y_S2的正确率,为与词语真实词性Y_S2相同的该词性的词语个数除以真实词性Y_S2中该词性的总个数;如果修正词性的正确率满足修正阈值条件,则该词性修正规则预备集S0作为修正词性规则集S;否则,输出与词语真实词性Y_S2不相同的修正词性标注M1X_S20,S,M1X_S20表示修正词性标注与真实词性不同的词语;4基于词性修正标注与真实词性不同的词语X_S20和词语真实词性Y_S20,人工编写修正规则fn+1、fn+2、…、fn+i,加入词性修正规则预备集S0,作为新的词性修正规则预备集S0;以此重复3、4步骤,获得修正词性规则集S;S2,对预处理后的待求解司法文本进行编码,包括:构建司法文本的实体图G=N,A,实体图由节点列表N和节点的邻接矩阵A组成,节点包括词语、词语类别,邻接矩阵为词语和词语类别的归属关系矩阵;计算待求解司法文本的向量表示;S3,对编码后的待求解司法文本进行解码,包括:构建解码器的表达式树,其中数值为叶子节点,运算符为非叶子节点,得到基于树结构的解码器的预测模型;将待求解司法文本的向量表示输入基于树结构的解码器的预测模型,生成待求解司法文本的涉案财物的计算表达式。
全文数据:
权利要求:
百度查询: 银江技术股份有限公司 一种基于司法文本的涉案财物计算方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。