恭喜之江实验室王海涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜之江实验室申请的专利一种融合正则表达式的金融文本关系抽取与分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113722495B 。
龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111240263.6,技术领域涉及:G06N5/025;该发明授权一种融合正则表达式的金融文本关系抽取与分类方法是由王海涛;刘昭然;许浩;周丹;焦旭;马雪环;王天放设计研发完成,并于2021-10-25向国家知识产权局提交的专利申请。
本一种融合正则表达式的金融文本关系抽取与分类方法在说明书摘要公布了:本发明公开了一种融合正则表达式的金融文本关系抽取与分类方法。该方法对金融文本编码后识别出文本中包含的关系实体对并进行标记;将金融文本依次和各项正则表达式进行匹配,将匹配结果转换为正则表达式标签,最后将该标签与标记结果融合,通过深度神经网络对实体对之间包含的关系进行抽取与分类。本发明实现了融合了正则表达式信息的金融文本端到端关系抽取与分类,逻辑结构清晰,层次分明,无需人工标注,节约了人力成本,提升了工作效率,准确率高,实用性强。
本发明授权一种融合正则表达式的金融文本关系抽取与分类方法在权利要求书中公布了:1.一种融合正则表达式的金融文本关系抽取与分类方法,其特征在于,包括以下步骤:(1)将金融文本库中的金融文本进行编码,将金融文本中的每个词都转换为词向量,通过深度神经网络对各个词向量进行标注,识别出金融文本中包含的关系实体对,对该关系实体对进行标记,得到标注结果;(2)将金融文本依次和正则表达式数据库中的各项正则表达式进行匹配,将匹配结果转换为该金融文本的正则表达式标签,将步骤(1)得到的标注结果输入双向长短期记忆网络,所述双向长短期记忆网络输出特征;具体地,包括:将所述正则表达式标签作为一个全连接神经网络的输入,经过该全连接神经网络后转换得到正则表达式特征,将正则表达式特征融入深度神经网络,表达式如下: ;其中,REfeature代表得到的正则表达式特征,FC2代表用于将正则表达式标签转换为正则表达式特征的全连接神经网络,RElabel表示正则表达式标签;将标注结果L输入双向长短期记忆网络中,得到从标注结果中提取的特征: ;其中为双向长短期记忆网络的输出;(3)将步骤(2)得到的正则表达式标签与双向长短期记忆网络的输出特征进行拼接,表达式如下: ;式中,表示总体特征:将总体特征送入注意力层,得到注意力层的输出,具体计算过程如下: ;其中,tanh为tanh激活函数,softmax为softmax函数,是可训练的参数向量,代表其转置;将注意力层的输出输入全连接分类网络并经过softmax运算后便可得到各关系类型的分类概率,取概率最大值对应的类别作为分类结果,具体运算过程如下: ; ;其中,FC3代表全连接分类网络,代表各关系类型的分类概率,m为关系类别数,argmax代表取最大值对应的关系类型索引的函数,C代表得到的关系类型索引值;通过查询关系类型索引值C对应的关系类型,得到金融关系抽取结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人之江实验室,其通讯地址为:310023 浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。