买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京网智天元大数据科技有限公司;网智天元科技集团股份有限公司
摘要:本申请提供了一种结合大模型的金融文档检测方法及系统,首先采集不同的金融文档,得到金融文档数据;进而得到各个金融文档的语义表征向量空间;进一步根据各个金融文档中金融术语之间的关联特征构建各个金融文档的要素关联图,从而确定各个金融文档中所有金融术语的语义连贯度;然后从金融文档数据中提取出多个金融关键词,再根据各个金融关键词的词性特征和各个金融关键词的语义损失度确定各个金融关键词的语义变化量;进而确定各个金融术语的语义异常值,根据所有的语义异常值对金融文档中的金融术语进行异常检测。采用本申请的方案,可实现跨文档之间专业术语的语义异常识别,从而提高金融术语描述的一致性。
主权项:1.一种结合大模型的金融文档检测方法,其特征在于,包括如下步骤:采集不同类型的金融文档,进而得到金融文档数据;基于预训练的大模型对不同类型的金融文档进行语义表征提取,得到各个金融文档的语义表征向量空间;根据各个金融文档中金融术语之间的关联特征构建各个金融文档的要素关联图,通过所有的语义表征向量空间和所有的要素关联图确定各个金融文档中所有金融术语的语义连贯度;对所述金融文档数据进行关键词提取,得到多个金融关键词,根据所有金融关键词的词性特征和每个金融关键词的语义损失度确定文档检测过程中该个金融关键词的语义变化量;通过每个金融术语的语义连贯度和所有的语义变化量确定所述每个金融术语的语义异常值,进而根据所有的语义异常值对金融文档中的金融术语进行异常检测。
全文数据:
权利要求:
百度查询: 北京网智天元大数据科技有限公司 网智天元科技集团股份有限公司 一种结合大模型的金融文档检测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。