买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于人工智能的公文文档校验方法及系统,涉及文档校验技术领域,该方法通过解析并转换不同格式的文档为统一文本格式,利用自然语言处理技术对文本分块,人工智能识别模型捕捉上下文关系,生成文本特征向量H,并结合源数据Metadata,获取源数据特征向量M,随后,结合文本和源数据特征向量生成综合特征向量F,使用孤立森林算法法进行异常检测,获取异常得分A,提高了敏感信息识别的准确性。通过综合计算获取文档敏感风险评分R,并根据文本序列计算动态调整的风险阈值O,确保识别的精确性和实时性。最终,通过对比评估生成校验报告,完成敏感信息检测和风险评估,提供详细的报告和处理建议,实现文档的全方位管理。
主权项:1.一种基于人工智能的公文文档校验方法,其特征在于:包括以下步骤:S1、提取和解析不同格式的文档,并将不同格式的文档转换为统一的文本格式,根据文本的结构信息对文本分块,获取文本序列T;S2、使用人工智能识别模型捕捉文本分块中的单词和短语的上下文关系,基于文本序列T生成文本特征向量H,提取源数据Metadata,将源数据Metadata转换向量,获取源数据特征向量M;S3、将所获取的文本特征向量H和源数据特征向量M进行相结合,生成综合特征向量F,使用孤立森林进行敏感信息的异常检测,获取异常得分A,识别潜在敏感信息;S4、将所获取的文本特征向量H、源数据特征向量M和异常得分A,进行综合相关联计算,获取文档敏感风险评分R,根据文档的具体文档文本序列T,进行计算获取风险阈值O;S5、依据所获取的风险阈值O与获取的文档敏感风险评分R,进行对比评估,获取校验报告。
全文数据:
权利要求:
百度查询: 上海银行股份有限公司 一种基于人工智能的公文文档校验方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。