买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:三峡高科信息技术有限责任公司
摘要:本发明涉及文档整理技术领域,并具体公开了一种基于AI大模型的电子档案预归档系统,包括:格式标准化模块,用于将可允许文档格式的海量需归档文档转换为标准格式;存储参数确定模块,用于确定出当前海量标准格式文档的最佳存储架构和最佳并行处理线程;文档内容纠错模块,用于基于AI文本纠错大模型对当前海量标准格式文档的文档内容进行纠错,获得当前海量最终文档;档号生成模块,用于生成每个最终文档的归档档号;归档任务执行模块,用于基于每个最终文档的归档档号、当前海量标准格式文档的最佳存储架构和最佳并行处理线程,将当前海量标准格式文档对应的最终文档加密传输至数字档案馆系统;用以提高电子文档后续的归档效率和归档安全性。
主权项:1.一种基于AI大模型的电子档案预归档系统,其特征在于,包括:格式标准化模块,用于将可允许文档格式的海量需归档文档转换为标准格式,获得当前海量标准格式文档;存储参数确定模块,用于基于当前海量标准格式文档的文档参数、数字档案馆的存储参数、归档系统的运行参数,确定出当前海量标准格式文档的最佳存储架构和最佳并行处理线程;文档内容纠错模块,用于基于AI文本纠错大模型对当前海量标准格式文档的文档内容进行纠错,获得当前海量标准格式文档对应的最终文档;档号生成模块,用于生成当前每个最终文档的归档档号;文档预分类模块,用于基于预分类模型,获得当前海量标准格式文档的文档分类建议信息;预归档结果生成模块,用于将当前每个最终文档的归档档号、当前海量标准格式文档的最佳存储架构和最佳并行处理线程以及文档分类建议信息,当作预归档结果;其中,存储参数确定模块,包括:存储参数解析子模块,用于基于数字档案馆的存储参数确定出数字档案馆的原始分布式内存架构,并确定出原始分布式内存架构中每个存储单元位置的最大内存量和极限运行内存量;文档参数解析子模块,用于基于当前海量标准格式文档的文档参数,确定出每个标准格式文档的存储限制规则和预测归档所需内存量;存储架构确定子模块,用于获取存储架构确定模型,并将当前海量标准格式文档的存储限制规则、预测归档所需内存量、数字档案馆的原始分布式内存架构以及原始分布式内存架构中每个存储单元位置的最大内存量和极限运行内存量,输入至存储架构确定模型,确定出当前海量标准格式文档的最佳存储架构;处理线程确定子模块,用于基于归档系统的运行参数和当前海量标准格式文档的最佳存储架构以及数字档案馆的原始分布式内存架构,确定出当前海量标准格式文档的最佳并行处理线程。
全文数据:
权利要求:
百度查询: 三峡高科信息技术有限责任公司 一种基于AI大模型的电子档案预归档系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。