恭喜福州金瑞迪软件技术有限公司郭志伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜福州金瑞迪软件技术有限公司申请的专利一种基于大语言模型的档案知识管理方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119180330B 。
龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411688143.6,技术领域涉及:G06N5/025;该发明授权一种基于大语言模型的档案知识管理方法和系统是由郭志伟;张志祥;严俊设计研发完成,并于2024-11-25向国家知识产权局提交的专利申请。
本一种基于大语言模型的档案知识管理方法和系统在说明书摘要公布了:本发明提供档案知识管理技术领域的一种基于大语言模型的档案知识管理方法和系统,方法包括:步骤S1、创建档案知识库、档案知识提取规则库以及问题模板库;步骤S2、获取历史档案文件构建数据集;步骤S3、创建大语言模型并训练;步骤S4、通过OCR技术识别待管理档案文件得到待管理档案内容,提取对应档案知识提取规则以及问题模板;步骤S5、将生成的知识提取问题以及待管理档案内容输入大语言模型,得到档案知识;步骤S6、将档案知识存入neo4j图型知识库和mysql关系型知识库;步骤S7、从图型知识库中获取知识三元组并以知识图谱的方式表现;步骤S8、对所述档案知识进行增加、删除、更新、查询的管理。本发明的优点在于:提高档案知识管理的效率以及质量。
本发明授权一种基于大语言模型的档案知识管理方法和系统在权利要求书中公布了:1.一种基于大语言模型的档案知识管理方法,其特征在于:包括如下步骤:步骤S1、创建一档案知识库、一档案知识提取规则库以及一问题模板库;步骤S2、获取大量的历史档案文件,通过OCR技术识别各所述历史档案文件的历史档案内容,对各所述历史档案内容进行知识提取问题以及档案知识的标注,基于标注后的各所述历史档案内容构建数据集;步骤S3、创建一用于提取档案知识的大语言模型,通过所述数据集对大语言模型进行训练;步骤S4、获取待管理档案文件,通过OCR技术识别所述待管理档案文件得到待管理档案内容,基于所述待管理档案文件的领域分别从档案知识提取规则库以及问题模板库匹配对应的档案知识提取规则以及问题模板;步骤S5、基于匹配的所述档案知识提取规则以及问题模板生成知识提取问题,将所述知识提取问题以及待管理档案内容输入大语言模型,得到包括知识实体、实体关系、知识属性以及知识附属信息的档案知识,将所述档案知识存储至档案知识库;步骤S6、将所述知识实体、实体关系、知识属性以知识三元组的模式写入预先创建的neo4j图型知识库,将所述知识附属信息写入预先创建的mysql关系型知识库;步骤S7、基于所述neo4j图型知识库以及mysql关系型知识库,对所述档案知识中的知识实体、实体关系、知识属性或者知识附属信息,进行增加、删除、更新、查询的管理;所述步骤S3具体为:创建一用于提取档案知识的大语言模型,基于7:2:1的比例将所述数据集划分为训练集、验证集以及测试集;通过所述训练集对大语言模型进行训练,直至满足预设的收敛条件,训练过程中不断优化所述大语言模型至少包括迭代次数、学习率、训练批次的超参数;通过所述验证集对训练后的大语言模型进行验证,判断所述大语言模型的提取精度是否大于预设的精度阈值,若否,则验证不通过,扩充所述训练集继续训练;若是,则验证通过,并:通过所述测试集对大语言模型进行测试,判断所述大语言模型的置信度是否大于预设的置信度阈值,若否,则测试不通过,扩充所述训练集继续训练;若是,则测试通过,结束训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人福州金瑞迪软件技术有限公司,其通讯地址为:350000 福建省福州市福州开发区星发路8号311室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。