首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

对小说进行信息提取和汇总的方法、电子设备和存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:深圳雷霆数字娱乐有限公司

摘要:本发明公开一种对小说进行信息提取和汇总的方法、电子设备和存储介质,利用AI大语言模型的语言文本处理能力,进行自动、快速、高效、低成本地完成小说的信息提取和汇总,预估可将时间和成本同时降低至人工的几十倍以下。本发明结合了大语言模型的二次训练、多轮次总结的总结方式,并配合知识向量库、知识图谱,能够自动、快速、高效、低成本地完成小说的信息提取和汇总,极大降低时间和成本,并解决了现有大语言模型在总结小说时遇到的输入长度不足、输出大量错误信息等问题。

主权项:1.一种对小说进行信息提取和汇总的方法,其特征在于包括:步骤1、对需要总结的小说进行预处理,将该小说作为训练素材给大语言模型进行二次训练,得到用于小说总结的专属大语言模型;将小说分段处理成向量,构建知识向量库;利用二次训练得到的专属大语言模型进行辅助构建小说的知识图谱,知识图谱里面包含小说的重要人物、地点、时间、物品和事件等重要信息以及各重要信息之间的相互关系;步骤2、将小说切分成符合专属大语言模型的最大输入长度且不重复的片段,然后利用步骤1得到的专属大语言模型分别对这些片段进行总结,得到片段总结文本;步骤3、校正和拼接根据片段总结文本的内容在知识向量库和知识图谱中查询与之相关的真实信息,由专属大语言模型根据查询到的真实信息对片段总结文本进行校正;完成校正后把所有片段总结文本按照对应片段的前后顺序拼接在一起,得到拼接总结文本;步骤4、最终总结先检查步骤3中拼接总结文本的文本长度是否超过专属大语言模型的最大输入长度,如果是,重复步骤2、3对拼接总结文本进行分段总结、校正和拼接,直至得到的拼接总结文本的文本长度不超过专属大语言模型的最大输入长度;当拼接总结文本的文本长度不超过专属大语言模型的最大输入长度时,利用专属大语言模型对拼接总结文本进行总结,得到最终总结文本,并利用知识向量库、知识图谱对最终总结文本进行校对。

全文数据:

权利要求:

百度查询: 深圳雷霆数字娱乐有限公司 对小说进行信息提取和汇总的方法、电子设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。