买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东大学
摘要:本发明属于智能问答系统领域,具体涉及一种面向婴幼儿成长发育的智能问答方法、系统、介质及设备,采用Flask框架,研发出一款直观、操作简便的前端用户界面,确保非专业使用者亦能轻易驾驭。每一项用户查询均迅捷传递至模型,而模型生成的个性化、精确回应随即反馈至用户,形成流畅互动的问答闭环,大幅提升用户体验与信息获取效率。通过采用先进的微调策略以及有效的检索增强技术,本发明成功地开发了一套专业级智能问答系统,不仅显著提高了问答的准确性和效率,还关注了用户隐私保护,适用于各类真实应用场景,提供了可靠的知识服务和解决方案。
主权项:1.一种面向婴幼儿成长发育的智能问答方法,其特征在于,包括以下步骤:S1:构建婴幼儿成长发育领域的专业知识库;S2:以预训练大模型Baichuan2-7B-Chat基础,通过低秩适应技术进行深度微调;使用LoRA技术对经过预训练的大模型进行微调步骤如下:S21.首先获取预训练模型Baichuan2-7B-Chat,记作M,使用S1中所获取的专业知识库作为微调数据集,设置相应微调参数,设置学习率为1e-4,确保模型稳定收敛到最优解;设置Adam优化器中β1为0.9,β2为0.98,以控制优化,并设置当前轮数为1;S22.如果当前轮数小于设定的轮数Rm,进入下一步,否则进入步骤S25;S23.继续进行微调,将轮数加1;S24.进入S22;S25.获取经过LoRA微调之后的张量及相应参数,与之前的预训练模型M进行合并,得到经过微调后的模型Mlora;S3:融入检索增强生成技术RAG,以Prompt提示作为指引,有效检索知识库内关联信息,协助模型推理进程;S31.使用S1中所获取的专业知识库作为RAG数据集,使用开源embedding数据集bge-large-zh-v1.5作为检索增强生成技术的embedding库数据集,将自然语言文本转化为高维向量空间中的稠密向量,以捕获语义层面的内在联系;S32.获取用户输入Iorigin,将其转换为与专业知识库中条目同维度的向量,确保两者能在同一语义空间内进行有效对比;S33.根据Iorigin的嵌入的内容与RAG数据集中所有文本向量进行匹配计算,找出最相似的前10个向量所对应的文本条目;S34.将检索得到的最相关文本条目提炼为一个提示H,该提示H既概括了关键知识要点,又与原始用户提问紧密相连;S35.将Iorigin与H一同作为最终输入传入给Mlora;S36.Mlora进行处理,生成对用户问题的回答;S4:采用Flask框架,构建前端用户界面,借助标准化JSON格式数据交换,实现前端与后端间通讯;采用Flask框架将S3中得到的经过微调后和检索增强生成后的大模型作为后端,设计前端页面实现智能问答系统的步骤如下:S41.利用前端输入框获取用户的问题;S42.将获取的输入利用Flask框架,转换为JSON数据格式并传入后端服务器;S43.后端服务器获取前端传入的输入,将对应输入传给经过微调和检索增强的模型进行推理;S44.将推理得到的输出转换为JSON数据格式并传给前端页面;S45.前端页面接受后端出来的输出,设计相应的动画,以动画形式展示给用户。
全文数据:
权利要求:
百度查询: 山东大学 面向婴幼儿成长发育的智能问答方法、系统、介质及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。