买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东浪潮科学研究院有限公司
摘要:本申请公开了一种大模型编译推理方法、设备及介质,涉及电数字数据处理技术领域。方法包括:获取预编译的大模型;对预填充模型和解码模型中的输入token长度和数据缓冲区进行调整,得到调整后的大模型;针对调整后的大模型,构建其对应的输入输出张量与数据缓冲区之间的依赖映射关系,并对调整后的大模型进行编译,得到编译后的大模型;接收用户发送的问答请求,将问答请求对应的问题转换为输入token序列,并将输入token序列输入到编译后的大模型中;基于编译后的大模型,以实现对输入token序列的推理,得到输出token序列;根据输出token序列,构建针对问题的答案。
主权项:1.一种大模型编译推理方法,其特征在于,所述方法包括:获取预编译的大模型;其中,所述大模型包括预填充模型和解码模型;对所述预填充模型和所述解码模型中的输入token长度和数据缓冲区进行调整,得到调整后的大模型;针对所述调整后的大模型,构建其对应的输入输出张量与数据缓冲区之间的依赖映射关系,并对所述调整后的大模型进行编译,得到编译后的大模型;接收用户发送的问答请求,将所述问答请求对应的问题转换为输入token序列,并将所述输入token序列输入到所述编译后的大模型中;基于所述编译后的大模型,根据调整后的所述输入token长度,降低预填充阶段中各向量对应的初次计算量,并根据所述依赖映射关系,分别通过所述预填充模型和所述解码模型对应的数据缓冲区获取历史批次中存储的指定向量,通过所述指定向量实现当前批次中注意力的计算,以实现对所述输入token序列的推理,得到输出token序列;根据所述输出token序列,构建针对所述问题的答案。
全文数据:
权利要求:
百度查询: 山东浪潮科学研究院有限公司 一种大模型编译推理方法、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。