买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种轻量混合专家模型架构系统及其实现方法,它们是相对应的方案,方案中:在通信前与通信后分别引入降维和升维操作,将传统的通信‑计算‑通信模式转变为降维‑通信‑计算‑通信‑升维的新模式,能够减少数据迁移通信的内容量,从而有效地降低通信开销;并且,本发明提供的模型架构可以按照部署时的并行方案进行划分,使用各种训练框架部署,从而在GPU(图形处理器)上高效地进行推理和训练任务。
主权项:1.一种轻量混合专家模型架构系统,其特征在于,包括:每一层均配置有轻量混合专家结构的大语言模型;所述轻量混合专家结构包括:门限网络、降维操作单元、多个专家、输出组合单元以及升维操作单元;其中:所述门限网络对输入的词元数据进行判别,确定词元数据与各专家的对应关系;所述降维操作单元对词元数据进行降维操作,并将降维后的词元数据传输至对应的专家;各专家接收到降维后的词元数据后做并行处理;所述输出组合单元将各专家并行处理的结果进行组合后输出;所述升维操作单元对输出组合单元的输出进行升维操作,获得与所述输入的词元数据相同维度的输出结果。
全文数据:
权利要求:
百度查询: 中国科学技术大学 轻量混合专家模型架构系统及其实现方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。