首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于环算法的多GPU集合通信路径选择方法 

申请/专利权人:南京大学

申请日:2024-03-28

公开(公告)日:2024-07-02

公开(公告)号:CN118282923A

主分类号:H04L45/12

分类号:H04L45/12;H04L45/00

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.07.19#实质审查的生效;2024.07.02#公开

摘要:本发明公开了一种基于环算法的多GPU集合通信路径选择方法,该方法提供了一种具备网络拓扑感知能力的智能通信路径选择机制,该机制能够紧密结合GPU分布式训练集群的实际物理网络布局、各种网络链路的带宽情况,选择合适的通信路径。根据本发明方法最终获得的目标环状通信路径进行环算法可以进行的所有集合通信行为时,在该机制的作用下,数据传输可以在优先利用距离相近且带宽充足的网卡进行直接通信的同时,避免不必要的内部带宽资源占用,以优化网络系统的整体通信效率。

主权项:1.一种基于环算法的多GPU集合通信路径选择方法,其特征在于,包括:步骤S1:获得当前通信系统所有网络节点的内部拓扑信息以及网络节点之间的拓扑信息,每个网络节点包含多个GPU和多个网卡,且每个网络节点具有相同的网卡数;步骤S2:根据各网络节点的内部拓扑信息,分别计算各网络节点内部的GPU之间以及GPU与网卡之间的最优路径,并按照最优路径建立所述GPU之间以及GPU与网卡之间的连接关系;步骤S3:针对每个网络节点的每个网卡,以其为起点,以其所属网络节点的另一个网卡为终点,在其所属网络节点内搜索出一条经过所有GPU的路径,定义其为第一子路径;步骤S4:根据网络节点间的拓扑信息,分别计算每个网络节点的所有网卡与其他网络节点的所有网卡的最短网络距离,并结合所述最短网络距离对所有网络节点划分组;步骤S5:对获得的所有组进行组间编号,并对每个组包含的所有网络节点进行组内编号;步骤S6:根据组内编号顺序,将同组网络节点的第一子路径依次串联,得到一条或多条第二子路径,每条第二子路径仅包含来自同一网络节点的一条第一子路径;步骤S7:依据组间编号顺序,将各组的第二子路径依次串联,得到一条或多条总路径,每条总路径仅包含来自同一个组的一条第二子路径,将每个总路径的起始端网卡和其终点端网卡相连,得到一条或多条目标环状通信路径。

全文数据:

权利要求:

百度查询: 南京大学 一种基于环算法的多GPU集合通信路径选择方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。