一种图神经网络的变维批处理小矩阵乘法加速方法

导航：龙图腾网> 最新专利技术> 一种图神经网络的变维批处理小矩阵乘法加速方法

申请/专利权人：中国科学院重庆绿色智能技术研究院

申请日：2024-03-02

公开（公告）日：2024-07-02

公开（公告）号：CN118277715A

主分类号：G06F17/16

分类号：G06F17/16;G06N3/042

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.07.19#实质审查的生效;2024.07.02#公开

摘要：本发明提供了本发明提供了一种图神经网络的变维批处理小矩阵乘法加速方法，属于高性能计算领域。首先设计了三种不同的变维小矩阵乘法加速策略，包含：针对维度固定或矩阵分布不均的BVSM‑B策略、针对维度跨度较小且分布均匀的BVSM‑M策略、和针对维度跨度较大且分布均匀的BVSM‑G策略；然后提出了优化选取三种策略进行变维批处理小矩阵乘法的具体分支流程。本发明方法可以实现对不同矩阵维度范围和不同矩阵分布情况的数据集自动选择最合理的策略，在CPU平台上与现有方法效率相当，在GPU平台上能够大幅的提高计算效率。

主权项：1.一种图神经网络的变维批处理小矩阵乘法加速方法，其特征在于，针对输入为：含有p个m×m邻接矩阵的数据集DSA＝{Ai|i＝1，2，...，p}以及含有p个m×n的矩阵的数据集DSB＝{Bi|i＝1，2，...，p}；得到输出为：由p个m×n的矩阵C构成的数据集DSC＝{Ci|i＝1，2，...，p}；其中p，m，n均为正整数，单个矩阵乘法可表示为Ci＝Ai×Bi，包括以下步骤：S1：设定当前数据集的容忍度k和区间跨度阈值t；S2：遍历DSA，得到Dmax和Dmin，判断Dmax和Dmin是否相等，若是，则应用BVSM-B策略并执行S8，若否，则执行S3；S3：判断Dmax和Dmin是否属于同一个的区间，若是，则执行S4，若否，则执行S5；S4：遍历该区间获取Bmax和Bmin，判断Bmax和Bmin的比值是否小于k，若是，则应用BVSM-M策略并执行S8，若否，则应用BVSM-B策略并执行S8；S5：判断Dmax和Dmin的差值是否小于t倍的Span，若是，则执行S6，若否，则执行S7；S6：判断BmaxBmin的值是否小于k，若是，则应用BVSM-M策略并执行S8，若否，则应用BVSM-B策略并执行S8；S7：判断BmaxBmin的值是否小于k，若是，则应用BVSM-G策略并执行S8，若否，则应用BVSM-B策略并执行S8；S8：按照选定的变维小矩阵乘法加速策略，完成矩阵乘法，并输出结果；其中，Dmax为数据集DSA中矩阵维度m的最大值；Dmin为数据集DSA中矩阵维度m的最小值；Span表示m维度上的划分区间的跨度大小；t为一个正整数，表示与跨度Span相关的阈值，用于选择不同策略；k为一个正整数，用于判断矩阵在m维度上分布是否均匀；Bmax表示在m维度上连续t个跨度Span的区间中，蕴含矩阵个数的最大值；Bmin为m维度上连续t个区间中，蕴含矩阵个数的最小值；所述的变维小矩阵乘法加速策略BVSM-B，主要针对维度m固定或矩阵分布不均的情形，具体为：B-1初始化LA和LB分别用于存储DSA的所有邻接矩阵和DSB的所有矩阵，初始化TLA和TLB用于存储张量；B-2声明批处理矩阵乘法算子batch_matmul并注册到AnsorTVM模块内；B-3遍历数据集DSA获取矩阵的维度信息，并创建哈希表H，根据哈希表H分割LA和LB，将结果转化为三维张量保存于TLA和TLB；B-4将TLA和TLB中的张量依次传入AnsorTVM，AnsorTVM通过搜索自动生成一个最优的调度模板schedule，AnsorTVM利用schedule计算出矩阵乘法结果保存于DSC中；所述的变维小矩阵乘法加速策略BVSM-M，主要针对维度m跨度较小且分布均匀的情形，具体为：M-1初始化LA和LB分别用于存储DSA的所有邻接矩阵和DSB的所有矩阵，初始化TLA和TLB用于存储张量；M-2声明批处理矩阵乘法算子batch_matmul并注册到AnsorTVM模块内；M-3将LA中的A矩阵的M和K维度依次向Dmax填充，将结果转化为三维张量保存于TLA；同理将LB中的B矩阵的K维度依次向Dmax填充，将结果转化为三维张量保存于TLB；M-4将TLA和TLB中的张量依次传入AnsorTVM，调优后得到最优的调度模板schedule并对输入应用schedule输出结果矩阵保存于DSC中；所述的变维小矩阵乘法加速策略BVSM-G，主要针对维度m跨度较大且分布均匀的情形，具体为：G-1初始化LA和LB分别用于存储DSA的所有邻接矩阵和DSB的所有矩阵，初始化grpA和grpB用于存储分组后的一组矩阵，初始化grpLA和grpLB用于存储分组并填充后的多组矩阵，初始化LDmax存储各个区间的维度最大值；G-2声明批处理矩阵乘法算子batch_matmul并注册到AnsorTVM模块内；G-3将Dmax和Dmin的范围按照跨度Span划分多个区间。遍历数据集DSA获取矩阵的维度信息，并创建哈希表H，根据哈希表H分割LA和LB，在每个区间范围内，将LA中对应维度范围矩阵存于grpA。将LB中对应维度范围矩阵存于grpB；G-4如果Dmax不能够被Span整除，则Dmax＝Dmax+Span-Dmax％Span；G-5若Dmin被Span整除，则Dmin＝Dmin-Span+1，否则Dmin＝Dmin-Dmin％Span+1；G-6遍历全部区间，将各个区间的Dmax存于LDmax；G-7对grpA内的矩阵的M维度和K维度向LDmax中对应Dmax最大化填充并合并，然后转化为张量并存于grpLA；同理对grpB内的矩阵的K维度向LDmax中对应Dmax最大化填充并合并，然后转化为张量并存于grpLB；G-8将grpLA和grpLB中的张量依次传入AnsorTVM，调优后得到最优的调度模板schedule并对输入应用schedule输出结果矩阵保存于DSC中；其中，LA、LB分别为一维指针数组；TLA、TLB分别为存储张量的一维数组；grpA、grpB分别为一维指针数组；grpLA、grpLB分别为一维指针数组；LDmax为一维整型数组。

全文数据：

权利要求：

百度查询：中国科学院重庆绿色智能技术研究院一种图神经网络的变维批处理小矩阵乘法加速方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：开放式主动降噪耳机和主动降噪方法

下一篇：一种联合提取多种绞股蓝提取物的方法

相关技术

开放式主动降噪耳机和主动降噪方法

一种联合提取多种绞股蓝提取物的方法

具有触摸传感器的透明显示装置

一种直流电机配件输送装置

一种虚拟机镜像文件动态轮换密钥的系统和方法

基于机器学习的按摩椅运行状态监测方法

一种用于气压动力机械元件制造的切割系统

一种六面铣型一体机

一种排泄物、垃圾燃烧发电系统

终端控制方法、装置、电子设备和存储介质

一种开关电源输出短路保护电路

一种基于数据分析的边坡安全监测方法及系统

批处理相关技术

处理方法和基板处理装置_东京毅力科创株式会社_201911082523.4

基板处理装置和基板处理方法_东京毅力科创株式会社_201910989235.0

基板处理装置和基板处理方法_东京毅力科创株式会社_201910676152.6

基板处理装置及基板处理方法_信越工程株式会社_202010948268.3

言语处理_谷歌有限责任公司_201980078166.6

借助包括多个数据处理模块的数据处理网络处理数据的方法、数据处理模块和数据处理网络_罗伯特·博世有限公司_202280083901.4

信息处理装置、信息处理方法以及信息处理程序_善肴控股株式会社_202410116168.2

被处理体的处理方法和等离子体处理装置_东京毅力科创株式会社_201911071001.4

信息处理系统、信息处理方法及信息处理装置_大金工业株式会社_202080089033.1

信息处理系统、信息处理方法及信息处理程序_株式会社力森诺科_202280084385.7

变相关技术

自变角液压爬升模架系统_华西工程科技(深圳)股份有限公司_201810607567.3

变径连续输筋机构_河北兴浦机械有限公司_202211663062.1

一种基于多时变波形模式分解的变转速滚动轴承故障诊断方法_同济大学_202410690191.2

一种变面积流量测量装置_毕托巴科技股份有限公司_202323367090.1

一种PVC材料高速变码印刷装置_江苏欧普特条码标签有限公司_202210277010.4

一种具有变温装置的电冰箱_长虹美菱股份有限公司_202011495752.1

基于交变磁场磁感应焊缝跟踪装置_湘潭大学_202410564356.1

一种变截面轧机上料装置_沈阳恩锋科技有限公司_202323528197.X

一种电冰箱变温装置_长虹美菱股份有限公司_202011495762.5

一种磁逆变液加注系统_宁波盛泽智能科技有限公司_202323580048.8

矩阵相关技术

一种基于非线性矩阵分解的高光谱异常目标检测方法_国科大杭州高等研究院_202410471093.X

一种基于稀疏矩阵的气象数据处理方法、设备及介质_浪潮智慧科技有限公司_202410888297.3

像素装置、像素矩阵、图像传感器和操作像素装置的方法_艾迈斯传感器美国股份有限公司_202280077812.9

面向异构分布式平台的稀疏矩阵的处理方法及装置_中国石油大学(北京)_202410350892.1

一种基于矩阵测试的半导体芯片一体机_浙江庆鑫科技有限公司_202410521450.9

自举主机式的矩阵式智能电池模组排列动态重构控制系统_云储新能源科技有限公司_202410881355.X

具有芯片矩阵的电路组件及包含其的电路_采埃孚股份公司_202420112035.3

基于矩阵图表的侧滑门控制方法、装置、介质及电子设备_东方久乐汽车电子(上海)股份有限公司_202410550258.2

基于琼斯矩阵的光纤型扫频偏振敏感OCT成像方法及系统_南京航空航天大学_201811165656.3

通量雅可比矩阵更新频率调整方法、装置、设备及介质_中国空气动力研究与发展中心计算空气动力研究所_202410889269.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种图神经网络的变维批处理小矩阵乘法加速方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务