买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提出基于国产众核处理器的FIR滤波器高性能实现方法,其基于国产众核处理器平台,将模拟信号进行模数转换后得到输入数据,控制核心使用消息传递接口将输入数据分配至四个核组中,在输入数据的前端补充M‑1个零值,然后计算旋转因子W和滤波器系数h[M]的FFT的结果H,使用直接存储访问将旋转因子W和计算结果H传输至各个运算核心;然后直接存储访问将单轮次数据传输至各个运算核心并进行单轮次FIR滤波计算,每轮次的运算结果在控制核心中按顺序连接获得最终结果。该方法对FIR滤波器算法进行的优化实现与利用国产处理器单核心直接计算FIR滤波器算法相比,提升核心并行性,实现了数据处理的并行化,从而提升算法速度。
主权项:1.基于国产众核处理器的FIR滤波器高性能实现方法,国产众核处理器包括四个核组,每个核组里有1个控制核心和64个运算核心,其特征在于:包括以下步骤:S1、将模拟信号进行模数A-D转换后得到输入数据,包括长度为M的滤波器系数h[M],输入数据长度为N;S2、利用控制核心读入步骤1的输入数据并使用消息传递接口MPI将输入数据分配至四个核组中,在输入数据的前端补充M-1个零值;在控制核心中,计算旋转因子W,对滤波器系数h[M]进行末尾补零至128点后进行快速傅里叶变换FFT计算获得结果H,使用直接存储访问DMA将旋转因子W和快速傅里叶变换FFT的计算结果H传输至所有运算核心;S3、每个核组中,将步骤S1输入数据划分成R块大小为L的数据块后,将上个子块的最后M-1个点加入,再分别进行R次单块长度为F=L+M-1的FIR滤波器计算,第一个子块的前M-1个点全部为0,按照输入顺序将连续的4*F点数据传入至各个运算核心;共传输M-1+4*L个点的数据,其中包含4*L个有效计算输入数据的FIR滤波计算结果;当每个核组中的64个运算核心都成功接收到数据后,单轮数据的传输完成;S4、每个运算核心接收到步骤3所传输的单轮次数据后,开始计算单轮次FIR滤波器,同时进行上一轮次FIR滤波器结果的直接存储访问DMA写回和下一轮次输入数据的直接存储访问DMA读入;每个运算核心在接收到数据后,利用单指令流多数据流SIMD技术,会将步骤3中输出的4*F点数据存入向量型变量数组中,再同时进行4组快速傅里叶变换FFT的计算,然后将输入信号和滤波器系数h[M]的快速傅里叶变换FFT结果相乘后,进行离散傅里叶反变换得到单次计算的结果;每个核组中的运算核心单轮FIR滤波器计算完成后,舍弃每个长度为F的子分块的前M-1个数,将输出结果y[4*L]使用直接存储访问DMA传输回控制核心中;S5、对步骤1的输入数据重复步骤S3和步骤S4的操作,直至完成对所有输入数据的处理,每轮次的运算结果y[4*L]在控制核心中按顺序存入y[N],得到N点滤波器最终的运算结果y[N]。
全文数据:
权利要求:
百度查询: 浙江大学 基于国产众核处理器的FIR滤波器高性能实现方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。