买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中科计算技术西部研究院
摘要:本发明公开了一种基于存内计算的碱基识别算子加速方法、系统及装置,涉及生物基因数据处理领域,用以高并行、高吞吐量、轻量级的加速碱基识别。本发明解码阶段中,使用基于模糊匹配机制的集束搜索方法对所述概率分布矩阵进行检索,其利用多层掩码机制在缓存内逐级搜索目标字符串。并使用基于缓存内计算的原位字符转换架构将检索到的目标字符串转换为连续的碱基序列,其使用基于德摩根定律的转换方程在缓存内进行转码。此外对编码阶段的乘加计算,采用无对齐缓存内乘加架构进行计算。本发明将集束搜索计算卸载到缓存上,提升了碱基识别计算效率和吞吐量,消除了字符串转换中的数据传输开销。
主权项:1.一种基于存内计算的碱基识别算子加速方法,所述碱基识别包括编码阶段和解码阶段,所述编码阶段将连续的电信号转化为碱基编码的概率分布矩阵,所述解码阶段将所述概率分布矩阵转换为连续的碱基序列;其特征在于,所述解码阶段中,使用基于模糊匹配机制的集束搜索方法对所述概率分布矩阵进行检索,所述基于模糊匹配机制的集束搜索方法利用多层掩码机制在缓存内逐级搜索目标字符串,所述基于模糊匹配机制的集束搜索方法的搜索区间为P×2n,P×2n+2n−1,其中log2P+n=N,N为搜索空间的指数位位数,P为每一层掩码网络号的数量,log2P∈正整数,n为每一层掩码的主机号位数;每一层掩码P值逐级增加;所述基于模糊匹配机制的集束搜索方法采用CAM搜索在缓存中搜索目标字符串;在缓存中搜索目标字符串,包括:将扩展序列存储在DRAM中,将对应指针存储在缓存中,在搜索目标字符串时,通过缓存中的指针从DRAM中读取对应的扩展序列进行搜索;以及使用基于缓存内计算的原位字符转换架构将检索到的目标字符串转换为连续的碱基序列,所述基于缓存内计算的原位字符转换架构被配置为对检索到的目标字符串进行并行转换,将转换输出以Z字形排列,并利用转置管理单元将排列的元素转置后进行拼接;所述基于缓存内计算的原位字符转换架构使用基于德摩根定律的转换方程在缓存内进行转码,所述基于德摩根定律的转换方程中输入oi,i∈[0,3],和输出rj,j∈[0,7],的转换关系被配置为:r7=0,r6=¬o2o0o2o1nor¬o2¬o1¬o0,r5=¬o2¬o1¬o0ando2¬o1o0,r4=¬o2o1¬o0,r3=¬o2¬o1¬o0,r2=¬o2¬o1¬o0ando2o1nor¬o2¬o1¬o0,r1=¬o2o1o0ando2¬o1¬o0,r0=¬o2¬o1and¬o2o1o0ando2¬o1¬o0。
全文数据:
权利要求:
百度查询: 中科计算技术西部研究院 一种基于存内计算的碱基识别算子加速方法、系统及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。