编辑推荐:
针对广义稀疏矩阵乘法(SpGEMM)内存瓶颈问题,提出基于近行缓冲存储器(PIM)的HighP加速器,通过非冲突列并行处理机制提升内存带宽利用率,实验表明性能较现有加速器提升17.88倍,较PIM方案提升8.19倍。
广义稀疏矩阵乘法(SpGEMM)是许多重要领域中的基本计算原语,例如图分析[1]、机器学习[2]和科学计算[3]。高效的SpGEMM执行对于这些应用实现高性能至关重要。近年来,已经提出了几种加速器[4]、[5]、[6]、[7]、[8]、[9]来加速SpGEMM。然而,对于大型实际稀疏矩阵,SpGEMM对内存的需求非常高,并且具有高内存带宽要求。现有的SpGEMM加速器由于SpGEMM的数据局部性较差,需要在片上逻辑和片外内存之间进行大量的数据传输。这些大量的DRAM访问会加重有限的带宽负担并增加能耗。
生物通 版权所有