ELG SpMM now working

9 months ago · 0490dd77db
parent dc6e5bb942
commit 0490dd77db
2 changed files with 5 additions and 9 deletions
--- a/cuda/spgpu/kernels/ell_spmm_base.cuh
+++ b/cuda/spgpu/kernels/ell_spmm_base.cuh
@ -122,14 +122,13 @@ GEN_SPGPU_ELL_NAME(TYPE_SYMBOL)
 	VALUE_TYPE beta,
 	int baseIndex)
 {
-// TODO
  VALUE_TYPE *px,*py,*pz;
  int cnt;
  int maxNForACall = max(handle->maxGridSizeX, THREAD_BLOCK*handle->maxGridSizeX);

  int maxShmemSz;
  maxShmemSz=getGPUSharedMemPerBlock();
-
+  //fprintf(stderr,"MaxSHmemSz  %d \n",maxShmemSz);
  while (rows > maxNForACall) {//managing large vectors
    cnt = count;
    px = (VALUE_TYPE *) x;
@ -176,7 +175,7 @@ GEN_SPGPU_ELL_NAME(TYPE_SYMBOL)
 							  alpha, cM, rP,
 							  cMPitch, rPPitch,
 							  rS, rIdx, avgNnzPerRow,
-							  maxNnzPerRow, maxNForACall,
+							  maxNnzPerRow, rows,
 							  px, xPitch, beta, baseIndex);
    px += xPitch*MMBSZ;
    py += yPitch*MMBSZ;
@ -189,7 +188,7 @@ GEN_SPGPU_ELL_NAME(TYPE_SYMBOL)
 							  alpha, cM, rP,
 							  cMPitch, rPPitch,
 							  rS, rIdx, avgNnzPerRow,
-							  maxNnzPerRow, maxNForACall,
+							  maxNnzPerRow, rows,
 							  px, xPitch, beta, baseIndex);
  }
  
--- a/cuda/spgpu/kernels/ell_spmm_base_template.cuh
+++ b/cuda/spgpu/kernels/ell_spmm_base_template.cuh
@ -34,12 +34,9 @@ CONCAT(GEN_SPGPU_ELL_NAME(TYPE_SYMBOL), _krn)
  int i = threadIdx.x + blockIdx.x * (THREAD_BLOCK);
    
  if (i < rows) {
-    int j;
+    rS += i; rP += i; cM += i;

-    rP += rPPitch;
-    cM += cMPitch;
-
-    int rowSize = rS[i];
+    int rowSize = rS[0];
    for (int k=0; k<count; k++) {
      temp[k][threadIdx.x] = CONCAT(zero_,VALUE_TYPE)();
    }