Modify CUDA code to compile with 12.4/12.5

8 months ago · e3a55967a5
parent 39cfcd3893
commit e3a55967a5
23 changed files with 21 additions and 48 deletions
--- a/cuda/CUDA/psi_cuda_CopyCooToElg.cuh
+++ b/cuda/CUDA/psi_cuda_CopyCooToElg.cuh
@ -1,8 +1,6 @@
 #include <stdlib.h>
 #include <stdio.h>

-#include "cintrf.h"
-#include "vectordev.h"
 #include "psi_cuda_common.cuh"


@ -62,11 +60,9 @@ __global__ void   CONCAT(GEN_PSI_FUNC_NAME(TYPE_SYMBOL),_krn)(int ii, int nrws,
    ir += ldv;
  }
  idiag[i]=idval;    
-    
 }    


-
 void  CONCAT(GEN_PSI_FUNC_NAME(TYPE_SYMBOL),_)(spgpuHandle_t handle, int nrws, int i, int nr, int nza,
 					       int baseIdx, int hacksz, int ldv, int nzm,
 					       int *rS,int *devIdisp, int *devJa, VALUE_TYPE *devVal,
@ -76,8 +72,10 @@ void  CONCAT(GEN_PSI_FUNC_NAME(TYPE_SYMBOL),_)(spgpuHandle_t handle, int nrws, i
  dim3 grid ((nrws + THREAD_BLOCK - 1) / THREAD_BLOCK);

  CONCAT(GEN_PSI_FUNC_NAME(TYPE_SYMBOL),_krn) 
-    <<< grid, block, 0, handle->currentStream >>>(i,nrws, nr, nza, baseIdx, hacksz, ldv, nzm,
-						  rS,devIdisp,devJa,devVal,idiag, rP,cM);
+    <<< grid, block, 0, handle->currentStream >>>(i,nrws, nr, nza, baseIdx,
+						  hacksz, ldv, nzm,
+						  rS,devIdisp,devJa,devVal,
+						  idiag, rP,cM);

 }

@ -89,16 +87,17 @@ GEN_PSI_FUNC_NAME(TYPE_SYMBOL)
  (spgpuHandle_t handle, int nr, int nc, int nza, int baseIdx, int hacksz, int ldv, int nzm,
   int *rS,int *devIdisp, int *devJa, VALUE_TYPE *devVal,
   int *idiag, int *rP, VALUE_TYPE *cM)
-{ int i,j, nrws;
+{ int i, nrws;
  //int maxNForACall = THREAD_BLOCK*handle->maxGridSizeX;
  int maxNForACall = max(handle->maxGridSizeX, THREAD_BLOCK*handle->maxGridSizeX);
  
-
  //fprintf(stderr,"Loop on j: %d\n",j); 
  for (i=0; i<nr; i+=nrws) {
    nrws = MIN(maxNForACall, nr - i);
    //fprintf(stderr,"ifirst: %d i : %d nrws: %d i + ifirst + (nrws -1) -1 %d \n",ifirst,i,nrws,i + ifirst + (nrws -1) -1);
-    CONCAT(GEN_PSI_FUNC_NAME(TYPE_SYMBOL),_)(handle,nrws,i, nr, nza, baseIdx, hacksz, ldv, nzm,
-					     rS,devIdisp, devJa, devVal, idiag, rP, cM);
+    CONCAT(GEN_PSI_FUNC_NAME(TYPE_SYMBOL),_)(handle,nrws,i, nr, nza, baseIdx,
+					     hacksz, ldv, nzm,
+					     rS,devIdisp, devJa, devVal,
+					     idiag, rP, cM);
  }
 }
--- a/cuda/CUDA/psi_cuda_CopyCooToHlg.cuh
+++ b/cuda/CUDA/psi_cuda_CopyCooToHlg.cuh
@ -1,8 +1,6 @@
 #include <stdlib.h>
 #include <stdio.h>

-#include "cintrf.h"
-#include "vectordev.h"
 #include "psi_cuda_common.cuh"


--- a/cuda/CUDA/psi_cuda_c_CopyCooToElg.cu
+++ b/cuda/CUDA/psi_cuda_c_CopyCooToElg.cu
@ -2,9 +2,7 @@
 #include <stdio.h>

 #include "cintrf.h"
-#include "vectordev.h"
-
-
 #define VALUE_TYPE cuFloatComplex
 #define TYPE_SYMBOL c
 #include "psi_cuda_CopyCooToElg.cuh"
+ 
--- a/cuda/CUDA/psi_cuda_c_CopyCooToHlg.cu
+++ b/cuda/CUDA/psi_cuda_c_CopyCooToHlg.cu
@ -2,9 +2,6 @@
 #include <stdio.h>

 #include "cintrf.h"
-#include "vectordev.h"
-
-
 #define VALUE_TYPE cuFloatComplex
 #define TYPE_SYMBOL c
 #include "psi_cuda_CopyCooToHlg.cuh"
--- a/cuda/CUDA/psi_cuda_d_CopyCooToElg.cu
+++ b/cuda/CUDA/psi_cuda_d_CopyCooToElg.cu
@ -2,9 +2,6 @@
 #include <stdio.h>

 #include "cintrf.h"
-#include "vectordev.h"
-
-
 #define VALUE_TYPE double
 #define TYPE_SYMBOL d
 #include "psi_cuda_CopyCooToElg.cuh"
--- a/cuda/CUDA/psi_cuda_d_CopyCooToHlg.cu
+++ b/cuda/CUDA/psi_cuda_d_CopyCooToHlg.cu
@ -2,9 +2,6 @@
 #include <stdio.h>

 #include "cintrf.h"
-#include "vectordev.h"
-
-
 #define VALUE_TYPE double
 #define TYPE_SYMBOL d
 #include "psi_cuda_CopyCooToHlg.cuh"
--- a/cuda/CUDA/psi_cuda_s_CopyCooToElg.cu
+++ b/cuda/CUDA/psi_cuda_s_CopyCooToElg.cu
@ -2,9 +2,6 @@
 #include <stdio.h>

 #include "cintrf.h"
-#include "vectordev.h"
-
-
 #define VALUE_TYPE float
 #define TYPE_SYMBOL s
 #include "psi_cuda_CopyCooToElg.cuh"
--- a/cuda/CUDA/psi_cuda_s_CopyCooToHlg.cu
+++ b/cuda/CUDA/psi_cuda_s_CopyCooToHlg.cu
@ -2,9 +2,6 @@
 #include <stdio.h>

 #include "cintrf.h"
-#include "vectordev.h"
-
-
 #define VALUE_TYPE float
 #define TYPE_SYMBOL s
 #include "psi_cuda_CopyCooToHlg.cuh"
--- a/cuda/CUDA/psi_cuda_z_CopyCooToElg.cu
+++ b/cuda/CUDA/psi_cuda_z_CopyCooToElg.cu
@ -2,9 +2,6 @@
 #include <stdio.h>

 #include "cintrf.h"
-#include "vectordev.h"
-
-
 #define VALUE_TYPE cuDoubleComplex
 #define TYPE_SYMBOL z
 #include "psi_cuda_CopyCooToElg.cuh"
--- a/cuda/CUDA/psi_cuda_z_CopyCooToHlg.cu
+++ b/cuda/CUDA/psi_cuda_z_CopyCooToHlg.cu
@ -2,9 +2,6 @@
 #include <stdio.h>

 #include "cintrf.h"
-#include "vectordev.h"
-
-
 #define VALUE_TYPE cuDoubleComplex
 #define TYPE_SYMBOL z
 #include "psi_cuda_CopyCooToHlg.cuh"
--- a/cuda/ccusparse.c
+++ b/cuda/ccusparse.c
@ -35,7 +35,6 @@

 #include <cuda_runtime.h>
 #include <cusparse_v2.h>
-#include "cintrf.h"
 #include "fcusparse.h"

 #include "ccusparse.h"
--- a/cuda/cintrf.h
+++ b/cuda/cintrf.h
@ -37,10 +37,9 @@
 #include <stdio.h>

 #include "core.h"
-#include "cuda_util.h"
-#include "vector.h"
-#include "vectordev.h"
-
+//#include "cuda_util.h"
+//#include "vector.h"
+//#include "vectordev.h"
 #define ELL_PITCH_ALIGN_S 32
 #define ELL_PITCH_ALIGN_D 16

--- a/cuda/dcusparse.c
+++ b/cuda/dcusparse.c
@ -35,7 +35,6 @@

 #include <cuda_runtime.h>
 #include <cusparse_v2.h>
-#include "cintrf.h"
 #include "fcusparse.h"

 #include "dcusparse.h"
--- a/cuda/diagdev.h
+++ b/cuda/diagdev.h
@ -33,6 +33,7 @@
 #define _DIAGDEV_H_

 #include "cintrf.h"
+#include "vectordev.h"
 #include "dia.h"

 struct DiagDevice
--- a/cuda/dnsdev.h
+++ b/cuda/dnsdev.h
@ -34,6 +34,7 @@
 #define _DNSDEV_H_

 #include "cintrf.h"
+#include "vectordev.h"
 #include "cuComplex.h"
 #include "cublas_v2.h"

--- a/cuda/elldev.h
+++ b/cuda/elldev.h
@ -34,6 +34,7 @@
 #define _ELLDEV_H_

 #include "cintrf.h"
+#include "vectordev.h"
 #include "cuComplex.h"
 #include "ell.h"

--- a/cuda/fcusparse.c
+++ b/cuda/fcusparse.c
@ -34,7 +34,6 @@
 #include <stdlib.h>

 #include <cuda_runtime.h>
-#include "cintrf.h"
 #include "fcusparse.h"

 static   cusparseHandle_t *cusparse_handle=NULL;
--- a/cuda/fcusparse.h
+++ b/cuda/fcusparse.h
@ -40,6 +40,7 @@
 #include <cusparse.h>
 #endif
 #include "cintrf.h"
+#include "vectordev.h"

 int FcusparseCreate();
 int FcusparseDestroy();
--- a/cuda/hdiagdev.h
+++ b/cuda/hdiagdev.h
@ -33,6 +33,7 @@
 #define _HDIAGDEV_H_

 #include "cintrf.h"
+#include "vectordev.h"
 #include "hdia.h"

 struct HdiagDevice
--- a/cuda/hlldev.h
+++ b/cuda/hlldev.h
@ -34,7 +34,7 @@

 #include "cintrf.h"
 #include "hell.h"
-
+#include "vectordev.h"

 typedef struct hlldevice
 {
--- a/cuda/scusparse.c
+++ b/cuda/scusparse.c
@ -35,7 +35,6 @@

 #include <cuda_runtime.h>
 #include <cusparse_v2.h>
-#include "cintrf.h"
 #include "fcusparse.h"

 #include "scusparse.h"
--- a/cuda/vectordev.h
+++ b/cuda/vectordev.h
@ -28,13 +28,12 @@
  /* ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE */
  /* POSSIBILITY OF SUCH DAMAGE. */
 
-  

 #pragma once
 //#include "utils.h"
 #include "cuda_runtime.h"
 //#include "common.h"
-#include "cintrf.h"
+//#include "cintrf.h"
 #include <complex.h>

 struct MultiVectDevice
@ -85,3 +84,4 @@ int allocMultiVecDevice(void ** remoteMultiVec, struct MultiVectorDeviceParams *
 int getMultiVecDeviceSize(void* deviceVec);
 int getMultiVecDeviceCount(void* deviceVec);
 int getMultiVecDevicePitch(void* deviceVec);
+
--- a/cuda/zcusparse.c
+++ b/cuda/zcusparse.c
@ -35,7 +35,6 @@

 #include <cuda_runtime.h>
 #include <cusparse_v2.h>
-#include "cintrf.h"
 #include "fcusparse.h"

 #include "zcusparse.h"