deepmodeling
diff --git a/‎source/module_base/blas_connector.cpp‎
Lines changed: 6 additions & 6 deletions b/‎source/module_base/blas_connector.cpp‎
Lines changed: 6 additions & 6 deletions
diff --git a/‎source/module_base/kernels/cuda/math_kernel_op.cu‎
Lines changed: 38 additions & 73 deletions b/‎source/module_base/kernels/cuda/math_kernel_op.cu‎
Lines changed: 38 additions & 73 deletions
diff --git a/‎source/module_base/kernels/math_kernel_op.cpp‎
Lines changed: 13 additions & 22 deletions b/‎source/module_base/kernels/math_kernel_op.cpp‎
Lines changed: 13 additions & 22 deletions
@@ -782,7 +782,7 @@ void vector_mul_vector(const int& dim, T* result, const T* vector1, const T* vec
 	}
 	else if (device_type == base_device::AbacusDevice_t::GpuDevice){
 #ifdef __CUDA
-		ModuleBase::vector_mul_vector_op<T, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, vector2);
+		ModuleBase::vector_mul_vector_op<T, base_device::DEVICE_GPU>()(dim, result, vector1, vector2);
 #endif
 	}
 }
@@ -802,7 +802,7 @@ void vector_div_vector(const int& dim, T* result, const T* vector1, const T* vec
 	}
 	else if (device_type == base_device::AbacusDevice_t::GpuDevice){
 #ifdef __CUDA
-		ModuleBase::vector_div_vector_op<T, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, vector2);
+		ModuleBase::vector_div_vector_op<T, base_device::DEVICE_GPU>()(dim, result, vector1, vector2);
 #endif
 	}
 }
@@ -820,7 +820,7 @@ void vector_add_vector(const int& dim, float *result, const float *vector1, cons
 	}
 	else if (device_type == base_device::GpuDevice){
 #ifdef __CUDA
-		ModuleBase::constantvector_addORsub_constantVector_op<float, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, constant1, vector2, constant2);
+		ModuleBase::constantvector_addORsub_constantVector_op<float, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);
 #endif
 	}
 }
@@ -838,7 +838,7 @@ void vector_add_vector(const int& dim, double *result, const double *vector1, co
 	}
 	else if (device_type == base_device::GpuDevice){
 #ifdef __CUDA
-		ModuleBase::constantvector_addORsub_constantVector_op<double, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, constant1, vector2, constant2);
+		ModuleBase::constantvector_addORsub_constantVector_op<double, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);
 #endif
 	}
 }
@@ -856,7 +856,7 @@ void vector_add_vector(const int& dim, std::complex<float> *result, const std::c
 	}
 	else if (device_type == base_device::GpuDevice){
 #ifdef __CUDA
-		ModuleBase::constantvector_addORsub_constantVector_op<std::complex<float>, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, constant1, vector2, constant2);
+		ModuleBase::constantvector_addORsub_constantVector_op<std::complex<float>, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);
 #endif
 	}
 }
@@ -874,7 +874,7 @@ void vector_add_vector(const int& dim, std::complex<double> *result, const std::
 	}
 	else if (device_type == base_device::GpuDevice){
 #ifdef __CUDA
-		ModuleBase::constantvector_addORsub_constantVector_op<std::complex<double>, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, constant1, vector2, constant2);
+		ModuleBase::constantvector_addORsub_constantVector_op<std::complex<double>, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);
 #endif
 	}
 }
@@ -110,8 +110,7 @@ struct calc_grad_with_block_op<T, base_device::DEVICE_CPU>
 template <typename FPTYPE>
 struct dot_real_op<FPTYPE, base_device::DEVICE_CPU>
 {
-    FPTYPE operator()(const base_device::DEVICE_CPU* d,
-                      const int& dim,
+    FPTYPE operator()(const int& dim,
                       const FPTYPE* psi_L,
                       const FPTYPE* psi_R,
                       const bool reduce)
@@ -129,8 +128,7 @@ struct dot_real_op<FPTYPE, base_device::DEVICE_CPU>
 template <typename FPTYPE>
 struct dot_real_op<std::complex<FPTYPE>, base_device::DEVICE_CPU>
 {
-    FPTYPE operator()(const base_device::DEVICE_CPU* d,
-                      const int& dim,
+    FPTYPE operator()(const int& dim,
                       const std::complex<FPTYPE>* psi_L,
                       const std::complex<FPTYPE>* psi_R,
                       const bool reduce)
@@ -153,7 +151,7 @@ template <typename T>
 struct vector_div_constant_op<T, base_device::DEVICE_CPU>
 {
     using Real = typename GetTypeReal<T>::type;
-    void operator()(const base_device::DEVICE_CPU* d, const int dim, T* result, const T* vector, const Real constant)
+    void operator()(const int dim, T* result, const T* vector, const Real constant)
     {
 #ifdef _OPENMP
 #pragma omp parallel for schedule(static, 4096 / sizeof(Real))
@@ -169,7 +167,7 @@ template <typename T>
 struct vector_mul_vector_op<T, base_device::DEVICE_CPU>
 {
     using Real = typename GetTypeReal<T>::type;
-    void operator()(const base_device::DEVICE_CPU* d, const int& dim, T* result, const T* vector1, const Real* vector2)
+    void operator()(const int& dim, T* result, const T* vector1, const Real* vector2)
     {
 #ifdef _OPENMP
 #pragma omp parallel for schedule(static, 4096 / sizeof(Real))
@@ -185,7 +183,7 @@ template <typename T>
 struct vector_div_vector_op<T, base_device::DEVICE_CPU>
 {
     using Real = typename GetTypeReal<T>::type;
-    void operator()(const base_device::DEVICE_CPU* d, const int& dim, T* result, const T* vector1, const Real* vector2)
+    void operator()(const int& dim, T* result, const T* vector1, const Real* vector2)
     {
 #ifdef _OPENMP
 #pragma omp parallel for schedule(static, 4096 / sizeof(Real))
@@ -201,8 +199,7 @@ template <typename T>
 struct constantvector_addORsub_constantVector_op<T, base_device::DEVICE_CPU>
 {
     using Real = typename GetTypeReal<T>::type;
-    void operator()(const base_device::DEVICE_CPU* d,
-                    const int& dim,
+    void operator()(const int& dim,
                     T* result,
                     const T* vector1,
                     const Real constant1,
@@ -222,8 +219,7 @@ struct constantvector_addORsub_constantVector_op<T, base_device::DEVICE_CPU>
 template <typename FPTYPE>
 struct scal_op<FPTYPE, base_device::DEVICE_CPU>
 {
-    void operator()(const base_device::DEVICE_CPU* /*ctx*/,
-                    const int& N,
+    void operator()(const int& N,
                     const std::complex<FPTYPE>* alpha,
                     std::complex<FPTYPE>* X,
                     const int& incx)
@@ -235,8 +231,7 @@ struct scal_op<FPTYPE, base_device::DEVICE_CPU>
 template <typename T>
 struct gemv_op<T, base_device::DEVICE_CPU>
 {
-    void operator()(const base_device::DEVICE_CPU* d,
-                    const char& trans,
+    void operator()(const char& trans,
                     const int& m,
                     const int& n,
                     const T* alpha,
@@ -255,8 +250,7 @@ struct gemv_op<T, base_device::DEVICE_CPU>
 template <typename T>
 struct axpy_op<T, base_device::DEVICE_CPU>
 {
-    void operator()(const base_device::DEVICE_CPU* /*ctx*/,
-                    const int& dim,
+    void operator()(const int& dim,
                     const T* alpha,
                     const T* X,
                     const int& incX,
@@ -270,8 +264,7 @@ struct axpy_op<T, base_device::DEVICE_CPU>
 template <typename T>
 struct gemm_op<T, base_device::DEVICE_CPU>
 {
-    void operator()(const base_device::DEVICE_CPU* /*ctx*/,
-                    const char& transa,
+    void operator()(const char& transa,
                     const char& transb,
                     const int& m,
                     const int& n,
@@ -293,8 +286,7 @@ struct gemm_op<T, base_device::DEVICE_CPU>
 template <typename T>
 struct gemm_op_mt<T, base_device::DEVICE_CPU>
 {
-    void operator()(const base_device::DEVICE_CPU* /*ctx*/,
-                    const char& transa,
+    void operator()(const char& transa,
                     const char& transb,
                     const int& m,
                     const int& n,
@@ -316,8 +308,7 @@ struct gemm_op_mt<T, base_device::DEVICE_CPU>
 template <typename T>
 struct matrixTranspose_op<T, base_device::DEVICE_CPU>
 {
-    void operator()(const base_device::DEVICE_CPU* d,
-                    const int& row,
+    void operator()(const int& row,
                     const int& col,
                     const T* input_matrix,
                     T* output_matrix)
@@ -348,7 +339,7 @@ struct matrixTranspose_op<T, base_device::DEVICE_CPU>
 template <typename T>
 struct matrixSetToAnother<T, base_device::DEVICE_CPU>
 {
-    void operator()(const base_device::DEVICE_CPU* d, const int& n, const T* A, const int& LDA, T* B, const int& LDB)
+    void operator()(const int& n, const T* A, const int& LDA, T* B, const int& LDB)
     {
 #ifdef _OPENMP
 #pragma omp parallel for collapse(2) schedule(static, 8192 / sizeof(T))
Original file line number	Diff line number	Diff line change
`@@ -782,7 +782,7 @@ void vector_mul_vector(const int& dim, T* result, const T* vector1, const T* vec`
`782`	`782`	`}`
`783`	`783`	`else if (device_type == base_device::AbacusDevice_t::GpuDevice){`
`784`	`784`	`#ifdef __CUDA`
`785`		`- ModuleBase::vector_mul_vector_op<T, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, vector2);`
	`785`	`+ ModuleBase::vector_mul_vector_op<T, base_device::DEVICE_GPU>()(dim, result, vector1, vector2);`
`786`	`786`	`#endif`
`787`	`787`	`}`
`788`	`788`	`}`
`@@ -802,7 +802,7 @@ void vector_div_vector(const int& dim, T* result, const T* vector1, const T* vec`
`802`	`802`	`}`
`803`	`803`	`else if (device_type == base_device::AbacusDevice_t::GpuDevice){`
`804`	`804`	`#ifdef __CUDA`
`805`		`- ModuleBase::vector_div_vector_op<T, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, vector2);`
	`805`	`+ ModuleBase::vector_div_vector_op<T, base_device::DEVICE_GPU>()(dim, result, vector1, vector2);`
`806`	`806`	`#endif`
`807`	`807`	`}`
`808`	`808`	`}`
`@@ -820,7 +820,7 @@ void vector_add_vector(const int& dim, float result, const float vector1, cons`
`820`	`820`	`}`
`821`	`821`	`else if (device_type == base_device::GpuDevice){`
`822`	`822`	`#ifdef __CUDA`
`823`		`- ModuleBase::constantvector_addORsub_constantVector_op<float, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, constant1, vector2, constant2);`
	`823`	`+ ModuleBase::constantvector_addORsub_constantVector_op<float, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);`
`824`	`824`	`#endif`
`825`	`825`	`}`
`826`	`826`	`}`
`@@ -838,7 +838,7 @@ void vector_add_vector(const int& dim, double result, const double vector1, co`
`838`	`838`	`}`
`839`	`839`	`else if (device_type == base_device::GpuDevice){`
`840`	`840`	`#ifdef __CUDA`
`841`		`- ModuleBase::constantvector_addORsub_constantVector_op<double, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, constant1, vector2, constant2);`
	`841`	`+ ModuleBase::constantvector_addORsub_constantVector_op<double, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);`
`842`	`842`	`#endif`
`843`	`843`	`}`
`844`	`844`	`}`
`@@ -856,7 +856,7 @@ void vector_add_vector(const int& dim, std::complex<float> *result, const std::c`
`856`	`856`	`}`
`857`	`857`	`else if (device_type == base_device::GpuDevice){`
`858`	`858`	`#ifdef __CUDA`
`859`		`- ModuleBase::constantvector_addORsub_constantVector_op<std::complex<float>, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, constant1, vector2, constant2);`
	`859`	`+ ModuleBase::constantvector_addORsub_constantVector_op<std::complex<float>, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);`
`860`	`860`	`#endif`
`861`	`861`	`}`
`862`	`862`	`}`
`@@ -874,7 +874,7 @@ void vector_add_vector(const int& dim, std::complex<double> *result, const std::`
`874`	`874`	`}`
`875`	`875`	`else if (device_type == base_device::GpuDevice){`
`876`	`876`	`#ifdef __CUDA`
`877`		`- ModuleBase::constantvector_addORsub_constantVector_op<std::complex<double>, base_device::DEVICE_GPU>()(gpu_ctx, dim, result, vector1, constant1, vector2, constant2);`
	`877`	`+ ModuleBase::constantvector_addORsub_constantVector_op<std::complex<double>, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);`
`878`	`878`	`#endif`
`879`	`879`	`}`
`880`	`880`	`}`