deepmodeling
diff --git a/‎CMakeLists.txt‎
Lines changed: 9 additions & 1 deletion b/‎CMakeLists.txt‎
Lines changed: 9 additions & 1 deletion
diff --git a/‎cmake/FindLapack.cmake‎
Lines changed: 7 additions & 11 deletions b/‎cmake/FindLapack.cmake‎
Lines changed: 7 additions & 11 deletions
diff --git a/‎source/source_base/CMakeLists.txt‎
Lines changed: 0 additions & 5 deletions b/‎source/source_base/CMakeLists.txt‎
Lines changed: 0 additions & 5 deletions
diff --git a/‎source/source_base/kernels/test/math_kernel_test.cpp‎
Lines changed: 18 additions & 16 deletions b/‎source/source_base/kernels/test/math_kernel_test.cpp‎
Lines changed: 18 additions & 16 deletions
diff --git a/‎source/source_base/module_external/blas_connector.h‎
Lines changed: 0 additions & 22 deletions b/‎source/source_base/module_external/blas_connector.h‎
Lines changed: 0 additions & 22 deletions
diff --git a/‎source/source_base/module_external/blas_connector_l1.cpp‎
Lines changed: 0 additions & 129 deletions b/‎source/source_base/module_external/blas_connector_l1.cpp‎
Lines changed: 0 additions & 129 deletions
@@ -459,6 +459,14 @@ if(ENABLE_ASAN)
   target_link_libraries(${ABACUS_BIN_NAME} -fsanitize=address)
 endif()
 
+add_library(math_connector OBJECT 
+${ABACUS_SOURCE_DIR}/source_base/module_external/blas_connector_base.cpp
+${ABACUS_SOURCE_DIR}/source_base/module_external/blas_connector_l1.cpp
+${ABACUS_SOURCE_DIR}/source_base/module_external/blas_connector_l2.cpp
+${ABACUS_SOURCE_DIR}/source_base/module_external/blas_connector_l3.cpp
+${ABACUS_SOURCE_DIR}/source_base/module_external/lapack_connector.cpp
+)
+list(APPEND math_libs math_connector)
 if(DEFINED ENV{MKLROOT} AND NOT DEFINED MKLROOT)
   set(MKLROOT "$ENV{MKLROOT}")
 endif()
@@ -479,7 +487,7 @@ else()
   find_package(FFTW3 REQUIRED)
   find_package(Lapack REQUIRED)
   include_directories(${FFTW3_INCLUDE_DIRS})
-  list(APPEND math_libs FFTW3::FFTW3 LAPACKE::LAPACKE LAPACK::LAPACK BLAS::BLAS)
+  list(APPEND math_libs FFTW3::FFTW3 LAPACKE::LAPACKE BLAS::BLAS)
   find_package(ScaLAPACK REQUIRED)
   list(APPEND math_libs ScaLAPACK::ScaLAPACK)
   if(USE_OPENMP)
 
@@ -9,6 +9,12 @@ endif()
 find_package(Blas REQUIRED)
 find_package(LAPACK REQUIRED)
 
+find_path(LAPACKE_INCLUDE_DIR
+  NAMES lapacke.h
+  PATHS ${LAPACK_DIR} ${LAPACKE_DIR} ${CMAKE_PREFIX_PATH}
+  PATH_SUFFIXES include include/lapacke
+  DOC "Path to LAPACKE include directory"
+)
 # find LAPACKE libraries
 find_library(LAPACKE_LIBRARY
   NAMES lapacke
@@ -17,20 +23,10 @@ find_library(LAPACKE_LIBRARY
   DOC "Path to LAPACKE library"
 )
 
-if(NOT TARGET LAPACK::LAPACK)
-    add_library(LAPACK::LAPACK UNKNOWN IMPORTED)
-    set_target_properties(LAPACK::LAPACK PROPERTIES
-        IMPORTED_LINK_INTERFACE_LANGUAGES "C"
-        IMPORTED_LOCATION "${LAPACK_LIBRARIES}")
-endif()
-
 if(NOT TARGET LAPACKE::LAPACKE)
   add_library(LAPACKE::LAPACKE UNKNOWN IMPORTED)
   set_target_properties(LAPACKE::LAPACKE PROPERTIES
+    INTERFACE_INCLUDE_DIRECTORIES "${LAPACKE_INCLUDE_DIR}"
     IMPORTED_LINK_INTERFACE_LANGUAGES "C"
     IMPORTED_LOCATION "${LAPACKE_LIBRARY}")
-
-  set_target_properties(LAPACKE::LAPACKE PROPERTIES
-    INTERFACE_LINK_LIBRARIES "LAPACK::LAPACK"
-  )
 endif()
@@ -10,11 +10,6 @@ add_library(
     base
     OBJECT
     assoc_laguerre.cpp
-    module_external/blas_connector_base.cpp
-    module_external/blas_connector_l1.cpp
-    module_external/blas_connector_l2.cpp
-    module_external/blas_connector_l3.cpp
-    module_external/lapack_connector.cpp
     clebsch_gordan_coeff.cpp
     complexarray.cpp
     complexmatrix.cpp
 
@@ -347,17 +347,18 @@ TEST_F(TestModuleHsolverMathKernel, gemv_op_cpu)
     int inc = 1;
     int row = 2;
     int col = 3;
-    zgemv_(&trans,
-           &row,
-           &col,
-           &ModuleBase::ONE,
+    BlasConnector::gemv_cm(
+           trans,
+           row,
+           col,
+           ModuleBase::ONE,
            A_gemv.data(),
-           &row,
+           row,
            X_gemv.data(),
-           &inc,
-           &ModuleBase::ONE,
+           inc,
+           ModuleBase::ONE,
            Y_test_gemv.data(),
-           &inc);
+           inc);
     for (int i = 0; i < Y_gemv.size(); i++)
     {
         EXPECT_LT(fabs(Y_gemv[i].imag() - Y_test_gemv[i].imag()), 1e-12);
@@ -607,17 +608,18 @@ TEST_F(TestModuleHsolverMathKernel, gemv_op_gpu)
     int inc = 1;
     int row = 2;
     int col = 3;
-    zgemv_(&trans,
-           &row,
-           &col,
-           &ModuleBase::ONE,
+    BlasConnector::gemv(
+           trans,
+           row,
+           col,
+           ModuleBase::ONE,
            A_gemv.data(),
-           &row,
+           row,
            X_gemv.data(),
-           &inc,
-           &ModuleBase::ONE,
+           inc,
+           ModuleBase::ONE,
            Y_test_gemv.data(),
-           &inc);
+           inc);
 
     for (int i = 0; i < Y_gemv.size(); i++)
     {
 
@@ -221,28 +221,6 @@ class BlasConnector
 
 	static
 	void copy(const long n, const std::complex<double> *a, const int incx, std::complex<double> *b, const int incy, base_device::AbacusDevice_t device_type = base_device::AbacusDevice_t::CpuDevice);
-
-	// There is some other operators needed, so implemented manually here
-	template <typename T>
-	static
-	void vector_mul_vector(const int& dim, T* result, const T* vector1, const T* vector2, base_device::AbacusDevice_t device_type = base_device::AbacusDevice_t::CpuDevice);
-
-	template <typename T>
-	static
-	void vector_div_vector(const int& dim, T* result, const T* vector1, const T* vector2, base_device::AbacusDevice_t device_type = base_device::AbacusDevice_t::CpuDevice);
-
-	// y = alpha * x + beta * y
-	static
-	void vector_add_vector(const int& dim, float *result, const float *vector1, const float constant1, const float *vector2, const float constant2, base_device::AbacusDevice_t device_type = base_device::AbacusDevice_t::CpuDevice);
-
-	static
-	void vector_add_vector(const int& dim, double *result, const double *vector1, const double constant1, const double *vector2, const double constant2, base_device::AbacusDevice_t device_type = base_device::AbacusDevice_t::CpuDevice);
-
-	static
-	void vector_add_vector(const int& dim, std::complex<float> *result, const std::complex<float> *vector1, const float constant1, const std::complex<float> *vector2, const float constant2, base_device::AbacusDevice_t device_type = base_device::AbacusDevice_t::CpuDevice);
-
-	static
-	void vector_add_vector(const int& dim, std::complex<double> *result, const std::complex<double> *vector1, const double constant1, const std::complex<double> *vector2, const double constant2, base_device::AbacusDevice_t device_type = base_device::AbacusDevice_t::CpuDevice);
 };
 
 namespace BlasUtils {
 
@@ -374,133 +374,4 @@ double BlasConnector::nrm2( const int n, const std::complex<double> *X, const in
 	else {
 		throw std::invalid_argument("device_type = " + std::to_string(device_type) + " in " + std::string(__FILE__) + " line " + std::to_string(__LINE__));
 	}
-}
-
-template <typename T>
-void vector_mul_vector(const int& dim, T* result, const T* vector1, const T* vector2, base_device::AbacusDevice_t device_type){
-	using Real = typename GetTypeReal<T>::type;
-	if (device_type == base_device::AbacusDevice_t::CpuDevice) {
-#ifdef _OPENMP
-#pragma omp parallel for schedule(static, 4096 / sizeof(Real))
-#endif
-        for (int i = 0; i < dim; i++)
-        {
-            result[i] = vector1[i] * vector2[i];
-        }
-	}
-#ifdef __CUDA
-	else if (device_type == base_device::AbacusDevice_t::GpuDevice) {
-		ModuleBase::vector_mul_vector_op<T, base_device::DEVICE_GPU>()(dim, result, vector1, vector2);
-	}
-#endif
-	else {
-		throw std::invalid_argument("device_type = " + std::to_string(device_type) + " in " + std::string(__FILE__) + " line " + std::to_string(__LINE__));
-	}
-}
-
-
-template <typename T>
-void vector_div_vector(const int& dim, T* result, const T* vector1, const T* vector2, base_device::AbacusDevice_t device_type){
-	using Real = typename GetTypeReal<T>::type;
-	if (device_type == base_device::AbacusDevice_t::CpuDevice) {
-#ifdef _OPENMP
-#pragma omp parallel for schedule(static, 4096 / sizeof(Real))
-#endif
-		for (int i = 0; i < dim; i++)
-        {
-            result[i] = vector1[i] / vector2[i];
-        }
-	}
-#ifdef __CUDA
-	else if (device_type == base_device::AbacusDevice_t::GpuDevice) {
-		ModuleBase::vector_div_vector_op<T, base_device::DEVICE_GPU>()(dim, result, vector1, vector2);
-	}
-#endif
-	else {
-		throw std::invalid_argument("device_type = " + std::to_string(device_type) + " in " + std::string(__FILE__) + " line " + std::to_string(__LINE__));
-	}
-}
-
-void vector_add_vector(const int& dim, float *result, const float *vector1, const float constant1, const float *vector2, const float constant2, base_device::AbacusDevice_t device_type)
-{
-	if (device_type == base_device::CpuDevice){
-#ifdef _OPENMP
-#pragma omp parallel for schedule(static, 8192 / sizeof(float))
-#endif
-        for (int i = 0; i < dim; i++)
-        {
-            result[i] = vector1[i] * constant1 + vector2[i] * constant2;
-        }
-	}
-#ifdef __CUDA
-	else if (device_type == base_device::GpuDevice) {
-		ModuleBase::vector_add_vector_op<float, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);
-	}
-#endif
-	else {
-		throw std::invalid_argument("device_type = " + std::to_string(device_type) + " in " + std::string(__FILE__) + " line " + std::to_string(__LINE__));
-	}
-}
-
-void vector_add_vector(const int& dim, double *result, const double *vector1, const double constant1, const double *vector2, const double constant2, base_device::AbacusDevice_t device_type)
-{
-	if (device_type == base_device::CpuDevice){
-#ifdef _OPENMP
-#pragma omp parallel for schedule(static, 8192 / sizeof(double))
-#endif
-        for (int i = 0; i < dim; i++)
-        {
-            result[i] = vector1[i] * constant1 + vector2[i] * constant2;
-        }
-	}
-#ifdef __CUDA
-	else if (device_type == base_device::GpuDevice) {
-		ModuleBase::vector_add_vector_op<double, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);
-	}
-#endif
-	else {
-		throw std::invalid_argument("device_type = " + std::to_string(device_type) + " in " + std::string(__FILE__) + " line " + std::to_string(__LINE__));
-	}
-}
-
-void vector_add_vector(const int& dim, std::complex<float> *result, const std::complex<float> *vector1, const float constant1, const std::complex<float> *vector2, const float constant2, base_device::AbacusDevice_t device_type)
-{
-	if (device_type == base_device::CpuDevice){
-#ifdef _OPENMP
-#pragma omp parallel for schedule(static, 8192 / sizeof(std::complex<float>))
-#endif
-        for (int i = 0; i < dim; i++)
-        {
-            result[i] = vector1[i] * constant1 + vector2[i] * constant2;
-        }
-	}
-#ifdef __CUDA
-	else if (device_type == base_device::GpuDevice) {
-		ModuleBase::vector_add_vector_op<std::complex<float>, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);
-	}
-#endif
-	else {
-		throw std::invalid_argument("device_type = " + std::to_string(device_type) + " in " + std::string(__FILE__) + " line " + std::to_string(__LINE__));
-	}
-}
-
-void vector_add_vector(const int& dim, std::complex<double> *result, const std::complex<double> *vector1, const double constant1, const std::complex<double> *vector2, const double constant2, base_device::AbacusDevice_t device_type)
-{
-	if (device_type == base_device::CpuDevice){
-#ifdef _OPENMP
-#pragma omp parallel for schedule(static, 8192 / sizeof(std::complex<double>))
-#endif
-        for (int i = 0; i < dim; i++)
-        {
-            result[i] = vector1[i] * constant1 + vector2[i] * constant2;
-        }
-	}
-#ifdef __CUDA
-	else if (device_type == base_device::GpuDevice) {
-		ModuleBase::vector_add_vector_op<std::complex<double>, base_device::DEVICE_GPU>()(dim, result, vector1, constant1, vector2, constant2);
-	}
-#endif
-	else {
-		throw std::invalid_argument("device_type = " + std::to_string(device_type) + " in " + std::string(__FILE__) + " line " + std::to_string(__LINE__));
-	}
 }