deepmodeling · mohanchen · Jan 13, 2025 · Jan 12, 2025 · Jan 12, 2025 · Jan 12, 2025
diff --git a/source/module_lr/ao_to_mo_transformer/ao_to_mo.h b/source/module_lr/ao_to_mo_transformer/ao_to_mo.h
@@ -7,15 +7,18 @@
 #endif
 namespace LR
 {
+#ifndef MO_TYPE_H
+#define MO_TYPE_H
     enum MO_TYPE { OO, VO, VV };
+#endif
     template<typename T>
     void  ao_to_mo_forloop_serial(
         const std::vector<container::Tensor>& mat_ao,
         const psi::Psi<T>& coeff,
         const int& nocc,
         const int& nvirt,
         T* const mat_mo,
-        MO_TYPE type = VO);
+        const MO_TYPE type = VO);
     template<typename T>
     void ao_to_mo_blas(
         const std::vector<container::Tensor>& mat_ao,
@@ -24,7 +27,7 @@ namespace LR
         const int& nvirt,
         T* const mat_mo,
         const bool add_on = true,
-        MO_TYPE type = VO);
+        const MO_TYPE type = VO);
 #ifdef __MPI
     template<typename T>
     void ao_to_mo_pblas(
@@ -38,6 +41,6 @@ namespace LR
         const Parallel_2D& pmat_mo,
         T* const mat_mo,
         const bool add_on = true,
-        MO_TYPE type = VO);
+        const MO_TYPE type = VO);
 #endif
 }
diff --git a/source/module_lr/ao_to_mo_transformer/ao_to_mo_parallel.cpp b/source/module_lr/ao_to_mo_transformer/ao_to_mo_parallel.cpp
@@ -21,7 +21,7 @@ namespace LR
         const Parallel_2D& pmat_mo,
         double* mat_mo,
         const bool add_on,
-        MO_TYPE type)
+        const MO_TYPE type)
     {
         ModuleBase::TITLE("hamilt_lrtd", "ao_to_mo_pblas");
         assert(pmat_ao.comm() == pcoeff.comm() && pmat_ao.comm() == pmat_mo.comm());
@@ -79,7 +79,7 @@ namespace LR
         const Parallel_2D& pmat_mo,
         std::complex<double>* const mat_mo,
         const bool add_on,
-        MO_TYPE type)
+        const MO_TYPE type)
     {
         ModuleBase::TITLE("hamilt_lrtd", "cal_AX_plas");
         assert(pmat_ao.comm() == pcoeff.comm() && pmat_ao.comm() == pmat_mo.comm());

diff --git a/source/module_lr/ao_to_mo_transformer/ao_to_mo_serial.cpp b/source/module_lr/ao_to_mo_transformer/ao_to_mo_serial.cpp
@@ -11,7 +11,7 @@ namespace LR
         const int& nocc,
         const int& nvirt,
         double* mat_mo,
-        MO_TYPE type)
+        const MO_TYPE type)
     {
         ModuleBase::TITLE("hamilt_lrtd", "ao_to_mo_forloop_serial");
         const int nks = mat_ao.size();
@@ -49,7 +49,7 @@ namespace LR
         const int& nocc,
         const int& nvirt,
         std::complex<double>* const mat_mo,
-        MO_TYPE type)
+        const MO_TYPE type)
     {
         ModuleBase::TITLE("hamilt_lrtd", "ao_to_mo_forloop_serial");
         const int nks = mat_ao.size();
@@ -88,7 +88,7 @@ namespace LR
         const int& nvirt,
         double* mat_mo,
         const bool add_on,
-        MO_TYPE type)
+        const MO_TYPE type)
     {
         ModuleBase::TITLE("hamilt_lrtd", "ao_to_mo_blas");
         const int nks = mat_ao.size();
@@ -129,7 +129,7 @@ namespace LR
         const int& nvirt,
         std::complex<double>* const mat_mo,
         const bool add_on,
-        MO_TYPE type)
+        const MO_TYPE type)
     {
         ModuleBase::TITLE("hamilt_lrtd", "ao_to_mo_blas");
         const int nks = mat_ao.size();

diff --git a/source/module_lr/dm_trans/dm_trans.h b/source/module_lr/dm_trans/dm_trans.h
@@ -8,7 +8,12 @@
 #endif
 namespace LR
 {
-    // use templates in the future.
+
+#ifndef MO_TYPE_H
+#define MO_TYPE_H
+    enum MO_TYPE { OO, VO, VV };
+#endif
+
 #ifdef __MPI
 /// @brief calculate the 2d-block transition density matrix in AO basis using p?gemm
 /// \f[ \tilde{\rho}_{\mu_j\mu_b}=\sum_{jb}c_{j,\mu_j}X_{jb}c^*_{b,\mu_b} \f]
@@ -22,8 +27,8 @@ namespace LR
         const int nocc,
         const int nvirt,
         const Parallel_2D& pmat,
-        const bool renorm_k = true,
-        const int nspin = 1);
+        const T factor = (T)1.0,
+        const MO_TYPE type = MO_TYPE::VO);
 #endif
 
     /// @brief calculate the 2d-block transition density matrix in AO basis using ?gemm
@@ -32,8 +37,8 @@ namespace LR
         const T* const X_istate,
         const psi::Psi<T>& c,
         const int& nocc, const int& nvirt,
-        const bool renorm_k = true,
-        const int nspin = 1);
+        const T factor = (T)1.0,
+        const MO_TYPE type = MO_TYPE::VO);
 
     // for test
     /// @brief calculate the 2d-block transition density matrix in AO basis using for loop (for test)
@@ -42,6 +47,6 @@ namespace LR
         const T* const X_istate,
         const psi::Psi<T>& c,
         const int& nocc, const int& nvirt,
-        const bool renorm_k = true,
-        const int nspin = 1);
+        const T factor = (T)1.0,
+        const MO_TYPE type = MO_TYPE::VO);
 }
diff --git a/source/module_lr/dm_trans/dm_trans_parallel.cpp b/source/module_lr/dm_trans/dm_trans_parallel.cpp
@@ -18,44 +18,49 @@ std::vector<container::Tensor> cal_dm_trans_pblas(const double* const X_istate,
     const int nocc,
     const int nvirt,
     const Parallel_2D& pmat,
-    const bool renorm_k,
-    const int nspin)
+    const double factor,
+    const MO_TYPE type)
 {
     ModuleBase::TITLE("hamilt_lrtd", "cal_dm_trans_pblas");
     assert(px.comm() == pc.comm() && px.comm() == pmat.comm());
     assert(px.blacs_ctxt == pc.blacs_ctxt && px.blacs_ctxt == pmat.blacs_ctxt);
     assert(pmat.get_local_size() > 0);
 
     const int nks = c.get_nk();
+    const int i1 = 1;
+    const int ivirt = nocc + 1;
+    const int nmo1 = type == MO_TYPE::VV ? nvirt : nocc;
+    const int nmo2 = type == MO_TYPE::OO ? nocc : nvirt;
+    const int imo1 = type == MO_TYPE::VV ? ivirt : i1;
+    const int imo2 = type == MO_TYPE::OO ? i1 : ivirt;
 
     std::vector<container::Tensor> dm_trans(nks,
         container::Tensor(DAT::DT_DOUBLE, DEV::CpuDevice, { pmat.get_col_size(), pmat.get_row_size() }));
     for (int isk = 0; isk < nks; ++isk)
     {
         c.fix_k(isk);
         const int x_start = isk * px.get_local_size();
-        int i1 = 1;
-        int ivirt = nocc + 1;
+
         char transa = 'N';
         char transb = 'T';
         const double alpha = 1.0;
         const double beta = 0;
 
         // 1. [X*C_occ^T]^T=C_occ*X^T
         Parallel_2D pXc; // nvirt*naos
-        LR_Util::setup_2d_division(pXc, px.get_block_size(), naos, nvirt, px.blacs_ctxt);
+        LR_Util::setup_2d_division(pXc, px.get_block_size(), naos, nmo2, px.blacs_ctxt);
         container::Tensor Xc(DAT::DT_DOUBLE,
                              DEV::CpuDevice,
                              {pXc.get_col_size(), pXc.get_row_size()}); // row is "inside"(memory contiguity) for pblas
         Xc.zero();
-        pdgemm_(&transa, &transb, &naos, &nvirt, &nocc,
-            &alpha, c.get_pointer(), &i1, &i1, pc.desc,
+        pdgemm_(&transa, &transb, &naos, &nmo2, &nmo1,
+            &alpha, c.get_pointer(), &i1, &imo1, pc.desc,
             X_istate + x_start, &i1, &i1, px.desc,
             &beta, Xc.data<double>(), &i1, &i1, pXc.desc);
 
         // 2. C_virt*[X*C_occ^T]
-        pdgemm_(&transa, &transb, &naos, &naos, &nvirt,
-            &alpha, c.get_pointer(), &i1, &ivirt, pc.desc,
+        pdgemm_(&transa, &transb, &naos, &naos, &nmo2,
+            &factor, c.get_pointer(), &i1, &imo2, pc.desc,
             Xc.data<double>(), &i1, &i1, pXc.desc,
             &beta, dm_trans[isk].data<double>(), &i1, &i1, pmat.desc);
     }
@@ -70,23 +75,27 @@ std::vector<container::Tensor> cal_dm_trans_pblas(const std::complex<double>* co
     const int nocc,
     const int nvirt,
     const Parallel_2D& pmat,
-    const bool renorm_k,
-    const int nspin)
+    const std::complex<double> factor,
+    const MO_TYPE type)
 {
     ModuleBase::TITLE("hamilt_lrtd", "cal_dm_trans_pblas");
     assert(px.comm() == pc.comm() && px.comm() == pmat.comm());
     assert(px.blacs_ctxt == pc.blacs_ctxt && px.blacs_ctxt == pmat.blacs_ctxt);
     assert(pmat.get_local_size() > 0);
     const int nks = c.get_nk();
+    const int i1 = 1;
+    const int ivirt = nocc + 1;
+    const int nmo1 = type == MO_TYPE::VV ? nvirt : nocc;
+    const int nmo2 = type == MO_TYPE::OO ? nocc : nvirt;
+    const int imo1 = type == MO_TYPE::VV ? ivirt : i1;
+    const int imo2 = type == MO_TYPE::OO ? i1 : ivirt;
 
     std::vector<container::Tensor> dm_trans(nks,
         container::Tensor(DAT::DT_COMPLEX_DOUBLE, DEV::CpuDevice, {pmat.get_col_size(), pmat.get_row_size()}));
     for (int isk = 0; isk < nks; ++isk)
     {
         c.fix_k(isk);
         const int x_start = isk * px.get_local_size();
-        int i1 = 1;
-        int ivirt = nocc + 1;
 
         // ============== C_virt * X * C_occ^\dagger=============
         // char transa = 'N';
@@ -114,24 +123,23 @@ std::vector<container::Tensor> cal_dm_trans_pblas(const std::complex<double>* co
         char transa = 'N';
         char transb = 'C';
         Parallel_2D pXc;
-        LR_Util::setup_2d_division(pXc, px.get_block_size(), nvirt, naos, px.blacs_ctxt);
+        LR_Util::setup_2d_division(pXc, px.get_block_size(), nmo2, naos, px.blacs_ctxt);
         container::Tensor Xc(DAT::DT_COMPLEX_DOUBLE,
                              DEV::CpuDevice,
                              {pXc.get_col_size(), pXc.get_row_size()}); // row is "inside"(memory contiguity) for pblas
         Xc.zero();
-        std::complex<double> alpha(1.0, 0.0);
+        const std::complex<double> alpha(1.0, 0.0);
         const std::complex<double> beta(0.0, 0.0);
-        pzgemm_(&transa, &transb, &nvirt, &naos, &nocc, &alpha,
+        pzgemm_(&transa, &transb, &nmo2, &naos, &nmo1, &alpha,
             X_istate + x_start, &i1, &i1, px.desc,
-            c.get_pointer(), &i1, &i1, pc.desc,
+            c.get_pointer(), &i1, &imo1, pc.desc,
             &beta, Xc.data<std::complex<double>>(), &i1, &i1, pXc.desc);
 
         // 2. [X*C_occ^\dagger]^TC_virt^T
-        alpha.real(renorm_k ? 1.0 / static_cast<double>(nks) : 1.0);
         transa = transb = 'T';
-        pzgemm_(&transa, &transb, &naos, &naos, &nvirt,
-            &alpha, Xc.data<std::complex<double>>(), &i1, &i1, pXc.desc,
-            c.get_pointer(), &i1, &ivirt, pc.desc,
+        pzgemm_(&transa, &transb, &naos, &naos, &nmo2,
+            &factor, Xc.data<std::complex<double>>(), &i1, &i1, pXc.desc,
+            c.get_pointer(), &i1, &imo2, pc.desc,
             &beta, dm_trans[isk].data<std::complex<double>>(), &i1, &i1, pmat.desc);
     }
     return dm_trans;