deepmodeling
diff --git a/‎source/module_hamilt_lcao/module_tddft/band_energy.cpp‎
Lines changed: 43 additions & 40 deletions b/‎source/module_hamilt_lcao/module_tddft/band_energy.cpp‎
Lines changed: 43 additions & 40 deletions
diff --git a/‎source/module_hamilt_lcao/module_tddft/middle_hamilt.cpp‎
Lines changed: 24 additions & 16 deletions b/‎source/module_hamilt_lcao/module_tddft/middle_hamilt.cpp‎
Lines changed: 24 additions & 16 deletions
@@ -28,12 +28,13 @@ void compute_ekb(const Parallel_Orbitals* pv,
                  double* ekb,
                  std::ofstream& ofs_running)
 {
+    assert(pv->nloc_wfc > 0 && pv->nloc > 0);
 
     std::complex<double>* tmp1 = new std::complex<double>[pv->nloc_wfc];
     ModuleBase::GlobalFunc::ZEROS(tmp1, pv->nloc_wfc);
 
-    std::complex<double>* Eij = new std::complex<double>[pv->nloc];
-    ModuleBase::GlobalFunc::ZEROS(Eij, pv->nloc);
+    std::complex<double>* eij = new std::complex<double>[pv->nloc];
+    ModuleBase::GlobalFunc::ZEROS(eij, pv->nloc);
 
     ScalapackConnector::gemm('N',
                              'N',
@@ -70,7 +71,7 @@ void compute_ekb(const Parallel_Orbitals* pv,
                              1,
                              pv->desc_wfc,
                              0.0,
-                             Eij,
+                             eij,
                              1,
                              1,
                              pv->desc_Eij);
@@ -83,12 +84,11 @@ void compute_ekb(const Parallel_Orbitals* pv,
         ofs_running << " Eij:" << std::endl;
         for (int i = 0; i < pv->nrow_bands; i++)
         {
+            const int in = i * pv->ncol;
             for (int j = 0; j < pv->ncol_bands; j++)
             {
-                double aa = 0.0;
-                double bb = 0.0;
-                aa = Eij[i * pv->ncol + j].real();
-                bb = Eij[i * pv->ncol + j].imag();
+                double aa = eij[in + j].real();
+                double bb = eij[in + j].imag();
                 if (std::abs(aa) < PARAM.inp.td_print_eij)
                 {
                     aa = 0.0;
@@ -112,8 +112,10 @@ void compute_ekb(const Parallel_Orbitals* pv,
     int info = 0;
     int naroc[2] = {0, 0};
 
-    double* Eii = new double[nband];
-    ModuleBase::GlobalFunc::ZEROS(Eii, nband);
+    assert(nband > 0);
+    double* eii = new double[nband];
+    ModuleBase::GlobalFunc::ZEROS(eii, nband);
+
     for (int iprow = 0; iprow < pv->dim0; ++iprow)
     {
         for (int ipcol = 0; ipcol < pv->dim1; ++ipcol)
@@ -138,18 +140,18 @@ void compute_ekb(const Parallel_Orbitals* pv,
                         }
                         if (igcol == igrow)
                         {
-                            Eii[igcol] = Eij[j * naroc[0] + i].real();
+                            eii[igcol] = eij[j * naroc[0] + i].real();
                         }
                     }
                 }
             }
         } // loop ipcol
     } // loop iprow
-    info = MPI_Allreduce(Eii, ekb, nband, MPI_DOUBLE, MPI_SUM, pv->comm());
+    info = MPI_Allreduce(eii, ekb, nband, MPI_DOUBLE, MPI_SUM, pv->comm());
 
     delete[] tmp1;
-    delete[] Eij;
-    delete[] Eii;
+    delete[] eij;
+    delete[] eii;
 }
 
 void compute_ekb_tensor(const Parallel_Orbitals* pv,
@@ -160,12 +162,14 @@ void compute_ekb_tensor(const Parallel_Orbitals* pv,
                         ct::Tensor& ekb,
                         std::ofstream& ofs_running)
 {
+    assert(pv->nloc_wfc > 0 && pv->nloc > 0);
+
     // Create Tensor objects for temporary data
     ct::Tensor tmp1(ct::DataType::DT_COMPLEX_DOUBLE, ct::DeviceType::CpuDevice, ct::TensorShape({pv->nloc_wfc}));
     tmp1.zero();
 
-    ct::Tensor Eij(ct::DataType::DT_COMPLEX_DOUBLE, ct::DeviceType::CpuDevice, ct::TensorShape({pv->nloc}));
-    Eij.zero();
+    ct::Tensor eij(ct::DataType::DT_COMPLEX_DOUBLE, ct::DeviceType::CpuDevice, ct::TensorShape({pv->nloc}));
+    eij.zero();
 
     // Perform matrix multiplication: tmp1 = Htmp * psi_k
     ScalapackConnector::gemm('N',
@@ -188,7 +192,7 @@ void compute_ekb_tensor(const Parallel_Orbitals* pv,
                              1,
                              pv->desc_wfc);
 
-    // Perform matrix multiplication: Eij = psi_k^dagger * tmp1
+    // Perform matrix multiplication: eij = psi_k^dagger * tmp1
     ScalapackConnector::gemm('C',
                              'N',
                              nband,
@@ -204,7 +208,7 @@ void compute_ekb_tensor(const Parallel_Orbitals* pv,
                              1,
                              pv->desc_wfc,
                              0.0,
-                             Eij.data<std::complex<double>>(),
+                             eij.data<std::complex<double>>(),
                              1,
                              1,
                              pv->desc_Eij);
@@ -217,12 +221,11 @@ void compute_ekb_tensor(const Parallel_Orbitals* pv,
         ofs_running << " Eij:" << std::endl;
         for (int i = 0; i < pv->nrow_bands; i++)
         {
+            const int in = i * pv->ncol;
             for (int j = 0; j < pv->ncol_bands; j++)
             {
-                double aa = 0.0;
-                double bb = 0.0;
-                aa = Eij.data<std::complex<double>>()[i * pv->ncol + j].real();
-                bb = Eij.data<std::complex<double>>()[i * pv->ncol + j].imag();
+                double aa = eij.data<std::complex<double>>()[in + j].real();
+                double bb = eij.data<std::complex<double>>()[in + j].imag();
                 if (std::abs(aa) < PARAM.inp.td_print_eij)
                 {
                     aa = 0.0;
@@ -246,9 +249,10 @@ void compute_ekb_tensor(const Parallel_Orbitals* pv,
     int info = 0;
     int naroc[2] = {0, 0};
 
-    // Create a Tensor for Eii
-    ct::Tensor Eii(ct::DataType::DT_DOUBLE, ct::DeviceType::CpuDevice, ct::TensorShape({nband}));
-    Eii.zero();
+    // Create a Tensor for eii
+    assert(nband > 0);
+    ct::Tensor eii(ct::DataType::DT_DOUBLE, ct::DeviceType::CpuDevice, ct::TensorShape({nband}));
+    eii.zero();
 
     for (int iprow = 0; iprow < pv->dim0; ++iprow)
     {
@@ -274,7 +278,7 @@ void compute_ekb_tensor(const Parallel_Orbitals* pv,
                         }
                         if (igcol == igrow)
                         {
-                            Eii.data<double>()[igcol] = Eij.data<std::complex<double>>()[j * naroc[0] + i].real();
+                            eii.data<double>()[igcol] = eij.data<std::complex<double>>()[j * naroc[0] + i].real();
                         }
                     }
                 }
@@ -283,7 +287,7 @@ void compute_ekb_tensor(const Parallel_Orbitals* pv,
     } // loop iprow
 
     // Perform MPI reduction to compute ekb
-    info = MPI_Allreduce(Eii.data<double>(), ekb.data<double>(), nband, MPI_DOUBLE, MPI_SUM, pv->comm());
+    info = MPI_Allreduce(eii.data<double>(), ekb.data<double>(), nband, MPI_DOUBLE, MPI_SUM, pv->comm());
 }
 
 template <typename Device>
@@ -306,11 +310,11 @@ void compute_ekb_tensor_lapack(const Parallel_Orbitals* pv,
                     ct::TensorShape({nlocal * nband})); // tmp1 shape: nlocal * nband
     tmp1.zero();
 
-    ct::Tensor Eij(ct::DataType::DT_COMPLEX_DOUBLE,
+    ct::Tensor eij(ct::DataType::DT_COMPLEX_DOUBLE,
                    ct_device_type,
-                   ct::TensorShape({nlocal * nlocal})); // Eij shape: nlocal * nlocal
+                   ct::TensorShape({nlocal * nlocal})); // eij shape: nlocal * nlocal
     // Why not use nband * nband ?????
-    Eij.zero();
+    eij.zero();
 
     std::complex<double> alpha = {1.0, 0.0};
     std::complex<double> beta = {0.0, 0.0};
@@ -330,7 +334,7 @@ void compute_ekb_tensor_lapack(const Parallel_Orbitals* pv,
                                                               tmp1.data<std::complex<double>>(),
                                                               nlocal); // Leading dimension of tmp1
 
-    // Perform matrix multiplication: Eij = psi_k^dagger * tmp1
+    // Perform matrix multiplication: eij = psi_k^dagger * tmp1
     ct::kernels::blas_gemm<std::complex<double>, ct_Device>()('C',
                                                               'N',
                                                               nband,
@@ -342,25 +346,24 @@ void compute_ekb_tensor_lapack(const Parallel_Orbitals* pv,
                                                               tmp1.data<std::complex<double>>(),
                                                               nlocal, // Leading dimension of tmp1
                                                               &beta,
-                                                              Eij.data<std::complex<double>>(),
-                                                              nlocal); // Leading dimension of Eij
+                                                              eij.data<std::complex<double>>(),
+                                                              nlocal); // Leading dimension of eij
 
     if (PARAM.inp.td_print_eij >= 0.0)
     {
-        ct::Tensor Eij_cpu = Eij.to_device<ct::DEVICE_CPU>();
+        ct::Tensor eij_cpu = eij.to_device<ct::DEVICE_CPU>();
 
         ofs_running
             << "------------------------------------------------------------------------------------------------"
             << std::endl;
         ofs_running << " Eij:" << std::endl;
         for (int i = 0; i < nband; i++)
         {
+            const int in = i * nlocal;
             for (int j = 0; j < nband; j++)
             {
-                double aa = 0.0;
-                double bb = 0.0;
-                aa = Eij_cpu.data<std::complex<double>>()[i * nlocal + j].real();
-                bb = Eij_cpu.data<std::complex<double>>()[i * nlocal + j].imag();
+                double aa = eij_cpu.data<std::complex<double>>()[in + j].real();
+                double bb = eij_cpu.data<std::complex<double>>()[in + j].imag();
                 if (std::abs(aa) < PARAM.inp.td_print_eij)
                 {
                     aa = 0.0;
@@ -381,15 +384,15 @@ void compute_ekb_tensor_lapack(const Parallel_Orbitals* pv,
             << std::endl;
     }
 
-    // Extract diagonal elements of Eij into ekb
+    // Extract diagonal elements of eij into ekb
     if (ct_device_type == ct::DeviceType::GpuDevice)
     {
         // GPU implementation
         for (int i = 0; i < nband; ++i)
         {
             base_device::memory::synchronize_memory_op<double, Device, Device>()(
                 ekb.data<double>() + i,
-                reinterpret_cast<const double*>(Eij.data<std::complex<double>>() + i * nlocal + i),
+                reinterpret_cast<const double*>(eij.data<std::complex<double>>() + i * nlocal + i),
                 1);
         }
     }
@@ -398,7 +401,7 @@ void compute_ekb_tensor_lapack(const Parallel_Orbitals* pv,
         // CPU implementation
         for (int i = 0; i < nband; ++i)
         {
-            ekb.data<double>()[i] = Eij.data<std::complex<double>>()[i * nlocal + i].real();
+            ekb.data<double>()[i] = eij.data<std::complex<double>>()[i * nlocal + i].real();
         }
     }
 }
 
@@ -29,9 +29,10 @@ void half_Hmatrix(const Parallel_Orbitals* pv,
         ofs_running << " H(t+dt) :" << std::endl;
         for (int i = 0; i < pv->nrow; i++)
         {
+            const int in = i * pv->ncol;
             for (int j = 0; j < pv->ncol; j++)
             {
-                ofs_running << Htmp[i * pv->ncol + j].real() << "+" << Htmp[i * pv->ncol + j].imag() << "i ";
+                ofs_running << Htmp[in + j].real() << "+" << Htmp[in + j].imag() << "i ";
             }
             ofs_running << std::endl;
         }
@@ -40,10 +41,10 @@ void half_Hmatrix(const Parallel_Orbitals* pv,
         ofs_running << " H(t):" << std::endl;
         for (int i = 0; i < pv->nrow; i++)
         {
+            const int in = i * pv->ncol;
             for (int j = 0; j < pv->ncol; j++)
             {
-                ofs_running << H_laststep[i * pv->ncol + j].real() << "+" << H_laststep[i * pv->ncol + j].imag()
-                            << "i ";
+                ofs_running << H_laststep[in + j].real() << "+" << H_laststep[in + j].imag() << "i ";
             }
             ofs_running << std::endl;
         }
@@ -61,9 +62,10 @@ void half_Hmatrix(const Parallel_Orbitals* pv,
         ofs_running << " H (t+dt/2) :" << std::endl;
         for (int i = 0; i < pv->nrow; i++)
         {
+            const int in = i * pv->ncol;
             for (int j = 0; j < pv->ncol; j++)
             {
-                ofs_running << Htmp[i * pv->ncol + j].real() << "+" << Htmp[i * pv->ncol + j].imag() << "i ";
+                ofs_running << Htmp[in + j].real() << "+" << Htmp[in + j].imag() << "i ";
             }
             ofs_running << std::endl;
         }
@@ -88,10 +90,11 @@ void half_Hmatrix_tensor(const Parallel_Orbitals* pv,
         ofs_running << " H(t+dt) :" << std::endl;
         for (int i = 0; i < pv->nrow; i++)
         {
+            const int in = i * pv->ncol;
             for (int j = 0; j < pv->ncol; j++)
             {
-                ofs_running << Htmp.data<std::complex<double>>()[i * pv->ncol + j].real() << "+"
-                            << Htmp.data<std::complex<double>>()[i * pv->ncol + j].imag() << "i ";
+                ofs_running << Htmp.data<std::complex<double>>()[in + j].real() << "+"
+                            << Htmp.data<std::complex<double>>()[in + j].imag() << "i ";
             }
             ofs_running << std::endl;
         }
@@ -100,10 +103,11 @@ void half_Hmatrix_tensor(const Parallel_Orbitals* pv,
         ofs_running << " H(t):" << std::endl;
         for (int i = 0; i < pv->nrow; i++)
         {
+            const int in = i * pv->ncol;
             for (int j = 0; j < pv->ncol; j++)
             {
-                ofs_running << H_laststep.data<std::complex<double>>()[i * pv->ncol + j].real() << "+"
-                            << H_laststep.data<std::complex<double>>()[i * pv->ncol + j].imag() << "i ";
+                ofs_running << H_laststep.data<std::complex<double>>()[in + j].real() << "+"
+                            << H_laststep.data<std::complex<double>>()[in + j].imag() << "i ";
             }
             ofs_running << std::endl;
         }
@@ -149,10 +153,11 @@ void half_Hmatrix_tensor(const Parallel_Orbitals* pv,
         ofs_running << " H (t+dt/2) :" << std::endl;
         for (int i = 0; i < pv->nrow; i++)
         {
+            const int in = i * pv->ncol;
             for (int j = 0; j < pv->ncol; j++)
             {
-                ofs_running << Htmp.data<std::complex<double>>()[i * pv->ncol + j].real() << "+"
-                            << Htmp.data<std::complex<double>>()[i * pv->ncol + j].imag() << "i ";
+                ofs_running << Htmp.data<std::complex<double>>()[in + j].real() << "+"
+                            << Htmp.data<std::complex<double>>()[in + j].imag() << "i ";
             }
             ofs_running << std::endl;
         }
@@ -186,10 +191,11 @@ void half_Hmatrix_tensor_lapack(const Parallel_Orbitals* pv,
         ofs_running << " H(t+dt) :" << std::endl;
         for (int i = 0; i < nlocal; i++)
         {
+            const int in = i * nlocal;
             for (int j = 0; j < nlocal; j++)
             {
-                ofs_running << Htmp_cpu.data<std::complex<double>>()[i * nlocal + j].real() << "+"
-                            << Htmp_cpu.data<std::complex<double>>()[i * nlocal + j].imag() << "i ";
+                ofs_running << Htmp_cpu.data<std::complex<double>>()[in + j].real() << "+"
+                            << Htmp_cpu.data<std::complex<double>>()[in + j].imag() << "i ";
             }
             ofs_running << std::endl;
         }
@@ -198,10 +204,11 @@ void half_Hmatrix_tensor_lapack(const Parallel_Orbitals* pv,
         ofs_running << " H(t):" << std::endl;
         for (int i = 0; i < nlocal; i++)
         {
+            const int in = i * nlocal;
             for (int j = 0; j < nlocal; j++)
             {
-                ofs_running << H_laststep_cpu.data<std::complex<double>>()[i * nlocal + j].real() << "+"
-                            << H_laststep_cpu.data<std::complex<double>>()[i * nlocal + j].imag() << "i ";
+                ofs_running << H_laststep_cpu.data<std::complex<double>>()[in + j].real() << "+"
+                            << H_laststep_cpu.data<std::complex<double>>()[in + j].imag() << "i ";
             }
             ofs_running << std::endl;
         }
@@ -246,10 +253,11 @@ void half_Hmatrix_tensor_lapack(const Parallel_Orbitals* pv,
         ofs_running << " H (t+dt/2) :" << std::endl;
         for (int i = 0; i < nlocal; i++)
         {
+            const int in = i * nlocal;
             for (int j = 0; j < nlocal; j++)
             {
-                ofs_running << Htmp_cpu.data<std::complex<double>>()[i * nlocal + j].real() << "+"
-                            << Htmp_cpu.data<std::complex<double>>()[i * nlocal + j].imag() << "i ";
+                ofs_running << Htmp_cpu.data<std::complex<double>>()[in + j].real() << "+"
+                            << Htmp_cpu.data<std::complex<double>>()[in + j].imag() << "i ";
             }
             ofs_running << std::endl;
         }
Original file line number	Diff line number	Diff line change
`@@ -29,9 +29,10 @@ void half_Hmatrix(const Parallel_Orbitals* pv,`
`29`	`29`	`ofs_running << " H(t+dt) :" << std::endl;`
`30`	`30`	`for (int i = 0; i < pv->nrow; i++)`
`31`	`31`	`{`
	`32`	`+ const int in = i * pv->ncol;`
`32`	`33`	`for (int j = 0; j < pv->ncol; j++)`
`33`	`34`	`{`
`34`		`- ofs_running << Htmp[i * pv->ncol + j].real() << "+" << Htmp[i * pv->ncol + j].imag() << "i ";`
	`35`	`+ ofs_running << Htmp[in + j].real() << "+" << Htmp[in + j].imag() << "i ";`
`35`	`36`	`}`
`36`	`37`	`ofs_running << std::endl;`
`37`	`38`	`}`
`@@ -40,10 +41,10 @@ void half_Hmatrix(const Parallel_Orbitals* pv,`
`40`	`41`	`ofs_running << " H(t):" << std::endl;`
`41`	`42`	`for (int i = 0; i < pv->nrow; i++)`
`42`	`43`	`{`
	`44`	`+ const int in = i * pv->ncol;`
`43`	`45`	`for (int j = 0; j < pv->ncol; j++)`
`44`	`46`	`{`
`45`		`- ofs_running << H_laststep[i * pv->ncol + j].real() << "+" << H_laststep[i * pv->ncol + j].imag()`
`46`		`- << "i ";`
	`47`	`+ ofs_running << H_laststep[in + j].real() << "+" << H_laststep[in + j].imag() << "i ";`
`47`	`48`	`}`
`48`	`49`	`ofs_running << std::endl;`
`49`	`50`	`}`
`@@ -61,9 +62,10 @@ void half_Hmatrix(const Parallel_Orbitals* pv,`
`61`	`62`	`ofs_running << " H (t+dt/2) :" << std::endl;`
`62`	`63`	`for (int i = 0; i < pv->nrow; i++)`
`63`	`64`	`{`
	`65`	`+ const int in = i * pv->ncol;`
`64`	`66`	`for (int j = 0; j < pv->ncol; j++)`
`65`	`67`	`{`
`66`		`- ofs_running << Htmp[i * pv->ncol + j].real() << "+" << Htmp[i * pv->ncol + j].imag() << "i ";`
	`68`	`+ ofs_running << Htmp[in + j].real() << "+" << Htmp[in + j].imag() << "i ";`
`67`	`69`	`}`
`68`	`70`	`ofs_running << std::endl;`
`69`	`71`	`}`
`@@ -88,10 +90,11 @@ void half_Hmatrix_tensor(const Parallel_Orbitals* pv,`
`88`	`90`	`ofs_running << " H(t+dt) :" << std::endl;`
`89`	`91`	`for (int i = 0; i < pv->nrow; i++)`
`90`	`92`	`{`
	`93`	`+ const int in = i * pv->ncol;`
`91`	`94`	`for (int j = 0; j < pv->ncol; j++)`
`92`	`95`	`{`
`93`		`- ofs_running << Htmp.data<std::complex<double>>()[i * pv->ncol + j].real() << "+"`
`94`		`- << Htmp.data<std::complex<double>>()[i * pv->ncol + j].imag() << "i ";`
	`96`	`+ ofs_running << Htmp.data<std::complex<double>>()[in + j].real() << "+"`
	`97`	`+ << Htmp.data<std::complex<double>>()[in + j].imag() << "i ";`
`95`	`98`	`}`
`96`	`99`	`ofs_running << std::endl;`
`97`	`100`	`}`
`@@ -100,10 +103,11 @@ void half_Hmatrix_tensor(const Parallel_Orbitals* pv,`
`100`	`103`	`ofs_running << " H(t):" << std::endl;`
`101`	`104`	`for (int i = 0; i < pv->nrow; i++)`
`102`	`105`	`{`
	`106`	`+ const int in = i * pv->ncol;`
`103`	`107`	`for (int j = 0; j < pv->ncol; j++)`
`104`	`108`	`{`
`105`		`- ofs_running << H_laststep.data<std::complex<double>>()[i * pv->ncol + j].real() << "+"`
`106`		`- << H_laststep.data<std::complex<double>>()[i * pv->ncol + j].imag() << "i ";`
	`109`	`+ ofs_running << H_laststep.data<std::complex<double>>()[in + j].real() << "+"`
	`110`	`+ << H_laststep.data<std::complex<double>>()[in + j].imag() << "i ";`
`107`	`111`	`}`
`108`	`112`	`ofs_running << std::endl;`
`109`	`113`	`}`
`@@ -149,10 +153,11 @@ void half_Hmatrix_tensor(const Parallel_Orbitals* pv,`
`149`	`153`	`ofs_running << " H (t+dt/2) :" << std::endl;`
`150`	`154`	`for (int i = 0; i < pv->nrow; i++)`
`151`	`155`	`{`
	`156`	`+ const int in = i * pv->ncol;`
`152`	`157`	`for (int j = 0; j < pv->ncol; j++)`
`153`	`158`	`{`
`154`		`- ofs_running << Htmp.data<std::complex<double>>()[i * pv->ncol + j].real() << "+"`
`155`		`- << Htmp.data<std::complex<double>>()[i * pv->ncol + j].imag() << "i ";`
	`159`	`+ ofs_running << Htmp.data<std::complex<double>>()[in + j].real() << "+"`
	`160`	`+ << Htmp.data<std::complex<double>>()[in + j].imag() << "i ";`
`156`	`161`	`}`
`157`	`162`	`ofs_running << std::endl;`
`158`	`163`	`}`
`@@ -186,10 +191,11 @@ void half_Hmatrix_tensor_lapack(const Parallel_Orbitals* pv,`
`186`	`191`	`ofs_running << " H(t+dt) :" << std::endl;`
`187`	`192`	`for (int i = 0; i < nlocal; i++)`
`188`	`193`	`{`
	`194`	`+ const int in = i * nlocal;`
`189`	`195`	`for (int j = 0; j < nlocal; j++)`
`190`	`196`	`{`
`191`		`- ofs_running << Htmp_cpu.data<std::complex<double>>()[i * nlocal + j].real() << "+"`
`192`		`- << Htmp_cpu.data<std::complex<double>>()[i * nlocal + j].imag() << "i ";`
	`197`	`+ ofs_running << Htmp_cpu.data<std::complex<double>>()[in + j].real() << "+"`
	`198`	`+ << Htmp_cpu.data<std::complex<double>>()[in + j].imag() << "i ";`
`193`	`199`	`}`
`194`	`200`	`ofs_running << std::endl;`
`195`	`201`	`}`
`@@ -198,10 +204,11 @@ void half_Hmatrix_tensor_lapack(const Parallel_Orbitals* pv,`
`198`	`204`	`ofs_running << " H(t):" << std::endl;`
`199`	`205`	`for (int i = 0; i < nlocal; i++)`
`200`	`206`	`{`
	`207`	`+ const int in = i * nlocal;`
`201`	`208`	`for (int j = 0; j < nlocal; j++)`
`202`	`209`	`{`
`203`		`- ofs_running << H_laststep_cpu.data<std::complex<double>>()[i * nlocal + j].real() << "+"`
`204`		`- << H_laststep_cpu.data<std::complex<double>>()[i * nlocal + j].imag() << "i ";`
	`210`	`+ ofs_running << H_laststep_cpu.data<std::complex<double>>()[in + j].real() << "+"`
	`211`	`+ << H_laststep_cpu.data<std::complex<double>>()[in + j].imag() << "i ";`
`205`	`212`	`}`
`206`	`213`	`ofs_running << std::endl;`
`207`	`214`	`}`
`@@ -246,10 +253,11 @@ void half_Hmatrix_tensor_lapack(const Parallel_Orbitals* pv,`
`246`	`253`	`ofs_running << " H (t+dt/2) :" << std::endl;`
`247`	`254`	`for (int i = 0; i < nlocal; i++)`
`248`	`255`	`{`
	`256`	`+ const int in = i * nlocal;`
`249`	`257`	`for (int j = 0; j < nlocal; j++)`
`250`	`258`	`{`
`251`		`- ofs_running << Htmp_cpu.data<std::complex<double>>()[i * nlocal + j].real() << "+"`
`252`		`- << Htmp_cpu.data<std::complex<double>>()[i * nlocal + j].imag() << "i ";`
	`259`	`+ ofs_running << Htmp_cpu.data<std::complex<double>>()[in + j].real() << "+"`
	`260`	`+ << Htmp_cpu.data<std::complex<double>>()[in + j].imag() << "i ";`
`253`	`261`	`}`
`254`	`262`	`ofs_running << std::endl;`
`255`	`263`	`}`