Got Power method right, but no options not correct

jajhall · jajhall · commit 0140a4c40969 · 2025-08-28T00:01:03.000+01:00
diff --git a/check/TestPdlp.cpp b/check/TestPdlp.cpp
@@ -331,17 +331,26 @@ TEST_CASE("pdlp-restart-add-row", "[pdlp]") {
 }
 
 TEST_CASE("hi-pdlp", "[pdlp]") {
-  std::string model = "adlittle";//"avgas";
+  std::string model = "avgas";//"adlittle";//"afiro";//
   std::string model_file =
       std::string(HIGHS_DIR) + "/check/instances/" + model + ".mps";
   Highs h;
   //  h.setOptionValue("output_flag", dev_run);
   REQUIRE(h.readModel(model_file) == HighsStatus::kOk);
   h.setOptionValue("solver", kHiPdlpString);
   h.setOptionValue("kkt_tolerance", kkt_tolerance);
-  h.setOptionValue("pdlp_iteration_limit", 10000);
-  h.setOptionValue("log_dev_level", kHighsLogDevLevelVerbose);
+  h.setOptionValue("pdlp_scaling_mode", 0);
+  h.setOptionValue("pdlp_restart_strategy", 0);
+  h.setOptionValue("pdlp_step_size_strategy", 0);
+  //  h.setOptionValue("pdlp_iteration_limit", 10000);
+  //  h.setOptionValue("log_dev_level", kHighsLogDevLevelVerbose);
   HighsStatus run_status = h.run();
   //  REQUIRE(run_status == HighsStatus::kOk);
   //  REQUIRE(h.getModelStatus() == HighsModelStatus::kOptimal);
+  const bool cupdlp_test = false;
+  if (cupdlp_test) {
+    h.setOptionValue("solver", kCuPdlpString);
+    h.setOptionValue("pdlp_features_off", kPdlpAllFeaturesOff);
+    run_status = h.run();
+  }
 }
diff --git a/highs/pdlp/cupdlp/cupdlp_step.c b/highs/pdlp/cupdlp/cupdlp_step.c
@@ -77,6 +77,8 @@ cupdlp_retcode PDHG_Power_Method(CUPDLPwork *work, cupdlp_float *lambda) {
   if (work->settings->nLogLevel>0) 
     cupdlp_printf("Power Method:\n");
 
+  // work->buffer is a CUPDLPvec*, but a pointer to its values is
+  // needed for some linalg calls
   cupdlp_float *q = work->buffer->data;
 
   cupdlp_initvec(q, 1.0, lp->nRows);
@@ -86,9 +88,24 @@ cupdlp_retcode PDHG_Power_Method(CUPDLPwork *work, cupdlp_float *lambda) {
   CUPDLPvec *aty = iterates->aty[iter % 2];
 
   double res = 0.0;
+  double previous_lambda = 0.0;
+  // q is stored in work->buffer->data
+  //
+  // z is stored in ax->data
+  //
+  // y is stored in aty->data
+  //
+  int log_iters = work->settings->nLogLevel > 0;
+  log_iters = 1;
+
+  if (log_iters)
+    cupdlp_printf("It       lambda   dl_lambda    residual\n");
   for (cupdlp_int iter = 0; iter < 20; ++iter) {
     // z = A*A'*q
+    //
+    // as y = A'q...
     ATy(work, aty, work->buffer);
+    // ... then z = Ay
     Ax(work, ax, aty);
 
     // q = z / norm(z)
@@ -97,17 +114,30 @@ cupdlp_retcode PDHG_Power_Method(CUPDLPwork *work, cupdlp_float *lambda) {
     cupdlp_twoNorm(work, lp->nRows, q, &qNorm);
     cupdlp_scaleVector(work, 1.0 / qNorm, q, lp->nRows);
 
+    // Now compute the Rayleigh quotient of q which, since q'q=1 is
+    //
+    // lambda = q'AA'q = w^Tw = ||w||_2
+    //
+    // where w = A'q
+    //
+    // aty is no longer needed, so w is stored in aty->data
     ATy(work, aty, work->buffer);
-
     cupdlp_twoNormSquared(work, lp->nCols, aty->data, lambda);
 
     cupdlp_float alpha = -(*lambda);
+    // Now compute the residual between z = A*A'*q (old q) and
+    // lambda.q (new q) to just to log progress
+    //
+    // z := z - lambda.q
     cupdlp_axpy(work, lp->nRows, &alpha, q, ax->data);
 
     cupdlp_twoNormSquared(work, lp->nCols, ax->data, &res);
 
-     if (work->settings->nLogLevel>0) 
-      cupdlp_printf("% d  %e  %.3f\n", iter, *lambda, res);
+    double dl_lambda = fabs(*lambda - previous_lambda);
+    previous_lambda = *lambda;
+
+    if (log_iters)
+      cupdlp_printf("%2d %12.6g %11.4g %11.4g\n", iter, *lambda, dl_lambda, res);
   }
 
 exit_cleanup:
@@ -424,4 +454,4 @@ cupdlp_retcode PDHG_Update_Iterate(CUPDLPwork *pdhg) {
 
 exit_cleanup:
   return RETCODE_OK;
-}
+}
diff --git a/highs/pdlp/hipdlp/logger.hpp b/highs/pdlp/hipdlp/logger.hpp
@@ -39,7 +39,7 @@ class Logger {
 public:
     Logger(LogLevel level = LogLevel::kInfo);
     void set_log_file(const std::string& filename);
-
+    LogLevel getLogLevel() const { return console_level_; }
     // Logging methods for different levels
     void info(const std::string& message);
     void verbose(const std::string& message);
diff --git a/highs/pdlp/hipdlp/pdhg.cc b/highs/pdlp/hipdlp/pdhg.cc
@@ -792,40 +792,118 @@ HighsStatus PDLPSolver::PowerMethod(HighsLp &lp, double& op_norm_sq) {
     const double tol = 1e-6;
 
     // Initialize a random vector x
-    std::vector<double> x(lp.num_col_);
+    std::vector<double> x_vec(lp.num_col_);
     std::random_device rd;
     std::mt19937 engine_fixed_seed(12345); //gen(rd());
     std::uniform_real_distribution<> dis(-1.0, 1.0);
     for (HighsInt i = 0; i < lp.num_col_; ++i) {
-        x[i] = dis(engine_fixed_seed);
+        x_vec[i] = dis(engine_fixed_seed);
     }
-    linalg::normalize(x); // Assumes a normalize function in linalg
+    linalg::normalize(x_vec); // Assumes a normalize function in linalg
 
+    const HighsInt kYanyuPowerMethod = 0;
+    const HighsInt kATAPowerMethod = 1;
+    const HighsInt kCuPdlpAATPowerMethod = 2;
+    
+    const HighsInt power_method = kCuPdlpAATPowerMethod;
     // Allocate memory for matrix-vector products
-    std::vector<double> Ax_vec(lp.num_row_);
-    std::vector<double> ATAx_vec(lp.num_col_);
+    std::vector<double> y_vec;
+    std::vector<double> z_vec;
+    if (power_method < kCuPdlpAATPowerMethod) {
+      y_vec.resize(lp.num_row_);
+      z_vec.resize(lp.num_col_);
+    } else {
+      y_vec.resize(lp.num_col_);
+      z_vec.resize(lp.num_row_);
+    }
     
     double op_norm_sq_old = 0.0;
+    LogLevel log_level = logger_.getLogLevel();
+    int log_iters = log_level == LogLevel::kVerbose || log_level == LogLevel::kDebug;
+    log_iters = 1;
+
+    if (log_iters) printf("It       lambda   dl_lambda\n");
 
+    if (power_method == kATAPowerMethod) {
+      x_vec.assign(lp.num_col_, 1);
+    } else if (power_method == kCuPdlpAATPowerMethod) {
+      x_vec.assign(lp.num_row_, 1);
+    }
+    const HighsSparseMatrix& matrix = lp.a_matrix_;
+    double lambda = 0.0;
+    double previous_lambda = lambda;
     for (int iter = 0; iter < max_iter; ++iter) {
+      if (power_method == kYanyuPowerMethod) {
+	// Original Yanyu power method
+	//
         // Compute ATAx = A^T * (A * x)
-        linalg::Ax(lp, x, Ax_vec);
-        linalg::ATy(lp, Ax_vec, ATAx_vec); // Note: ATy computes A^T * vector
+        linalg::Ax(lp, x_vec, y_vec);
+        linalg::ATy(lp, y_vec, z_vec); // Note: ATy computes A^T * vector
 
         // Estimate the squared operator norm (largest eigenvalue of A^T*A)
-        op_norm_sq = linalg::dot(x, ATAx_vec); // Assumes a dot product function in linalg
+        op_norm_sq = linalg::dot(x_vec, z_vec); // Assumes a dot product function in linalg
         
         // Check for convergence
         if (std::abs(op_norm_sq - op_norm_sq_old) < tol * op_norm_sq) {
             return HighsStatus::kOk;
         }
+	double dl_op_norm_sq = std::fabs(op_norm_sq - op_norm_sq_old);
         op_norm_sq_old = op_norm_sq;
 
         // Prepare for the next iteration
-        linalg::normalize(ATAx_vec); // Normalize the result
-        x = ATAx_vec;
-    }
-
+        linalg::normalize(z_vec); // Normalize the result
+        x_vec = z_vec;
+	if (log_iters) printf("%2d %12.6g %11.4g\n", iter, op_norm_sq, dl_op_norm_sq);
+      } else {
+	if (power_method == kATAPowerMethod) {
+	  // Yanyu power method corrected - with Rayleigh quotient
+	  //
+	  // Compute z = ATAx = A^T * (A * x)
+	  matrix.product(y_vec, x_vec);
+	  matrix.productTranspose(z_vec, y_vec);
+	  // q = z / norm(z)
+	  double z_norm = std::sqrt(linalg::dot(z_vec, z_vec));
+	  double denom = 1.0 / z_norm;
+	  for (HighsInt iCol = 0; iCol < lp.num_col_; iCol++)
+	    z_vec[iCol] *= denom;
+	  // Now compute the Rayleigh quotient of q which, since q'q=1 is
+	  //
+	  // lambda = q'A'Aq = w^Tw = ||w||_2
+	  //
+	  // where w = Aq
+	  //
+	  // y_vec is no longer needed, so w is stored in it
+	  matrix.product(y_vec, z_vec);
+	  lambda = linalg::dot(y_vec, y_vec);
+	} else {
+	  // cuPDLP-C power method
+	  //
+	  // Compute z = AA^Tx = A * (A^T * x)
+	  matrix.productTranspose(y_vec, x_vec);
+	  matrix.product(z_vec, y_vec);
+	  // q = z / norm(z)
+	  double z_norm = std::sqrt(linalg::dot(z_vec, z_vec));
+	  double denom = 1.0 / z_norm;
+	  for (HighsInt iRow = 0; iRow < lp.num_row_; iRow++)
+	    z_vec[iRow] *= denom;
+	  // Now compute the Rayleigh quotient of q which, since q'q=1 is
+	  //
+	  // lambda = q'AA'q = w^Tw = ||w||_2
+	  //
+	  // where w = A'q
+	  //
+	  // y_vec is no longer needed, so w is stored in it
+	  matrix.productTranspose(y_vec, z_vec);
+	  lambda = linalg::dot(y_vec, y_vec);
+	}
+	double dl_lambda = std::fabs(lambda - previous_lambda);
+        previous_lambda = lambda;
+
+	x_vec = z_vec;
+	if (log_iters) printf("%2d %12.6g %11.4g\n", iter, lambda, dl_lambda);
+      }
+    }
+    if (power_method != kYanyuPowerMethod) op_norm_sq = lambda;
     // If the method did not converge within max_iter
     return HighsStatus::kWarning;
 }