distribution matching

xzhang2523-c · xzhang2523-c · commit 86bef58be095 · 2025-03-26T20:52:33.000+08:00
diff --git a/libmoon/gan_tester/mooGAN.py b/libmoon/gan_tester/mooGAN.py
@@ -6,14 +6,12 @@
 import os
 import numpy as np
 
-
 def plot_figure(folder_name, generated_samples, sample1, sample2, pref):
     plt.scatter(generated_samples[:, 0], generated_samples[:, 1], label='Generated', s=50)
     plt.scatter(sample1[:, 0], sample1[:, 1], label='Sample 1', s=25, alpha=0.5)
     plt.scatter(sample2[:, 0], sample2[:, 1], label='Sample 2', s=25, alpha=0.5)
     if abs(pref[0]) < 1e-6:
         plt.legend(fontsize=20, loc='lower right')
-
     plt.xlabel('$X_1$', fontsize=25)
     plt.ylabel('$X_2$', fontsize=25)
     plt.xticks(fontsize=20)
diff --git a/libmoon/gan_tester/prefgan.py b/libmoon/gan_tester/prefgan.py
@@ -7,6 +7,8 @@
 import numpy as np
 from torch.distributions.dirichlet import Dirichlet
 
+
+
 def plot_figure(folder_name, generated_samples, sample1, sample2, pref):
     plt.scatter(generated_samples[:, 0], generated_samples[:, 1], label='Generated', s=50)
     plt.scatter(sample1[:, 0], sample1[:, 1], label='Sample 1', s=25, alpha=0.5)
diff --git a/libmoon/model/policy_model.py b/libmoon/model/policy_model.py
@@ -1,10 +1,8 @@
 import torch
 from torch import nn
-
 import torch
 import torch.nn as nn
 
-
 class Policy(nn.Module):
     def __init__(self, state_space, action_space):
         super(Policy, self).__init__()
@@ -27,7 +25,6 @@ def forward(self, state, stochastic=True):
 
         # Convert logits to probabilities using a softmax function
         probabilities = torch.softmax(logits, dim=-1)
-
         if stochastic:
             # Sample an action according to the action probabilities
             action = torch.multinomial(probabilities, num_samples=1)
diff --git a/libmoon/model/simple.py b/libmoon/model/simple.py
@@ -1,7 +1,6 @@
 import torch
 from torch import nn
 
-
 class SimplePSLModel(nn.Module):
     def __init__(self, problem):
         super().__init__()
@@ -45,8 +44,6 @@ def forward(self, pref):
             return mid
 
 
-
-
 class PFLModel(nn.Module):
     def __init__(self, n_obj):
         super(PFLModel, self).__init__()
diff --git a/libmoon/problem/synthetic/distribution.py b/libmoon/problem/synthetic/distribution.py
@@ -12,24 +12,30 @@ def __init__(self, mu_arr=None, Sigma_arr=None):
         self.n_var = len(self.mu_arr[0])
         self.problem_name = "MOKL"
 
-    def _evaluate_torch(self, prefs: torch.Tensor):
+
+    def _evaluate_torch(self, prefs_arr: torch.Tensor):
         # prefs are the coefficients.
-        mu_arr_arr = [p * mu for p, mu in zip(prefs, self.mu_arr)]
-        Sigma_arr_arr = [p * Sigma for p, Sigma in zip(prefs, self.Sigma_arr)]
-        mu = torch.sum( torch.stack(mu_arr_arr), axis=0)
-        Sigma = torch.sum( torch.stack(Sigma_arr_arr), axis=0)
-
-        f_arr = []
-        for obj_idx in range(self.n_obj):
-            mu_i = self.mu_arr[obj_idx]
-            Sigma_i = self.Sigma_arr[obj_idx]
-
-            term1 = torch.log(torch.det(Sigma_i)) - torch.log(torch.det(Sigma_i))
-            term2 = (mu - mu_i) @ torch.inverse(Sigma_i) @ (mu - mu_i)
-            term3 = torch.trace(torch.inverse(Sigma_i) @ Sigma)
-            fi = 0.5 * (term1 + term2 + term3 - self.n_var)
-            f_arr.append(fi)
-        return torch.stack(f_arr)
+        f_arr_all = []
+        for prefs in prefs_arr:
+            Sigma_inverse_arr_arr = [p * torch.inverse(Sigma_) for p, Sigma_ in zip(prefs, self.Sigma_arr)]
+            Sigma = torch.inverse(torch.sum( torch.stack(Sigma_inverse_arr_arr), axis=0))
+
+            mu_arr_arr = [p * torch.inverse(Sigma_) @ mu
+                          for p, mu, Sigma_ in zip(prefs, self.mu_arr, self.Sigma_arr)]
+            mu = Sigma @ torch.sum( torch.stack(mu_arr_arr), axis=0)
+            f_arr = []
+
+            for obj_idx in range(self.n_obj):
+                mu_i = self.mu_arr[obj_idx]
+                Sigma_i = self.Sigma_arr[obj_idx]
+                term1 = torch.log(torch.det(Sigma_i)) - torch.log(torch.det(Sigma))
+                term2 = (mu - mu_i) @ torch.inverse(Sigma_i) @ (mu - mu_i)
+                term3 = torch.trace(torch.inverse(Sigma_i) @ Sigma)
+                fi = 0.5 * (term1 + term2 + term3 - self.n_var)
+                f_arr.append(fi)
+            f_arr = torch.stack(f_arr)
+            f_arr_all.append(f_arr)
+        return torch.stack(f_arr_all)
 
 
 if __name__ == '__main__':
diff --git a/libmoon/problem/synthetic/re_problem.py b/libmoon/problem/synthetic/re_problem.py
@@ -4,6 +4,7 @@
 from libmoon.problem.synthetic.mop import BaseMOP
 from numpy import array
 
+
 class RE21(BaseMOP):
     def __init__(self, n_var=4, n_obj=2, lbound=np.zeros(4), ubound=np.ones(4)):
         self.problem_name = 'RE21'
@@ -25,7 +26,6 @@ def __init__(self, n_var=4, n_obj=2, lbound=np.zeros(4), ubound=np.ones(4)):
 
     def _evaluate_numpy(self, x):
         n_sub = len(x)
-
         x1 = x[:,0]
         x2 = x[:,1]
         x3 = x[:,2]
diff --git a/libmoon/problem/synthetic/reinforcement.py b/libmoon/problem/synthetic/reinforcement.py
diff --git a/libmoon/solver/gradient/methods/__init__.py b/libmoon/solver/gradient/methods/__init__.py
@@ -1,27 +1,3 @@
-# from libmoon.solver.gradient.methods.base_solver import GradAggSolver
-# from libmoon.solver.gradient.methods.mgda_solver import MGDAUBSolver
-# from libmoon.solver.gradient.methods.gradhv import GradHVSolver
-# from libmoon.solver.gradient.methods.pmtl import PMTLSolver
-# from libmoon.solver.gradient.methods.epo_solver import EPOSolver
-# from libmoon.solver.gradient.methods.moosvgd import MOOSVGDSolver
-# from libmoon.solver.gradient.methods.pmgda_solver import PMGDASolver
-# from libmoon.solver.gradient.methods.uniform_solver import UniformSolver
-# from libmoon.solver.gradient.methods.core.core_solver_bk import CoreAgg, CoreMGDA, CoreEPO, CoreMOOSVGD, CoreHVGrad
-# def get_core_solver(args, pref=None):
-#     if args.solver == 'agg':
-#         return CoreAgg(pref=pref, agg_mtd=args.agg_mtd)
-#     elif args.solver == 'mgda':
-#         return CoreMGDA()
-#     elif args.solver == 'epo':
-#         return CoreEPO(pref=pref)
-#     elif args.solver == 'moosvgd':
-#         return CoreMOOSVGD(args=args)
-#     elif args.solver == 'hvgrad':
-#         return CoreHVGrad(args=args)
-#     else:
-#         assert False, 'not implemented'
-
-
 from libmoon.solver.gradient.methods.mgda_solver import MGDAUBSolver
 from libmoon.solver.gradient.methods.epo_solver import EPOSolver
 from libmoon.solver.gradient.methods.random_solver import RandomSolver
diff --git a/libmoon/solver/gradient/methods/base_solver.py b/libmoon/solver/gradient/methods/base_solver.py
@@ -12,6 +12,7 @@
 from libmoon.metrics.metrics import compute_lmin
 from torch import Tensor
 criterion = torch.nn.MSELoss()
+from tqdm import tqdm
 
 def umod_train_pfl_model(folder_name, update_idx, pfl_model, pfl_optimizer,
                     criterion, prefs, y, pfl_epoch=2000):
@@ -94,15 +95,19 @@ def solve(self, problem, x, prefs):
             self.pfl_optimizer = torch.optim.Adam(self.pfl_model.parameters(), lr=1e-3)
 
         self.n_prob, self.n_obj = prefs.shape[0], prefs.shape[1]
-
         xs_var = Variable(x, requires_grad=True)
         optimizer = Adam([xs_var], lr=self.step_size)
-        ind = HV( ref_point=get_hv_ref(problem.problem_name) )
+        ind = HV(ref_point=get_hv_ref(problem.problem_name))
         hv_arr, y_arr = [], []
+
         # For UMOD solver, we need to store (pref, y) pairs.
         pref_y_pairs = []
+        if self.verbose:
+            iteration_container = tqdm(range(self.epoch))
+        else:
+            iteration_container = range(self.epoch)
 
-        for epoch_idx in range(self.epoch):
+        for epoch_idx in iteration_container:
             fs_var = problem.evaluate(xs_var)
             y_np = fs_var.detach().numpy()
             y_arr.append(y_np)
@@ -134,10 +139,19 @@ def solve(self, problem, x, prefs):
                 torch.sum(alpha_array * fs_var).backward()
 
             optimizer.step()
+
+
+
             if 'lbound' in dir(problem):
                 x.data = torch.clamp(x.data, torch.Tensor(problem.lbound) + solution_eps,
                                      torch.Tensor(problem.ubound) - solution_eps)
 
+            if problem.problem_name in ['MOKL']:
+                x.data = torch.clamp(x.data, min=0)
+                x.data = x.data / torch.sum(x.data, dim=1, keepdim=True)
+            # print('x.data', x.data)
+            # assert False
+
             if self.solver_name == 'UMOD':
                 if epoch_idx % self.pfl_train_epoch == 0 and epoch_idx != 0:
                     pref_y_pairs.append((prefs, y_np))
diff --git a/libmoon/solver/gradient/methods/epo_solver.py b/libmoon/solver/gradient/methods/epo_solver.py
@@ -2,23 +2,17 @@
 import cvxpy as cp
 import cvxopt
 from libmoon.solver.gradient.methods.base_solver import GradBaseSolver
-from torch.autograd import Variable
-from tqdm import tqdm
 import torch
-from torch.optim import SGD
-from numpy import array
-from pymoo.indicators.hv import HV
 import warnings
 warnings.filterwarnings("ignore")
-from libmoon.util.constant import solution_eps, get_hv_ref
-from libmoon.util.gradient import get_moo_Jacobian
 from libmoon.problem.synthetic.zdt import ZDT1
 from matplotlib import pyplot as plt
 
 
-
 class EPO_LP(object):
-    # Paper: https://proceedings.mlr.press/v119/mahapatra20a.html, https://arxiv.org/abs/2010.06313
+    # Paper:
+    # https://proceedings.mlr.press/v119/mahapatra20a.html,
+    # https://arxiv.org/abs/2010.06313
     def __init__(self, m, n, r, eps=1e-4):
         cvxopt.glpk.options["msg_lev"] = "GLP_MSG_OFF"
         self.m = m
diff --git a/libmoon/solver/gradient/methods/gradhv_solver.py b/libmoon/solver/gradient/methods/gradhv_solver.py
@@ -77,23 +77,23 @@ def get_alpha_array(self, losses):
 
 
 class GradHVSolver(GradBaseSolver):
-    def __init__(self, prefs, step_size, n_epoch, tol, problem=None,problem_name=None,folder_name=None):
+    def __init__(self, prefs, step_size, n_epoch, tol, problem=None,
+                 problem_name=None, folder_name=None, verbose=False):
+        self.verbose = verbose
         self.folder_name = folder_name
         self.problem = problem
         if problem_name != None:
             self.problem_name = problem_name
         else:
             self.problem_name = problem.problem_name
-
         self.prefs = prefs
         self.solver_name = 'GradHV'
-
         self.core_solver = GradHVCore(n_obj=problem.n_obj, n_var=problem.n_var,
                                       problem_name=self.problem_name)
-
         super().__init__(step_size, n_epoch, tol, self.core_solver)
 
 
     def solve(self, x_init):
+        print(self.problem)
         res = super().solve(self.problem, x_init, self.prefs)
         return res
diff --git a/libmoon/solver/gradient/methods/readme.md b/libmoon/solver/gradient/methods/readme.md
diff --git a/libmoon/solver/gradient/methods/tester.py b/libmoon/solver/gradient/methods/tester.py
@@ -1,29 +1,59 @@
-from stack_data import Variable
-
 from gradhv_solver import GradHVSolver
+from epo_solver import EPOSolver
 from libmoon.problem.synthetic.distribution import MOKL
 import numpy as np
 from torch import Tensor
 import torch
-from torch.autograd import Variable
+import argparse
+from matplotlib import pyplot as plt
 
+from libmoon.util.constant import root_name
 
 if __name__ == '__main__':
-
+    parser = argparse.ArgumentParser()
+    parser.add_argument('--seed', type=int, default=0)
+    parser.add_argument('--n-obj', type=int, default=2)
+    parser.add_argument('--n-problem', type=int, default=5)
+    parser.add_argument('--n-epoch', type=int, default=6000)
+    parser.add_argument('--step-size', type=float, default=1e-4)
+    parser.add_argument('--solver-name', type=str, default='hvmax')
+    args = parser.parse_args()
     problem_name = "MOKL"
     mu_arr = [Tensor([1, 2]), Tensor([2, 3])]
     Sigma_arr = [Tensor(np.array([[1, 0.5], [0.5, 1]])),
                  Tensor(np.array([[1, 0], [0, 1]]))]
-
     problem = MOKL(mu_arr, Sigma_arr)
-    n_obj = 2
-    n_problems = 10
-    prefs = torch.randn(n_problems, n_obj)
-    solver = GradHVSolver(prefs=prefs, step_size=1e-3, n_epoch=100,
-                          tol=1e-4, problem_name=problem_name, problem=problem)
+    prefs = torch.randn(args.n_problem, args.n_obj)
 
-    x_init = Variable(torch.randn(2))
-    x_init = x_init / torch.sum(x_init)
+    if args.solver_name == 'hvmax':
+        solver = GradHVSolver(prefs=prefs, step_size=args.step_size, n_epoch=args.n_epoch,
+                              tol=1e-4, problem_name=problem_name, problem=problem, verbose=True)
+    else:
+        solver = EPOSolver(prefs=prefs, step_size=args.step_size, n_epoch=args.n_epoch,
+                              tol=1e-4, problem_name=problem_name, problem=problem, verbose=True)
+
+    x_init = torch.rand(args.n_problem, args.n_obj)
+    x_init = x_init / torch.sum(x_init, axis=1, keepdim=True)
+    print('Solving...')
     res = solver.solve( x_init )
-    print(res)
+    print('Solving over.')
+    print('res [x]', res['x'])
+    print('res [y]', res['y'])
+    plt.subplot(2, 1, 1)
+
+    if 'hv_history' in res:
+        plt.plot(range(len(res['hv_history'])),
+                 res['hv_history'])
+        plt.xticks(fontsize=16)
+        plt.yticks(fontsize=16)
+    else:
+        print("Warning: 'hv_history' not found in res")
 
+    plt.subplot(2, 1, 2)
+    if 'y' in res and isinstance(res['y'], (list, tuple, np.ndarray)) and len(res['y'].shape) == 2 and res['y'].shape[
+        1] >= 2:
+        plt.scatter(res['y'][:, 0], res['y'][:, 1])
+        plt.xticks(fontsize=16)
+        plt.yticks(fontsize=16)
+    else:
+        print("Warning: 'y' does not have the correct shape")
diff --git a/libmoon/solver/mobo/methods/base_psl_model.py b/libmoon/solver/mobo/methods/base_psl_model.py
@@ -1,12 +1,10 @@
 """
-A simple FC Pareto Set model.
+    A simple FC Pareto Set model.
 """
-
 import torch
 import torch.nn as nn
 torch.set_default_dtype(torch.float64)
 
-
 class ParetoSetModel(torch.nn.Module):
     def __init__(self, n_dim, n_obj):
         super(ParetoSetModel, self).__init__()
diff --git a/libmoon/solver/mobo/methods/base_solver_mobod.py b/libmoon/solver/mobo/methods/base_solver_mobod.py
@@ -6,10 +6,8 @@
     Computation, 28(2): 432-444, 2024.
 '''
 
-
 import numpy as np
 import torch 
-
 from pymoo.util.nds.non_dominated_sorting import NonDominatedSorting
 from pymoo.util.ref_dirs import get_reference_directions
 from libmoon.solver.mobo.utils.lhs import lhs