fix: use in pufferrl, missed in merge conflict

hysmio · hysmio · commit 46d598dabaa0 · 2025-11-23T01:08:17.000+11:00
diff --git a/pufferlib/pufferl.py b/pufferlib/pufferl.py
@@ -53,6 +53,7 @@
 # Assume advantage kernel has been built if torch has been compiled with CUDA or HIP support
 # and can find CUDA or HIP in the system
 ADVANTAGE_CUDA = bool(CUDA_HOME or ROCM_HOME)
+ADVANTAGE_MPS = bool(torch.backends.mps.is_available())
 
 class PuffeRL:
     def __init__(self, config, vecenv, policy, logger=None):
@@ -664,7 +665,8 @@ def compute_puff_advantage(values, rewards, terminals,
     compile the fast version.'''
 
     device = values.device
-    if not ADVANTAGE_CUDA:
+
+    if not ADVANTAGE_CUDA and not ADVANTAGE_MPS:
         values = values.cpu()
         rewards = rewards.cpu()
         terminals = terminals.cpu()
@@ -674,7 +676,7 @@ def compute_puff_advantage(values, rewards, terminals,
     torch.ops.pufferlib.compute_puff_advantage(values, rewards, terminals,
         ratio, advantages, gamma, gae_lambda, vtrace_rho_clip, vtrace_c_clip)
 
-    if not ADVANTAGE_CUDA:
+    if not ADVANTAGE_CUDA and not ADVANTAGE_MPS:
         return advantages.to(device)
 
     return advantages
@@ -1134,7 +1136,9 @@ def autotune(args=None, env_name=None, vecenv=None, policy=None):
  
 def load_env(env_name, args):
     package = args['package']
+    print("package", package)
     module_name = 'pufferlib.ocean' if package == 'ocean' else f'pufferlib.environments.{package}'
+    print("module_name", module_name)
     env_module = importlib.import_module(module_name)
     make_env = env_module.env_creator(env_name)
     return pufferlib.vector.make(make_env, env_kwargs=args['env'], **args['vec'])