Small fix in OMAR MAMuJoCo wrapper.

jcformanek · jcformanek · commit b89f793e695e · 2025-04-24T11:49:00.000+02:00
diff --git a/og_marl/wrapped_environments/mamujoco_omar.py b/og_marl/wrapped_environments/mamujoco_omar.py
@@ -39,7 +39,7 @@ def reset(self) -> ResetReturn:
         observations = self._environment.get_obs()
 
         observations = {
-            agent: observations[i].astype("float32") for i, agent in enumerate(self.possible_agents)
+            agent: observations[i].astype("float32") for i, agent in enumerate(self.agents)
         }
 
         info = {"state": self._environment.get_state()}
@@ -48,20 +48,20 @@ def reset(self) -> ResetReturn:
 
     def step(self, actions: Dict[str, np.ndarray]) -> StepReturn:
         mujoco_actions = []
-        for agent in self.possible_agents:
+        for agent in self.agents:
             mujoco_actions.append(actions[agent])
 
         reward, done, info = self._environment.step(mujoco_actions)
 
-        terminals = {agent: done for agent in self.possible_agents}
-        trunctations = {agent: False for agent in self.possible_agents}
+        terminals = {agent: done for agent in self.agents}
+        trunctations = {agent: False for agent in self.agents}
 
-        rewards = {agent: reward for agent in self.possible_agents}
+        rewards = {agent: reward for agent in self.agents}
 
         observations = self._environment.get_obs()
 
         observations = {
-            agent: observations[i].astype("float32") for i, agent in enumerate(self.possible_agents)
+            agent: observations[i].astype("float32") for i, agent in enumerate(self.agents)
         }
 
         info = {}