automl
diff --git a/‎carl/envs/gymnax/__init__.py‎
Lines changed: 7 additions & 7 deletions b/‎carl/envs/gymnax/__init__.py‎
Lines changed: 7 additions & 7 deletions
diff --git a/‎carl/envs/gymnax/carl_gymnax_env.py‎
Lines changed: 83 additions & 0 deletions b/‎carl/envs/gymnax/carl_gymnax_env.py‎
Lines changed: 83 additions & 0 deletions
diff --git a/‎carl/envs/gymnax/carl_jax_acrobot.py‎
Lines changed: 38 additions & 76 deletions b/‎carl/envs/gymnax/carl_jax_acrobot.py‎
Lines changed: 38 additions & 76 deletions
diff --git a/‎carl/envs/gymnax/carl_jax_cartpole.py‎
Lines changed: 22 additions & 65 deletions b/‎carl/envs/gymnax/carl_jax_cartpole.py‎
Lines changed: 22 additions & 65 deletions
@@ -13,19 +13,19 @@
 )
 from carl.envs.gymnax.carl_jax_cartpole import CARLJaxCartPoleEnv  # noqa: F401
 from carl.envs.gymnax.carl_jax_mountaincar import (  # noqa: F401
+    CONTEXT_BOUNDS as CARLJaxMountainCarContinuousEnv_bounds,
+)
+from carl.envs.gymnax.carl_jax_mountaincar import (
     CONTEXT_BOUNDS as CARLJaxMountainCarEnv_bounds,
 )
 from carl.envs.gymnax.carl_jax_mountaincar import (  # noqa: F401
+    DEFAULT_CONTEXT as CARLJaxMountainCarContinuousEnv_defaults,
+)
+from carl.envs.gymnax.carl_jax_mountaincar import (
     DEFAULT_CONTEXT as CARLJaxMountainCarEnv_defaults,
 )
 from carl.envs.gymnax.carl_jax_mountaincar import CARLJaxMountainCarEnv  # noqa: F401
-from carl.envs.gymnax.carl_jax_mountaincarcontinuous import (  # noqa: F401
-    CONTEXT_BOUNDS as CARLJaxMountainCarContinuousEnv_bounds,
-)
-from carl.envs.gymnax.carl_jax_mountaincarcontinuous import (  # noqa: F401
-    DEFAULT_CONTEXT as CARLJaxMountainCarContinuousEnv_defaults,
-)
-from carl.envs.gymnax.carl_jax_mountaincarcontinuous import (  # noqa: F401
+from carl.envs.gymnax.carl_jax_mountaincar import (  # noqa: F401
     CARLJaxMountainCarContinuousEnv,
 )
 from carl.envs.gymnax.carl_jax_pendulum import (  # noqa: F401
 
@@ -0,0 +1,83 @@
+from typing import Any, Dict, List, Optional, Union
+
+import gymnasium
+
+from carl.context.selection import AbstractSelector
+from carl.envs.carl_env import CARLEnv
+from carl.envs.gymnax.wrappers import make_gymnax_env
+from carl.utils.trial_logger import TrialLogger
+from carl.utils.types import Context, Contexts
+
+
+class CARLGymnaxEnv(CARLEnv):
+    env_name: str
+    DEFAULT_CONTEXT: Context
+    max_episode_steps: int
+
+    def __init__(
+        self,
+        env: gymnasium.Env | None = None,
+        contexts: Contexts = {},
+        hide_context: bool = True,
+        add_gaussian_noise_to_context: bool = False,
+        gaussian_noise_std_percentage: float = 0.01,
+        logger: Optional[TrialLogger] = None,
+        scale_context_features: str = "no",
+        default_context: Optional[Context] = None,
+        state_context_features: Optional[List[str]] = None,
+        context_mask: Optional[List[str]] = None,
+        dict_observation_space: bool = False,
+        context_selector: Optional[
+            Union[AbstractSelector, type[AbstractSelector]]
+        ] = None,
+        context_selector_kwargs: Optional[Dict] = None,
+    ):
+        """
+        Max torque is not a context feature because it changes the action space.
+
+        Parameters
+        ----------
+        env
+        contexts
+        instance_mode
+        hide_context
+        add_gaussian_noise_to_context
+        gaussian_noise_std_percentage
+        """
+        if env is None:
+            env = make_gymnax_env(env_name=self.env_name)
+
+        if not contexts:
+            contexts = {0: self.DEFAULT_CONTEXT}
+
+        if not default_context:
+            default_context = self.DEFAULT_CONTEXT
+
+        super().__init__(
+            env=env,
+            contexts=contexts,
+            hide_context=hide_context,
+            add_gaussian_noise_to_context=add_gaussian_noise_to_context,
+            gaussian_noise_std_percentage=gaussian_noise_std_percentage,
+            logger=logger,
+            scale_context_features=scale_context_features,
+            default_context=default_context,
+            max_episode_length=self.max_episode_steps,
+            state_context_features=state_context_features,
+            dict_observation_space=dict_observation_space,
+            context_selector=context_selector,
+            context_selector_kwargs=context_selector_kwargs,
+            context_mask=context_mask,
+        )
+        self.whitelist_gaussian_noise = list(
+            self.DEFAULT_CONTEXT.keys()
+        )  # allow to augment all values
+
+    def _update_context(self) -> None:
+        raise NotImplementedError
+
+    def __getattr__(self, name: str) -> Any:
+        if name in ["sys", "__getstate__"]:
+            return getattr(self.env._environment, name)
+        else:
+            return getattr(self, name)
@@ -1,13 +1,16 @@
+from __future__ import annotations
+
 from typing import Dict, List, Optional, Union
 
+import gymnasium
+import gymnax
 import jax.numpy as jnp
 import numpy as np
 from gymnax.environments.classic_control.acrobot import Acrobot
-from gymnax.environments.spaces import Space, gymnax_space_to_gym_space
-from gymnax.wrappers.gym import GymnaxToGymWrapper
 
 from carl.context.selection import AbstractSelector
 from carl.envs.carl_env import CARLEnv
+from carl.envs.gymnax.carl_gymnax_env import CARLGymnaxEnv
 from carl.utils.trial_logger import TrialLogger
 from carl.utils.types import Context, Contexts
 
@@ -16,11 +19,13 @@
     "link_length_2": 1,
     "link_mass_1": 1,
     "link_mass_2": 1,
-    "link_com_1": 0.5,
-    "link_com_2": 0.5,
+    "link_com_pos_1": 0.5,
+    "link_com_pos_2": 0.5,
     "link_moi": 1,
-    "max_velocity_1": 4 * jnp.pi,
-    "max_velocity_2": 9 * jnp.pi,
+    "max_vel_1": 4 * jnp.pi,
+    "max_vel_2": 9 * jnp.pi,
+    "torque_noise_max": 0.0,
+    "max_steps_in_episode": 500,
 }
 
 CONTEXT_BOUNDS = {
@@ -36,97 +41,54 @@
         float,
     ),  # Link mass can be shrunken and grown by a factor of 10
     "link_mass_2": (0.1, 10, float),
-    "link_com_1": (0, 1, float),  # Center of mass can move from one end to the other
-    "link_com_2": (0, 1, float),
+    "link_com_pos_1": (
+        0,
+        1,
+        float,
+    ),  # Center of mass can move from one end to the other
+    "link_com_pos_2": (0, 1, float),
     "link_moi": (
         0.1,
         10,
         float,
     ),  # Moments on inertia can be shrunken and grown by a factor of 10
-    "max_velocity_1": (
+    "max_vel_1": (
         0.4 * np.pi,
         40 * np.pi,
         float,
     ),  # Velocity can vary by a factor of 10 in either direction
-    "max_velocity_2": (0.9 * np.pi, 90 * np.pi, float),
+    "max_vel_2": (0.9 * np.pi, 90 * np.pi, float),
     "torque_noise_max": (
         -1.0,
         1.0,
         float,
     ),  # torque is either {-1., 0., 1}. Applying noise of 1. would be quite extreme
-    "initial_angle_lower": (-jnp.inf, jnp.inf, float),
-    "initial_angle_upper": (-jnp.inf, jnp.inf, float),
-    "initial_velocity_lower": (-jnp.inf, jnp.inf, float),
-    "initial_velocity_upper": (-jnp.inf, jnp.inf, float),
+    "max_steps_in_episode": (1, jnp.inf, int),
 }
 
 
-class CustomGymnaxToGymWrapper(GymnaxToGymWrapper):
-    @property
-    def observation_space(self) -> Dict:
-        return gymnax_space_to_gym_space(self._env.observation_space(self.env_params))
-
-    @observation_space.setter
-    def observation_space(self, value: Space) -> None:
-        self._observation_space = value
-
-
-class CARLJaxAcrobotEnv(CARLEnv):
-    def __init__(
-        self,
-        env: Acrobot = CustomGymnaxToGymWrapper(Acrobot()),
-        contexts: Contexts = {},
-        hide_context: bool = True,
-        add_gaussian_noise_to_context: bool = False,
-        gaussian_noise_std_percentage: float = 0.01,
-        logger: Optional[TrialLogger] = None,
-        scale_context_features: str = "no",
-        default_context: Optional[Context] = DEFAULT_CONTEXT,
-        max_episode_length: int = 500,  # from https://github.com/openai/gym/blob/master/gym/envs/__init__.py
-        state_context_features: Optional[List[str]] = None,
-        context_mask: Optional[List[str]] = None,
-        dict_observation_space: bool = False,
-        context_selector: Optional[
-            Union[AbstractSelector, type[AbstractSelector]]
-        ] = None,
-        context_selector_kwargs: Optional[Dict] = None,
-    ):
-        if not contexts:
-            contexts = {0: DEFAULT_CONTEXT}
-        super().__init__(
-            env=env,
-            contexts=contexts,
-            hide_context=hide_context,
-            add_gaussian_noise_to_context=add_gaussian_noise_to_context,
-            gaussian_noise_std_percentage=gaussian_noise_std_percentage,
-            logger=logger,
-            scale_context_features=scale_context_features,
-            default_context=default_context,
-            max_episode_length=max_episode_length,
-            state_context_features=state_context_features,
-            dict_observation_space=dict_observation_space,
-            context_selector=context_selector,
-            context_selector_kwargs=context_selector_kwargs,
-            context_mask=context_mask,
-        )
-        self.whitelist_gaussian_noise = list(
-            DEFAULT_CONTEXT.keys()
-        )  # allow to augment all values
+class CARLJaxAcrobotEnv(CARLGymnaxEnv):
+    env_name: str = "Acrobot-v1"
+    max_episode_steps: int = DEFAULT_CONTEXT["max_steps_in_episode"]
+    DEFAULT_CONTEXT: Context = DEFAULT_CONTEXT
 
     def _update_context(self) -> None:
-        self.env: Acrobot
-        self.env.LINK_LENGTH_1 = self.context["link_length_1"]
-        self.env.LINK_LENGTH_2 = self.context["link_length_2"]
-        self.env.LINK_MASS_1 = self.context["link_mass_1"]
-        self.env.LINK_MASS_2 = self.context["link_mass_2"]
-        self.env.LINK_COM_POS_1 = self.context["link_com_1"]
-        self.env.LINK_COM_POS_2 = self.context["link_com_2"]
-        self.env.LINK_MOI = self.context["link_moi"]
-        self.env.MAX_VEL_1 = self.context["max_velocity_1"]
-        self.env.MAX_VEL_2 = self.context["max_velocity_2"]
+        content = self.env.env.env_params.__dict__
+        content.update(self.context)
+        # We cannot directly set attributes of env_params because it is a frozen dataclass
+        self.env.env.env_params = gymnax.environments.classic_control.acrobot.EnvParams(
+            **content
+        )
 
         high = jnp.array(
-            [1.0, 1.0, 1.0, 1.0, self.env.MAX_VEL_1, self.env.MAX_VEL_2],
+            [
+                1.0,
+                1.0,
+                1.0,
+                1.0,
+                self.env.env.env_params.max_vel_1,
+                self.env.env.env_params.max_vel_2,
+            ],
             dtype=jnp.float32,
         )
         low = -high
 
@@ -1,13 +1,10 @@
-from typing import Dict, List, Optional, Union
+from __future__ import annotations
 
+import gymnax
 import jax.numpy as jnp
 from gymnax.environments.classic_control.cartpole import CartPole
-from gymnax.environments.spaces import Space, gymnax_space_to_gym_space
-from gymnax.wrappers.gym import GymnaxToGymWrapper
 
-from carl.context.selection import AbstractSelector
-from carl.envs.carl_env import CARLEnv
-from carl.utils.trial_logger import TrialLogger
+from carl.envs.gymnax.carl_gymnax_env import CARLGymnaxEnv
 from carl.utils.types import Context, Contexts
 
 DEFAULT_CONTEXT = {
@@ -17,6 +14,9 @@
     "length": 0.5,
     "force_mag": 10.0,
     "tau": 0.02,
+    "polemass_length": None,
+    "total_mass": None,
+    "max_steps_in_episode": 500,
 }
 
 CONTEXT_BOUNDS = {
@@ -26,75 +26,32 @@
     "length": (0.25, 1.0, float),
     "force_mag": (5.0, 15.0, float),
     "tau": (0.01, 0.05, float),
+    "polemass_length": (0, jnp.inf, float),
+    "total_mass": (0, jnp.inf, float),
+    "max_steps_in_episode": (1, jnp.inf, int),
 }
 
 
-class CustomGymnaxToGymWrapper(GymnaxToGymWrapper):
-    @property
-    def observation_space(self) -> Dict:
-        return gymnax_space_to_gym_space(self._env.observation_space(self.env_params))
+class CARLJaxCartPoleEnv(CARLGymnaxEnv):
+    env_name: str = "CartPole-v1"
+    max_episode_steps: int = DEFAULT_CONTEXT["max_steps_in_episode"]
+    DEFAULT_CONTEXT: Context = DEFAULT_CONTEXT
 
-    @observation_space.setter
-    def observation_space(self, value: Space) -> None:
-        self._observation_space = value
-
-
-class CARLJaxCartPoleEnv(CARLEnv):
-    def __init__(
-        self,
-        env: CartPole = CustomGymnaxToGymWrapper(CartPole()),
-        contexts: Contexts = {},
-        hide_context: bool = True,
-        add_gaussian_noise_to_context: bool = False,
-        gaussian_noise_std_percentage: float = 0.01,
-        logger: Optional[TrialLogger] = None,
-        scale_context_features: str = "no",
-        default_context: Optional[Context] = DEFAULT_CONTEXT,
-        max_episode_length: int = 500,  # from https://github.com/openai/gym/blob/master/gym/envs/__init__.py
-        state_context_features: Optional[List[str]] = None,
-        context_mask: Optional[List[str]] = None,
-        dict_observation_space: bool = False,
-        context_selector: Optional[
-            Union[AbstractSelector, type[AbstractSelector]]
-        ] = None,
-        context_selector_kwargs: Optional[Dict] = None,
-    ):
-        if not contexts:
-            contexts = {0: DEFAULT_CONTEXT}
-        super().__init__(
-            env=env,
-            contexts=contexts,
-            hide_context=hide_context,
-            add_gaussian_noise_to_context=add_gaussian_noise_to_context,
-            gaussian_noise_std_percentage=gaussian_noise_std_percentage,
-            logger=logger,
-            scale_context_features=scale_context_features,
-            default_context=default_context,
-            max_episode_length=max_episode_length,
-            state_context_features=state_context_features,
-            dict_observation_space=dict_observation_space,
-            context_selector=context_selector,
-            context_selector_kwargs=context_selector_kwargs,
-            context_mask=context_mask,
+    def _update_context(self) -> None:
+        self.context["polemass_length"] = (
+            self.context["masspole"] * self.context["length"]
         )
-        self.whitelist_gaussian_noise = list(
-            DEFAULT_CONTEXT.keys()
-        )  # allow to augment all values
+        self.context["total_mass"] = self.context["masscart"] + self.context["masspole"]
 
-    def _update_context(self) -> None:
-        self.env: CartPole
-        self.env.gravity = self.context["gravity"]
-        self.env.masscart = self.context["masscart"]
-        self.env.masspole = self.context["masspole"]
-        self.env.length = self.context["length"]
-        self.env.force_mag = self.context["force_mag"]
-        self.env.tau = self.context["tau"]
+        self.env.env.env_params = (
+            gymnax.environments.classic_control.cartpole.EnvParams(**self.context)
+        )
 
         high = jnp.array(
             [
-                self.env.x_threshold * 2,
+                self.env.env.env_params.x_threshold * 2,
                 jnp.finfo(jnp.float32).max,
-                self.env.theta_threshold_radians * 2,
+                self.env.env.env_params.theta_threshold_radians * 2,
                 jnp.finfo(jnp.float32).max,
             ],
             dtype=jnp.float32,