will-maclean
diff --git a/‎examples/dqn_cartpole.rs‎
Lines changed: 5 additions & 5 deletions b/‎examples/dqn_cartpole.rs‎
Lines changed: 5 additions & 5 deletions
diff --git a/‎examples/dqn_gridworld.rs‎
Lines changed: 21 additions & 9 deletions b/‎examples/dqn_gridworld.rs‎
Lines changed: 21 additions & 9 deletions
diff --git a/‎examples/dqn_mountaincar.rs‎
Lines changed: 21 additions & 9 deletions b/‎examples/dqn_mountaincar.rs‎
Lines changed: 21 additions & 9 deletions
diff --git a/‎examples/dqn_probe1.rs‎
Lines changed: 22 additions & 9 deletions b/‎examples/dqn_probe1.rs‎
Lines changed: 22 additions & 9 deletions
diff --git a/‎examples/dqn_probe2.rs‎
Lines changed: 24 additions & 9 deletions b/‎examples/dqn_probe2.rs‎
Lines changed: 24 additions & 9 deletions
diff --git a/‎examples/dqn_probe3.rs‎
Lines changed: 22 additions & 9 deletions b/‎examples/dqn_probe3.rs‎
Lines changed: 22 additions & 9 deletions
diff --git a/‎examples/dqn_probe4.rs‎
Lines changed: 21 additions & 9 deletions b/‎examples/dqn_probe4.rs‎
Lines changed: 21 additions & 9 deletions
@@ -23,9 +23,9 @@ use burn::backend::Wgpu;
 use burn::backend::{LibTorch, LibTorchDevice};
 
 #[cfg(not(feature = "tch"))]
-type TrainDevice = Autodiff<Wgpu>;
+type B = Autodiff<Wgpu>;
 #[cfg(feature = "tch")]
-type TrainDevice = Autodiff<LibTorch>;
+type B = Autodiff<LibTorch>;
 
 extern crate sb3_burn;
 
@@ -34,7 +34,7 @@ fn main() {
     // https://github.com/DLR-RM/rl-baselines3-zoo/blob/master/hyperparams/dqn.yml
 
     #[cfg(feature = "tch")]
-    let train_device = if has_cuda() {
+    let train_device = if tch::utils::has_cuda()() {
         LibTorchDevice::Cuda(0)
     } else {
         LibTorchDevice::Cpu
@@ -43,7 +43,7 @@ fn main() {
     #[cfg(not(feature = "tch"))]
     let train_device = WgpuDevice::default();
 
-    sb3_seed::<TrainDevice>(1234, &train_device);
+    sb3_seed::<B>(1234, &train_device);
 
     let config_optimizer =
         AdamConfig::new().with_grad_clipping(Some(GradientClippingConfig::Norm(10.0)));
@@ -63,7 +63,7 @@ fn main() {
         .with_train_every(256);
 
     let env = CartpoleEnv::new(500);
-    let q: LinearAdvDQNNet<TrainDevice> = LinearAdvDQNNet::init(
+    let q: LinearAdvDQNNet<B> = LinearAdvDQNNet::init(
         &train_device,
         env.observation_space().shape().len(),
         env.action_space().shape(),
 
@@ -1,10 +1,6 @@
 use std::path::PathBuf;
 
-use burn::{
-    backend::{libtorch::LibTorchDevice, Autodiff, LibTorch},
-    grad_clipping::GradientClippingConfig,
-    optim::AdamConfig,
-};
+use burn::{backend::Autodiff, grad_clipping::GradientClippingConfig, optim::AdamConfig};
 use sb3_burn::{
     common::{
         algorithm::{OfflineAlgParams, OfflineTrainer},
@@ -17,17 +13,33 @@ use sb3_burn::{
     env::{base::Env, gridworld::GridWorldEnv},
 };
 
+#[cfg(not(feature = "tch"))]
+use burn::backend::{wgpu::WgpuDevice, Wgpu};
+#[cfg(feature = "tch")]
+use burn::backend::{LibTorch, LibTorchDevice};
+
+#[cfg(not(feature = "tch"))]
+type B = Autodiff<Wgpu>;
+#[cfg(feature = "tch")]
+type B = Autodiff<LibTorch>;
+
 extern crate sb3_burn;
 
 fn main() {
     // Using parameters from:
     // https://github.com/DLR-RM/rl-baselines3-zoo/blob/master/hyperparams/dqn.yml
 
-    type TrainingBacked = Autodiff<LibTorch>;
+    #[cfg(feature = "tch")]
+    let train_device = if tch::utils::has_cuda()() {
+        LibTorchDevice::Cuda(0)
+    } else {
+        LibTorchDevice::Cpu
+    };
 
-    let train_device = LibTorchDevice::Cuda(0);
+    #[cfg(not(feature = "tch"))]
+    let train_device = WgpuDevice::default();
 
-    sb3_seed::<TrainingBacked>(1234, &train_device);
+    sb3_seed::<B>(1234, &train_device);
 
     let config_optimizer =
         AdamConfig::new().with_grad_clipping(Some(GradientClippingConfig::Norm(10.0)));
@@ -40,7 +52,7 @@ fn main() {
         .with_lr(1e-3);
 
     let env = GridWorldEnv::default();
-    let q = LinearAdvDQNNet::<TrainingBacked>::init(
+    let q = LinearAdvDQNNet::<B>::init(
         &train_device,
         env.observation_space().shape().len(),
         env.action_space().shape(),
 
@@ -1,10 +1,6 @@
 use std::path::PathBuf;
 
-use burn::{
-    backend::{libtorch::LibTorchDevice, Autodiff, LibTorch},
-    grad_clipping::GradientClippingConfig,
-    optim::AdamConfig,
-};
+use burn::{backend::Autodiff, grad_clipping::GradientClippingConfig, optim::AdamConfig};
 use sb3_burn::{
     common::{
         algorithm::{OfflineAlgParams, OfflineTrainer},
@@ -17,17 +13,33 @@ use sb3_burn::{
     env::{base::Env, classic_control::mountain_car::MountainCarEnv},
 };
 
+#[cfg(not(feature = "tch"))]
+use burn::backend::{wgpu::WgpuDevice, Wgpu};
+#[cfg(feature = "tch")]
+use burn::backend::{LibTorch, LibTorchDevice};
+
+#[cfg(not(feature = "tch"))]
+type B = Autodiff<Wgpu>;
+#[cfg(feature = "tch")]
+type B = Autodiff<LibTorch>;
+
 extern crate sb3_burn;
 
 fn main() {
     // Using parameters from:
     // https://github.com/DLR-RM/rl-baselines3-zoo/blob/master/hyperparams/dqn.yml
 
-    type TrainingBacked = Autodiff<LibTorch>;
+    #[cfg(feature = "tch")]
+    let train_device = if tch::utils::has_cuda()() {
+        LibTorchDevice::Cuda(0)
+    } else {
+        LibTorchDevice::Cpu
+    };
 
-    let train_device = LibTorchDevice::Cuda(0);
+    #[cfg(not(feature = "tch"))]
+    let train_device = WgpuDevice::default();
 
-    sb3_seed::<TrainingBacked>(1234, &train_device);
+    sb3_seed::<B>(1234, &train_device);
 
     let config_optimizer =
         AdamConfig::new().with_grad_clipping(Some(GradientClippingConfig::Norm(10.0)));
@@ -46,7 +58,7 @@ fn main() {
         .with_train_every(16);
 
     let env = MountainCarEnv::default();
-    let q = LinearAdvDQNNet::<TrainingBacked>::init(
+    let q = LinearAdvDQNNet::<B>::init(
         &train_device,
         env.observation_space().shape().len(),
         env.action_space().shape(),
 
@@ -1,10 +1,6 @@
 use std::path::PathBuf;
 
-use burn::{
-    backend::{libtorch::LibTorchDevice, Autodiff, LibTorch},
-    grad_clipping::GradientClippingConfig,
-    optim::AdamConfig,
-};
+use burn::{backend::Autodiff, grad_clipping::GradientClippingConfig, optim::AdamConfig};
 use sb3_burn::{
     common::{
         algorithm::{OfflineAlgParams, OfflineTrainer},
@@ -17,16 +13,33 @@ use sb3_burn::{
     env::{base::Env, probe::ProbeEnvValueTest},
 };
 
+#[cfg(not(feature = "tch"))]
+use burn::backend::{wgpu::WgpuDevice, Wgpu};
+#[cfg(feature = "tch")]
+use burn::backend::{LibTorch, LibTorchDevice};
+
+#[cfg(not(feature = "tch"))]
+type B = Autodiff<Wgpu>;
+#[cfg(feature = "tch")]
+type B = Autodiff<LibTorch>;
+
 extern crate sb3_burn;
 
 fn main() {
     // Using parameters from:
     // https://github.com/DLR-RM/rl-baselines3-zoo/blob/master/hyperparams/dqn.yml
 
-    type TrainBackend = Autodiff<LibTorch>;
-    let train_device = LibTorchDevice::default();
+    #[cfg(feature = "tch")]
+    let train_device = if tch::utils::has_cuda()() {
+        LibTorchDevice::Cuda(0)
+    } else {
+        LibTorchDevice::Cpu
+    };
+
+    #[cfg(not(feature = "tch"))]
+    let train_device = WgpuDevice::default();
 
-    sb3_seed::<TrainBackend>(1234, &train_device);
+    sb3_seed::<B>(1234, &train_device);
 
     let config_optimizer =
         AdamConfig::new().with_grad_clipping(Some(GradientClippingConfig::Norm(10.0)));
@@ -42,7 +55,7 @@ fn main() {
         .with_evaluate_during_training(false);
 
     let env = ProbeEnvValueTest::default();
-    let q: LinearDQNNet<TrainBackend> = LinearDQNNet::init(
+    let q: LinearDQNNet<B> = LinearDQNNet::init(
         &train_device,
         env.observation_space().shape().len(),
         env.action_space().shape(),
 
@@ -1,10 +1,6 @@
 use std::path::PathBuf;
 
-use burn::{
-    backend::{libtorch::LibTorchDevice, Autodiff, LibTorch},
-    grad_clipping::GradientClippingConfig,
-    optim::AdamConfig,
-};
+use burn::{backend::Autodiff, grad_clipping::GradientClippingConfig, optim::AdamConfig};
 use sb3_burn::{
     common::{
         algorithm::{OfflineAlgParams, OfflineTrainer},
@@ -17,14 +13,33 @@ use sb3_burn::{
     env::{base::Env, probe::ProbeEnvBackpropTest},
 };
 
+#[cfg(not(feature = "tch"))]
+use burn::backend::{wgpu::WgpuDevice, Wgpu};
+#[cfg(feature = "tch")]
+use burn::backend::{LibTorch, LibTorchDevice};
+
+#[cfg(not(feature = "tch"))]
+type B = Autodiff<Wgpu>;
+#[cfg(feature = "tch")]
+type B = Autodiff<LibTorch>;
+
 extern crate sb3_burn;
 
 fn main() {
     // Using parameters from:
     // https://github.com/DLR-RM/rl-baselines3-zoo/blob/master/hyperparams/dqn.yml
-    type TrainBackend = Autodiff<LibTorch>;
-    let train_device = LibTorchDevice::default();
-    sb3_seed::<TrainBackend>(1234, &train_device);
+
+    #[cfg(feature = "tch")]
+    let train_device = if tch::utils::has_cuda()() {
+        LibTorchDevice::Cuda(0)
+    } else {
+        LibTorchDevice::Cpu
+    };
+
+    #[cfg(not(feature = "tch"))]
+    let train_device = WgpuDevice::default();
+
+    sb3_seed::<B>(1234, &train_device);
 
     let config_optimizer =
         AdamConfig::new().with_grad_clipping(Some(GradientClippingConfig::Norm(10.0)));
@@ -40,7 +55,7 @@ fn main() {
         .with_evaluate_during_training(false);
 
     let env = ProbeEnvBackpropTest::default();
-    let q: LinearDQNNet<TrainBackend> = LinearDQNNet::init(
+    let q: LinearDQNNet<B> = LinearDQNNet::init(
         &train_device,
         env.observation_space().shape(),
         env.action_space().shape(),
 
@@ -1,10 +1,6 @@
 use std::path::PathBuf;
 
-use burn::{
-    backend::{libtorch::LibTorchDevice, Autodiff, LibTorch},
-    grad_clipping::GradientClippingConfig,
-    optim::AdamConfig,
-};
+use burn::{backend::Autodiff, grad_clipping::GradientClippingConfig, optim::AdamConfig};
 use sb3_burn::{
     common::{
         algorithm::{OfflineAlgParams, OfflineTrainer},
@@ -17,16 +13,33 @@ use sb3_burn::{
     env::{base::Env, probe::ProbeEnvDiscountingTest},
 };
 
+#[cfg(not(feature = "tch"))]
+use burn::backend::{wgpu::WgpuDevice, Wgpu};
+#[cfg(feature = "tch")]
+use burn::backend::{LibTorch, LibTorchDevice};
+
+#[cfg(not(feature = "tch"))]
+type B = Autodiff<Wgpu>;
+#[cfg(feature = "tch")]
+type B = Autodiff<LibTorch>;
+
 extern crate sb3_burn;
 
 fn main() {
     // Using parameters from:
     // https://github.com/DLR-RM/rl-baselines3-zoo/blob/master/hyperparams/dqn.yml
 
-    type TrainingBacked = Autodiff<LibTorch>;
+    #[cfg(feature = "tch")]
+    let train_device = if tch::utils::has_cuda()() {
+        LibTorchDevice::Cuda(0)
+    } else {
+        LibTorchDevice::Cpu
+    };
+
+    #[cfg(not(feature = "tch"))]
+    let train_device = WgpuDevice::default();
 
-    let train_device = LibTorchDevice::default();
-    sb3_seed::<TrainingBacked>(1234, &train_device);
+    sb3_seed::<B>(1234, &train_device);
 
     let config_optimizer =
         AdamConfig::new().with_grad_clipping(Some(GradientClippingConfig::Norm(10.0)));
@@ -42,7 +55,7 @@ fn main() {
         .with_evaluate_during_training(false);
 
     let env = ProbeEnvDiscountingTest::default();
-    let q = LinearAdvDQNNet::<TrainingBacked>::init(
+    let q = LinearAdvDQNNet::<B>::init(
         &train_device,
         env.observation_space().shape(),
         env.action_space().shape(),
 
@@ -1,10 +1,6 @@
 use std::path::PathBuf;
 
-use burn::{
-    backend::{libtorch::LibTorchDevice, Autodiff, LibTorch},
-    grad_clipping::GradientClippingConfig,
-    optim::AdamConfig,
-};
+use burn::{backend::Autodiff, grad_clipping::GradientClippingConfig, optim::AdamConfig};
 use sb3_burn::{
     common::{
         algorithm::{OfflineAlgParams, OfflineTrainer},
@@ -17,17 +13,33 @@ use sb3_burn::{
     env::{base::Env, probe::ProbeEnvActionTest},
 };
 
+#[cfg(not(feature = "tch"))]
+use burn::backend::{wgpu::WgpuDevice, Wgpu};
+#[cfg(feature = "tch")]
+use burn::backend::{LibTorch, LibTorchDevice};
+
+#[cfg(not(feature = "tch"))]
+type B = Autodiff<Wgpu>;
+#[cfg(feature = "tch")]
+type B = Autodiff<LibTorch>;
+
 extern crate sb3_burn;
 
 fn main() {
     // Using parameters from:
     // https://github.com/DLR-RM/rl-baselines3-zoo/blob/master/hyperparams/dqn.yml
 
-    type TrainingBacked = Autodiff<LibTorch>;
+    #[cfg(feature = "tch")]
+    let train_device = if tch::utils::has_cuda()() {
+        LibTorchDevice::Cuda(0)
+    } else {
+        LibTorchDevice::Cpu
+    };
 
-    let train_device = LibTorchDevice::default();
+    #[cfg(not(feature = "tch"))]
+    let train_device = WgpuDevice::default();
 
-    sb3_seed::<TrainingBacked>(1234, &train_device);
+    sb3_seed::<B>(1234, &train_device);
 
     let config_optimizer =
         AdamConfig::new().with_grad_clipping(Some(GradientClippingConfig::Norm(10.0)));
@@ -43,7 +55,7 @@ fn main() {
         .with_evaluate_during_training(false);
 
     let env = ProbeEnvActionTest::default();
-    let q = LinearAdvDQNNet::<TrainingBacked>::init(
+    let q = LinearAdvDQNNet::<B>::init(
         &train_device,
         env.observation_space().shape(),
         env.action_space().shape(),