GitHub - isaprykin/mario-rl: Implementation of a DQN for Mario that I started on a plane ride once.

isaprykin / mario-rl Public

Notifications You must be signed in to change notification settings
Fork 0
Star 0

Implementation of a DQN for Mario that I started on a plane ride once.

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
.gitattributes		.gitattributes
.gitignore		.gitignore
README		README
dqn_model.py		dqn_model.py
dqn_play.py		dqn_play.py
dqn_train.py		dqn_train.py
mario_dqn.ipynb		mario_dqn.ipynb
mario_env.py		mario_env.py
replay_buffer.py		replay_buffer.py

Repository files navigation

Mario RL (Double DQN)
=====================

This project trains a Double DQN agent to play Super Mario Bros using
frame-stacked observations and a target network. The original notebook
(`mario_dqn.ipynb`) is preserved for reference; the recommended workflow
is now script-based.

Requirements
------------
- Python 3.9+
- `tensorflow`, `gym-super-mario-bros`, `nes-py`
- `numpy<2.0` and `gym<0.26` (compatibility with `nes-py`/`gym-super-mario-bros`)
- A valid Super Mario Bros ROM as required by `gym-super-mario-bros`

Quick Start
-----------
Train (default settings):
```
python3 dqn_train.py --model-dir models/mario_dqn
```

Train faster with multiple environments (single process):
```
python3 dqn_train.py --model-dir models/mario_dqn --num-envs 4
```

Train faster with parallel environment workers:
```
python3 dqn_train.py --model-dir models/mario_dqn --parallel-envs 4
```

Delay learning until the replay buffer is prefetched:
```
python3 dqn_train.py --model-dir models/mario_dqn --prefetch-steps 10000
```

Resume training:
```
python3 dqn_train.py --model-dir models/mario_dqn --resume
```

Play a trained model:
```
python3 dqn_play.py --model-dir models/mario_dqn --render
```

Key Files
---------
- `dqn_train.py`: main training loop (Double DQN + prioritized replay)
- `dqn_play.py`: run a trained agent
- `mario_env.py`: environment creation + preprocessing (frame skip/stack)
- `replay_buffer.py`: prioritized replay buffer
- `dqn_model.py`: Q-network definition
- `mario_dqn.ipynb`: original notebook (legacy reference)

Notes
-----
- The default replay buffer size is conservative to avoid huge memory use.
  Increase `--replay-size` if you have more RAM.
- Models are saved as `model.keras` inside the directory passed via
  `--model-dir`, along with `training_state.json` and TensorBoard logs
  under `logs/`.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

isaprykin/mario-rl

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages