Dieses Repository enthält den begleitenden Code zu meiner Bachelorarbeit, in der ich verschiedene Bildgenerierungsmodelle — DP‑GAN, OASIS, Kolors und Stable Diffusion XL (SDXL) — auf dem Cityscapes‑Datensatz vergleiche.
Folge der offiziellen Anleitung, um das Kolors‑Inpainting‑Repository zu klonen und die passende Conda‑Umgebung anzulegen: https://github.com/Kwai-Kolors/Kolors/blob/master/inpainting/README.md
Alternativ kannst du das Modell direkt von Hugging Face laden: https://huggingface.co/Kwai-Kolors/Kolors-Inpainting
1. Repository klonen: https://github.com/sj-li/DP_GAN
2. Checkpoints herunterladen (ZIP) und in ./checkpoints/ entpacken. Die Struktur sollte danach so aussehen:
DP_GAN/
├── checkpoints/
│ └── dp_gan_cityscapes/
└── scripts/- Repository & Cityscapes‑Checkpoint: https://github.com/boschresearch/OASIS
conda create -n sdxl python=3.10
conda activate sdxl
pip install -r requirementsSDXL.txtZur Konvertierung und Aufteilung des Cityscapes‑Datensatzes nutze die Anweisungen aus SPADE: https://github.com/NVlabs/SPADE
Mit mask_generator.py erstellst du binäre Masken (Klasse car) und kopierst die zugehörigen RGB‑Bilder.
conda activate sdxl
python mask_generator.py \
--input_dir /datasets/cityscapes/val \
--output_dir ./outputs/val_masksDies legt folgende Ordner an:
outputs/val_masks/
├── images/<city>/*_leftImg8bit.png
└── masks/<city>/*_gtFine_binary.png
- Steps (Inpainting jedes Auto einzeln)
conda activate Kolors
python kolors_steps.py \
--input_dir ./outputs/val_masks \
--output_dir ./outputs/kolors_steps- Whole (Gesamtmaske in einem Schritt)
conda activate Kolors
python kolors_whole.py \
--input_dir ./outputs/val_masks \
--output_dir ./outputs/kolors_whole- Steps
conda activate sdxl
python sdxl_steps.py \
--input_dir ./outputs/val_masks \
--output_dir ./outputs/sdxl_steps- Whole
conda activate sdxl
python sdxl_whole.py \
--input_dir ./outputs/val_masks \
--output_dir ./outputs/sdxl_whole1. Folge der Originaldoku, um Bilder zu erzeugen: https://github.com/sj-li/DP_GAN 2. Merge mit Originalbildern & Masken:
python combineGANpics.py \
--ganpics /pfad/zu/dpgan_results \
--originalpics ./outputs/val_masks/images \
--masks ./outputs/val_masks/masks \
--output ./outputs/dpgan_merged1. Folge der Originaldoku, um Bilder zu erzeugen: https://github.com/boschresearch/OASIS 2. Merge‑Schritt analog zu DP‑GAN:
python combineGANpics.py \
--ganpics /pfad/zu/oasis_results \
--originalpics ./outputs/val_masks/images \
--masks ./outputs/val_masks/masks \
--output ./outputs/oasis_mergedFragen oder Probleme? → [email protected]