Basado en la metodología de Beavan et al. (2024) PNAS: "Contingency, repeatability, and predictability in the evolution of a prokaryotic pangenome"
Este pipeline implementa un flujo de trabajo para identificar patrones deterministas en la evolución del pangenoma bacteriano. Utilizando aprendizaje automático (Random Forest) y métodos comparativos filogenéticos (estadístico D de Fritz-Purvis), determina si los patrones de presencia/ausencia de genes son predecibles o si ocurren de manera aleatoria a través de la evolución de los genomas bacterianos.
Pasos a seguir para ejecutar el pipeline (v1.0):
Linux:
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.shgit clone https://github.com/vogonverse/pangenoma.git
cd pangenomaconda env create -f environment.yaml
conda activate pangenomagit fetch --tags
git checkout v1.0Dry run (verificar pipeline sin ejecutar):
snakemake -nEjecutar el pipeline completo:
snakemake --cores 40 results/database/network.db --use-conda --conda-frontend condaAjustar --cores según núcleos disponibles