Instructora: Dra. Evelia Coss, Posdoc de la Dra. Alejandra Medina, LIIGH-UNAM
Clases para los alumnos de Ciencias Genomicas de 4to semestre de la ENES, Juriquilla (25 y 27 Febrero, 4 y 6 Marzo 2025). Formando parte de la clase de Bioinformática y Estadística 2.
El módulo consta de sesiones teóricas y prácticas impartidas de forma presencial, que cubrirán aspectos básicos del tópico como:
- Calidad y limpieza de archivos fastq
- Alineamiento y ensamblaje con el genoma de referencia usando STAR
- Generación del archivo de cuentas crudas
- Importar datos en R
- Normalización y corrección por batch
- Expresión diferencial con DESEq2 y edgeR
- Análisis funcional de los genes detectados
- Visualización grafica de los resultados
Se ofrecerán presentaciones detalladas sobre el uso de programas clave, todos de código abierto, utilizando datos extraídos de bases de datos. Además, se introducirá el uso de scripts sencillos en Bash y R, con el objetivo de aprender los conceptos básicos de estos lenguajes para el análisis de datos transcriptómicos.
- Dia 1. Aspectos generales de RNA-Seq / Control de calidad de los datos
- Dia 2. Diversos pipeline para Alineamiento, ensamblaje y conteo de reads
- Dia 3. Importar datos en R, Normalización y Corrección por batch / DEG con DESeq2
- Dia 4. GSEA - Análisis funcional
- Fecha: martes 25 de febrero 2025
- Presentación:
- Datos:
/mnt/atgc-d1/bioinfoII/rnaseq/BioProject_2025/ - Tarea para el jueves 27 de feb: Elegir en equipos los transcriptomas que emplearán en su proyecto - Información diapositiva 60 y Google Classroom ENES
Ejemplo de entregable: Reporte
Bioproject que usaron anteriormente (NO SE PUEDEN USAR): PRJNA821620 (At), PRJNA256121 (At), PRJNA858106 (Hs), PRJNA826506 (Hs), PRJNA649971 (Mm), PRJNA743296 (Hs), PRJNA739157 (Hs), PRJNA983389 (Hs), PRJNA759864 (Hs).
Bioproject dados en cursos (NO SE PUEDEN USAR): PRJNA649971 (Mm) - RNASeq_Workshop_Nov2023 y RNAseq_classFEB2024, PRJNA821620 (At) - RNAseq_classFEB2023
- Lecturas y cursos recomendados:
-
Fecha: jueves 27 de febrero 2025
-
Presentación:
-
Lecturas y cursos recomendados:
- Alineamiento de novo - Trinity
- Alineamiento con el genoma de referencia - STAR
- Pseudoalineamiento con Kallisto
- Pseudoalineamiento con Kallisto - practica
-
Tarea para el martes 4 de marzo:
- Descripción de los datos (entregable 1, fecha límite: 25 de febrero).
- Explicación de las gráficas generadas por MultiQC.
- Conclusión sobre los datos:
- ¿Son viables para continuar con el análisis?
- ¿Qué pasos deben seguirse para mejorar la calidad de los datos?
Ejemplo de entregable: Reporte
Subir en la tarea de Google Classroom
- Fecha: martes 4 de marzo 2025
- Presentación:
- Scripts: https://github.com/EveliaCoss/RNAseq_classFEB2025/tree/main/Practica_Dia3/scripts/
- Lecturas y cursos recomendados:
- Fecha: jueves 6 de marzo 2025
- Presentación:
- Lecturas y cursos recomendados:
- Base de datos Gene Ontology Resource
- Base de datos AmiGo2
- Reducir terminos con REVIGO
- Heatmap con ComplexHeatmap - Github
- Heatmap con ComplexHeatmap - manual
- Contar con una terminal en tu sistema operativo
- Los paquetes que emplearemos en R v4.0.2, se encuentran presentes en el cluster DNA, por lo que, no es necesario instalar nada en nuestras computadoras.
- Nodo de prueba (qlogin)
-
Script
load_data_inR.R:1) Importar datos en R (archivo de cuentas) + metadatos y 2) Crear una matriz de cuentas con todos los transcriptomas
-
Script
DEG_analysis.R:3) Crear el archivo
ddsconDESeq2, 4) Correr el análisis de Expresión Diferencial de los Genes (DEG), 5) Normalización de los datos, 6) Detección de batch effect y 7) Obtener los resultados de los contraste de DEG
Los siguientes script se pueden emplear para todas las especies, siendo sencillo su formato y empleo:
-
Script
VisualizacionDatos.R:8) Visualización de los datos
-
Script
GOterms_analysis.R:9) Análisis de Terminos funcionales (GO terms)
- Crear llaves y alias
Puedes crear llaves (ssh-keygen) y alias para acceder a los servidores de una manera segura y rápida: https://github.com/EveliaCoss/keygen
- Presentación: Clase de retro
- Script de repaso: Ejemplo Michael Love
- Informacion fuente:
- GOterms en S. cereviacae
- Go Term finder
- REVIGO - pagina principal
- REVIGO - Reducir terminos GO, ejemplos
- ggprofiler2
- Pathway enrichment analysis and visualization of omics data
- Biomedical knowledge mining using GOSemSim and Clusterprofiler
- Pathview - Pagina principal
- Pathview - Manual
- KEGG - Pathway ID
- AnnotationDbi
- Gene Ontology enrichment analysis - Uso de varias bases de datos en R