Skip to content

EveliaCoss/RNAseq_classFEB2025

Repository files navigation

Análisis de datos de RNA-Seq 👾

Instructora: Dra. Evelia Coss, Posdoc de la Dra. Alejandra Medina, LIIGH-UNAM

Clases para los alumnos de Ciencias Genomicas de 4to semestre de la ENES, Juriquilla (25 y 27 Febrero, 4 y 6 Marzo 2025). Formando parte de la clase de Bioinformática y Estadística 2.

Descripción

El módulo consta de sesiones teóricas y prácticas impartidas de forma presencial, que cubrirán aspectos básicos del tópico como:

  • Calidad y limpieza de archivos fastq
  • Alineamiento y ensamblaje con el genoma de referencia usando STAR
  • Generación del archivo de cuentas crudas
  • Importar datos en R
  • Normalización y corrección por batch
  • Expresión diferencial con DESEq2 y edgeR
  • Análisis funcional de los genes detectados
  • Visualización grafica de los resultados

Se ofrecerán presentaciones detalladas sobre el uso de programas clave, todos de código abierto, utilizando datos extraídos de bases de datos. Además, se introducirá el uso de scripts sencillos en Bash y R, con el objetivo de aprender los conceptos básicos de estos lenguajes para el análisis de datos transcriptómicos.

Contenido 📌

  • Dia 1. Aspectos generales de RNA-Seq / Control de calidad de los datos
  • Dia 2. Diversos pipeline para Alineamiento, ensamblaje y conteo de reads
  • Dia 3. Importar datos en R, Normalización y Corrección por batch / DEG con DESeq2
  • Dia 4. GSEA - Análisis funcional

Dia 1. Aspectos generales de RNA-Seq / Control de calidad de los datos

Ejemplo de entregable: Reporte

Bioproject que usaron anteriormente (NO SE PUEDEN USAR): PRJNA821620 (At), PRJNA256121 (At), PRJNA858106 (Hs), PRJNA826506 (Hs), PRJNA649971 (Mm), PRJNA743296 (Hs), PRJNA739157 (Hs), PRJNA983389 (Hs), PRJNA759864 (Hs).

Bioproject dados en cursos (NO SE PUEDEN USAR): PRJNA649971 (Mm) - RNASeq_Workshop_Nov2023 y RNAseq_classFEB2024, PRJNA821620 (At) - RNAseq_classFEB2023

Dia 2. Diversos pipeline para Alineamiento, ensamblaje y conteo de reads

Ejemplo de entregable: Reporte

Subir en la tarea de Google Classroom

Dia 3. Importar datos en R, Normalización y Corrección por batch effect 🪲 / DEG con DESeq2

Dia 4. GSEA - Análisis funcional

Requisitos

  • Contar con una terminal en tu sistema operativo
  • Los paquetes que emplearemos en R v4.0.2, se encuentran presentes en el cluster DNA, por lo que, no es necesario instalar nada en nuestras computadoras.
  • Nodo de prueba (qlogin)

Pipeline ⚡

Pasos a seguir para el análisis de los datos de RNA-Seq

  • Script load_data_inR.R:

    1) Importar datos en R (archivo de cuentas) + metadatos y 2) Crear una matriz de cuentas con todos los transcriptomas

  • Script DEG_analysis.R:

    3) Crear el archivo dds con DESeq2, 4) Correr el análisis de Expresión Diferencial de los Genes (DEG), 5) Normalización de los datos, 6) Detección de batch effect y 7) Obtener los resultados de los contraste de DEG

Los siguientes script se pueden emplear para todas las especies, siendo sencillo su formato y empleo:

Clase para mejorar tus skills

  • Crear llaves y alias

Puedes crear llaves (ssh-keygen) y alias para acceder a los servidores de una manera segura y rápida: https://github.com/EveliaCoss/keygen

Clase de retroalimentación (21 de mayo 2025)

Cursos para practicar 📕

Referencias 📚

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages