#AprendeBioinformáticaEnCasa
Clases de bioinformática para la cuarentena
Si quieres aprender bioinformática aplicada a genómica y:
- dispones de un ordenador con 4GB de RAM o más,
- con procesador de 4 núcleos o más,
- con sistema operativo de 64bit o más :-)
Puede que este curso te interese. Tuvo lugar entre el 23 de marzo y el 1 de junio de 2020, durante
la cuarentena provocada por la pandemia de COVID-19 provocada por el SARS-CoV-2.
|
|
Para seguir algunas de las clases será necesaria la instalación de
programas (gratuitos) y/o la descarga de archivos de datos con antelación. ¡Estad muy atentos a los requisitos!
Todas las clases:
Lunes, 01 de junio de 2020
"Detección de variantes genómicas (SNP) mediante secuenciación masiva"
Profesor: Juan Carlos Oliveros Collazos
Una de las principales aplicaciones de la secuenciación masiva consiste en la determinación de variantes en secuencias genómicas. Durante el
proceso de alineamiento de lecturas cortas, el estudio de las no-coincidencias puntuales con la secuencia de referencia permite detectar
cambios en dicha secuencia y, gracias a la redundancia obtenida, encontrar variaciones consistentes que no sean simples errores de secuenciación.
En esta última clase utilizaremos el entorno UNIX para alinear lecturas cortas y detectar variaciones en el genoma del SARS-CoV-2. Visualizaremos los resultados con IGV.
INSTALACIÓN REQUERIDA: Para el total aprovechamiento de la clase, será necesario tener instalado un entorno UNIX (o linux) tal y como se explicó en las clases del 13 y 20 de abril. Dedicaremos
los primeros minutos de la clase a instalar algunos comandos adicionales.
Lunes, 25 de mayo de 2020
"Alineamientos múltiples de secuencias biológicas"
Profesor: Rafael Torres Pérez
El alineamiento múltiple de secuencias (MSA, por sus siglas en inglés) es un método para
comparar entre sí un grupo de secuencias en principio relacionadas de proteínas,
ADN o ARN. Nos fijaremos en cuál es su fundamento, cómo es el modelo para representar
las secuencias alineadas y usaremos herramientas fácilmente accesibles y ejecutables
en la web, como MAFFT o MUSCLE, que siguen diversas aproximaciones para realizar MSA.
Tan importante como llevar a cabo un buen alineamiento con estas herramientas automáticas
es la visualización, edición y representación de los resultados. JalView se presenta como
una herramienta muy apropiada es estos aspectos, además de ofrecer conexiones con otras
utilidades que complementan la información obtenida a partir del alineamiento.
INSTALACIÓN REQUERIDA: Usaremos la popular aplicación Jalview.
Será necesario que esté instalada en el ordenador antes de la clase del lunes. Instrucciones :Installing_Jalview.pdf
Como siempre, no olvidéis descargar y, en su caso, descomprimir todos los archivos de
datos
antes del comienzo de la sesión.
Lunes, 18 de mayo de 2020
"Redes de interacciones proteína-proteína: tipos y herramientas para su visualización"
Profesor: Juan Carlos Oliveros Collazos
Durante décadas, los investigadores han recopilado información sobre todo tipo de interacciones entre proteínas y,
hoy en día, tenemos a nuestra disposición bases de datos y herramientas para su análisis y visualización.
En esta clase describiremos herramientas y aprenderemos técnicas para añadir información de interacciones
proteína-proteína a resultados de proyectos de genómica cuantitativa.
INSTALACIÓN REQUERIDA: Usaremos la popular aplicación Cytoscape.
Será necesario que esté instalada en el ordenador antes de la clase del lunes.
Como siempre, no olvidéis descargar todos los archivos de datos antes del comienzo de la sesión.
(NOTA: Para descomprimir archivos ".gz" sin necesidad de utilizar funciones de R, recomendamos a
los usuarios de Windows el programa: 7zip).
Lunes, 11 de mayo de 2020
"Técnicas para la interpretación funcional de resultados de RNA-seq"
Profesor: Juan Carlos Oliveros Collazos
Un protocolo típico de RNA-seq genera una tabla de resultados numéricos (log2Ratios, p-values, counts...)
asociados a cada elemento genómico considerado. En general, la interpretación de dichos resultados se puede hacer
a nivel de genes individuales o a nivel de grupos funcionales. Existen multitud de herramientas bioinformáticas
que facilitan dicha interpretación.
En esta clase mostraremos algunas de estas herramientas, las aplicaremos al proyecto comenzado
en las clases anteriores y hablaremos de sus virtudes y, sobre todo, de sus limitaciones.
Para el correcto seguimiento de esta clase es muy recomendable haber seguido las anteriores.
IMPORTANTE: Usaremos la popular aplicación Gene Set Enrichment Analysis, del Broad Institute,
disponible AQUÍ.
Elegid la versión específica para vuestro sistema operativo (uno de los tres primeros enlaces, para MacOS, Windows o Linux)
e instaladla en vuestro ordenador antes de la clase del lunes.
Como siempre, no olvidéis descargar todos los archivos de datos antes del comienzo de la sesión.
Lunes, 04 de mayo de 2020
"RNA-seq con R: Técnicas para una buena gestión de las muestras. Incorporación de anotaciones funcionales"
Profesor: Juan Carlos Oliveros Collazos
Combinaremos distintas herramientas y entornos para completar nuestro proyecto de RNA-seq: aprenderemos
técnicas para crear protocolos robustos, evaluaremos el efecto de eliminar alineamientos
duplicados y añadiremos anotaciones funcionales a los resultados numéricos.
Para el correcto seguimiento de esta clase es muy recomendable haber seguido las anteriores.
Accederemos a la plataforma on-line Biomart y volveremos a utilizar las siguientes aplicaciones instaladas en nuestro ordenador: Lenguaje R, samtools e IGV.
No olvidéis descargar todos los archivos de datos antes del comienzo de la sesión.
Lunes, 27 de abril de 2020
"Introducción práctica a Ensembl: visualización y recuperación de información genómica de interés"
Profesor: Rafael Torres Pérez
La plataforma Ensembl (www.ensembl.org y www.ensemblgenomes.org) integra datos y anotaciones genómicas de gran cantidad de especies. Incluye herramientas que facilitan el acceso a la información a través de un visualizador genómico que interrelaciona contenidos y permite su fácil recuperación por el usuario.
En esta sesión práctica veremos qué tipos de información relevante podemos consultar en este valioso recurso y cómo obtener secuencias y anotaciones de los elementos constitutivos de los genomas (regiones reguladoras, genes y proteínas).
Lunes, 20 de abril de 2020
"Herramientas de línea de comandos UNIX para la manipulación y análisis de datos genómicos" (segunda parte)
Profesor: Juan Antonio García Martín
Durante esta(s) sesion(es) conoceremos herramientas
que permiten el uso de lineas de comandos y programas UNIX sobre Windows, y aprenderemos los comandos
básicos de UNIX para la navegación en el sistema de directorios, así como para la visualización y
manipulación de archivos. Finalmente, se introducirá al uso de Samtools y Bedtools, que
son respectivamente los programas de linea de comandos más extendidos para la manipulación
de archivos de alineamientos (SAM, BAM) y archivos de datos asociados a coordenadas cromosómicas (BED, GFF).
Requisitos y programas necesarios:
-(Para usuarios de Windows) se requiere la instalación previa del Subsistema de Windows para Linux (WSL),
disponible para Windows 10, y la descarga de Ubuntu desde la Microsoft Store
(ver guía). O en su defecto (aunque no se recomienda excepto para usuarios con versiones anteriores de Windows)
la instalación de la versión gratuita de MobaXterm, disponible aquí
-(Para los usuarios de Mac OSX) se requiere la instalación previa de Xcode Command Line Tools
(ver guía)
-Samtools (última versión disponible 1.10): Comandos para la manipulación de archivos de alineamientos
(Manual)
-Bedtools (última versión disponible 2.29.2) (versión para MobaXterm aquí): Comandos para la manipulación de archivos de datos asociados a coordenadas cromosómicas
(Manual)
-Integrative Genomics Viewer (IGV):
Programa muy popular para visualizar genomas y datos asociados a coordenadas cromosómicas
Lunes, 13 de abril de 2020
"Herramientas de línea de comandos UNIX para la manipulación y análisis de datos genómicos"
Profesor: Juan Antonio García Martín
Durante esta(s) sesion(es) conoceremos herramientas
que permiten el uso de lineas de comandos y programas UNIX sobre Windows, y aprenderemos los comandos
básicos de UNIX para la navegación en el sistema de directorios, así como para la visualización y
manipulación de archivos. Finalmente, se introducirá al uso de Samtools y Bedtools, que
son respectivamente los programas de linea de comandos más extendidos para la manipulación
de archivos de alineamientos (SAM, BAM) y archivos de datos asociados a coordenadas cromosómicas (BED, GFF).
Requisitos y programas necesarios:
-(Para usuarios de Windows) se requiere la instalación previa del Subsistema de Windows para Linux (WSL),
disponible para Windows 10, y la descarga de Ubuntu desde la Microsoft Store
(ver guía). O en su defecto (aunque no se recomienda excepto para usuarios con versiones anteriores de Windows)
la instalación de la versión gratuita de MobaXterm, disponible aquí
-(Para los usuarios de Mac OSX) se requiere la instalación previa de Xcode Command Line Tools
(ver guía)
-Samtools (última versión disponible 1.10): Comandos para la manipulación de archivos de alineamientos
(Manual)
-Bedtools (última versión disponible 2.29.2) (versión para MobaXterm aquí): Comandos para la manipulación de archivos de datos asociados a coordenadas cromosómicas
(Manual)
-Integrative Genomics Viewer (IGV):
Programa muy popular para visualizar genomas y datos asociados a coordenadas cromosómicas
Lunes, 06 de abril de 2020
"Análisis diferencial de la expresión génica (RNA-seq) con R (segunda parte)"
Profesor: Juan Carlos Oliveros Collazos
Programas necesarios:
Lenguaje R:
Lenguaje de programación estadística muy popular. Usaremos la versión de 64bit.
Integrative Genomics Viewer (IGV):
Programa muy popular para visualizar genomas y datos asociados a coordenadas cromosómicas.
Lunes, 30 de marzo de 2020
"Análisis diferencial de la expresión génica (RNA-seq) con R"
Profesor: Juan Carlos Oliveros Collazos
Programas necesarios:
Lenguaje R:
Lenguaje de programación estadística muy popular. Usaremos la versión de 64bit.
Integrative Genomics Viewer (IGV):
Programa muy popular para visualizar genomas y datos asociados a coordenadas cromosómicas.
Lunes, 23 de marzo de 2020
"Introducción al alineamiento genómico de secuencias cortas con R y visualización de resultados con IGV"
Profesor: Juan Carlos Oliveros Collazos
Programas necesarios:
Lenguaje R:
Lenguaje de programación estadística muy popular. Usaremos la versión de 64bit.
Integrative Genomics Viewer (IGV):
Programa muy popular para visualizar genomas y datos asociados a coordenadas cromosómicas.