#AprendeBioinformáticaEnCasa
Clases de bioinformática para la cuarentena
Si quieres aprender bioinformática aplicada a genómica y:
  • dispones de un ordenador con 4GB de RAM o más,
  • con procesador de 4 núcleos o más,
  • con sistema operativo de 64bit o más :-)
Puede que este curso te interese. Tuvo lugar entre el 23 de marzo y el 1 de junio de 2020, durante la cuarentena provocada por la pandemia de COVID-19 provocada por el SARS-CoV-2.
Si te gustan las clases y quieres contribuir con una pequeña (o gran) donación a la causa contra la COVID-19 te sugerimos dos formas de hacerlo:
  • Página oficial del CSIC
  • Plataforma "Apadrina la Ciencia"

  • Si no te gustan las clases, también puedes donar :-)
    ¡Gracias!
    Para seguir algunas de las clases será necesaria la instalación de programas (gratuitos) y/o la descarga de archivos de datos con antelación. ¡Estad muy atentos a los requisitos!
    Organiza: BioinfoGP (bioinfogp@cnb.csic.es)
    Referencias:
    Herramientas utilizadas durante el curso: References_AprendeBioinfomaticaEnCasa2020.pdf
    Todas las clases:

    Lunes, 01 de junio de 2020

    "Detección de variantes genómicas (SNP) mediante secuenciación masiva"

    Profesor: Juan Carlos Oliveros Collazos


    Una de las principales aplicaciones de la secuenciación masiva consiste en la determinación de variantes en secuencias genómicas. Durante el proceso de alineamiento de lecturas cortas, el estudio de las no-coincidencias puntuales con la secuencia de referencia permite detectar cambios en dicha secuencia y, gracias a la redundancia obtenida, encontrar variaciones consistentes que no sean simples errores de secuenciación.
     
    En esta última clase utilizaremos el entorno UNIX para alinear lecturas cortas y detectar variaciones en el genoma del SARS-CoV-2. Visualizaremos los resultados con IGV.
     
    INSTALACIÓN REQUERIDA: Para el total aprovechamiento de la clase, será necesario tener instalado un entorno UNIX (o linux) tal y como se explicó en las clases del 13 y 20 de abril. Dedicaremos los primeros minutos de la clase a instalar algunos comandos adicionales.

  • Vídeo (twitch)
  • Datos
  • Lunes, 25 de mayo de 2020

    "Alineamientos múltiples de secuencias biológicas"

    Profesor: Rafael Torres Pérez


    El alineamiento múltiple de secuencias (MSA, por sus siglas en inglés) es un método para comparar entre sí un grupo de secuencias en principio relacionadas de proteínas, ADN o ARN. Nos fijaremos en cuál es su fundamento, cómo es el modelo para representar las secuencias alineadas y usaremos herramientas fácilmente accesibles y ejecutables en la web, como MAFFT o MUSCLE, que siguen diversas aproximaciones para realizar MSA.
     
    Tan importante como llevar a cabo un buen alineamiento con estas herramientas automáticas es la visualización, edición y representación de los resultados. JalView se presenta como una herramienta muy apropiada es estos aspectos, además de ofrecer conexiones con otras utilidades que complementan la información obtenida a partir del alineamiento.
     
    INSTALACIÓN REQUERIDA: Usaremos la popular aplicación Jalview. Será necesario que esté instalada en el ordenador antes de la clase del lunes. Instrucciones :Installing_Jalview.pdf
     
    Como siempre, no olvidéis descargar y, en su caso, descomprimir todos los archivos de datos antes del comienzo de la sesión.
     

  • Vídeo (twitch)
  • Datos
  • Lunes, 18 de mayo de 2020

    "Redes de interacciones proteína-proteína: tipos y herramientas para su visualización"

    Profesor: Juan Carlos Oliveros Collazos


    Durante décadas, los investigadores han recopilado información sobre todo tipo de interacciones entre proteínas y, hoy en día, tenemos a nuestra disposición bases de datos y herramientas para su análisis y visualización.
     
    En esta clase describiremos herramientas y aprenderemos técnicas para añadir información de interacciones proteína-proteína a resultados de proyectos de genómica cuantitativa.
     
    INSTALACIÓN REQUERIDA: Usaremos la popular aplicación Cytoscape. Será necesario que esté instalada en el ordenador antes de la clase del lunes.
     
    Como siempre, no olvidéis descargar todos los archivos de datos antes del comienzo de la sesión.
     
    (NOTA: Para descomprimir archivos ".gz" sin necesidad de utilizar funciones de R, recomendamos a los usuarios de Windows el programa: 7zip).

  • Vídeo (twitch)
  • Datos
  • Lunes, 11 de mayo de 2020

    "Técnicas para la interpretación funcional de resultados de RNA-seq"

    Profesor: Juan Carlos Oliveros Collazos


    Un protocolo típico de RNA-seq genera una tabla de resultados numéricos (log2Ratios, p-values, counts...) asociados a cada elemento genómico considerado. En general, la interpretación de dichos resultados se puede hacer a nivel de genes individuales o a nivel de grupos funcionales. Existen multitud de herramientas bioinformáticas que facilitan dicha interpretación.
     
    En esta clase mostraremos algunas de estas herramientas, las aplicaremos al proyecto comenzado en las clases anteriores y hablaremos de sus virtudes y, sobre todo, de sus limitaciones.
     
    Para el correcto seguimiento de esta clase es muy recomendable haber seguido las anteriores.
     
    IMPORTANTE: Usaremos la popular aplicación Gene Set Enrichment Analysis, del Broad Institute, disponible AQUÍ.
    Elegid la versión específica para vuestro sistema operativo (uno de los tres primeros enlaces, para MacOS, Windows o Linux) e instaladla en vuestro ordenador antes de la clase del lunes.
     
    Como siempre, no olvidéis descargar todos los archivos de datos antes del comienzo de la sesión.

  • Vídeo 1 (twitch)
  • Vídeo 2 (twitch)
  • Datos
  • Lunes, 04 de mayo de 2020

    "RNA-seq con R: Técnicas para una buena gestión de las muestras. Incorporación de anotaciones funcionales"

    Profesor: Juan Carlos Oliveros Collazos


    Combinaremos distintas herramientas y entornos para completar nuestro proyecto de RNA-seq: aprenderemos técnicas para crear protocolos robustos, evaluaremos el efecto de eliminar alineamientos duplicados y añadiremos anotaciones funcionales a los resultados numéricos.
     
    Para el correcto seguimiento de esta clase es muy recomendable haber seguido las anteriores. Accederemos a la plataforma on-line Biomart y volveremos a utilizar las siguientes aplicaciones instaladas en nuestro ordenador: Lenguaje R, samtools e IGV.
     
    No olvidéis descargar todos los archivos de datos antes del comienzo de la sesión.

  • Vídeo (twitch)
  • Datos
  • Lunes, 27 de abril de 2020

    "Introducción práctica a Ensembl: visualización y recuperación de información genómica de interés"

    Profesor: Rafael Torres Pérez


    La plataforma Ensembl (www.ensembl.org y www.ensemblgenomes.org) integra datos y anotaciones genómicas de gran cantidad de especies. Incluye herramientas que facilitan el acceso a la información a través de un visualizador genómico que interrelaciona contenidos y permite su fácil recuperación por el usuario.
     
    En esta sesión práctica veremos qué tipos de información relevante podemos consultar en este valioso recurso y cómo obtener secuencias y anotaciones de los elementos constitutivos de los genomas (regiones reguladoras, genes y proteínas).

  • Vídeo 1 (twitch)
  • Vídeo 2 (twitch)
  • Datos
  • Lunes, 20 de abril de 2020

    "Herramientas de línea de comandos UNIX para la manipulación y análisis de datos genómicos" (segunda parte)

    Profesor: Juan Antonio García Martín


    Durante esta(s) sesion(es) conoceremos herramientas que permiten el uso de lineas de comandos y programas UNIX sobre Windows, y aprenderemos los comandos básicos de UNIX para la navegación en el sistema de directorios, así como para la visualización y manipulación de archivos. Finalmente, se introducirá al uso de Samtools y Bedtools, que son respectivamente los programas de linea de comandos más extendidos para la manipulación de archivos de alineamientos (SAM, BAM) y archivos de datos asociados a coordenadas cromosómicas (BED, GFF).

    Requisitos y programas necesarios:


    -(Para usuarios de Windows) se requiere la instalación previa del Subsistema de Windows para Linux (WSL), disponible para Windows 10, y la descarga de Ubuntu desde la Microsoft Store (ver guía). O en su defecto (aunque no se recomienda excepto para usuarios con versiones anteriores de Windows) la instalación de la versión gratuita de MobaXterm, disponible aquí

    -(Para los usuarios de Mac OSX) se requiere la instalación previa de Xcode Command Line Tools (ver guía)

    -Samtools (última versión disponible 1.10): Comandos para la manipulación de archivos de alineamientos (Manual)

    -Bedtools (última versión disponible 2.29.2) (versión para MobaXterm aquí): Comandos para la manipulación de archivos de datos asociados a coordenadas cromosómicas (Manual)

    -Integrative Genomics Viewer (IGV): Programa muy popular para visualizar genomas y datos asociados a coordenadas cromosómicas

  • Vídeo (twitch)
  • Datos
  • Lunes, 13 de abril de 2020

    "Herramientas de línea de comandos UNIX para la manipulación y análisis de datos genómicos"

    Profesor: Juan Antonio García Martín


    Durante esta(s) sesion(es) conoceremos herramientas que permiten el uso de lineas de comandos y programas UNIX sobre Windows, y aprenderemos los comandos básicos de UNIX para la navegación en el sistema de directorios, así como para la visualización y manipulación de archivos. Finalmente, se introducirá al uso de Samtools y Bedtools, que son respectivamente los programas de linea de comandos más extendidos para la manipulación de archivos de alineamientos (SAM, BAM) y archivos de datos asociados a coordenadas cromosómicas (BED, GFF).

    Requisitos y programas necesarios:


    -(Para usuarios de Windows) se requiere la instalación previa del Subsistema de Windows para Linux (WSL), disponible para Windows 10, y la descarga de Ubuntu desde la Microsoft Store (ver guía). O en su defecto (aunque no se recomienda excepto para usuarios con versiones anteriores de Windows) la instalación de la versión gratuita de MobaXterm, disponible aquí

    -(Para los usuarios de Mac OSX) se requiere la instalación previa de Xcode Command Line Tools (ver guía)

    -Samtools (última versión disponible 1.10): Comandos para la manipulación de archivos de alineamientos (Manual)

    -Bedtools (última versión disponible 2.29.2) (versión para MobaXterm aquí): Comandos para la manipulación de archivos de datos asociados a coordenadas cromosómicas (Manual)

    -Integrative Genomics Viewer (IGV): Programa muy popular para visualizar genomas y datos asociados a coordenadas cromosómicas

  • Vídeo (twitch)
  • Datos
  • Lunes, 06 de abril de 2020

    "Análisis diferencial de la expresión génica (RNA-seq) con R (segunda parte)"

    Profesor: Juan Carlos Oliveros Collazos

    Programas necesarios:

    Lenguaje R: Lenguaje de programación estadística muy popular. Usaremos la versión de 64bit.
    Integrative Genomics Viewer (IGV): Programa muy popular para visualizar genomas y datos asociados a coordenadas cromosómicas.

  • Vídeo (twitch)
  • Datos
  • Lunes, 30 de marzo de 2020

    "Análisis diferencial de la expresión génica (RNA-seq) con R"

    Profesor: Juan Carlos Oliveros Collazos

    Programas necesarios:

    Lenguaje R: Lenguaje de programación estadística muy popular. Usaremos la versión de 64bit.
    Integrative Genomics Viewer (IGV): Programa muy popular para visualizar genomas y datos asociados a coordenadas cromosómicas.

  • Datos
  • Lunes, 23 de marzo de 2020

    "Introducción al alineamiento genómico de secuencias cortas con R y visualización de resultados con IGV"

    Profesor: Juan Carlos Oliveros Collazos

    Programas necesarios:

    Lenguaje R: Lenguaje de programación estadística muy popular. Usaremos la versión de 64bit.
    Integrative Genomics Viewer (IGV): Programa muy popular para visualizar genomas y datos asociados a coordenadas cromosómicas.

  • Datos