Descripción
Contenidos
Como resultado de los avances en la tecnología de secuenciación se ha generado una revolución en diversas áreas de la biología. Estás metodologías generan una enorme cantidad de información, genomas completos, genes e incluso permite estimar con precisión sus niveles de expresión. Por sus características estos datos sólo pueden ser analizados mediante herramientas bioinformáticas. Muchas de estas herramientas se desarrollan sin una interfaz gráfica, y las que la tienen suelen desarrollarse más lentamente o en versiones no actualizadas. Adquirir manejo en su entorno es fundamental para lograr un uso eficiente de las mismas. Este curso plantea introducir a los estudiantes en la línea de comando, elemento básico para el análisis de secuencias, genomas y datos secuenciación, y en a la programación. El curso está orientado a estudiantes avanzados de grado y estudiantes de posgrado de áreas biológicas sin formación en programación o bioinformática.
Palabras claves: Linux, Biología computacional, Programación.
Programa
Teórico
- Introducción al Curso. Historia de la Bioinformática. Introducción a sistema operativo Linux. Formatos, scripts y lenguajes de programación. (Musto & Iriarte – Lunes 10/02)
- Comandos básicos en la terminal. Concepto de pipeline y path. (Iriarte – Martes 11/02)
- Comandos para el manejo de textos I. (Iriarte – Miércoles 12/02)
- Comandos para el manejo de textos II. (Alvarez-Valín – Jueves 13/02)
- Herramientas del paquete Emboss: Introducción al emboss y manejo básico de secuencias. (Iriarte - Viernes 14/02)
- Introducción a la programación. (Iriarte - Lunes 17/02)
- Programación en el Shell (“Bash scripting”) I: Manejo de variables y listas, salidas y entradas. Integración con otros lenguajes de programación. (Iriarte - Martes 18/02)
- Programación en el Shell (“Bash scripting”) II: Loops (for, while, until) y Condicional (if). (Iriarte – Miércoles 19/02)
- Introducción a R: Manejo de datos, entradas y salidas. Tipos de objetos. (Lamolle – Jueves 20/02)
- Estadística básicas y gráficos simples en R. (Lamolle - Viernes 21/02)
- Manejo de datos I. (Romero & Langleib - Lunes 02/03)
- Manejo de datos II. (Romero & Langleib - Martes 03/03)
- Análisis de datos de secuenciación masiva. (Jara - Miércoles 04/03)
- Análisis de enriquecimiento funcional. (Peñagaricano (via web) - Jueves 05/03)
Práctico
- Conexión remota vía ssh. Desplazamiento a través de la terminal. Uso de comandos básicos en la terminal. (Lunes 10/02)
- Instalar y correr programas. Ejemplos: Muscle, FastTree, Bwe, Spades y otros. (Martes 11/02)
- Manejo de textos: sed, uniq, grep, sort y otros. (Miércoles 12/02)
- Manejo de textos: awk. (Jueves 13/02)
- Comandos del paquete Emboss, ejemplos más utilizados. (Viernes 14/02)
- Comparación de scripts escritos en distintos lenguajes y ejemplos. (Lunes 17/02)
- Scripting Shell I. Introducción al scripting y uso de variables. (Martes 18/02)
- Scripting Shell II. Recorrer listas, ejecutar acciones repetidas. Uso de loops. (Miércoles 19/02)
- RStudio. Manejo de datos, filas y matrices en R. Tipos de objetos. (Jueves 20/02)
- Análisis estadísticos en R. (Viernes 21/02)
- Ejemplos simples de loops y funciones en R. (Lunes 02/03)
- Filtrado, edición y visualización de datos biológicos. (Martes 03/03)
- Análisis de RNAseq en R. (Miércoles 04/03)
- Análisis genómicos funcionales. (Jueves 05/03)
Evaluación
Examen individual, con preguntas abiertas y ejercicios, 3 horas.
Textos recomendados
- Practical Computing for Biologists, de Haddock and Dunn, Ed. Sinauer, 2010.
- A Beginner’s Guide to R, de Zuur, Ieno and Meesters, Ed. Springer, 2009.
- R para Ciencia de Datos, de Garrett Grolemund y Hadley Wickham, 2017.