Образовательные модули

Учебный план нашего спецкурса и факультатива охватывает ключевые направления современной биоинформатики, критически важные для развития актуальных генетических исследований. С целью оптимизации учебного процесса и создания гибкой образовательной траектории, весь материал систематизирован и распределен по тематическим модулям. Каждый модуль представляет собой относительно автономный блок, что позволяет студентам последовательно и глубоко осваивать специфические инструменты и методы анализа данных, сохраняя при этом целостное понимание предмета.

Основы работы в командной строке Linux

Проходим основные команды Bash и учимся работать в терминале Linux. Создаём и запускаем свои первые скрипты на Bash.

Основы работы на вычислительном кластере

Разбираем разные способы подключения к кластеру (ssh и sftp в операционных системах Windows, OS X и Linux). Проходим основные команды и возможности менеджера задач Slurm. Учимся загружать модули нужных программ и программных пакетов. Запускаем и контролируем свои первые вычислительные работы.

Продвинутые возможности терминала

Разбираем более сложные команды Bash - grep, awk, sort. Учимся скачивать файлы из баз данных (wget) и перемещать их между любыми компьютерами, подключенными к интернету (scp).

Основы R

Изучаем базовые принципы, синтаксис и возможности R - одного из наиболее популярных языков программирования, применяемого в анализе биоинформатических данных.

Основы визуализации данных в R

Разбираем построение основных типов графиков и диаграмм, используемых в научных публикациях: диаграмма рассеяния (scatter plot, stripchart), столбиковая диаграмма (bar plot), гистограмма (histogram), коробчатая диаграмма (box plot), скрипичная диаграмма (violin plot), круговая диаграмма (pie chart), тепловая карта (heat map).

Основы Python

Проходим базовые принципы, синтаксис и возможности Python - второго наиболее популярного в биоинформатике языка программирования.

Основные форматы файлов в биоинформатике

Подробно разбираем наиболее распространённые форматы файлов, с которыми работают биоинформатики - fasta, fastq, sam (bam), vcf (gvcf), bed (bedgraph), gtf (gff).

Геномные браузеры

Проходим возможности современных геномных браузеров на примере IGV и UCSC. Изучаем, как выглядят уже привычные нам прочтения и генетические варианты в IGV и исследуем обширные возможности браузера Санта-Крузского университета (UCSC).

Поиск и аннотация SNP

Пишем, отлаживаем и запускаем полноценный скрипт для реализации многостадийной обработки NGS данных: контроль качества исходных данных, фильтрация, выравнивание, определение SNP и аннотация полученных генетических вариантов для поиска известных и неизвестных мутаций, вызывающих различные заболевания.