Образовательные модули

Программа нашего спецкурса и факультатива состоит из различных разделов биоинформатики, которые актуальны для современной генетики. Для структурирования учебного процесса, мы сгруппировали эти разделы в относительно независимые друг от друга образовательные модули.


Основы работы в командной строке Linux

Проходим основные команды Bash и учимся работать в терминале Linux. Создаём и запускаем свои первые скрипты на Bash.



Основы работы на вычислительном кластере

Разбираем разные способы подключения к кластеру (ssh и sftp в операционных системах Windows, OS X и Linux). Проходим основные команды и возможности менеджера задач Slurm. Учимся загружать модули нужных программ и программных пакетов. Запускаем и контролируем свои первые вычислительные работы.



Продвинутые возможности терминала

Разбираем более сложные команды Bash - grep, awk, sort. Учимся скачивать файлы из баз данных (wget) и перемещать их между любыми компьютерами, подключенными к интернету (scp).



Основы R

Изучаем базовые принципы, синтаксис и возможности R - одного из наиболее популярных языков программирования, применяемого в анализе биоинформатических данных.



Основы визуализации данных в R

Разбираем построение основных типов графиков и диаграмм, используемых в научных публикациях: диаграмма рассеяния (scatter plot, stripchart), столбиковая диаграмма (bar plot), гистограмма (histogram), коробчатая диаграмма (box plot), скрипичная диаграмма (violin plot), круговая диаграмма (pie chart), тепловая карта (heat map).



Основы Python

Проходим базовые принципы, синтаксис и возможности Python - второго наиболее популярного в биоинформатике языка программирования.



Основные форматы файлов в биоинформатике

Подробно разбираем наиболее распространённые форматы файлов, с которыми работают биоинформатики - fasta, fastq, sam (bam), vcf (gvcf), bed (bedgraph), gtf (gff).



Геномные браузеры

Проходим возможности современных геномных браузеров на примере IGV и UCSC. Изучаем, как выглядят уже привычные нам прочтения и генетические варианты в IGV и исследуем обширные возможности браузера Санта-Крузского университета (UCSC).



Поиск и аннотация SNP

Пишем, отлаживаем и запускаем полноценный скрипт для реализации многостадийной обработки NGS данных: контроль качества исходных данных, фильтрация, выравнивание, определение SNP и аннотация полученных генетических вариантов для поиска известных и неизвестных мутаций, вызывающих различные заболевания.



Поиск и аннотация структурных вариантов

Учимся искать и аннотировать многонуклеотидные генетические варианты - инсерции, делеции и инверсии.



Основы метагеномного анализа

Выполняем количественный и качественный метагеномный анализ NGS данных на основе присутствующих k-меров.



Основы статистического анализа данных в R

Учимся рассчитывать и понимать основные статистические метрики и применять наиболее востребованные статистические тесты для обработки и интерпретации экспериментальных данных в R.