Глеб Доценко

24 марта 2025 14:00

Шестое занятие факультатива

Прошло шестое занятие по биоинформатике в рамках нашего кафедрального факультатива.
Присутствовало 17 слушателей.


Мы продолжили работу с уже знакомым по прошлому занятию скриптом для выполнения выравнивания прочтений на референсный геном и определения генетических вариантов.

На этом занятии мы усовершенствовали этот скрипт и сделали его более универсальным, поместив все изменяемые параметры наших команд (например, файловые пути к исходным и референсным данным, а также параметры фильтрации полученных результатов) в переменные. Теперь, если нам потребуется изменить значение какого-нибудь параметра нашего скрипта (например, поменять референсный геном), мы изменим значение всего одной переменной в начале скрипта и не будем искать и изменять этот параметр во всех командах.

Затем мы разобрали запуск скриптов bash с параметрами, которые задаются в командной строке. Это очень удобно, поскольку позволяет написать единый скрипт для обработки множества файлов и просто указывать пути к этим файлам как параметры скрипта при его запуске. Пользуясь этим приёмом, мы вынесли пути к нашим исходным данным и название образца в три параметра нашего скрипта. Полученный скрипт мы запустили в начале занятия, чтобы он выполнился за время лекции и мы получили результаты для нашего практикума во второй части нашего занятия.

На лекции мы начали разбирать основные форматы файлов в биоинформатике (.fasta, .fastq, .bam, .vcf, .bed, .bedgraph, .gtf, .gff) и их назначение. Мы подробно обсудили форматы .fasta, .fastq и .bam и посмотрели содержимое этих файлов на реальных примерах в терминале.

На практической части мы открыли только что полученные с помощью нашего скрипта файлы .bam и .vcf в геномном браузере IGV и по идентичности митохондриальной ДНК идентифицировали двух родственников по материнской линии.


Изображение 1
Изображение 4 Изображение 5 Изображение 6