01 апреля 2025 13:00
Седьмое занятие факультатива
Прошло седьмое занятие по биоинформатике в рамках нашего кафедрального факультатива.
Присутствовало 16 слушателей.
На этом занятии мы завершили рассмотрение основных форматов файлов в биоинформатике. Мы разобрали структуру .bam, .vcf, .bed, .bedgraph, .gtf, .gff файлов и подробно поговорили о наиболее важных для практической работы аспектах - например, о правильном задании тегов ридгрупп @RG для корректной работы с .bam файлом, о способах узнать референс и параметры программ, которые применялись для получения .bam файла, об интерпретации генотипа и покрытия для каждого генетического варианта в .vcf файле).
На практической части мы нашли патогенную мутацию, вызывающую врожденную мозжечковую атаксию (congenital cerebellar ataxia) по исходным данным нашей лабораторной статьи https://pubmed.ncbi.nlm.nih.gov/36675067/.
Для выполнения этой задачи мы применили приёмы и команды, с которыми познакомились на прошлых занятиях:
задание переменных для команд
замена ридгрупп .bam файла (это было необходимо, поскольку для исходного файла они оказались заданы некорректно)
фильтрация прочтений по качеству картирования и по длине
определение генетических вариантов (т.н. "снипов", от англ. snp - single nucleotide polymorphism)
фильтрация полученных снипов по качеству
Затем мы выполнили аннотацию полученных генетических вариантов и отфильтровали наиболее вредоносные из них . В полученном небольшом списке мы обнаружили патогенную мутацию chr6:146720646 C>G, вызывающую врожденную мозжечковую атаксию.




