Глеб Доценко

24 апреля 2025 12:00

Десятое занятие факультатива

Прошло десятое занятие по биоинформатике в рамках нашего кафедрального факультатива.
Присутствовало 15 слушателей.


На прошедшем занятии мы продолжили изучать возможности языка программирования R и освоили работу с табличными данными, с которыми должен уметь работать любой хороший биоинформатик.

Мы разобрали загрузку табличных данных из текстовых файлов и их конвертацию их в различные форматы.
Затем мы подробно разобрали основные функции пакета tidyverse, которые реализует наиболее востребованные преобразования табличных строк и столбцов – фильтрацию, упорядочивание, создание новых строк и колонок, слияние и разбиение таблиц, а также многое другое.

На практической части мы потренировались в применении изученных возможностей для решения типичных задач, возникающих при работе с табличными данными. Например, мы выполнили поиск патогенных мутаций в таблице аннотированных генетических вариантов, которую мы получили на седьмом занятии. Также мы выполнили отбор образцов из обширной базы литературных данных по заданным критериям. В завершающем задании этого практикумы мы реализовали левое объединение двух таблиц по ключу с последующей фильтрацией строк по заданным критериям и их форматированием.