Международная конференция СПбГУ по биоинформатике собрала около 400 ведущих ученых со всего мира

Завершилась четвертая международная конференция «Биоинформатика: от алгоритмов к применению» (BiATA 2020), которую ежегодно организует Санкт-Петербургский университет (лаборатория «Центр алгоритмической биотехнологии» СПбГУ).

Благодаря онлайн-формату в этом году BiATA собрала в четыре раза больше исследователей, чем обычно. Организаторы также отметили существенный рост числа участников из России. По словам председателя программного комитета конференции, заместителя директора Центра алгоритмической биотехнологии Института трансляционной биомедицины СПбГУ Аллы Лапидус, это признак того, что биоинформатика в нашей стране выходит на новый уровень.

На территории России расположены уникальные природные объекты, которые пока что изучены мало. Однако BiATA 2020 показала, что наши ученые проводят исследования микробиот озера Байкал, Белого моря, таежных лесов Сибири и не только. Уверена, в будущем число таких работ будет только расти.

Заместитель директора Центра алгоритмической биотехнологии Института трансляционной биомедицины СПбГУ Алла Лапидус

За годы существования конференция превратилась в полноценную площадку, на которой собираются основные разработчики программных продуктов для анализа современных биологических данных и ученые — поставщики этих первичных данных со всего мира.

Несмотря на то, что тематика докладов обширна — от расшифровки генома человека до широкого спектра метагеномных исследований, объединяет их одно — огромные объемы данных, для интерпретации которых нужно надежное и простое в применении программное обеспечение.

Заместитель директора Центра алгоритмической биотехнологии Института трансляционной биомедицины СПбГУ Алла Лапидус

В первый день конференции с докладом выступил директор австралийского Центра экогеномики Университета Квинсленда (Австралия) профессор Фил Хёгенхольц — специалист мирового уровня в области таксономии. Свой доклад он посвятил проблемам систематики простых одноклеточных — прокариот — в эпоху больших данных. По словам ученого, современная классификация микроорганизмов не учитывает почти 85 % всего микробиологического разнообразия — некультивированные микроорганизмы, которые нельзя вырастить в лабораторных условиях. «Разрабатывая новую, основанную на знании геномов систематику, мы использовали существующую классификацию микробов, полученных в лабораториях. На первом этапе мы разделили полифилетические группы — набор видов, у которых есть сразу несколько общих предков. Затем необходимо было учесть эволюционную дивергенцию — расхождение признаков родственных групп в ходе эволюции», — пояснил профессор Хёгенхольц.

В результате ученым удалось получить полностью систематизированную классификацию бактерий с учетом всех эволюционных процессов. Оказалось, что из сотни тысяч доступных для изучения геномов бактерий более половины требовали изменений в их классификации. Перемены затронули как высшие ранги — отделы, так и более низшие — роды. Так, например, род анаэробных бактерий Clostridium был разделен на сотню новых обособленных родов.

Артем Бабаян из Университета Британской Колумбии (Ванкувер, Канада) рассказал о масштабном проекте Serratus, цель которого заключается в поиске новых коронавирусов в публичных базах данных, что особенно актуально в условиях современной эпидемиологической ситуации. «Основная проблема заключается в том, что мы до сих пор не имеем полного представления о биоразнообразии и природе вирусов. Кроме того, в открытом доступе есть очень мало полностью расшифрованных геномов. Поэтому, чтобы обнаружить новые последовательности коронавирусов, мы анализируем все доступные данные — как об уже изученных вирусах, так и абсолютно неизвестных. Это более 3,4 млн образцов биологического материала со всего мира, который еще необходимо расшифровать», — подчеркнул исследователь.

Собирать геномы РНК-вирусов, и в первую очередь коронавирусов, позволяет новая разработка лаборатории «Центр алгоритмической биотехнологии» СПбГУ coronaspades — специальный режим сборщика spades (Saint Petersburg Assembler), флагманского продукта лаборатории. Как отметил Артем Бабаян, новый инструмент помог коллаборации Serratus оптимизировать процесс сборки, поскольку в отличие от других программных продуктов учитывал все особенности строения геномов РНК-вирусов. В основу coronaspades легли многолетние наработки Центра алгоритмической биотехнологии СПбГУ, и, как утверждают сами разработчики — Дмитрий Мелешко и Антон Коробейников, — без этого создание модуля было бы невозможно.

Участникам конференции была предоставлена возможность обучиться работе с одним из инновационных программных инструментов MGnify в рамках воркшопа «Анализ метагеномных сборок при помощи MGnify». Об особенностях работы на платформе MGnify начинающим биоинформатикам рассказали сотрудники Европейского института биоинформатики (EMBL-EBI) Роб Финн, Лорна Ричардсон и Алекс Альмейда. Так, к последнему дню конференции участники научились не только осуществлять сборку сложных метагеномных данных, но и аннотировать полученные после сборки последовательности, функционально и таксономически их характеризовать.