Биоинформатики СПбГУ помогли собрать геном российского варианта коронавируса

Научные сотрудники Центра алгоритмической биотехнологии СПбГУ Дмитрий Антипов и Михаил Райко приняли участие в расшифровке генома российского варианта вируса SARS-CoV-2 — его РНК выделили из мазка заболевшей петербурженки 15 марта. Впервые отсеквенировать «российский» коронавирус удалось исследователям из петербургского Института гриппа имени Смородинцева.

Сегодня внимание врачей и ученых всего мира приковано к коронавирусной инфекции COVID-19, которую вызывает вирус SARS-CoV-2. Всего за несколько месяцев он стал причиной масштабной пандемии — каждый день регистрируются десятки тысяч новых случаев заражения. Причем во время путешествия вируса по планете его генетическая информация неизбежно меняется: «итальянские» или «российские» варианты уже немного отличаются от изначального «китайского».

Чтобы оперативно отслеживать изменения в геноме SARS-CoV-2, а также лучше понимать, откуда он пришел к человеку и как он будет меняться в будущем, исследователи изучают разные варианты коронавируса — сегодня прочитаны геномы уже более тысячи образцов со всего мира. На днях в список расшифрованных вариантов вошел и «российский» — его отсеквенировали ученые из петербургского Института гриппа имени Смородинцева, а биоинформатики Центра алгоритмической биотехнологии СПбГУ помогли собрать короткие фрагменты РНК в единую последовательность.

Когда мы увидели новости о секвенировании генома SARS-CoV-2 в НИИ гриппа, мы сами предложили коллегам помощь со сборкой. Понимая важность задачи, мы на два дня отложили все остальные проекты в сторону и занялись ее решением.

Научный сотрудник Центра алгоритмической биотехнологии СПбГУ Дмитрий Антипов

Как объяснил Дмитрий Антипов, геномная последовательность SARS-CoV-2 оказалась довольно небольшой — всего около 30 тысяч нуклеотидов (для сравнения — в ДНК человека 3,2 миллиарда пар нуклеотидов). При этом бионформатикам пришлось работать с огромными объемом сырых данных, полученных после секвенирования, — их размер составлял 18 гигабайт. Все же решение этой задачи оказалось для ученых привычным, ведь одно из главных направлений лаборатории — разработка инструментов для сборки геномов, причем часто гораздо более сложных, чем вирусные.

«У РНК-вирусов довольно высокая изменчивость, — рассказал Михаил Райко. — И это довольно важное свойство: с одной стороны, нам важно отличать возникающие мутации от ошибок, возникающих при чтении генома. С другой стороны, скорость возникновения новых мутаций важна при разработке вакцины».

Чем быстрее мутирует вирус, тем больше вероятность, что разработанная вакцина в какой-то момент перестанет быть эффективной.

Научный сотрудник Центра алгоритмической биотехнологии СПбГУ Михаил Райко

Все полученные последовательности генома вируса из разных стран, в том числе и «российская», объясняет Михаил Райко, собираются в общую базу данных GISAID, которая изначально разрабатывалась для мониторинга новых штаммов вируса гриппа. Сегодня там можно увидеть филогенетическое дерево нового вируса и его распространение по планете со временем. Вирус меняется, поэтому ученым важно понимать, с каким именно вариантом они имеют дело и откуда он пришел.

Результаты работы по расшифровке и сборке генома SARS-CoV-2 позволили ученым из Института гриппа и их коллегам из Сколтеха выяснить, что в целом «российский» коронавирус мало отличается от исходных «китайских» вариантов, но все-таки генетически он ближе к европейским образцам. Чтобы получить больше информации, отмечают исследователи, нужно и дальше продолжать секвенировать различные штаммы, встречающиеся по всему миру.

«Я очень рада, что Михаил и Дмитрий смогли помочь коллегам из петербургского Института гриппа имени Смородинцева. Ошибки сиквенса, равно как и ошибки сборки, ведут к неправильной интерпретации данных и неверным выводам, а в сложных ситуациях на их исправление и переанализ всегда мало времени, — отметила заместитель директора Центра алгоритмической биотехнологии Института трансляционной биомедицины СПбГУ, профессор СПбГУ Алла Лапидус. — Сегодня высококлассных специалистов-биоинформатиков катастрофически не хватает, и в критических ситуациях это становится особенно заметно. Вот почему совершенно необходимо как можно активнее создавать высокого уровня бакалавриаты, магистратуры и аспирантуры по биоинформатике, чтобы растить кадры, которые крайне востребованы во всех сферах нашей жизни».