Биоинформатики СПбГУ выяснили, что в кишечнике человека изучена только половина бактерий
Исследователи Санкт-Петербургского университета создали новый алгоритм для анализа метагеномов — наборов геномов больших сообществ микроорганизмов, которые обитают, к примеру, в почве, воде или кишечниках животных и человека. Новый инструмент помог выяснить, что сегодня известна лишь половина всего многообразия кишечных бактерий, живущих в организмах людей.
Одна из важных задач биоинформатики заключается в том, чтобы восстанавливать последовательность генома — именно в нем заложена наследственная информация любого живого существа. Решение этой непростой задачи состоит из двух этапов: секвенирования («разрезания» молекулы ДНК на мелкие «кусочки» и прочтение каждого из них отдельно) и сборки, когда при помощи математических алгоритмов геном восстанавливают из фрагментов (ридов). Чем длиннее и точнее получаются риды во время секвенирования, тем эффективнее работают алгоритмы сборки, а значит, можно больше узнать о хозяине генома — животном, растении или бактерии. Однако создание длинных ридов стоит дороже, поэтому исследователи нередко предпочитают им короткие фрагменты.
Результаты исследования опубликованы в журнале Cell Systems.
Сегодня ученые умеют работать не только с единственным геномом, но и с их совокупностями — метагеномами. Это может быть генетический материал большого сообщества бактерий, которое живет в образцах почвы, в воде на дне океанов, в сточных водах и даже в кишечнике человека. Новый алгоритм, который разработали авторы статьи в Cell Systems — младший научный сотрудник СПбГУ Антон Банкевич и заведующий лабораторией «Центр алгоритмической биотехнологии» Института трансляционной биомедицины СПбГУ Павел Певзнер, позволяет гораздо эффективнее исследовать именно такое генетическое «ассорти».
Исследователи Санкт-Петербургского университета первыми в мире предложили изучать редкие бактерии с помощью анализа результатов секвенирования сразу двух технологий: Illumina, которая позволяет получать короткие фрагменты ДНК, и TruSeq Synthetic Long Reads (TSLR), которая помогает восстанавливать более длинные участки генома. Биоинформатики с помощью различных математических методов ищут, где участки ДНК (как короткие, так и длинные) совпадают, это позволяет понять, какие прочтения пришли из высокопредставленных в метагеноме бактерий, а какие из редких.
«К сожалению, мы не знаем точно, какие фрагменты генома к каким бактериям относятся. Однако новый алгоритм помогает нам спрогнозировать, какого размера будет "белое пятно" — неизученная область метагенома, — рассказал Антон Банкевич. — Эта информация позволяет увидеть полный масштаб многообразия бактериального сообщества, а значит — сэкономить немало средств исследователей. По нашим расчетам, суммарная длина геномов бактерий в кишечнике человека составляет 1,3 миллиарда нуклеотидов, а длина геномов кишечных бактерий, которую на сегодня удалось восстановить исследователям, — всего 656 миллионов. Это значит, что мы знаем только около 50 % микроорганизмов, которые живут у нас в животе».
Скорее всего, отмечает исследователь, известная половина — самая важная, тем не менее ученые всего мира продолжают изучать различные метагеномы и искать в них неизвестные виды бактерий. Такие находки могут обладать интересными свойствами и в будущем стать основой для новых видов антибиотиков, пестицидов или, к примеру, помочь в создании устойчивых к болезням овощей и фруктов. К тому же подобные исследования помогут больше узнать о различных заболеваниях желудочно-кишечного тракта — от элементарного расстройства желудка до болезни Крона.
Недавно ученые предложили считать человеческий микробиом — сообщество бактерий, живущих в симбиозе с организмом человека, — одним из органов тела наряду с сердцем и легкими. Его заболевания так же опасны, как заболевания других органов, и часто связаны с уменьшением многообразия бактерий. Предложенный в статье метод позволяет измерять и наблюдать, как меняется состояние микробиома, а значит — может помочь в его лечении.