Ученые ИТМО разработали алгоритм для анализа бактериальных геномов. Метод позволяет менее чем за минуту автоматически распознать в геномах изменения, ответственные за эволюцию бактерий, в том числе вызывающие заболевания человека.
Фото: Максим Кимерлинг, Коммерсантъ
Сравнительная геномика позволяет изучать историю происхождения геномов живых существ, выявлять эволюционные сценарии и реализующие их молекулярные механизмы.
Разработанный биоинформатиками ИТМО и сотрудниками Института науки и технологии в Австрии алгоритм PaReBrick позволяет автоматически идентифицировать параллельные перестройки в бактериальных популяциях. Сперва инструмент изучает коллекцию штаммов, представленных в виде последовательности общих блоков в геномах различных живых организмов, и их филогенетическое дерево, которое демонстрирует эволюционные взаимосвязи между ними. Затем он определяет перестройки в геноме и визуализирует информацию на филогенетическом дереве, отображающем нужный признак, например наличие определенного гена.
По словам главного автора исследования, аспиранта факультета информационных технологий и программирования ИТМО Алексея Забелкина, толчком к проекту стала работа коллег ИППИ РАН, которые описали ранее неизвестный эволюционный механизм антигенной вариации, позволяющий патогену оставаться невидимым для иммунной системы человека. Сравнивая геномы разных штаммов стрептококка, они обнаружили, что одно и то же эволюционное событие (изменение порядка генов и их фрагментов в геноме) происходит в разных штаммах независимо, существенно меняя свойства этого патогена. Но обычно подобные исследования проводятся вручную и занимают много времени, теперь же метод ученых ИТМО поможет автоматизировать этот процесс.
Алгоритм может использоваться в медицине, генной инженерии, сельскохозяйственных и фундаментальных биологических исследованиях. Например, изучение эволюционных механизмов бактерий позволяет узнать потенциальные причины их устойчивости к антибиотикам и их стратегии эволюции — все это может существенно упростить работу врачей, биоинформатиков, биологов.
Алексей Забелкин, аспирант факультета информационных технологий и программирования Университета ИТМО, и Юлия Яковлева, инженер-исследователь кафедры микробиологии СПбГУ:
— Программа получает на вход прочитанные последовательности геномов, разбивает их на сходные (гомологичные) участки и анализирует их порядок. Алгоритм детектирует изменение порядка таких участков, то есть перестройки на хромосомах, и позволяет определить, у каких именно представителей из изучаемой выборки они произошли. Также программа получает на вход филогенетическое, «фамильное», дерево тех организмов, для которых получены геномы. С помощью филогенетического дерева можно понять, случилась ли хромосомная перестройка независимо в эволюции у представителей или передалась от общего предка. Если перестройка обнаружилась внутри разных «семей» филогенетического дерева, то ее можно считать независимой, то есть параллельной, независимо случившейся в ходе эволюции.
При этом алгоритм не определяет сам геном. Геном прочитывает специальная аппаратура — секвенаторы, а алгоритм позволяет находить интересные биологические истории в уже прочитанных геномах. Биоинформатические программы могут достаточно точно предсказывать некоторые свойства генома, однако нельзя на 100% исключить возможность предсказания ложноположительного или ложноотрицательного результата. Для подтверждения биоинформатических результатов существует этап валидации в биологической лаборатории. Алгоритм позволяет находить и проверять самые многообещающие и перспективные для дальнейшего изучения, позволяет избежать многодневной или даже многолетней рутинной работы.
Полученный алгоритм позволяет определять параллельную адаптацию с помощью хромосомных перестроек у бактерий. Эти перестройки потенциально могут быть вовлечены в приобретение устойчивости к антибиотикам у бактерий, влиять на их способность эффективно заражать хозяина, а также избегать ответа иммунной системы с помощью смены поверхностных белков (один из механизмов антигенной вариации). Перспектива применения достаточно широка. Хромосомные перестройки сами по себе могут играть роль в эволюционном процессе и видообразовании, в нарушении фертильности, в онкологических и врожденных наследственных заболеваниях.
Ранее подобные эволюционные события ученые могли обнаружить только с помощью большого количества лабораторных экспериментов. Специалистам Института проблем передачи информации им. А. А. Харкевича РАН удалось аналитическими методами обнаружить повторяющиеся антигенные вариации, которые помогают обходить иммунный ответ, на примере выборки штаммов стрептококка, однако без разработанного биоинформатического алгоритма работа была очень трудоемкой.