Как гены дирижируют работой клеток? С чего вести отсчет жизни? Как остановить механизм, который превращает обычную клетку в раковую? Ответ на эти фундаментальные вопросы сегодня невозможен без биоинформатики. "Огонек" встретился с одним из самых известных представителей этого направления в биологии, заместителем директора Института проблем передачи информации (ИППИ) РАН, математиком Михаилом Гельфандом*
* "Огонек" вместе с Институтом проблем передачи информации им. Харкевича РАН начинает цикл публикаций "Математические прогулки". В течение года мы будем встречаться с ведущими учеными, которые убеждены в том, что математика — по-прежнему "царица всех наук".
Биоинформатика — наука до того молодая, что многие о ней и не слышали. Между тем развивается она весьма бурно: число центров, где ученые с помощью математических методов работают с данными, полученными экспериментальной биологией, растет систематически и очень бурно.
Главный предмет анализа — информация о том, как работают белки и гены: по объему этот массив добытых, но еще не переваренных сведений можно сравнить с айсбергом, покачивающимся на волнах современной научной мысли. Один пример, чтобы понять, с какой скоростью этот массив нарастает: в 1977-м американцы расшифровали первый в мире геном (это был геном фага phi Х-174 — вируса, убивающего бактерии) и опубликовали результаты работы в виде атласа. Сегодня такое в принципе невозможно: мы научились прочитывать записи ДНК бактерий и вирусов, растений и животных, живых и давно умерших организмов с такой умопомрачительной скоростью, что с обработкой всей этой информации не справляются даже компьютеры. Биоинформатика же не только придумывает, как хранить это богатство, но и ищет способы упорядочить весь объем данных, систематизирует их, сопоставляет, делает выводы. Иногда — потрясающие. В частности, благодаря биоинформатике ученые прочитали геном человека, создали искусственную бактерию и подступились к лечению некоторых видов рака.
— Михаил Сергеевич, а какие открытия последних лет вы назвали бы самыми важными?
— Знаете, мне не нравится термин "открытие". В современной биологии масса народа работает в одних и тех же областях — такого, чтобы кто-то один думал-думал да и сделал открытие, не бывает. Поэтому, кстати, и выродились Нобелевские премии по биологии — вокруг каждой из них целый ореол исследователей: всем тоже нужно было что-нибудь дать.
— Хорошо, в таком случае как бы вы определили самые существенные процессы, ключ к пониманию которых удалось подобрать с помощью биоинформатики?
— Самое значимое, пожалуй, в том, что мы научились отслеживать, как работает клетка в целом. До сих пор молекулярные биологи в конкретном исследовании могли изучать работу только одного гена или одного белка. А теперь наконец-то появилась возможность смотреть на то, как работают все гены сразу, как их регулируют белки, взаимодействуя с ДНК. Это порождает огромное количество информации, с которой нужно уметь работать, меняет саму биологию. Можно сказать, что изменился сам стиль работы...
— Что вы имеете в виду?
— Раньше биологи работали с проверенными-перепроверенными фактами, а сейчас они имеют дело с огромным количеством данных, некоторые из которых запросто могут быть и ошибочными. И это понятно: одно дело, когда аспирант ставит эксперимент и раз за разом смотрит, с каким геном взаимодействует такой-то белок, другое — когда эту задачу в масштабном режиме решает робот, машина. При этом постоянно возникают погрешности, которые нужно уметь отделять от полезной информации. Это умеют делать биоинформатики, используя ряд математических приемов. В итоге из массива информации, полезной и бесполезной, мы научились извлекать целостную картину. К тому же она переведена на язык, привычный для биологов.
— А где биоинформатики берут эти самые данные для обработки? Это плод какой-то совместной работы с биологами?
— Во-первых, сегодня любой крупный биологический эксперимент планируется вместе с биоинформатиками. Во-вторых, есть очень большие международные проекты по генерации таких данных. Например, в Китае есть Пекинский геномный институт — огромная корпорация, которая генерирует последовательности ДНК самых разных организмов и выкладывает их в открытый доступ. Кроме того, по международным правилам, если ты публикуешь работу, связанную с изучением генома, в уважаемом журнале, ты обязан опубликовать последовательности ДНК. Ну а вокруг этого, как слепни вокруг коровы, вьется куча биоинформатиков, каждый из которых пытается высосать свою капельку крови...
— И много ли удалось высосать?
— Достаточно, чтобы иметь возможность иначе смотреть на эволюцию жизни на Земле. Теперь у нас есть полные геномы разнообразных живых существ, их видовая принадлежность прослеживается на молекулярном уровне. Мы строим так называемые молекулярные деревья, которые показывают родственные отношения между видами на уровне генов. Это потрясающе: раньше вся эволюционная биология строилась в значительной мере на догадках, а теперь мы можем делать статистически достоверные выводы! Это вносит существенные коррективы и в систематику биологии. Мой любимый пример: киты и бегемоты оказались ближайшими родственниками. При этом в "двоюродных" родственниках у них свиньи, а к ним — другие парнокопытные: верблюды и крупный рогатый скот.
— И вы все это видите на уровне генов?
— Да. Причем, наблюдая эволюцию на молекулярном уровне, мы можем предсказывать функции тех или иных генов. Экспериментально это очень тяжелая задача, а проверить конкретное предсказание оказывается гораздо проще. Именно этой трудоемкой работой заняты десятки лабораторий по всему миру.
Химерный прадедушка
— Теперь давайте от преамбулы к основной части: и как же все эти данные повлияли на наши знания о человеке?
— О человеке говорить я очень люблю, потому что это прикольно. Исследования такого рода меняют представления о поздней предыстории, когда письменных памятников нет, а археологические уже есть. По древней ДНК этих людей мы можем проследить, как заселялась Европа, связать, к примеру, индоевропейцев с носителями так называемой ямной культуры Восточной Сибири. А если залезть глубже, можно отследить всякие безнравственные выходки наших предков, которые, выйдя из Африки, вступали в интимные отношения с неандертальцами. Ключ ко всему этому — изучение генома. Мы, например, теперь точно знаем, что у каждого европейца есть примерно два процента неандертальских генов. Это наше генетическое наследство.
— А у других народов что же, такого наследства нет?
— Оно есть только у европейцев и азиатов. Дело в том, что примерно полмиллиона лет назад из Африки первыми ушли неандертальцы, которые поселились в Евразии. Примерно 80 тысяч лет назад Африку покинула следующая ветвь человечества — наши с вами предки, которые активно скрещивались с неандертальцами. Кстати, вся эта история сильно подрывает теории о чистоте белой расы: если у кого и осталась "чистая кровь", так это у африканцев.
— Известно, за что у нас отвечают эти два процента неандертальских генов?
— Это не так просто. Дело в том, что эти два процента у всех людей разные. Более того, если взять множество современных людей, у каждого из них найти его неандертальские фрагменты, а потом все их сложить, то мы восстановим примерно 30 процентов нашего неандертальского прадедушки. Это если верить, что этот прадедушка был один. На самом деле нет, потому что гибридизация, по-видимому, случалась несколько раз.
— И все-таки, что можно сказать о химерном прадедушке?
— Известно, что неандертальцы были довольно красивенькие — белокожие, с рыжими волосами и голубыми глазами, то есть у них была очень арийская внешность. На лекциях я всегда объясняю: если кому-то нужен повод для национальной гордости, можно иметь в виду, что этот неандертальский прадедушка генетически ближе всего к неандертальцу, найденному у нас в пещере в Адыгее. Иными словами, это наши неандертальцы всех... хм... гибридизировали.
— А проследить функцию этих генов неандертальцев в нас как-то можно?
— Зафиксирована масса вариантов генов, связанная с цветом и структурой кожи и волос. Еще от неандертальцев нам достались какие-то варианты генов иммунной системы — они ведь жили в Европе полмиллиона лет и приспособились к местным патогенным микроорганизмам. Еще есть куча вариантов генов, которые дают предрасположенность к тем или иным заболеваниям. Например, есть такой неандертальский вариант гена, который увеличивает предрасположенность к диабету второго типа. И это понятно: ведь эволюция человека большую часть времени проходила в отсутствие "Макдоналдса". Соответственно метаболизм был заточен на то, чтобы быстро что-нибудь съесть, запасти в виде жира, а потом долго голодать и выживать за счет накопленного. Когда же у вас рядом "Макдоналдс", то драйв быстро что-нибудь съесть сохранился, а голодать уже не приходится. Вообще, многие болезни, связанные с ожирением, диабетом и прочими нарушениями обмена веществ, на самом деле следствие того, что отбор действовал в сторону выживания в ситуации отсутствия еды, а не в ситуации ее избытка
— С неандертальским наследием более или менее ясно. А еще какие-то древние геномы преподнесли сюрпризы?
— Денисовский человек (ветвь человечества, существовавшая примерно 40 тысяч лет назад параллельно с неандертальцами и кроманьонцами, названа по месту обнаружения в Денисовой пещере на Алтае в 2008 году.— "О") — открытие совершенно потрясающего уровня. Найдено всего полдюжины косточек размером с сантиметр и один зуб, никакого целого скелета. Поэтому все, что известно про денисовцев, мы почерпнули из его генома. Например, мы знаем, что в отличие от неандертальцев денисовцы выглядели как современные африканцы, может чуть посветлее.
— А что удалось узнать из древних ДНК, не связанных с человеком?
— Можно по генам проследить историю одомашнивания скота или растений. Работают чудесные проекты типа "Тысяча геномов риса", которые помогут сделать селекцию и геномное редактирование более осмысленными. Это крайне ценно в ситуации, когда мы не можем прокормить половину человечества.
Полезные ископаемые
— Михаил Сергеевич, в какой мере российская наука участвует в этой череде открытий?
— Биоинформатика — наука относительно дешевая. Ей не нужны реактивы и дорогие приборы, нужны только компьютеры и приличные зарплаты. Это экспериментальному биологу деваться некуда, а биоинформатик хоть завтра может пойти программистом в банк. Поэтому российская биоинформатика удивительным образом устроена довольно прилично. Есть какое-то количество действительно хороших групп, которые работают как с российскими, так и с иностранными консорциумами биологов. Например, у нас есть коллаборация с выдающимся китайским ученым Филиппом Хайтовичем (российский биолог, руководит Институтом вычислительной биологии в Шанхае.— "О"), с видным японским ученым Олегом Гусевым (работает в составе международной группы астробиологов в Национальном институте агробиологических наук в Цукубе (Япония).— "О").
— Реально ли говорить о какой-то специфике российских работ? Есть что-то вроде генеральной линии?
— Да, у нас есть чудесная вечная мерзлота и чудесная Денисова пещера. И там, и там отлично сохраняется ДНК, причем почему в последнем случае, никто не знает. Поэтому Россия является ресурсной державой еще и в этом смысле. Не все же нефтью торговать, можно еще и костями. Если вы посмотрите на публикации по этой теме в Nature, где в числе соавторов присутствуют россияне, то увидите — зачастую предоставляли археологический материал мы. Бывают смешные истории, например, с кроманьонцем из Усть-Ишима. Один человек, который занимался косторезным искусством, ходил по берегам реки Ишим и подбирал кости, а потом устроил в местной школе выставку своих готовых изделий и найденных костей. Мимо проходил местный милиционер, который намекнул, что кость-то эта человеческая. Повезло, что милиционер был просвещенный, не просто участковый какой-нибудь, а криминалист, который заочно учился на томском биофаке. В общем, уголовное дело открывать не стали, а вместо этого сдали кость на секвенирование — в итоге оба стали полноценными соавторами статьи в Nature. Причем костореза приписали к какому-то центру народной культуры, а у второго так и написано "отделение милиции такого-то района". И это абсолютно правильно. Иное дело, когда свое имя в статью вписывает директор института, вся заслуга которого в том, что он разрешил для анализа сделать дырочку в кости, которая до того пролежала в музее лет сорок...
— Вы это к тому, что сами мы исследовать древнюю ДНК не умеем?
— На деле древней ДНК хорошо занимаются всего несколько лабораторий в мире. Это страшно трудоемкая вещь! Конкуренция высока, выйти на этот рынок трудно — требуются очень большие затраты на старте: оборудование, чистые комнаты и т.д. Организовывать такую лабораторию с нуля — все равно, что запускать новую автомобильную компанию, когда есть "Порше" и "Дженерал Моторс". То есть вы выходите на рынок, где уже работают гиганты. В этом смысле как раз тактически разумно с ними коллаборировать.
Традиция думать
— Ваш дед, знаменитый математик Израиль Гельфанд, стал родоначальником не только определенной школы в математике, но и в нейрофизиологии. Российская наука всегда славилась сильными научными школами. Можно ли говорить, что нечто подобное сложилось у нас с биоинформатикой?
— Первые лаборатории, которые что-то делали в области биоинформатики, появились в конце 1970-х. Были лаборатории в ГосНИИгенетике и в Институте молекулярной генетики, были семинары в Институте полиомиелита, и в Институте физико-химической биологии МГУ и сильная группа в Пущино в Институте вычислительных проблем биологии, тогда он назывался Вычислительный центр Пущинского центра.
— Из них и сложился Московский биоинформатический семинар в ИППИ РАН?
— С семинаром такая история. В конце 1980-х считалось, что в каждой лаборатории должен быть свой рабочий семинар, люди ходили друг к другу в гости и рассказывали, что у них происходит. Потом в 1990-е почти одновременно уехало очень много народу, и критическая масса участников таких семинаров пропала. Поэтому мы создали общегородской семинар. В 1990-е годы московское биоинформатическое сообщество было какое-то удивительно просветленное — там практически не было злобной конкуренции за ресурс, там не было мерзавцев. В этом смысле очень хорошо работать внутри расширяющейся науки — нет конкуренции за ресурс, а денег все равно не было нигде. Это всегда просветляет. К середине 2000-х эти группы возникли снова, и сейчас наш семинар собирается, когда приезжает кто-то интересный.
— Сейчас, по вашим наблюдениям, больше ученых уезжает от нас или меньше? Молодежь, которую так стараются удержать...
— Сейчас, конечно, будут уезжать больше, даже не из соображений, что тут хуже жить. Уезжают не по объективным, а по каким-то психологическим причинам. Со мной разговаривали сотрудники из нашей лаборатории и предупреждали, что они ищут место. Мотивируют тем, что так их все устраивает, наука замечательная и с деньгами не то что хорошо, но во всяком случае не голодно, но вот открываешь интернет утром и хочется валить сразу. Раньше этого не было. В середине 2000-х, когда стало понятно, что здесь можно работать, был даже заметный обратный приток.
— Наших биоинформатиков ждут за границей?
— Никого нигде никогда не ждут. Конкуренция есть везде, но тем не менее наши оседают во вполне приличных местах.
— Пока не появился факультет биоинженерии и биоинформатики, откуда все-таки больше приходило специалистов — из математики или биологии?
— Пополам. И сейчас на самом деле очень много людей приходит не с факультета, а откуда-то еще. Химики, физики, есть даже экономисты. Это зависит от задач, которые мы решаем.
— Современные студенты сильно отличаются от тех, что были лет 15-20 назад? Есть проблемы с высшим образованием в биологии?
— Я не замечал. Но у нас довольно специальный факультет, название длинное, не очень понятно, что там делать, поэтому люди приходят тоже довольно специальные, которые к моменту выбора достаточно хорошо понимают, зачем они идут в науку.
— Можно назвать направления, где молодежь делает что-то стоящее? Есть яркие имена?
— Не буду называть имен — есть очень хорошие работы, но им самим будет неудобно. Из направлений могу отметить, что у нас действительно есть кусочек работы с древней ДНК, есть много коллабораций по работе с массовыми данными как с зарубежными, так и с российскими группами. Например, именно с российскими биологами мы изучаем пространственную структуру ДНК. Оказывается, она не просто свернута в клубок каким-то произвольным образом, какие-то близкие участки ДНК взаимодействуют друг с другом. Это очень сложная наука, которая сейчас в самом начале пути.
Остановить мгновение
— Можно выделить какую-то область, где биоинформатики ждут какого-то прорыва в первую очередь?
— Есть совсем новая наука, которой от силы лет пять, и связана она с изучением работы индивидуальной клетки. Дело в том, что когда вначале говорил о том, что мы научились смотреть на работу клетки в целом, я соврал. Потому что имелось в виду, что мы видим работу какой-то усредненной клетки данной ткани. А сейчас наконец-то научились смотреть на клетки именно индивидуальные.
— Это связано с прочтением индивидуальных геномов?
— В том числе, ведь когда в 2000 году все газеты написали о том, что расшифрован геном человека, многие ехидно спрашивали: какого именно? Это ведь на самом деле был не один человек, а некоторая химера из людей, то есть какой-то усредненный геном человека вообще. Потом стали действительно делать геномы индивидуумов, возник проект "Тысяча геномов", появилось много крупных медицинских работ. Но теперь ученые идут дальше. Они говорят: если мы имеем геном конкретного Васи Пупкина, то это на самом деле все равно не очень понятно что, потому что он был таким на момент анализа, а каждое мгновение на одно клеточное деление накапливается несколько десятков мутаций, и поэтому все клетки немного разные. Для большинства клеток это несущественно, потому что эти мутации происходят в участках генома, которые ни на что особенно не влияют. Но для некоторых клеток это существенно, потому что если случатся мутации в каких-нибудь онкогенах, то будут всякие неприятности со здоровьем.
— Значит, это тоже своего рода эволюция, только на уровне жизни каждой конкретной клетки?
— Да, и тут происходят большие открытия. Например, ученые проследили эволюцию индивидуальных нейронов и совершенно неожиданно оказалось, что каждая область мозга сложена клетками, которые на самом деле очень слабо родственны друг другу. Говоря иными словами, у зародыша появляется клетка, а затем она "выбирает" себе функцию в зависимости от того, в какой части мозга она оказалась. Теперь, задним числом, мы понимаем, что это очень мудро с чисто инженерной точки зрения. Ведь клетки при делении портятся, и если у вас в зародыше пострадала клетка-предшественник какой-то области коры мозга, то у вас этой области просто не будет. А если каждая область закладывается клетками из нескольких линий, которые только потом становятся физиологически однородными, такого произойти не может.
— Можно ли говорить, что в итоге это может стать серьезным шагом на пути к персонализированной медицине?
— Да, есть огромное направление работы — это когда ученые расшифровывают ДНК клеток опухоли и ДНК здоровой ткани, из которой эта опухоль произошла. Так можно увидеть, какие именно поломки привели к возникновению рака. Дело в том, что рак — это, по сути, заболевание генома, которое возникает из-за мутаций в ДНК. Мы можем проверить их и увидеть, что то, что мы раньше считали одним и тем же диагнозом, на самом деле на молекулярном уровне — разные болезни. И лечить их соответственно нужно по-разному. Это очень большая работа и очень большая наука, которой сейчас занимаются во всем мире. Подчеркну: это очень большая наука.
Ну и, кроме того, есть системы, в которых клетки обладают индивидуальностью просто по построению. Например, клетки иммунной системы: у нас существует специальный механизм порождения разнообразия лимфоцитов, чтобы можно было бороться с разными патогенами. Это единственные клетки в организме, у которых перестройка ДНК — не поломка, а запланированное действие. Все это люди поняли, когда начали работать с индивидуальными клетками.
Эта наука только появилась, но очевидно: вскоре она будет применяться в самых разных областях. Так что будем ждать новых чудесных открытий, связанных с индивидуальными клетками.
Уже династия
Визитная карточка
Соединить математику с биологией пытался не один Гельфанд. Вот что удалось этой семье за три поколения
Израиль Моисеевич Гельфанд (1913-2009) — один из крупнейших математиков ХХ века, основатель научной школы, оказавший влияние на все области математики и математической физики. Математический семинар Гельфанда действовал 45 лет и дал миру десятки научных светил. Почетный член двух десятков университетов и академий, включая Лондонское Королевское общество, Оксфорд, Гарвард. В конце 1950-х Гельфанд занялся математическими методами в биологии, нейрофизиологии и медицине. Одним из первых начал математически описывать механизмы опухолевого перерождения клеток. В Институте проблем передачи информации РАН исследовал моторную нейрофизиологию. В конце жизни занялся биоинформатикой, применяя математические методы для описания работы белков.
Сергей Израилевич Гельфанд — известный математик, автор ряда монографий по математике, ныне — ответственный издатель Американского математического общества в Провиденсе (штат Род-Айленд, США).
Михаил Сергеевич Гельфанд — доктор биологических наук, профессор факультета биоинженерии и биоинформатики МГУ, замдиректора ИППИ РАН, член Европейской академии, лауреат премии им. А. Баева РАН за цикл работ "Компьютерная сравнительная геномика", один из основателей сетевого сообщества профессиональных ученых "Диссернет", а также один из самых цитируемых в мире современных российских ученых.