Строители новой жизни
Нобелевская премия по химии вручена за структуру и функции белков
Большинство реакций в нашем организме проходит с участием белков. Про их роль в нашей жизни ученые знали достаточно давно. Сами белки известны еще с 1789 года. Но только в последние годы удалось окончательно разобраться с их структурой и функциями. Нобелевская премия 2024 года по химии выдана именно за это.
Дэмис Хассабис и Джон М. Джампер
Фото: Toby Melville / Reuters
Собственно, существуют две больших причины получить Нобелевскую премию — открыть либо эпохальную химическую реакцию, либо метод исследования химических молекул. И то, что в данном случае речь идет не о большом сером ящике, на который похожи многие современные приборы, а о компьютерной программе, сути дела не меняет. У химиков появились инструменты, которые позволяют разобраться со всеми существующими белками на Земле и насоздавать новых с заданными свойствами.
Первую половину Нобелевской премии по химии 2024 года получил американец Дэвид Бейкер (Университет штата Вашингтон, Сиэтл, США) «За проектирование новых видов белков». Вторую половину поделили между собой Дэмис Хассабис и Джон М. Джампер из Google DeepMind (Лондон, Великобритания) «За предсказание сложной структуры белков».
Природные белки — это такие высокомолекулярные конструкторы, которые в основном состоят из 20 кирпичиков — аминокислот. Порядок, в котором аминокислоты следуют друг за другом в белковой цепочке, определен в главных молекулах организма — ДНК и РНК. С помощью рибосом эта информация считывается, и затем по ней, как по матрице, создаются белки. Каждый белок обладает собственной структурой, которая однозначно определяется последовательностью аминокислот в нем. За это открытие, кстати, в 1972 году получил Нобелевскую премию по химии Кристиан Анфинсен. Он выяснил, что небольшие белки, потерявшие свою структуру при денатурации, затем ренатурируют обратно с восстановлением своих функций. Дальнейшая работа показала, что и структура их идентична изначальной. Догма Анфинсена подтвердилась почти для всех белков. Исключение составляют, например, прионы, способные свернуться в другую стабильную конформацию, что приводит к смертельному накоплению амилоида, известному как коровье бешенство. Другие неправильные сворачивания амилоидных белков известны как болезнь Альцгеймера и Паркинсона. Неудивительно, что ученые стремятся разобраться с функционированием белков, чтобы понимать, как можно управлять ими.
Разбираться пришлось долго. Строение белковой молекулы отличается от «обычных» полимеров и включает в себя четыре уровня организации. Первый уровень — собственно цепочка соединенных в определенном порядке аминокислот. Первую такую структуру — инсулин — расшифровал Фредерик Сенгер («Нобель» по химии 1958 года). Помимо обычных химических связей аминокислоты цепляются друг за друга при помощи так называемых водородных связей. Такие сцепки приводят к тому, что из цепочек образуются альфа-спирали или бета-блоки. А если водородной связью соединены несоседние аминокислоты, образуется «петля». Это второй уровень. За расшифровку структуры «спирали» Нобелевскую премию получил в 1954 году Лайнус Полинг.
Блоки соединяются между собой различными связями в третичную структуру. И она очень строго регламентирована. Белок даже можно превратить в кристалл, настолько одинаково сворачиваются в третичную структуру все его молекулы. Первым таким кристаллическим белком стал гемоглобин, чью структуру при помощи кристаллографии расшифровали Макс Перуц и Джон Кендрю в 1962 году. Еще через два года Дороти Ходжкин получила премию за массовую расшифровку третичной структуры важных белков, в том числе инсулина.
Некоторые белки соединяются в комплексы по два, три, четыре или даже больше белков, другие молекулы. Так образуется четвертичная структура.
Самое удивительное, что белки сворачиваются в нужную структуру буквально за доли секунды. Хотя число комбинаций настолько огромно, что даже для белка длиной в сто аминокислотных остатков число комбинаций структуры невероятно. Если бы перебор осуществлялся раз в секунду, то полный перебор занял бы 10 в 80-й степени лет. Как говорят, «столько не живут» — возраст нашей Вселенной всего 1,35*10 в 10-й степени лет. И тем не менее — уникальная структура за доли секунды, однозначно зависящая от аминокислотной последовательности. Как сейчас понятно, такая структура формируется, потому что она самая энергетически выгодная. И она непременно связана с функцией белка. А вот как — из-за сложности определения структур оставалось загадкой.
Методы совершенствовались. Сначала в лидеры выбился рентгеноструктурный анализ. Затем ядерно-магнитный резонанс. А затем криоэлектронная микроскопия. Количество структур росло, они собирались в базы данных, крупнейшая из которых — Priotein Data Bank, сейчас в ней более 200 тыс. структур. Параллельно упрощался механизм секвенирования ДНК и РНК, из-за чего ученые смогли получить данные об аминокислотной структуре множества белков. Последним предварительным шагом стало развитие нейросетей, которыми, кстати, занимались лауреаты «Нобеля» по физике 2024 года Джон Хопфилд и Джеффри Хинтон.
Из двух задач — предсказание структуры существующих белков и создание новых белков — сначала удалось решить вторую. Первую такую молекулу синтезировали в 1988 году. С 1997 года к разработке последовательностей, которые могли бы сложиться в нужную структуру, подключились нейросети.
В 2003 году Дэвид Бейкер и его коллеги при помощи разработанной ими программы Rosetta смоделировали белок Тор-7, состоящий из 93 аминокислот, свернутых в два бета-слоя и одну альфа-спираль. Rosetta объединяла последовательности от разных белков из Priotein Data Bank (PDB) и считала итоговую структуру, соотнося ее с прогнозированной. Когда последовательность виртуально свернулась в слои и спираль нужного размера, белок синтезировали, и он собрался в структуру, абсолютно соответствующую спрогнозированной. Рентгеноструктурный анализ все подтвердил. Прелесть синтеза состояла в том, что в природе нет такого белка. Так что, хотя белок Тор-7 и нефункционален, сам принцип создания оказался верным.
Группе удалось синтезировать множество новых белков — ферментов, а также лиганд-связывающих белков, реагирующих на пикомолярные концентрации стероидов.
К решению второй задачи — расшифровке трехмерной структуры существующих белков ученые подходили регулярно. Один очень значимый конкурс CASP (Critical Assessment of protein Structure Prediction — «критическая оценка предсказания белковых структур») проходит регулярно с 1994 года и собирает более сотни команд. По условиям конкурса команды предсказывают структуру белка, который еще не внесен в базу PDB. Только после сдачи алгоритмов проводится рентгеноструктурный анализ. Точность прогноза не превышала 40%, пока в 2018 году команда DeepMind во главе с Демисом Хассабисом не использовала программу AlphaFold и не увеличила точность прогноза до 60%. Ключевым разработчиком стал Джон М. Джампер. В 2020 году AlphaFold2, основанная на другом алгоритме, спрогнозировала трехмерную структуру с точностью 90%. Это уже оказалось сравнимо с экспериментальными методами, только проще и дешевле. Вскоре AlphaFold2 создала трехмерные модели всех человеческих белков, после чего предсказала структуру более 200 млн белков. А в этом году разработчики создали еще более правильный алгоритм — AlphaFold3. Новая программа способна предсказывать взаимодействия между белковыми молекулами, а также структуры их комплексов с ДНК, РНК, ионами и другими лигандами. То есть расшифровывать четвертичную структуру белка.
Обеими программами пользуются ученые всего мира. Благодаря их работе мы можем быстро получить новые лекарства против рака, болезней Альцгеймера и Паркинсона или любого вируса, синтетические моющие средства, дешевые реактивы, экологически чистые химические производства, молекулярных роботов и многое другое. Так что и Rosetta, и AlphaFold — абсолютно химические инструменты для работы.