Е.Я.Тетушкин Трудности на пути конструирования белков

advertisement
Е.Я.Тетушкин
Трудности на пути
конструирования белков
На заре белковой инженерии, в на­
чале 80-х, ее адепты полагали, что
белковые молекулы с желаемыми
свойствами можно будет получать це­
ленаправленным, рациональным кон­
струированием. Действительно, при­
менение известных правил, которым
подчиняется структурно-функцио­
нальная организация белков, в соче­
тании с компьютерной графикой при­
вело к интересным и важным резуль­
татам. Модифицируя природные по­
липептиды, исследователи получили
множество белков с новыми свой­
ствами: ферменты с измененной суб­
стратной специфичностью, белки,
связывающие те или иные металлы,
более устойчивые, чем их обычные
формы, и другие.
Однако вскоре стало ясно, что с
помощью так называемых структур­
ных подходов (основанных на ана­
лизе первичной структуры белков)
можно решить лишь самые простые
задачи белковой инженерии. Чем
сильнее нужно изменить молекулу,
тем сложнее предсказать, какую роль
сыграет замена каждой из множества
аминокислот. Поэтому конструирова­
ние кардинально измененных белков
(например, имеющих повышенную
термостабильность) путем перебора
вариантов на экране компьютера
практически невозможно. Еще слож­
нее создать новый белок. Попытки
такого рода были; удалось даже по­
лучить полипептиды, складывающие­
ся в общем и целом именно так, как
было задумано. Но эти молекулы
представляли собой рыхлые глобулы
(специалисты называют такие струк­
туры «расплавленными») и не похо­
дили на компактные, плотно упакован­
ные природные белки.
Главная трудность заключается в
том, что приходится анализировать
огромное множество вариантов, од­
новременно учитывая все детали
структуры молекулы. Например, весь­
ма небольшой белок из 100 амино­
кислот может быть образован 20 100
разными аминокислотными последо-
8
Â
ероятно, без участия белка в живом организме не протекает ни одной
реакции. Неудивительно, что на протяжении десятилетий белки были
центральным объектом биохимии, и сегодня о них известно в общем немало.
Тем не менее ученые до сих пор не умеют предсказывать пространственную
структуру белковой молекулы по той линейной цепочке аминокислот,
из которой она, собственно, и состоит. Причудливая, самопроизвольно
формирующаяся архктектура этих цепей — уникальная и специфичная
для каждого белка — пока не поддается скрупулезному расчету.
Между тем очевидно, что белковая инженерия может кардинально
изменить многое в нашей жизни. Искусственно сконструированные белки —
это и медицинские препараты с новыми свойствами (здесь уместно
вспомнить модифицированные инсулин и интерфероны, которые существуют
уже сегодня), и улучшение качества сельхозпродукции, и даже совершенно
новые пищевые продукты, и прорыв в нанотехнологиях. Кроме того,
нерешенность проблемы самоорганизации белков тормозит постижение
и использование информации, получаемой при расшифровке геномов
человека и других биологических видов.
Недаром исследователи во всем мире десятилетие за десятилетием
искали переход от последовательности аминокислот к трехмерной структуре
и функции белка. Попытки были безуспешными, однако в самом конце
1990-х годов исследователям из Калифорнийского технологического
института в Пасадене (США) Стефану Мэйо и его соавторам удалось решить
обратную задачу — «вычислить» последовательность (цепочку) аминокислот,
способную образовать заданную трехмерную конструкцию.
До последнего времени ученым, работающим в этой области, удавалось
лишь модифицировать натуральные, то есть выделенные из живых
организмов, белки. Теперь же открываются возможности для конструирования
новых, не встречающихся в природе белковых молекул с совершенно
новыми, нужными для науки и практики свойствами.
вательностями и принимать 101000 конформаций. Ясно, что перебрать и
сравнить все эти варианты не под
силу ни одному современному к о м ­
пьютеру. Можно упростить задачу с
помощью различных допущений. Од­
нако даже при максимальном упро­
щении поисковое пространство оста­
ется огромным: для белка из 100 ами­
нокислот порядка 10 10 вариантов.
Вот почему многие белковые инже­
неры полностью отказались от струк­
турных подходов и предложили в ка­
честве альтернативы использовать
методы, основанные на эксперимен­
тальном моделировании эволюцион­
ных процессов. Эти методы оказались
весьма плодотворными.
Эволюция в пробирке
Как и все удивительное разнообразие
жизненных форм, белковые молекулы
сформировались в ходе эволюции.
Отсюда возникла идея конструировать
белки, подражая природе.
Главные инструменты эволюции —
мутации и отбор. Мутагенез постав­
ляет материал, «сырье» для этого
п р о ц е с с а , а отбор оставляет из
всего разнообразия мутаций толь­
ко т е , которые благоприятствуют
выживанию организмов, повышают
их приспособленность к внешней
среде. Несколько групп белковых
инженеров решили воспроизвести
эту схему в эксперименте с микро­
организмами и культурами клеток
млекопитающих. Мутации, возника­
ющие в норме довольно р е д к о ,
вызывали искусственно. Отбор же
проводили на специальных селек­
тивных средах: в них выживали толь­
ко те мутанты, которые имели белки
с нужными свойствами. (На самом
деле использовались более замысло­
ватые экспериментальные схемы. Но
общая логика этих опытов была имен­
но такой.)
Отметим две работы, наглядно де­
монстрирующие преимущества этого
подхода. Первая выполнена в Евро­
пейской лаборатории молекулярной
в белковой инженерии
ПРОБЛЕМЫ И МЕТОДЫ НАУКИ
биологии, находящейся в Гейдельберге (Германия), а вторая — в Уни­
верситете К ю с ю , расположенном
в Хакодзаки (префектура Фукуока,
Япония). Европейские исследователи
под руководством Карла Бухгольца
усовершенствовали фермент рекомбиназу из трех биологических видов (ки­
шечной палочки, человека и мыши) —
улучшили его способность «перетасо­
вывать» гены. С помощью аналогич­
ной методики японские ученые во гла­
ве с Тетсуя Кумамару получили но­
вые бактериальные бифенилдиоксигеназы (ферменты, разрушающие полихлорированные бифенильные со­
единения). Мутантные ферменты спо­
собны катализировать превращения
таких веществ, которые их нормаль­
ные варианты перерабатывать не мо­
гут.
Оба эти результата было бы край­
не трудно получить с помощью раци­
онального конструирования. Дело в
том, что пока совершенно неясно, от
каких структурных характеристик за­
висят функции рекомбиназы и бифенилдиоксигеназы. Никто не знает, что
надо менять в этих молекулах, чтобы
они заработали как-то по-другому.
Белки вообще настолько сложны и
тонко организованы, что их гораздо
легче сломать, чем усовершенство­
вать. Пока мы не поймем, как связа­
ны структура и функция белка, инже­
нерные решения, направленные на
усиление одного признака (например,
увеличение устойчивости), чаще все­
го будут ухудшать другие необходи­
мые качества (например, каталити­
ческую активность). Эволюция обхо­
дит все подобные препятствия и на­
ходит решение, приемлемое с разных
точек зрения.
Вместе с тем направленная эволю­
ция белков будет успешной лишь в том
случае, если нужная структура может
быть получена в результате серии пос­
ледовательных мутаций. Это условие
сильно ограничивает возможности
эволюционного подхода. Молекула с
нужными свойствами, удовлетворяю­
щая всем правилам белковой архитек­
туры, не может возникнуть при отсут­
ствии «удобного» эволюционного пути,
ведущего к ней, — например, если этот
путь очень длинен или если необхо­
димо сделать несколько аминокислот­
ных замен и некоторые из них нару­
шают функцию белка, выводят его из
строя. (Понятно, что вероятность од­
новременной «правильной» замены
нескольких аминокислот ничтожно
мала; преобладающая часть эволюци­
онных изменений в белках — это еди­
ничные аминокислотные замены.)
Почему и как
полипептидные цепи
сворачиваются в клубки?
Структурные подходы все-таки о б ­
ладают очевидными преимущества­
ми перед альтернативными метода­
м и . Во-первых, они делают в о з ­
можным создание молекул, карди­
нально отличающихся от любых на­
туральных белков. Во-вторых, с их
помощью можно получать модифика­
ции белков, функционирующие в та­
ких экстремальных условиях, которые
трудно воспроизвести в эксперимен­
те. В-третьих, на экране компьютера
можно (хотя бы в принципе) проана­
лизировать неизмеримо большее чис­
ло вариантов, чем в лаборатории.
Возникает вопрос: как при компью­
терном конструировании белков уйти
от перебора огромного множества
вариантов? Каким образом можно
учесть закономерности, управляющие
укладкой белка в трехмерную струк­
туру, и тем самым упростить задачу?
И кстати, что известно об этих зако­
номерностях?
Почти нет сомнений, что конформация белка определяется его первич­
ной структурой — аминокислотной
последовательностью, которая, в свою
очередь, кодируется соответствующим
геном (генами). Самосборка (склады­
вание) полипептида зависит от вза­
имного расположения составляющих
его аминокислот, поскольку разные
аминокислоты, а точнее, их радика­
лы (боковые цепи) обладают разны­
ми физико-химическими свойствами.
Взаимодействуя друг с другом, они
стабилизируют трехмерную структу-
ру белка.
Все аминокислоты можно разделить
по свойствам радикалов на полярные
(гидрофильные) и неполярные (гидро­
фобные). Среди первых особый и н ­
терес представляют кислые аминокис­
лоты (глутаминовая и аспарагиновая)
и основные (аргинин и лизин). Боко­
вые цепи кислых аминокислот содер­
жат карбоксильную группу COOH, а ос­
новных — аминогруппу NH 2 . Посколь­
ку в нативных (неповрежденных) бел­
ках эти группы заряжены (COO— и
NH 3 + ), между ними возникают силы
электростатического притяжения и
отталкивания. Химические группы
разных аминокислот (гидроксильные,
карбоксильные, амидные, тиольные и
др.) могут взаимодействовать друг с
другом, образуя водородные связи.
Эти связи возникают между атомом
водорода, имеющим в результате пе­
рераспределения электронной плот­
ности слабый положительный заряд,
и каким-нибудь электроотрицатель­
ным атомом. Существуют еще д и поль-дипольные взаимодействия,
тоже обусловленные слабыми элект­
рическими зарядами, возникающими
при сдвиге электронов от одного ато­
ма химической группы к другому.
Но наиболее важны для стабилиза­
ции белковых глобул так называемые
гидрофобные взаимодействия. Непо­
лярным радикалам аминокислот «вы­
годнее» контактировать друг с дру­
г о м , чем с молекулами воды; сбли­
жение этих радикалов, сопровождае­
мое «выталкиванием» воды и приво­
дящее к образованию гидрофобного
ядра глобулярного белка, понижает
общую энергию системы. Таким обра­
зом, при сворачивании полипептида
неполярные группы стремятся внутрь
белковой глобулы, а полярные — на­
ружу. Помимо рассмотренных выше
слабых (нековалентных) взаимодей­
ствий, многие белки скрепляются еще
ковалентной связью — дисульфидным
мостиком (мостиками), образуемым
SH-группами двух молекул аминокис­
лоты цистеина из разных участков
полипептидной цепочки. Некоторые
белки дополнительно стабилизируют­
ся небелковыми компонентами — ато-
9
мами металлов, витаминами и дру­
гими органическими соединениями.
Так что задача, о которой говорит­
ся в начале статьи и которую решили
исследователи из Калтеха — подо­
брать оптимальную аминокислотную
последовательность, чтобы получить
белок, имеющий определенную трех­
мерную структуру, — очень мало по­
хожа на простое механическое к о н ­
струирование: каждая «деталь» свя­
зана не только с соседними деталя­
м и , но сложным образом влияет на
всю конструкцию в целом. Отсюда по­
нятно, почему работы Мэйо с соав­
торами были признаны этапными.
Вычислительная белковая
инженерия
Белковые инженеры из Пасадены,
развив и дополнив результаты кол­
лег, создали оригинальные п р о ­
граммы автоматизированного конст­
руирования белков — не первые, но
первые по-настоящему эффективные.
Они уточнили полуэмпирические пра­
вила структурной организации бел­
ков, сформулированные в течение
двух последних десятилетий, все, о
которых говорилось в предыдущей
главе, а также некоторые другие, и
свели их к единому вычислительному
алгоритму. При вычислении энергии
попарных взаимодействий между бо­
ковыми цепями аминокислот, а так­
же между ними и каркасом полипеп­
тида, используются так называемые
эмпирические энергетические функ­
ц и и . Полученные величины служат
исходными данными для оптимиза­
ции вторичной и третичной струк­
тур конструируемого белка. Про­
цесс оптимизации основан на теоре­
ме, доказанной авторами работы, и
сводится к поиску глобального энер­
гетического минимума системы.
Теперь для создания нового белка
(пока, правда, очень небольшого)
достаточно запустить программу и
описать желаемую цель. Впервые это
сделали в 1997 году Стефан Мэйо и
Бэзил Дахьят. Они задались целью
найти аминокислотную последова­
тельность, которая сама собой скла­
дывалась бы в структуру, повторяю­
щую все изгибы одного из участков
цинковых пальцев (белков, ассоции­
рованных с ионами цинка). Задача
была успешно решена. «Вычислен­
ный» полипептид был синтезирован,
и его конформация, как показала про­
верка с помощью ядерного магнит-
ного резонанса, оказалась такой же,
как у выбранного прототипа. В опре­
деленном смысле конструкторы даже
превзошли природу. Структура есте­
ственного прототипа стабилизирует­
ся ионом цинка, а его искусственный
аналог, образованный иным полипеп­
тидом, не нуждается в этой металли­
ческой скрепе. Это самый маленький
из известных белков (в нем всего 23
аминокислоты), способных образовы­
вать уникальную трехмерную структу­
ру без подобных скреп (металличе­
ских и прочих).
Уже после этой работы калтеховцы
усовершенствовали свой алгоритм,
сделали его более универсальным.
Применив обновленную программу,
они сконструировали гипертермо­
фильный (то есть устойчивый к высо­
ким температурам) аналог одного из
доменов белка G стрептококка. По­
добный белок нельзя получить п о ­
средством эволюции в пробирке, по­
скольку в настоящее время не суще­
ствует экспериментальных систем,
позволяющих проводить селекцию
белков при температуре 100°С.
Конечно, сконструированные белки
пока очень малы по размеру. Но надо
учесть, что их первичные структуры вы­
числялись на компьютере с быстродей-
O структуре
белков
юбой белок представля­
ет собой цепочку (или
комплекс и з нескольких
цепочек), звеньями которой
служат, как правило, 20 раз­
личных альфа-аминокислот.
Последние соединены друг
с другом пептидными свя­
зями, и поэтому такие ц е ­
почки именуют пептидами
(полипептидами). Белка­
ми обычно называют доста­
точно длинные полипепти­
ды, включающие не менее
50 аминокислот.
Последовательность ами­
нокислот в полипептидной
цепи образует низший уро­
вень структурной организа­
ции белка — его первичную
структуру. Как правило, зна­
чительная часть полипептид-
Ë
10
ной цепочки завивается в
спираль подобно ленте сер­
пантина (ее называют альфаспиралью), а небольшая об­
разует характерные изгибы
(бета-структуры). Этот следу­
ющий уровень укладки белка
называют его вторичной
структурой. Спирализованная
же цепь, в свою очередь,
Пространственная структура «вычисленной»
и синтезированной калифорнийскими учеными
белковой молекулы (правая стереопара)
практически не отличается о т структуры своего
природного прототипа (левая стереопара) —
фрагмента белка (так называемого цинкового
пальца), влияющего на репродуктивную функцию.
Чтобы увидеть стереоизображение, надо левую
часть стереопары разглядывать левым глазом,
а правую — правым
ствием всего лишь около 4 млрд. опе­
раций в секунду. Между тем уже сей­
час имеются машины, производящие
триллионы операций в секунду. Так
что конструирование более крупных
белков не за горами. Принимая во
внимание быстрый прогресс компь­
ютерной техники, можно сделать вы­
вод, что вычислительную белковую
инженерию ждет блестящее будущее.
Но специалисты по белкам не ос­
тавляют без внимания и первоначаль­
ную (прямую) задачу: установление
структуры и механизмов функциони­
рования белка по данной аминокис­
лотной последовательности. Ведь если
бы ученые умели сворачивать поли­
пептиды in silico, то есть в компьюте­
ре, это открыло бы путь к содержа­
тельной расшифровке геномов живых
организмов, к пониманию «смысла»
нуклеотидных текстов, кодирующих
белки.
Задача ясна. Однако даже мощные
компьютеры за несколько недель ра­
боты могут промоделировать лишь не­
сколько наносекунд (10 -9 сек) процес­
са самосборки белка, реальная про­
должительность которого составляет
от нескольких микросекунд до (чаще
всего) нескольких секунд. Вывод: что­
бы решить задачу, надо кардинально
увеличить вычислительные мощности.
Для достижения этой цели разра­
ботано два очень разных проекта.
Первый, представленный еще в де­
кабре 1999 г., принадлежит IBM. Эта
компания намерена, затратив 100
млн. долларов, создать за пять лет
мощнейший суперкомпьютер, кото­
рый при нынешних темпах развития
электронной индустрии появился бы
только через 15 лет. Проектируемая
вычислительная машина, получившая
название Blue Gene, будет состоять
из одного миллиона процессоров,
каждый из которых будет работать со
скоростью один гигафлоп (один мил­
лиард операций с плавающей точкой
в секунду). Общая производитель­
ность Blue Gene, архитектура которо­
го включает пять иерархических уров­
н е й , составит один петафлоп, или
миллион гигафлопов. Такая машина
могла бы загрузить все содержимое
современного Интернета менее чем
за секунду.
Второй проект был предложен груп­
пой Виджея Панде из Стэнфордского
университета. Идея, на которой он
основан, заимствована из программы
SETI@home. Последняя задействова­
ла миллионы компьютеров по всему
миру для анализа космических радио-
волн с целью обнаружения следов вне­
земных цивилизаций. Панде тоже на­
мерен объединить миллионы обычных
домашних компьютеров, но уже для
моделирования свертывания белков.
Его группа разработала алгоритмы,
которые разбивают задачу на части,
соответствующие переходу полипеп­
тида от одного локального энергети­
ческого минимума к другому. Из-за
многовариантности процесса вычис­
ление каждого его этапа требует па­
раллельной работы множества ком­
пьютеров. Результат, полученный на
одном из них, служит отправным пун­
ктом для последующего моделирова­
ния. Этот проект получил название,
по аналогии со своим прототипом,
folding@home. Читатели «Химии и
жизни», имеющие выход в Интернет,
тоже могут содействовать его реали­
зации. Чтобы подключить свой к о м ­
пьютер к вычислениям в рамках дан­
ного проекта, надо обратиться на сайт
группы Панде (www.stanford.edu/
group/pandegroup/Cosm/).
ПРОБЛЕМЫ И МЕТОДЫ НАУКИ
многократно складывается,
формируя третичную струк­
туру белка. Если полноцен­
но функционирующий б е ­
лок образуется при объеди­
нении нескольких цепей
(как, например, гемогло­
бин), то возникает еще один
уровень структурной органи­
зации — четвертичный.
Иногда выделяют еще два
дополнительных уровня
структурной организации
белка — супервторичную
структуру и доменную струк­
туру (домен — функциональ­
ный и/или структурный мо­
дуль белка). В этом случае
иерархия белковых структур
выглядит так:
первичная структура®
вторичная структура®супер­
вторичная структура® до­
менная структура®четвертичная структура.
Никаких простых эмпири­
ческих или теоретических
правил, позволяющих надеж­
но предсказывать склонность
полипептида к образованию
тех или иных трехмерных
структур, не существует. Точ­
ность предсказаний, осно­
ванных на применении ста­
тистических (вероятностных)
методов и на различных фи­
зико-химических вычислени­
ях, как правило, невысока.
По п р о с т р а н с т в е н н о й
структуре (конформации)
белки разделяют на фибрил­
лярные и глобулярные. Пер­
вые сильно вытянуты и нера­
створимы в водных раство­
рах; они образуют длинные
волокна (например, кератин
волос и ногтей, коллаген су­
хожилий и костей). Вторые
компактны (по форме отда­
ленно напоминают сферу) и
водорастворимы. К глобу­
лярным белкам относятся
почти все ферменты (белки,
катализирующие биохими­
ческие реакции), антитела,
транспортные белки (тот же
гемоглобин) и гормоны бел­
ковой природы.
11
Download