КОНФОРМАЦИОННЫЕ ПЕРЕХОДЫ В БЕЛКАХ И ПОЛИПЕПТИДАХ

Учреждение Российской академии наук Физико-технический институт им. А. Ф. Иоффе РАН на правах рукописи Якубович Александр Валентинович КОНФОРМАЦИОННЫЕ ПЕРЕХОДЫ В БЕЛКАХ И ПОЛИПЕПТИДАХ Специальность: 01.04.02 - теоретическая физика ДИССЕРТАЦИЯ на соискание ученой степени кандидата физико-математических наук научный руководитель: доктор физико-математических наук, ведущий научный сотрудник А. В. Соловьев Санкт-Петербург 2010 Оглавление Введение 4 1 Теоретические Методы 16 1.1 Уравнение Шредингера . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.2 Приближение Борна-Оппенгеймера . . . . . . . . . . . . . . . . . . . 18 1.3 Ограничения на волновую функцию . . . . . . . . . . . . . . . . . . 19 1.4 Теория Харти-Фока . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.5 Теория Функционала Плотности . . . . . . . . . . . . . . . . . . . . . 32 1.6 Потенциал молекулярной механики . . . . . . . . . . . . . . . . . . . 38 1.7 Молекулярная динамика . . . . . . . . . . . . . . . . . . . . . . . . . 40 2 Степени свободы в полипептидах и белках 42 2.1 Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.2 Конформационные свойства полипептидов аланина . . . . . . . . . . 46 2.2.1 Определение крутильных степеней свободы полипептида . . 46 2.2.2 Оптимизированные геометрии полипептидов аланина . . . . 47 2.2.3 Зависимость энергии полипептида от двугранного угла ω . . 48 2.2.4 Поверхность потенциальной энергии трипептида аланина . . 49 1 2.2.5 Поверхность потенциальной энергии гексапептида аланина в конформации листа . . . . . . . . . . . . . . . . . . . . . . . . 2.2.6 Поверхность потенциальной энергии гексапептида аланина в конформации спирали . . . . . . . . . . . . . . . . . . . . . . . 2.2.7 57 59 Сравнение результатов расчета с экспериментальными данными . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 2.3 Конформационные переходы в три- и гексапептидах глицина . . . . 68 2.3.1 Оптимизированные геометрии полипептидов глицина . . . . 68 2.3.2 Поверхность потенциальной энергии трипептида глицина . . 69 2.3.3 Поверхность потенциальной энергии гексапептида глицина в конформации листа . . . . . . . . . . . . . . . . . . . . . . . . 2.3.4 Поверхность потенциальной энергии гексапептида глицина в конформации спирали . . . . . . . . . . . . . . . . . . . . . . . 2.3.5 74 79 Сравнение результатов расчета с экспериментальными данными . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Статистическая модель 82 88 3.1 Гамильтониан полипептидной цепи . . . . . . . . . . . . . . . . . . . 89 3.2 Статистическая сумма 93 . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Термодинамические характеристики полипептида . . . . . . . . . . . 100 4 Фазовые переходы в полипептидах 103 4.1 Точность потенциала молекулярной механики . . . . . . . . . . . . . 103 4.2 Поверхность потенциальной энергии полипептидов аланина . . . . . 105 4.3 Фазовый переход α-спираль↔статистический клубок в полипептидах аланина . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 4.3.1 Внутренняя энергия полипептида . . . . . . . . . . . . . . . . 107 4.3.2 Теплоемкость полипептидов аланина . . . . . . . . . . . . . . 111 4.3.3 Расчет параметров Цимма-Брагга . . . . . . . . . . . . . . . . 113 4.3.4 Спиральность полипептидов аланина . . . . . . . . . . . . . . 116 4.3.5 Корреляции разных аминокислот в полипептиде . . . . . . . 118 5 Сворачивание полипептидов и белков в водной среде 120 5.1 Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 5.2 Теоретические методы . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 5.2.1 Статсумма белка . . . . . . . . . . . . . . . . . . . . . . . . . . 123 5.2.2 Статистическая сумма белка в водной среде . . . . . . . . . . 128 5.3 Результаты и дискуссия . . . . . . . . . . . . . . . . . . . . . . . . . . 134 5.3.1 Теплоемкость стафилококковой нуклеазы . . . . . . . . . . . 134 5.3.2 Теплоемкость метмиоглобина . . . . . . . . . . . . . . . . . . 142 Заключение 146 Публикации автора по теме диссертации 150 Список литературы 151 3 Введение Актуальность темы диссертации. Фазовые переходы в сложных молекулярных системах конечного размера, например, переход из стабильной трехмерной молекулярной структуры в состояние статистического клубка, или наоборот (также известный как процесс (ан)фолдинга) широко исследовались во множестве работ (см. обзоры [1–4]). Фазовые переходы данной или схожей природы существуют (или могут ожидаться) во множестве различных сложных молекулярных систем и в нанообъектах, таких как полипептиды, белки, полимеры, ДНК, фуллерены, нанотрубки [5]. Они могут быть рассмотрены как фазовые переходы первого рода, которые характеризуются резким увеличением внутренней энергии системы при определенной температуре. И, как следствие, теплоемкость системы, как функция температуры, имеет выраженный максимум при температуре фазового перехода. В работе [6] предложен новый теоретический метод из первых принципов для описания фазовых переходах в вышеупомянутых системах. А именно, было продемонстрировано, что в полипептидных цепочках (биополимерах, состоящих из аминокислот) можно выделить особенные, так называемые крутильные степени свободы, ответственные за динамику фолдинга полипептидов, т. е. за переход из состояния статистического клубка в состояние α-спирали. Крутильные степени свободы иногда также называеют торсионными степенями свободы. Домен на потенциальной поверхности полипептида соответствующий, данным степеням свободы, может быть рассчитан и тщательно проанализирован на основе методов из 4 первых принципов, таких как теория функционала плотности или метод ХартиФока. В [6] показано, что таких данных достаточно для построения статистической суммы полипептидной цепочки, и, следовательно, для ее полного термодинамического описания, которое включает в себя расчет всех основных термодинамических переменных и характеристик, таких как свободная энергия, теплоемкость, температура фазового перехода и т.д. Применимость метода для описания фазового перехода в цепочках аминокислот различной длины была доказана сравнением предсказаний данной теории с результатами нескольких независимых экспериментов, а так же с результатами расчетов молекулярной динамики. Аналогичные описания могут быть построены для широкого разнообразия сложных молекулярных систем. Предыдущие работы, посвященные изучению процесса фолдинга на основе принципов статистической механики (см. [7–10]) всегда содержали некоторые эмпирические параметры, и поэтому с трудом могут быть применены для предсказания характеристик фазового перехода из первых принципов. Количество работ, посвященных данной проблеме, очень велико. В данной диссертации невозможно рассмотреть их все, поэтому рассмотрены из них лишь те, которые имеют непосредственное отношение к результатам данной работы (см. для обзора [1, 3, 4] и ссылки в них). Первая теоретическая работа, описывающая процесс фолдинга полипептидов была выполнена Циммом и Браггом [7]. В их работе процесс формирования αспирали в полипептиде был рассмотрен в рамках простой двухуровневой статистической модели. Эта модель содержала три принципиальных параметра: (i) константа, описывающая вероятность образования связи аминокислотой с частью полипептида, которая находится в конформации α-спирали, (ii) специальный корректирующий фактор инициации спирали и, (iii) минимально количество аминокислот, которые могут находиться в состоянии статистического клубка межу двумя α-спиральными фрагментами полипептида. 5 Другой набор параметров был предложен в [8]. Основными параметрами в работе являлись энергия водородной связи и количество возможных конформаций аминокислоты в состоянии статистического клубка. Эти два параметра определяют разницу энергии и энтропии между свернутым и развернутым состоянием полипептида. В [10] обсуждались факторы, влияющие на стабильность полипептида в растворе. В [9] статистическая сумма полипептидной цепочки была определена как функция обобщенных координат, соответствующих крутильным степеням свободы молекулы. В той работе условные вероятности нахождения аминокислоты были получены в форме матрицы 3×3. Собственные числа этой матрицы выражали функции от степени полимеризации, температуры и молекулярных констант различных усредненных характеристик молекулы. Теоретическая модель, предложенная в [9] содержала три параметра, описывающих статистический вес трех возможных состояний аминокислоты в полипептиде: состояние спирали, состояние клубка и состояние на границе между спиральной и клубковой фазами. В [11] был предложен другой статистический метод для определения статсуммы линейно-цепочечных молекул. Статистическая сумма была построена на основе так называемых определяющих последовательностей, которые являлись числами, описывающими длины участков полипептида, находящихся в различных конформационных состояниях. Таким образом, определяющая последовательность задает определенное микросостояние системы. Статсумма системы была построена на основе статсуммы определяющих последовательностей. Для осуществления этого, был введен определенный набор эмпирических функций, которые называется последовательность-задающие функции. Метод, предложенный в [11] был использован в [12] для изучения фазового перехода спираль-клубок в полипептидах. В той работе также было проанализировано условие существования фазового переходы в одномерной системе. В [13] была рассмотрена кинетика перехода спираль-клубок в рамках формализма, развитого в [9, 11]. 6 В [14] была обсуждена важность различных внутренних степеней свободы полипептида. Статистическая сумма системы была построена в рамках квантовомеханического и классического формализмов. Переход спираль-клубок был также рассмотрен в [15, 16]. В тех работах общие уравнения статистической физики были использованы для описания фазового перехода. Теории содержали несколько параметров (таких как энтальпия, энтропия, внутренняя энергия), которые были использованы для описания ряда результатов независимых экспериментальных измерений. Подход, основанный на использовании молекулярной динамики является альтернативой использованию статистической физики, который широко применяется в последнее десятилетие для изучения структурных переходов в полипептидах. Молекулярная динамика с учетом всех атомов в системе [17–19] и подход на основе метода Монте-Карло [20, 21] были использованы для изучения трипептида аланина [17], пентапептида аланина [18] и полипептида аланина, состоящего из 21 аминокислоты [19, 21]. Расчеты молекулярной динамики были выполнены в рамках классической механики с использованием эмпирического гамильтониена, который также называют форсфилдом. Наиболее используемые в последние годы форсфилды это GROMOS [22], AMBER [23] и CHARMM [24]. В последние годы молекулярная динамика также широко использовалась для изучения процесса фолдинга небольших белков [25–30]. Такие рассчеты стали возможными относительно недавно благодаря современным компьютерам. Однако, до сих пор невозможно проводить расчеты молекулярной динамики больших белков [1], потому что характерное время этого процесса - от микросекунд до минут [31,32], что на порядки превосходит время возможных расчетов молекулярной динамики. Другой подход на основе молекулярной динамики был предложен в [33, 34]. В этих статьях динамика макромолекулы была рассмотрена в фазовом пространстве торсионных степеней свободы. 7 Стохастический подход к изучению перехода спираль-клубок был предложен в [35,36]. В [35] было проанализировано применение для полипептидов подхода на основе скорреллированных случайных блужданий. В [36] был проведен расчет с учетом всех атомов в системе на основе стохастического разностного уравнения. Переход спираль-клубок также широко исследовался экспериментально [37– 40]. В [37] было калориметрически измерено изменение энтальпии при фазовом переходе α-спираль - статистический клубок в полипептиде Ac-Y(AEAAKA)8 FNH2 , содержащем 50 аминокислот, в основном аланин. Зависимость теплоемкости полипептида от температуры была измерена методом сканирующей разностной калориметрии. В [38,39] были проведены эксперименты для A5 (A3 RA)3 A и MABAA5 -(AAARA)3 -A-NH2 богатых аланином полипептидов, состоящих из 21 аминокислоты методом УФ резонансной рамановской спектроскопии и методом на основе циркулярного дихроизма, соответственно. Была измерена зависимость спиральности полипептида от температуры. Кинетика фазового перехода спираль-клубок для полипептида Suc-AAAAA-(AAARA)3 A-NH2 , состоящего из 21 аминокислоты была изучена в [40] методом инфракрасной спектроскопии. Предыдущие попытки описания перехода спираль-клубок в полипептидах на основе статистической физики, основываются на моделях, предложенных в шестидесятые годы [7–10], в которых был рассмотрен общий формализм построения статистической суммы полипептида. Все предыдущие теории всегда содержали определенные параметры в статистической сумме, что делало их зависимыми от этих параметров. Методы, предложенные в [7–10], широко использовались для описания фазового перехода спираль-клубок в полипептидных цепочках (см. [1–3,21,41–44]). Зависимость термодинамических характеристик фазового перехода α-спираль↔статистический клубок от модельных параметров, используемых для построения статистической суммы, была тщательно проанализирована (см. вышеприведенные ссылки). Несколько работ посвящено определению модельных параметров из экспериментальных данных. В [45] параметры теории Цимма 8 и Брагга [7] были определены на основе измерений кругового дихроизма в поли(Lцистиине) в водном растворе при нейтральном pH. Первые попытки рассчитать параметры Цимма-Брагга теоретически были проведены в [43]. В этой работе был использован полуэмпирический потенциал [46,47] для описания конформационной динамики полипептида. Потенциал, предложенный в этих работах схож с современными форсфилдами [22–24], однако, он упрощенно учитывает структуру полипептида, не учитывая некоторые атомы водорода и делая минимальные предположения о гибридизации атомов. Потенциал, предложенный в [46, 47] можно назвать одним из первых форсфилдов. С его использованием, в [43] были рассчитаны параметры теории Цимма-Брагга и определена температура фазового перехода в полипептиде. В этой работе статистическая сумма была построена в рамках матричного метода, развитого в [9]. Параметры теории Цимма-Брагга были также рассчитаны с использованием молекулярной динамики [48]. В этой работе был предложен метод расчета на основе роста полипептида, с помощью которого была построена модель полипептидной цепочки в конформации α-спирали и статистического клубка. Этим методом были рассчитаны параметры инициации и элонгации спирали, введеные Циммом и Браггом. В настоящей диссертации описан альтернативный теоретический подход, основанный на статистической механике, для описания фазового перехода αспираль↔статистический клубок в полипептидах аланина. Рассматриваемый метод является дальнейшим развитием метода, предложенного в [5, 6], который основывается на построении без каких-либо параметров статистической суммы для системы, совершающей фазовый переход. Вся необходимая информация для построения такой статсуммы может быть рассчитана на основе методов из первых принципов, таких как ТФП, а так же комбинированно с теорией молекулярной механики. Сравнение результатов данного метода с результатами расчетов на основе молекулярной механики позволяет установить точность предложенного но- 9 вого метода для достаточно больших систем, и далее применить данный метод для еще больших систем, молекулярнодинамический расчет которых невозможен из-за ограничений компьютерной мощности. Необходимо отметить, что предложенный метод является новой эффективной альтернативой существующим теоретическим подходам, описывающим фазовый переход спираль-клубок в полипептидах, так как он не содержит никаких модельных параметров и дает универсальный рецепт для построения статсумм сложных молекулярных систем. Статсумма полипептида строится, основываясь на минимальном количестве предположений о системе, что отличается от предыдущих теорий. Она включает все существенные физические факторы, необходимые для описания фазового перехода спираль-клубок в полипептидах. Поэтому, итоговое выражение для статсуммы, полученное в рамках данной теории, отличается от ранее предложенных. Данная работа основана на оригинальных результатах, опубликованных в ведущих международных журналах (см. список публикаций). Научная новизна работы состоит в решении следующих задач: 1. С использованием теории функционала плотности рассчитаны поверхности потенциальной энергии полипептидов аланина и глицина в различных конформациях, состоящих из 3 и 6 аминокислот. Определены основные степени свободы молекулы, ответственные за конформационные переходы. 2. На основе рассчитанных поверхностей потенциальной энергии построена статистическая сумма полипептида и определены термодинамические характеристики системы. 3. В рамках молекулярной динамики исследован переход спираль↔клубок в полипептидах аланина различной длины. 4. Проведено сравнение результатов разработанной теоретической модели, описывающей фазовый переход в полипептидах, с результатами расчётов на основе молекулярной динамики. 10 5. Построена статистическая сумма однодоменного белка в водном окружении. 6. Произведено сравнение разработанной теоретической модели, описывающей конформационные переходы в белках, с результатами экспериментальных измерений зависимости теплоёмкости от температуры для метмиоглобина и стафилококковой нуклеазы. Практическая значимость работы. С использованием точных методов квантовой механики рассчитаны поверхности потенциальной энергии полипептидов аланина и глицина как функции двугранных углов φ, ψ и ω. Данные поверхности потенциальной энергии могут быть использованы для определения характерных высот энергетических барьеров и времён, соответствующих переходам между различными конформацонными состояниями молекулы. Также данные поверхности могут быть использованы для определения уровня точности различных модельных потенциалов, например потенциала молекулярной механики. Разработана теоретическая модель, описывающая сворачивание и разворачивание белков в водном окружении. Результаты, полученные с помощью теоретической модели, хорошо согласуются с результатами экспериментальных измерений, что открывает возможности для использования разработанной модели для предсказания влияния мутаций на конформационную стабильность белков, а также для дизайна белков и белково-подобных полимеров с заданными термодинамическими характеристиками. С определёнными изменениями предложенная теоретическая модель сворачивания белков может быть также обобщена для описания образования функциональных комплексов белков, изучения процессов белковой агломерации. Основные положения, выносимые на защиту: 1. На основе рассчитанных поверхностей потенциальной энергии полипептидов аланиниа и глицина определены характерные времена переходов между наиболее энергетически выгодными конформациями молекул. 11 2. Разработана теоретическая модель, описывающая переход спираль↔клубок в полипептидах аланина. В работе показано, что для построения статистической суммы полипептида необходимо знать только поверхность его потенциальной энергии как функцию мягких степеней свободы молекулы, а именно двугранных углов φ и ψ. 3. Разработанная теоретическая модель хорошо согласуется с другими теоретическими моделями, описывающими переход спираль-клубок, однако, в отличии от предыдущих работ, предложенная модель не содержит свободных параметров. 4. Построена теоретическая модель сворачивания белков в водной среде. Сравнение теоретически рассчитанных результатов зависимости теплоёмкости белков с результатами экспериментальных измерений показывают высокую точность предложенной модели в широком диапазоне температур. Апробация работы. Результаты работы докладывались на семинарах и коллоквиумах в Физико-Техническом институте им. Иоффе РАН, а также в Goethe Universitaet и Frankfurt Institute for Advanced Studies (Франкфурт на Майне). Также результаты работы были представлены на следующих международных конференциях: 1. Symposium on Size Selected Clusters, 2007, Brandt, Austira 2. Moscow Conference on Computational Molecular Biology, 2007, Moscow, Russia 3. International Symposium Atomic Cluster Collisions: structure and dynamics from the nuclear to the biological scale, 2007, Darmstadt, Germany 4. International Conference on Theoretical Physics, 2008, Dubna, Russia 5. International Symposium Atomic Cluster Collisions: structure and dynamics from the nuclear to the MesoBioNano scale, 2008, St.Petersburg, Russia 6. International Symposium on Nanofusion, 2009, London, United Kingdom 7. Symposium on Size Selected Clusters, 2009, Brandt, Austira 12 8. 2nd ITS LEIF Winter School, 2009, Morzine, Haute-Savoie, France 9. DPG Fruhjahrstagung, 2009, Dresden, Germany 10. International Symposium Atomic Cluster Collisions: structure and dynamics from the nuclear to the biological scale, Ann Arbor, MI, USA 11. Physical Principles of Protein Behavior in the Cell, International Workshop, 2009, Dresden, Germany 12. European Conference on Atoms Molecules and Photons, 2010, Salamanca, Spain и других конференциях Публикации. По результатам исследований, проведенных в диссертации, опубликовано 14 статей (их список приведен в конце диссертации). Структура и объем диссертации. Диссертация состоит из введения, пяти глав, заключения и списка литературы. Диссертация содержит 165 страниц текста, включая 42 рисунка и 9 таблиц. Список цитируемой литературы содержит 123 наименований. Первая глава “Теоретические Методы” посвящена краткому описанию основных теоретических методов квантовой механики и молекулярной динамики, которые используются в работе. В первых 4 секциях первой главы приведён обзор метода Хартри-Фока и представлен общий вид стандартных базисных функций, которые используются при численном решении уравнения Хартри-Фока. В секции 5 представлен общий вид уравнения Кона-Шама, которое учитывает локальный обменно-корреляционный функционал. Также в секции 5 приведён вид обменно-корреляционных функционалов, которые использовались в данной работе, а именно функционал Гуннарсона-Люндквиста, Ли-Янг-Парра и функционал Воско-Вилк-Нуссаира. В секции 6 первой главы приведен так называемый феноменологический потенциал молекулярной механики. 13 Вторая глава “Степени свободы в полипептидах и белках” посвящена исследованию поверхностей потенциальной энергии небольших фрагментов белков, полипетидов, как функций различных степеней свободы молекул. Приведенные во второй главе расчеты выполнены на основе теории функционала плотности с учетом всех электронов в системе. В третьей главе “Статистическая модель” приведена разработанная теоретическая модель, описывающая конформационный переход спираль↔клубок в полипетидах. Разработанная теоретическая модель конформационного перехода основывается на построении статистической суммы системы, не используя никаких подгоночных параметров. В секции 1 третьей главы производится построение Гамильтониана полипептидной цепи. Зная Гамильтониан системы как функцию всех ее координат, можно построить статистическую сумму. Построение статистической суммы полипептида, который может находиться в различных конформационных состояниях, приведено в секции 2 третьей главы. В четвертой главе “Фазовые переходы в полипептидах” приведены результаты расчета поверхностей потенциальной энергии полипептидов аланина. Секция 3 посвящена сравнению результатов разработанной теоретической модели с результатами расчетов на основе молекулярной динамики. Также в главе 4 обсуждается зависимость спиральности полипептида от температуры. Спиральность - доля аминокислот биомолекулы, находящихся в конформации спирали. Спиральность полипептидов может быть использована как параметр порядка для перехода спираль↔клубок. Отдельная секция главы 4 посвящена сравнению разработанной теории с результатами других теоретических работ. В частности, в диссертации произведен расчет параметров феноменологической модели Цимма-Брагга, которая широко использовалась для описания перехода спираль-клубок. Основное отличие разра- 14 ботанной теоретической модели от предыдущих работ в том, что предложенная теория не содержит модельных параметров, в то время как предыдущие работы основывались на нескольких варьируемых параметрах. В пятой главе “Сворачивание полипептидов и белков в водной среде” произведено существенное обобщение теории описывающей переход спираль-клубок на случай небольших глобулярных белков в водном окружении. В диссертации проанализированы температурные зависимости теплоёмкости двух глобулярных белков: стафилококковой нуклеазы и метмиоглобина. Из сравнения теоретических и экспериментальных результатов видно, что разработанная модель хорошо описывает такие особенности сворачивания белков как температуры тепловой и холодной денатурации, характерный температурный диапазон обоих переходов при различных значениях pH раствора, максимальные значения теплоемкости при температуре перехода, уменьшение теплоемкости системы находящейся в свернутом состоянии, выгнутый профиль зависимости теплоёмкости от температуры для белка в развернутом состоянии. В последней главе “Заключение” суммированы основные результаты работы, приведено заключение и предложены возможные направления дальнейших исследований. Формулы, рисунки и таблицы диссертации нумеруются по главам, нумерация литературы единая для всего текста. 15 Глава 1 Теоретические Методы В этой части работы рассмотрены теоретические методы, использованные при расчете полипептидов аланина и глицина. Цель этого обсуждения - представить основные идеи этих методов и указать необходимые ссылки, но не описывать их во всех деталях. Для изучения термодинамических свойств системы необходимо исследовать поверхность ее потенциальной энергии относительно всех степеней свободы. Существуют различные методы расчета энергии многочастичной системы. Самые точные подходы основываются не решении уравнения Шредингера. Такие подходы называют подходами их первых принципов, так как они используют минимальное количество предположений о системе. 1.1 Уравнение Шредингера Для точного описания электронной и ионной структуры многоатомной системы необходимо решить уравнение Шредингера для всех частиц в системе. Уравнение Шредингера описывает волновую функцию системы ĤΨ(r, R, t) = i ∂Ψ(r, R, t) , ∂t (1.1) Где Ĥ оператор Гамильтона (Гамильтониан), Ψ(r, R, t) волновая функция систе- 16 мы, которая зависит от координат электронов и ядер в молекуле, и времени, обозначеных как r, R и t, соответственно. Гамильтониан системы можно представить в виде суммы кинетического, T̂ , и потенциального, V̂ , членов энергии: (1.2) Ĥ = T̂ + V̂ Если V̂ не зависит от времени, уравнение Шредингера можно упростить, используя математический прием, известный как разделение переменных. Для этого представим волновую функцию как произведение пространственной и временной функций: (1.3) Ψ(r, R, t) = ψ(r, R)τ (t). Подставляя новые функции в уравнение (1.1), получаем два уравнения, одно из которых зависит только от координат частицы, а другое только от времени. Полученное уравнение называется стационарным уравнением Шредингера: (1.4) Ĥψ(r, R) = Eψ(r, R) где E - энергия системы. Различные решения уравнения (1.4) соответствуют стационарным состояниям молекулы. Состояние с минимальной энергией называют основным состоянием. Уравнение (1.4) не является релятивистским и не верно в случае, когда скорости частиц приближаются к скорости света. Поэтому уравнение (1.4) не совсем точно описывает движение внутренних электронов больших ядер. Кинетическая энергия определяется как: 1∑ 1 T̂ = − 2 k mk ( ∂2 ∂2 ∂2 + + ∂x2k ∂yk2 ∂zk2 ) = 1 ∑ p̂2k , 2 k mk где p̂k - оператор импульса частицы k , и mk - ее масса. 17 (1.5) Потенциальная энергия определяется Кулоновским взаимодействием между каждой парой заряженных частиц: V̂ = ∑ j<N k<j ej ek , |rj − rk | (1.6) где N - количество частицы в системе, |rj − rk | - расстояние между частицами j и k, а ej и ek - их заряды. При этом заряд электрона равен −1, а ядра Z. В итоге: V̂ = − ∑ i<Ne I<Nn ∑ ∑ ZI ZJ ZI 1 + + , |ri − rI | i<N |ri − rj | I<N |rI − rJ | j<i e J<I (1.7) n где Ne количество электронов и Nn количество ядер в системе. Первый член соответствует притяжению между электронами и ядрами, второй и третий соответственно отталкиванию электронов и ядер между собой. 1.2 Приближение Борна-Оппенгеймера Если скорость движения ядер мала по сравнению со скоростью движения электронов в системе, можно упростить задачу, разделив движение электронной и ионной подсистем. Это приближение справедливо, так как масса типичного ядра в тысячи раз больше массы электрона. Такое приближение называется приближением Борна-Оппенгеймера. Полный Гамильтониан системы в этом случае имеет вид: Ĥ = T̂ elec (r) + T̂ nucl (R) + V̂ nucl−elec (R, r) + V̂ elec (r) + V̂ nucl (R), (1.8) где T̂ elec (r) кинетическая энергия электронов, T̂ nucl (R) кинетическая энергия ядер, V̂ nucl−elec (R, r) взаимодействие электронов и ядер, V̂ elec (r) и V̂ nucl (R) электронэлектронное и межядерное взаимодействия соответственно. Приближение БорнаОппенгеймера позволяет разделить ионную и электронную подсистемы, поэтому 18 возможно построить Гамильтониан для электронов, в который не входит член, зависящий от кинетической энергии ядер: e 1∑ = − 2 i N Ĥ elec + ∑( i<Ne j<i ( ∂2 ∂2 ∂2 + + ∂x2i ∂yi2 ∂zi2 1 |ri − rj | ) + ∑( I<Nn J<I ) − ∑( i<Ne I<Nn ZI ZJ |RI − RJ | ZI |RI − ri | ) (1.9) ) Этот Гамильтониан описывает движение электронов в поле стационарных ядер. Ĥ elec ψ elec (r, R) = E ef f (R)ψ elec (r, R) (1.10) Решая уравнения (1.10) для электронной волновой функции, получаем функцию эффективного потенциала ядер E ef f . Она зависит от координат ядер и описывает поверхность потенциальной энергии системы. Соответственно, E ef f также является эффективным потенциалом для Гамильтониана ядер: Ĥ nucl = T̂ nucl (R) + E ef f (R) (1.11) Этот Гамильтониан используется в уравнении Шредингера для описания движения ядер, описания колебательных, вращательных и поступательных движений ионной подсистемы. 1.3 Ограничения на волновую функцию Рассмотрим электронную подсистему. Для краткости, не будем указывать верхние индексы над соответствующими операторами и функциями. Хорошо известно, что |ψ|2 является плотностью вероятности соответствующей частицы. А значит необходима нормировка ψ. Проинтегрировав по всему 19 пространству, вероятность должна равняться количеству частиц. Следовательно, умножим ψ на константу так, чтобы: ∫ |cψ|2 dV = nparticles (1.12) V Это справедливо, так как уравнение Шредингера является уравнением на собственные числа, и, в общем случае, если f - решение уравнения на собственные числа, то и cf - тоже решение этого уравнения, для любой константы c. Для уравнения Шредингера легко показать, что Ĥ(cψ) = cĤ(ψ) и E(cψ) = c(Eψ). Поэтому, если ψ решение уравнения Шредингера, то cψ также решение. Во вторых, ψ должна быть антисимметрична, то есть ее знак должн меняться при перестановке двух. Для простой функции антисимметрия определяется следующим соотношением: f (i, j) = −f (j, i) (1.13) Для электронной волновой функции, антисимметричность - следствие того, что электроны являются фермионами. А значит каждая волновая функция электронов должна удовлетворять следующему соотношению: ψ(r1 , ..., ri , ..., rj , ..., rn ) = −ψ(r1 , ..., rj , ..., ri , ..., rn ) (1.14) 1.4 Теория Харти-Фока Невозможно найти точное аналитическое решение уравнения Шредингера для многоатомной системы. Однако, используя упрощающие предложения во многих случаях возможно найти его решение численно. Рассмотрим одно из наиболее известных приближений - приближение ХартриФока. Основная идея этого метода - заменить многочастичную задачу эффективной одночастичной. В приближении Хартри-Фока волновая функция основного 20 состояния представляется в виде произведения одночастичных волновых функций, которые часто называют молекулярными орбиталями. Разложим волновую функцию основного состояния N -частичной системы фермионов, в данном случае электронов, в виде комбинации молекулярных орбиталей: ϕ1 , ϕ2 , ... Для того чтобы удовлетворить вышеизложенным свойствам волновой функции, выберем нормированный, ортогональный базис из молекулярных орбиталей: ∫ ∫ ϕ∗i ϕi dV = 1 ϕ∗i ϕj dV = 0; (1.15) i ̸= j (1.16) Самый простой способ представить ψ как комбинацию молекулярных орбиталей - сформировать Хартриевское представление: ψ(r) = ϕ1 (r1 )ϕ2 (r1 )...ϕN (rN ) (1.17) Однако, полученная таким образом функция не является антисимметричной, так как замена местами двух ri эквивалентна замене орбиталей двух электронов, что не приводит к смене знака. Следовательно Хартриевское представление не подходит. Самое простое представление антисимметричной волновой функции как комбинации молекулярных орбиталей - представление в виде определителя. Перед тем как его составить, необходимо рассмотреть еще один фактор, который не был учтен выше: спин электрона. Электрон может иметь спин, направленный вверх (+ 12 ) или вниз (− 12 ). Уравнение (1.17) предполагает, что на каждой молекулярной орбитали находится только один электрон. Однако, большинство рассчетов - рассчеты замкнутых оболочек, на каждой из которых находится по два электрона с противонаправленными спинами. Рассмотрим пока именно такой случай. Определим две волновые функции, α and β, следующим образом: 21 α(↑) = 1 α(↓) = 0 β(↑) = 0 β(↓) = 1 (1.18) Функция α равна 1 для электрона со спином вверх, и функция β 1 в случае когда спин электрона направлен вниз. Индексы α(i) и β(i) определяют значения α и β i − электрона. Учтем спин электрона как часть полной электронной волновой функции ψ, домножив функцию молекулярной орбитали на α или β. Произведение молекулярной орбитали и спиновой функции называют спиновой орбиталью, функцией координат электрона и его спина. Отметим, что спиновые орбитали также ортонормированы как и входящие в них молекулярные орбитали. Теперь можно построить волновую функцию замкнутой оболочки, определив N/2 молекулярных орбиталей для системы из N электронов, считая что электроны расположены на этих орбиталях парами с противоположно направленными спинами: 1 ψ(r) = √ N ! ϕ1 (r1 )α(1) ϕ1 (r1 )β(1) ... ϕ1 (r2 )α(2) ϕ1 (r2 )β(2) ... . . . ϕ1 (ri )α(i) ϕ1 (ri )β(i) ... ϕ1 (rj )α(j) ϕ1 (rj )β(j) ... . . . ϕ1 (rN )α(N ) ϕ1 (rN )β(N ) ... 22 ϕ N (r1 )α(1) ϕ N (r1 )β(1) 2 2 ϕ N (r2 )α(2) ϕ N (r2 )β(2) 2 2 . . . ϕ N (ri )β(i) (1.19) ϕ N (ri )α(i) 2 2 ϕ N (rj )α(j) ϕ N (rj )β(j) 2 2 . . . ϕ N (rN )α(N ) ϕ N (rN )β(N ) 2 2 Определитель (1.19) называется определителем Слэйтера. Каждая строка построена так, чтобы учесть все возможные спин-орбитальные комбинации волновой функции i-го электрона. Дополнительный множитель перед определителем необходим для нормировки. Перестановка местами двух электронов соответствует перестановке двух строк определителя, в результате чего его знак изменится. Отметим, что волновая функция (1.19) также соответствует принципу Паули, который запрещает двум или более фермионам находится одновременно в одном и том же квантовом состоянии. Двум или более электронам в одном и том же состоянии будут соответствовать две или более одинаковые строки определителя Слэйтера, а значит определитель будет равен нулю. Далее будем использовать обозначение ψ(r) = |a, b, ...n⟩ Введем еще одно обозначение ϕi (rj , sj ) ≡ ϕi (j)- молекулярная орбиталь i-го электрона со спином. Индексы i и j принимают все целые значения от 1 до N . В этих новых обозначениях имеем: ϕi (rj , sj ) = ϕ i+1 (rj )α(j) для спина вверх, и 2 ϕi (rj , sj ) = ϕ i (rj )β(j) для спина вниз. 2 Для того, чтобы найти уровни энергии системы из N электронов необходимо найти матричные элементы Гамильтониана между антисимметричными состояниями. Гамильтониан системы из N электронов имеет следующий вид: 1∑ 2 ∑Z ∑ 1 Ĥ = − ∇ − + 2 i=1 i r r i=1 i i<j ij N N N (1.20) Здесь первый член - кинетическая энергия электронов, второй отвечает за их притяжение к ионному ядру, и третий отвечает за межэлектронное отталкивание. Гамильтониан (1.20) включает в себя одноэлектронный оператор типа Z/ri , который действует на координаты одного электрона, и двухэлектронный оператор типа 1/rij . А значит нам нужны матричные элементы одно- и двухчастичных операторов в скалярных произведениях между определителями, составленными из ортонормированных функций. Рассмотрим в общем виде одноэлектронный оператор. Его можно представить 23 в следующем виде: F = N ∑ f (i) (1.21) i=1 где f (i) действует только на координаты i-го электрона. Для простоты ограничимся рассмотрением системы из двух электронов для которой F = f (1) + f (2) (1.22) Диагональные матричные элементы F для антисимметричной волновой функции |ab⟩ имеют следующий вид: ∫ ∫ 1 ⟨ab|F |ab⟩ = [ϕa (1)ϕb (2) − ϕa (2)ϕb (1)]∗ 2 ×[f (1) + f (2)][ϕa (1)ϕb (2) − ϕa (2)ϕb (1)]dr1 dr2 , (1.23) где dr1 и dr2 обозначают элементы объема, интегрирование по которым включает в себя также суммирование по всем спиновым координатам. перекрестные члены типа ∫ ∫ ϕ∗a (1)ϕ∗b (2)f (1)ϕa (2)ϕb (1)dr1 dr2 (1.24) очевидно равны нулю в силу того, что f (1) действует только на первую волновую функцию, а ϕb (2) и ϕa (2) ортогональны. Более того, переставив местами координаты первого и второго электрона, легко увидеть, что ∫ ∫ ϕ∗a (1)ϕ∗b (2)f (1)ϕa (1)ϕb (2)dr1 dr2 ∫ ∫ = ϕ∗a (1)ϕ∗b (2)f (2)ϕa (2)ϕb (1)dr1 d (1.25) Таким образом вид (1.23) упрощается: ∫ ∫ ⟨ab|F |ab⟩ = ϕ∗a (1)ϕ∗b (2)[f (1) + f (2)]ϕa (1)ϕb (2)dr1 dr2 = ⟨a|f |a⟩ + ⟨b|f |b⟩. 24 (1.26) Аналогично можно показать, что недиагональные матричные элементы между двумя состояниями в форме определителя, отличающиеся лишь по одному состоянию, имеют следующий вид: ⟨ab|F |ac⟩ = ⟨b|f |c⟩, (1.27) и, наконец, когда оба состояния различные, получаем: ⟨ab|F |cd⟩ = 0, (1.28) Двухэлектронный оператор в общем виде можно записать следующим образом: G= ∑ g(i, j) (1.29) i<j где g(i, j) действует на i-ый и j-ый электрон, и суммирование происходит по каждой паре электронов. Для двухэлектронной системы оператор просто G = g(1, 2). Диагональный матричный элемент G в этом случае: ∫ ∫ 1 ⟨ab|G|ab⟩ = [ϕa (1)ϕb (2) − ϕa (2)ϕb (1)]∗ g(1, 2) 2 ×[ϕa (1)ϕb (2) − ϕa (2)ϕb (1)]dr1 dr2 = ∫ ∫ 1 = [ϕ∗a (1)ϕ∗b (2)g(1, 2)ϕa (1)ϕb (2) 2 −ϕ∗a (1)ϕ∗b (2)g(1, 2)ϕa (2)ϕb (1) (1.30) −ϕ∗a (2)ϕ∗b (1)g(1, 2)ϕa (1)ϕb (2) +ϕ∗a (2)ϕ∗b (1)g(1, 2)ϕa (2)ϕb (1)]dr1 dr2 Ввиду того, что двухэлектронное взаимодействие g(1, 2) симметрично относительно смены местами координат двух электронов между собой (1 ↔ 2), первый и четвертый члены в этом разложении равны, аналогично, равны второй и третий члены. Таким образом матричный элемент можно записать как 25 ⟨ab|G|ab⟩ = ⟨ab|g|ab⟩ − ⟨ba|g|ab⟩. (1.31) Правая часть равенства представляет матричные элементы с обычной функциейпроизведением. Назовем первый матричный элемент прямым, а второй - обменным членом. Обменный матричный элемент не будет возникть в том случае, если в качестве функции-произведения взять просто ϕa (1)ϕb (2), а не правильную антисимметричную волновую функцию. Результат, полученный выше, можно обобщить и на случай N -электронной системы. Для этой цели введем следующее обозначение. Обозначим греческими буквами упорядоченные множества квантовых чисел, нумерующих детерминанты Слэйтера. Так, например, для буквы α, соответствующей квантовым числам a, b, ... n, состояние |ab...n⟩ запишется просто как |α⟩. Одночастичные функции, входящие в выражение для определителя, называют занятыми орбиталями, а остальные базисные функции - возбужденными или виртуальными орбиталями. Используем обозначение |αar ⟩, чтобы указать определитель в который вместо занятой орбитали a из α входит виртуальная орбиталь r. Аналогично, в случае двойного замещения, когда два электрона (здесь a и b) возбуждаются из множества занятых орбиталей, rs имеем обозначение |αab ⟩. Используя эти обозначения, формулы матричных элементов одно- и двухчастичных операторов в скалярных произведениях с волновыми функциями в виде определителей могут быть обобщены на случай многочастичных систем следующим образом. Для диагональных элементов: ⟨α|F |α⟩ = occ ∑ ⟨a|f |a⟩ (1.32) (⟨ab|g|ab⟩ − ⟨ba|g|ab⟩) (1.33) a ⟨α|G|α⟩ = occ ∑ a<b где суммирование происходит по всем занятым орбиталям a и b из |α⟩. 26 Для элементов между состояниями, отличающимися квантовыми числами только одной орбитали ⟨αar |F |α⟩ = ⟨r|f |a⟩ occ ∑ ⟨αar |G|α⟩ = (⟨rb|g|ab⟩ − ⟨br|g|ab⟩) (1.34) (1.35) b для элементов между состояниями, которые отличаются квантовыми числами у двух орбиталей: rs ⟨αab |F |α⟩ = 0 (1.36) rs ⟨αab |G|α⟩ = ⟨rs|g|ab⟩ − ⟨sr|g|ab⟩ (1.37) Все матричные элементы F и G между состояниями, у которых различаются квантовые числа более чем у двух орбиталей, пропадают. Уравнения (1.32)-(1.37) можно использовать для вычисления атомного Гамильтониана (1.20). Для значения полной энергии в состоянии, определенным детерминантом Слэйтера |α⟩ получаем: ⟩ ⟨ N ( ) ∑ N ∑ 1 1 Z ⟨E⟩ = ⟨α|H|α⟩ = α − ∇2i − + α . 2 r r i ij i=1 i<j (1.38) В соответствии с вриационным принципом, "лучший"определитель основного состояния можно найти, минимизируя значение выражения (1.38). Необходимое условие определения минимума заключается в том, что величина (1.38) не должна меняться при малых изменениях занятых орбиталей. Это условие и используется для получения уравнений Хартри-Фока (ХФ) следующим образом: Малые изменения занятых орбиталей (a) можно получить с помощью их малого "смешивания"с виртуальными орбиталями (r) |a⟩ → |a⟩ + η|r⟩ 27 (1.39) Где η - малое вещественное число. Это ведет к "подмешиванию"к состоянию |α⟩ состояния |αar ⟩ |a⟩ → |a⟩ + η|αar ⟩ (1.40) и влечет изменение значения полной энергии ⟨E⟩ → ⟨E⟩ + η(⟨αar |H|α⟩ + ⟨α|H|αar ⟩), (1.41) отбрасывая квадратичные по η члены. Ввиду того, что оператор H Эрмитов, два вышеполученные матричные элемента являются комплексно сопряженными. Но два эти члена вещественные, а следовательно равны. Энергия стационарна при условии ⟨αar |H|α⟩ = 0. (1.42) Это условие называется теоремой Бриллюэна и означает, что Гамильтониан H не имеет матричных элементов на состоянии |α⟩ и состоянии, полученном из |α⟩ заменой одной орбитали. Используя (1.34) и (1.35) условие Хартри-Фока (1.42) можно записать с использованием матричных элементов одно- и двухчастичных операторов, ⟩ occ (⟨ ⟩ ⟨ ⟩) ⟨ ∑ 1 2 Z 1 1 r − ∇ − a + rb ab − br ab =0 2 r r r ij ij b (1.43) Для того, чтобы записать (1.43) в более простом виде, определим оператор Хартри-Фока (HHF ) и потенциал (UHF ) следующими уравнениями 1 Z HHF = − ∇2 − + UHF 2 r ⟩ ⟨ ⟩) occ (⟨ ∑ 1 1 ⟨j|UHF |j⟩ = rb ab − br ab rij rij b 28 (1.44) (1.45) где суммирование по b происходит по всем занятым орбиталям определителя |α⟩. Тогда выражение (1.43) принимает более простой вид ⟨r|HHF |a⟩ = 0 (1.46) где a - занятые и r - виртуальная орбиталь. Используя полноту базиса ∑ ( i |i⟩⟨i| = 1), получаем HHF |a⟩ = ∑ |i⟩⟨i|HHF |a⟩ = occ ∑ i |b⟩⟨b|HHF |a⟩, (1.47) b где индекс i суммирует по всем орбиталям, а b только по занятым. Отметим что, действуя оператором Хартри-Фока на занятую орбиталь, получаем только занятую орбиталь. Это следует непосредственно из симметрии кулоновского взаимодействия, и ⟨a|HHF |b⟩ = ⟨b|HHF |a⟩, что означает эрмитовость оператора ХартриФока. Более того, можно показать, что оператор инвариантен относительно унитарного преобразования. Таким образом можно построить новый базис из орбиталей, на котором HHF диагонален, ′ ′ ′ HHF |a ⟩ = εa |a ⟩. (1.48) Это обычная форма уравнения Хартри-Фока в общем виде. Используя (1.44) уравнение Хартри-Фока можно записать более подробно ( ) 1 2 Z − ∇ − + UHF |a⟩ = εa |a⟩. 2 r (1.49) Каждый член здесь имеет простую физическую интерпретацию. Первый член описывает кинетическую энергию электрона a и его притяжение Z/r к ядру. Потенциал UHF описывает среднее Кулоновское и обменное взаимодействие электрона a с другими электронами атома. Для более эффективного численного решения (1.49) и аналогичных уравнений, молекулярные орбитали ϕi часто аппроксимируют линейной комбинацией наперед 29 заданного базиса, состоящего из одноэлектронных функций χµ , которые называют базисными функциями. Разложение имеет следующий вид: ϕi = N ∑ (1.50) cµi χµ , µ=1 где коэффициенты cµi - коэффициенты разложения молекулярной орбитали, N количество базисных функций, которые выбирают ортонормированными. Базисные функции χµ вводятся как линейная комбинация простых функций Гаусса, гауссианов: χµ = ∑ (1.51) dµp gp , p где dµp фиксированные константы для данного базиса из простых гауссианов, gp = g(α, r), - атомные функции гауссиановского типа, имеющие следующий вид: g(α, r) = cxn y m z l e−αr 2 (1.52) Здесь c - нормировочная константа. Выбор целочисленных значений n, m и l определяет тип простых гауссиановских функций: s, p, d и f (более подробно см. [49]). Вот пример трех гауссиановских функций (s, py и dxy типа, соответственно): ( gs (α, r) = ( gy (α, r) = ( gxy (α, r) = 2α π )3/4 128α5 π3 e−αr 2 (1.53) )1/4 2048α7 π3 ye−αr 2 (1.54) )1/4 xye−αr 2 (1.55) В рассчетах использованы стандартные 6-31++G(d,p) и 6-31G(2d,p) базисные наборы. Конкретные значения констант в этих базисах можно найти в [49]. В итоге, получаем следующее выражение для молекулярных орбиталей: 30 ϕi = N ∑ cµi χµ = µ=1 N ∑ cµi ( ∑ µ=1 ) dµp gp (1.56) p Теперь задача состоит в том, чтобы найти cµi , коэффициенты разложения молекулярных орбиталей. Теория Хартри-Фока использует вариационный принцип, который гласит, что для основного состояния любой антисимметричной нормированной волновой функции координат электрона, которую назовем Ξ, значение энергии, соответствующие Ξ, будет всегда больше значения энергии точной волновой функции: E(Ξ) > E(ψ); Ξ ̸= ψ (1.57) Другими словами, энергия точной волновой функции является нижней гранью для энергий, вычисленных на любой другой нормированной антисимметричной функции. Таким образом, задача сводится к нахождению набора коэффициентов, минимизирующих энергию итоговой волновой функции. Вариационный принцип приводит к следующим уравнениям, которые описывают коэффициенты разложения молекулярной орбитали, cνi . Эти уравнения называют уравнениям Рутана и Хола: N ∑ (Hµν − εi Sµν )cνi = 0 µ = 1, 2, ..., N (1.58) ν=1 или, в матричном виде: HC = SCε, (1.59) где каждый элемент - матрица. Здесь ε - диагональная матрица энергий орбиталей, каждый элемент которой εi - энергия одного электрона на молекулярной орбитали ψi , H - матрица оператора Гамильтона, полученная из (1.48), S - матрица перекрытия, описывающая перекрывание орбиталей. Более подробно этот формализм можно найти в [49]. 31 Уравнения (1.59) - нелинейные и должны решаться итерационным методом. Метод поиска решений называется методом Само-Согласованного Поля (ССП). Вышенаписанные уравнения записаны для случая замкнутых электронных оболочек. В случае систем с незамкнутой оболочкой, необходимо электроны α и β с разнонаправленными спинами вверх и вниз, размещать на разных орбиталях, что приведет к двум наборам коэффициентов разложения молекулярных орбиталей: ϕαi = N ∑ cαµi χµ µ=1 ϕβi = N ∑ cβµi χµ , (1.60) µ=1 Как результат удвоения набора коэффициентов, появится два Гамильтониана и два набора орбиталей. 1.5 Теория Функционала Плотности Теория Хартри-Фока не совсем верно описывает движение электронов в молекулярной системе ввиду того, что она не учитывает многоэлектронные корреляции. Существуют методы, идущие дальше теории Хартри-Фока в рассмотрении проблемы многоэлектронных корреляций. Рассмотрим один из таких методов, который использовался в данной работе. Теория Функционала Плотности (ТФП) учитывает многоэлектронные корреляции с помощью характерных функционалов электронной плотности. В рамках ТФП необходимо решить уравнение Кона-Шама, которое имеет следующий вид ( ) p̂2 + Uions + VH + Vxc ψi = εi ψi , 2 (1.61) где первый член учитывает кинетическую энергию i-го электрона, Uions описы- 32 вает его притяжение к ядрам в молекуле, VH Хартриевская часть межэлектронного взаимодействия: ∫ VH (r) = ρ(r ′ ) dr ′ , |r − r ′ | (1.62) где ρ(r) электронная плотность: ρ(r) = Ne ∑ |ψi (r)|2 , (1.63) ν=1 и Vxc локальный обменно-корреляционный потенциал, ψi электронные орбитали и Ne - количество электронов в системе. Обменно-корреляционный потенциал определен как функциональная производная обменно-корреляционного функционала энергии: Vxc = δExc [ρ] , δρ(r) (1.64) Одно из наиболее известных приближений - модель Гуннарссона и Люндквиста. Она основана на вычислении собственной энергии однородного электронного газа. Локальный обменно-корреляционный функционал Гуннарссона и Люндквиста имеет следующий вид: GL Exc 3 =− 4 ( 9 4π 2 )1/3 1 − 0.0333 G rs (r) ( rs (r) 11.4 ) . (1.65) Здесь rs (r) = (3/4πρel (r))1/3 - локальный радиус Вигнера-Зейца, где ρel (r) электронная плотность в молекуле, а функция G(x) определена следующим соотношением: ( ) 1 x 1 G(x) = (1 + x ) ln 1 + − x2 + − . x 2 3 3 (1.66) Первый и второй члены уравнения (1.65) учитывают обменное и корреляционное взаимодействие соответственно. Плотность обменно-корреляционной энергии GL определяет ПЛП обменно-корреляционный потенциал VxcGL как Exc 33 VxcGL [ ] GL δ ρel (r)Exc (ρel (r)) = = δρel (r) ( )1/3 ( ) 9 11.4 1 − − 0.0333 ln 1 + . 4π 2 rs (r) rs (r) (1.67) Функционалы ТФП как правило разделяют Обменно-корреляционную энергию на две части, называемые обменной и корреляционной частями: Exc [ρ] = Ex (ρ) + Ec (ρ) (1.68) Обе части являются функционалами электронной плотности, которые тоже подразделяют на два типа: функционалы, зависящие только от электронной плотности ρ, локальные, и функционалы, зависящие от плотности и градиента плотности ∇ρ, с градиентными поправками В литературе можно найти множество различных обменно-корреляционных функционалов. Ниже рассмотрим только те, которые использовались для рассчетов в данной работе. Локальный обменный функционал фактически определяется следующим выражением: ExLDA 3 =− 2 ( )1/3 ∫ 3 4π ρ4/3 d3 r. (1.69) Это выражение определяет обменную энергию однородного электронного газа. Однако, его не достаточно для аккуратного описания молекул. Обменно-корреляционный функционал с градиентными поправками, предложенный Беке [50], основанный на ПЛП обменном функционале имеет следующий вид: ∫ ExB88 = ExLDA −γ ρ4/3 x2 d3 r, 1 + 6γSinh−1 x (1.70) где x=ρ−4/3 |∇ρ| и γ = 0.0042 параметры, подобранные так, чтобы описывать известную энергию обменного взаимодействия атомов благородных газов. 34 Аналогично вышезаписанным обменным функционалам с градиентными поправками, существуют корреляционные функционалы с градиентными поправками. Вот, например, корреляционный функционал, предложенный Пердью и Вангом: ∫ EcP W 91 = rs = ζ = ϵc (rs , ζ) = f (ζ) = ρϵc (rs (ρ(r)), ζ)d3 r [ ]1/3 3 4πρ ρα − ρβ ρα + ρβ f (ζ) ϵc (ρ, 0) + ac (rs ) ′′ (1 − ζ 4 ) + [ϵc (ρ, 1) − ϵc (ρ, 0)]f (ζ)ζ 4 f (0) 4/3 (1 + ζ) + (1 − ζ)4/3 − 2 , 24/3 − 2 (1.71) где ρα - означает плотность спина α, ρβ - плотность спина β, ρ - общую электронную плотность, (ρα + ρβ ). rs - локальный радиус Вигнера-Зейца. ζ - относительная спиновая поляризуемость, описывающая соотношение плотностей α и β электронов. ζ = 0 соответствует случаю только α-вой электронной плотности, а ζ = −1 только β-вой плотности. В рамках ТФП, как правило, обменные и корреляционные функционалы используются парами. Например, широко известный функционал BLYP состоит из пары функционалов: обменного функционала Беке с градиентными поправками (1.70) и корреляционного функционала Ли, Янга и Парра с градиентными поправками ( [51]). Корреляционный функционал Ли, Янга и Парра с градиентными поправками имеет следующий вид: 35 ∫ EcLY P { [ 2/3 γ(r) −5/3 ρ + 2bρ 2 CF ρ8/3 α 1 + dρ−1/3 ( ) 1 8/3 +22/3 CF ρβ − ρtW + ρα tαW + ρβ tβW 9 ] } ) −cρ−1/3 1 ( 2 2 d3 r + ρα ∇ ρα + ρβ ∇ ρβ e 18 = −a (1.72) где ( ) ρ2α (r) + ρ2β (r) γ(r) = 2 1 − ρ2 (r) 1 |∇ρ(r)|2 1 2 tW (r) = − ∇ρ 8 ρ((r)) 8 3 ( 2 )2/3 CF = 3π 10 (1.73) tW (r) локальная плотность кинетической энергии, tαW (r) и tβW (r) плотность кинетической энергии электронной плотности α-спиновых and β-спиновых электронов соответственно. Параметры уравнения (1.73) такие: a = 0.04918, b = 0.132, c = 0.2533 and d = 0.349. Несмотря на то, что ТФП хорошо описывает многоэлектронные системы, признаем, что Хартри-Фоковское рассмотрение обменного взаимодействия электронов наиболее естественно и последовательно. Поэтому, Беке предложил [50] функционалы, в которые входят и ХФ, и ТФП части обменного взаимодействия, а корреляционное взаимодействие учитывается только в рамках ТФП. Таким образом, выражение для Exc можно представить как: DF T mix , = cHF ExHF + cDF T Exc Exc (1.74) где cHF и cDF T - константы. Основываясь на этой идее, трехпараметрический функционал Беке (B3LYP) определен следующим образом: 36 B3LY P LDA Exc = ExLDA + c0 (ExHF − EX ) + cx (ExB88 − ExLDA ) + +EcV W N 3 + cc (EcLY P − EcV W N 3 ) (1.75) Здесь c0 = 0.2, cx = 0.72 и cc = 0.81 - константы, подобранные так, чтобы учесть значения потенциала ионизации, притяжения к протонам и энергии атомов первого ряда таблицы Менделеева [49]. ExLDA и ExB88 определены в (1.69) и (1.70) соответственно. ExHF - функционал, относящийся к уравнениям ХартриФока (1.48). EcV W N 3 - так называемый функционал Воско-Вилк-Нусаира, который имеет следующий вид: ∫ EcV W N 3 = ρϵVc W N 3 (ρα , ρβ )d3 r (1.76) ϵVc W N 3 (ρα , ρβ ) = ϵI (ρα , ρβ ) + ∆ϵc (rs , ξ) ( ) ( Qi 2bi rs −1 + T an ϵi = Ai Ln √ √ Xi ( rs ) Qi 2 rs + bi ( √ ( rs − x0i )2 bi x0i − Ln √ Xi (x0i ) X( rs ) )) 2(bi + 2x0i ) Qi −1 + T an √ Qi 2 r s + bi f (ζ) ∆ϵc (rs , ξ) = ϵIII (ρα , ρβ ) ′′ (1 + β(rs )ζ 4 ) f (0) ′′ f (0) β(rs ) = ∆ϵ(rs , 1) − 1 ϵIII (ρα , ρβ ) ∆ϵc (rs , 1) = ϵI (ρα , ρβ ) − ϵII (ρα , ρβ ) √ Qi = 4ci − b2i X(x) = x2 + bi x + ci [ ]1/3 3 rs = , 4πρ где константы Ai , bi , ci и x0i приведены в таблице 1.1. Корреляционный функционал Ли, Янга и Парра EcLY P определен в (1.73). Отметим, что вместо EcV W N 3 и 37 EcLY P в (1.75) можно использовать корреляционный функционал Пердбю и Ванга (1.72). В результате чего получим также широко используемый функционал B3PW91. Таблица 1.1: Параметры функционала Воско-Вилк-Нуссаира Параметр I II III Ai 0.06218 0.03109 -0.033774 bi 3.72744 7.06042 1.131071 ci 12.93520 18.05780 13.004500 x0i -0.10498 -0.32500 -0.004758 Важная особенность ТФП состоит в том, что она учитывает многоэлектронные корреляции, вводя некий феноменологический обменно-корреляционный функционал. Однако, до сих пор не найден универсальный потенциал, одинаково хорошо применимый для всех типов систем и условий. В результате чего, существует большой набор различных потенциалов (см. например D. Salahub, session LXXIII ), используемых в тех или иных случаях. Однако эти потенциалы получены некими эмпирическими методами и не совсем понятны, и сами по себе не имеют под собой четкой физической интерпретации. 1.6 Потенциал молекулярной механики Для сложных молекулярных систем расчеты из первых принципов требуют значительной компьютерной мощности. В зависимости от метода, время расчета растет как N 2 или даже N 8 [49], где N - число частиц в системе. Поэтому, размер систем, которые могут быть рассчитаны из первых принципов ограничен. И методы из первых принципов с трудом могут быть использованы для расчета больших биологических молекулярных систем. Для описания макромолекулярных систем, таких как белки и полипептиды 38 необходимы эффективные модельные подходы. Один из наиболее широко используемых методов для описания макромолекул основывается на так называемом потенциале молекулярной механики, который имеет следующий вид: U= Nb ∑ kib (ri − ri0 )2 + i=1 Na ∑ kia (θi − θi0 )2 i=1 Nid ∑ kiid (Si − Si0 )2 + i=1 N ∑ [( 4ϵij i,j=1 i<j + Nd ∑ kid [1 + cos(ni ϕi + δi )] + i=1 σij rij )12 ( − σij rij )6 ] + N ∑ qi qj . r ij i,j=1 (1.77) i<j Здесь первые четыре члена описывают зависимость потенциальной энергии от изменения расстояний, углов, двугранных углов и особых двугранных углов между двумя, тремя и четырьма соседними атомами, соответственно. Последние два члена описывают ван-дер-Ваальсово и Кулоновское взаимодействия, соответственно. Суммирование в первом члене идет по всем топологически заданным связям в системе, во втором - по всем топологически заданным углам, в третьем - по всем топологически заданным двугранным угам и в четвертом по всем топологически заданным особым двугранным углам. Общее число связей, углов, двугранных углов и особых двугранных углов - Nb , Na , Nd и Nid , соответственно. Общее число атомов в системе N . kib , kia , kid и kiid в (1.77) - параметры жесткости соответствующих членов в потенциальной энергии. ri0 , θi0 и Si0 - равновесное значение длин связей, углов и особых двугранных углов. ni и δi количество возможных торсионных конформаций и фаза торсионного угла. ϵij , σij и qi - параметры Ван-дер-Ваальса и заряды атомов в системе. Параметры kib , kia , kid , kiid , ri0 , θi0 , Si0 , ni , δi , ϵij , σij и qi определены на основе экспериментальных измерений кристаллографических структур, инфракрасных спектров, а так же на основе квантовомеханических расчетов маленьких систем (см. [22–24] и ссылки в них). Независимыми переменными в (1.77) являются ri , θi , ϕi и Si . Необходимо отметить, что члены, соответствующие изменению расстояний, углов и особых двугранных углов в (1.77) описывают движение молекулы в гар39 моническом приближении, которое работает только при низких температурах. Зависимость потенциальной энергии от изменения крутильных степеней свободы обычно полагают периодической (см. уравнение (1.77)), так как существует несколько устойчивых конформаций молекулы относительно этих степеней свободы [22–24, 52–55]. 1.7 Молекулярная динамика Молекулярная динамика является альтернативной статистическому подходу для изучения фазовых переходов в макромолекулярных системах. В рамках формализма молекулярной динамики решаются уравнения движения всех частиц в системы, взаимодействующих между собой заданным потенциалом. Так как формализм молекулярной динамики широко известен и изложен во множестве учебников [56–58], в данной диссертации приведены лишь основные идеи и уравнения этого метода. Расчеты на основе молекулярной динамики обычно основываются на численном решении уравнения Ланжевена [58–60]: mi ai = mi r̈i = − ∂U (R) − βi vi + η(t). ∂ri (1.78) Здесь mi , ri , vi и ai масса, радиус-вектор, скорость и ускорение i-го атома. U (R) - потенциальная энергия системы. Второй член описывает силу вязкости, которая пропорциональна скорости частицы. Коэффициент пропорциональности βi = mi γ, где γ коэффициент торможения. Третий член - шумовой член, который описывает эффект постоянного взаимодействия атома с окружающими молекулами среды. Для изучения эволюции системы во времени, уравнения движения Ланжевена (1.78) интегрируются для каждой частицы. В данной диссертации молекулярная динамика была использована для изучения фазового перехода α-спираль↔статистический клубок в полипептидах алани- 40 на. Проведено сравнение полученных результатов с результатами статистической модели. При расчете молекулярной динамики была использована параметризация CHARMM27 [24] для описания взаимодействия между атомами. Это широко используемый для изучения полипептидов, белков и жиров эмпирический форсфилд [24, 61–64]. Расчеты молекулярной динамики позволяют изучать фазовый переход αспираль↔статистический клубок, так как этот переход происходит за наносекунды. Из таких расчетов можно получить важные термодинамические характеристики фазового перехода, такие как его температура, максимальная теплоемкость, температурный диапазон перехода и его скрытая теплота. В данной диссертации были проведены расчеты молекулярной динамики полипептидов аланина, состоящих из 21, 30, 40, 50 и 100 аминокислот. В качестве начальной конфигурации молекулы была выбрана структура идеальной αспирали [2, 65, 66]. Расчеты молекулярной динамики были проведены при различных температурах, в интервале от 300 K◦ to 1000 K◦ для полипептида, состоящего из 21 аминокислоты и в интервале от 300 K◦ до 900 K◦ для остальных полипептидов. Набор параметров, использованных в расчетах может быть найден в [56–58]. Расчеты были проведены с использованием программного пакета NAMD [57], для визуализации результатов была использована программа VMD [67]. Расчеты были проведены в каноническом ансамбле N V T , используя термостат Ланжвена. Шаг интегрирования составлял 2 фемтосекунды. 41 Глава 2 Степени свободы в полипептидах и белках 2.1 Введение В настоящее время быстро развивающийся и перспективной областью науки является нанотехнология и наномедицина. Многие исследовательские институты занимаются разработкой и созданием наночипов, наноприборов, которые используются в медицине. Для создания таких биологических элементов нужно хорошо знать и понимать свойства систем, для которых данный прибор следует применять. В большинстве случаев, процесс работы таких устройств тесно связан с взаимодействием с белками организма. Однако этот процесс является чрезвычайно сложным и в данное время плохо изучен. Таким образом, понимание процессов, происходящих в белковых структурах позволит изменить возможности медицины кардинальным образом. Как известно, белки состоят из аминокислот, число которых в белке варьируется от сотен до десятков тысяч. Небольшие фрагменты белков называют полипептидами. Эта глава посвящена изучению конформационных свойств полипептидных цепочек, состоящих из аланинов и глицинов. 42 Изучение небольших фрагментов белков и полипептидов в газовой фазе стало возможным относительно недавно с использованием MALDI массспектрометрии [68–71] и с использованием ESI масс-спектрометрии [72, 73]. С теоретической точки зрения исследования свойств небольших полипептидов представляют заметный интерес, поскольку эти системы можно рассчитывать с достаточно высокой точностью из первых принципов. Соответственно, возможно проводить сравнение результатов теории и эксперимента. Полученная информация может быть использована для построения теоретических моделей более сложных белковых соединений. Полипептиды отличаются друг от друга первичной и вторичной структурами [2, 74–76]. При одинаковой первичной структуре, различия в структуре молекулы соответствуют ее разным конформациям (геометрическим конфигурациям). Вполне естественно, что химические и физические свойства различных конформаций сложных молекул могут существенно отличаться. Число различных конформаций (изомерных состояний) быстро возрастает с увеличением размера системы, поэтому поиск наиболее устойчивых конформаций биомолекулы значительно усложняется с увеличением ее размера. С помощью методов ЯМР и дифракции рентгеновских лучей [75] было установлено, что одними из наиболее характерных элементов вторичной структуры белка являются лист и спираль. Главное отличие листа от спирали связано с различием двугранных углов, образованных атомами полипептидной цепи в этих молекулярных структурах. При повышении температуры должна активироваться степень свободы связанная с кручением боковых радикалов вокруг полипептидной цепи, меняя при этом конформацию молекулы. Большой интерес представляет изучение этого перехода и оценка характерных времен перехода, поскольку он связан с одним из основных вопросов физики белка- его фолдингом. Для исследования этого перехода необходимо исследовать поверхность потенциальной энергии аминокислотной цепочки относительно кручения боковых радикалов вдоль полипептидной цепи. Кроме во- 43 просов, связанных с фолдингом, такое исследование несет в себе важную информацию о зависимости энергии от угловых переменных характеризующих цепочку аминокислот, которая очень важна для модельного описания больших белковых структур. Ранее достаточно детально исследовались лишь дипептиды аланина и глицина, а также их аналог (S)-α-(формиламино)пропанамид. В [77–79] эти молекулы были исследованы в рамках теории Хартри-Фока. В этих работах были рассчитаны потенциальные поверхности систем в зависимости от углов кручения молекулы. Были определены некоторые устойчивые состояния дипептидов, соответствующие различным конформациям молекул. Каждое устойчивое состояние молекулы дополнительно исследовалось на основе теории возмущений, учитывающей межэлектронные корреляционные взаимодействия. В [80–84] были исследованы различные конформационные свойства молекулы, определены устойчивые структуры, рассчитаны их энергии в рамках теории функционала плотности. В [85] обсуждалась динамика аналога дипептида аланина, рассчитанная в рамках теории функционала плотности. В этой работе был исследован переход дипептида из одной устойчивой конформации в другую и рассчитано характерное время этого перехода. В [86] с использованием методов Монте-Карло было рассчитано характерное время перехода дипептида аланина из одной конформации в другую в водном окружении. В [87] был определен эмпирический потенциал парного взаимодействия двух аланинов на основе экспериментальных данных, взятых из базы данных для белков [75]. При этом аланины в белке рассматривались как материальные точки. В ряде работ исследованы также свойства трипептидов. В [88–90] с помощью классической молекулярной механики и полуэмпирических потенциалов (таких как GROMOS, CHARMM и AMBER) была исследована динамика трипептида аланина и глицина. В [91] в рамках теории Хартри-Фока были найдены некоторые конформации трипептида аланина и дипептида глицина. В [92] были измерены рамановские и ИК спектры трипептида аланина и глицина в щелочном, нейтральном 44 и кислом окружениях. В этой работе также была разработана феноменологическая модель для определения устойчивых конформаций трипептидов. Полипептиды исследовались гораздо меньше. Нам известно лишь несколько работ на эту тему. Так, например, в [93] обсуждались устойчивые конформации нейтральных и заряженных гексапептидов аланина, рассчитанные на основе эмпирических потенциалов. В [94] было проведено экспериментальное исследование различных конформаций цепочки из семи аланинов с помощью ЯМР при различных температурах. В [95] методами эмпирической молекулярной динамики, основанной на методах Монте-Карло, был описан полипептид аланина, состоящий из 21 аминокислоты. В данной главе представлены результаты расчетов из первых принципов многомерной поверхности потенциальной энергии цепочек, состоящих их трех и шести аланинов и глицинов по отношению к степеням свободы, связанных с кручением этих молекул относительно полипептидной цепи. Этот расчет был выполнен в рамках теории функционала плотности (ТФП). Ранее такого рода вычисления проводились лишь для дипептидов (см., например, [77,78,85]). Для больших молекул исследовались лишь отдельные изомерные состояния (см. ссылки приведенные выше). Следует также отметить, что настоящий расчет поверхностей потенциальной энергии для цепочек из трех и шести аминокислот впервые выполнен с учетом всех электронов в системе. Анализ энергетических поверхностей позволил оценить вероятность перехода между различными устойчивыми конформациями молекул. Было выполнено сравнение полученных результатов с имеющимися результатами молекулярно-динамических расчетов и экспериментальными данными. В настоящей работе также исследовано влияние вторичной структуры полипептидной цепи на ее конформационные свойства относительно вращения. Так, для цепочки из шести аминокислот со структурой спирали и листа продемонстрировано влияние вторичной структуры на устойчивые изомерные состояния молекулы. Результаты работы представленной в данной главе были опубликованы в [52–55]. 45 2.2 Конформационные свойства полипептидов аланина 2.2.1 Определение крутильных степеней свободы полипептида В этом разделе приведены результаты расчета поверхностей потенциальной энергии цепочек аланина и глицина. Были исследованы потенциальные энергии цепочек, состоящих из трех и шести аминокислот в зависимости от двугранных углов φ и ψ, определенных на рисунке 2.1. Рис. 2.1: Двугранные углы φ и ψ, характеризующие вторичную структуру полипептидной цепи. Двугранный угол χi характеризует вращение бокового радикала вдоль связи Ciα − Ciβ . Оба угла определяются четырьмя соседними атомами в полипептидной цепочке. Угол φi определяется как двугранный угол между плоскостями, образованны′ ′ ми атомами Ci−1 −Ni −Ciα и Ni −Ciα −Ci . Угол ψi определяется как двугранный угол ′ ′ между плоскостями, образованными атомами Ni − Ciα − Ci и Ciα − Ci − Ni+1 . Кроме углов φi и ψi существует третий угол, образованный атомами полипептидной цепи - угол ωi , который определяется как двугранный угол между плоскостями, 46 ′ ′ α образованными атомами Ciα − Ci − Ni+1 и Ci − Ni+1 − Ci+1 . Нумерация атомов полипептидной цепи ведется начиная с N H2 − конца полипептида. Углы φi , ψi и ωi могут принимать все возможные значения в интервале [−180o ;180o ]. Для однозначного определения углов необходимо задать их направление отсчета. В данной работе использовано общепринятое определение [76], согласно которому, и отсчет углов φi , ψi и ωi производится по часовой стрелке, если смотреть на молекулу с ее N H2 − конца (см. рисунок 2.1). Углы φi и ψi могут быть определены для любой аминокислоты в цепочке, кроме крайних. В настоящей работе, были рассмотрены углы φ и ψ, соответствующие средней аминокислоте полипептида. Для простоты, индексы в обозначении углов опущены. 2.2.2 Оптимизированные геометрии полипептидов аланина Рис. 2.2: Оптимизированные геометрии полипептидных цепочек аланина, рассчитанные методами B3LYP/6-31++G(d,p). а) Трипептид аланина; б) Гексапептид аланина в конформации листа; в) Гексапептид аланина в конформации спирали. Энергии под каждым изображением приведены в атомных единицах. Для изучения кручения цепочек аминокислот вдоль полипептидной цепи необходимо задать начальную структуру молекулы. С увеличением размера системы возрастает количество ее стабильных изомерных состояний отличающихся, лишь своей вторичной структурой. В настоящей работе исследованы цепочки аминокислот с двумя наиболее распространенными типами вторичной структуры, именуемыми конформациями спирали и листа. 47 На рисунке 2.2 показаны структуры трех цепочек, которые были исследованы в данной работе. Геометрии цепочек были получены в рамках ТФП с использованием функционала B3LYP. На рисунке 2.2а показан трипептид аланина. В данной работе был исследован трипептид в конформации листа, поскольку при данной длине цепочки спиралевидной структуры еще не образуется. На рисунках 2.2б и 2.2в представлены гексапептиды в конформации листа и спирали соответственно, которые характеризуются четырьмя наборами углов φ и ψ. При изменении углов φ и ψ в центральной аминокислоте полипептид может принимать состояния заметно отличающиеся от структуры листа и спирали. В этих случаях для удобства обсуждения полипептид относится к типу листа или спирали, если структура листа или спирали возникает при определенных значениях углов φ и ψ в центральной аминокислоте. Энергии молекул приведены рядом с их изображениями на рисунке 2.2 в атомных единицах. 2.2.3 Зависимость энергии полипептида от двугранного угла ω Для каждой аминокислоты существует лишь три двугранных угла, образованных атомами полипептидной цепи и описывающих кручение полипептида. Угол ω (см. рисунок 2.1) образован на стыке двух аминокислот и тем самым отлича′ ется от углов φ и ψ. Между атомом Ci и Ni+1 образуется квази-двойная связь, которая препятствует кручению полипептида. Поэтому можно говорить об угле ω как о жесткой степени свободы, слабо зависящей от типа полипептида и значений остальных характерных углов. В качестве иллюстрации этого факта на рисунке 2.3 мы приводим зависимость энергии трипептида аланина от угла ω при различных значениях углов φ и ψ. Из рисунка видно, что в системе существуют два минимума при ω = 0o и ω = 180o положение которых практически не зависит от углов φ и ψ. Высота барьеров между этими минимумами также меняется незначительно и составляет приблизительно 1 эВ=23.06 ккал/моль, что неплохо согласуется с эмпирическими 48 Рис. 2.3: Зависимость энергии трипептида аланина от угла ω, рассчитанная методом B3LYP/6-31G(d) при различных значениях углов φ и ψ. предсказаниями в 15 ккал/моль для молекулы этена, имеющей подобную связь [2]. Расчет показывает, что при температуре близкой к комнатной значение угла ω меняется незначительно. Поэтому его изменение можно не учитывать при дальнейшем изучении поверхности потенциальной энергии, характеризующей кручение полипептидов. Зависимость потенциальной энергии полипептидов от углов φ и ψ при кручении молекулы при температурах близких к комнатной оказывается значительно более сложной и поэтому представляет значительный интерес. 2.2.4 Поверхность потенциальной энергии трипептида аланина На рисунке 2.4 показана поверхность потенциальной энергии трипептида аланина, рассчитанная методом B3LYP/6-31G(2d,p). Шкала энергии приведена в электронвольтах, ккал/моль и Кельвинах и отсчитана от глобального минимума данной поверхности. 49 Рис. 2.4: Поверхность потенциальной энергии трипептида аланина, рассчитанная методом B3LYP/6-31G(2d,p). Энергии приведены в эВ, ккал/моль и Кельвинах. Цифрами помечены минимумы на потенциальной поверхности. Стрелками показаны рассмотренные переходы между различными конформациями молекулы. Как видно из рисунка 2.4, на энергетической поверхности наблюдается несколько минимумов, они обозначены цифрами в порядке возрастания их энергии. Каждому минимуму соответствует устойчивое изомерное состояние молекулы. На рисунке видно 2 выраженных минимума, обозначенных цифрами 1 и 2, а также несколько менее глубоких, обладающих большей энергией (3-7). Конформации молекулы, соответствующие этим минимумам приведены на рис. 2.5. Пунктирными линиями на рисунке показаны основные водородные связи в системе, которые определены как связи между атомами кислорода и атомами водорода, связанными с атомами азота, и расположенными на расстоянии не превышающем 2.9 ангстрема. Как видно из этого рисунка, геометрии, соответствующие различным устойчивым состояниям, заметно отличаются друг от друга. Для исследования потенциальных поверхностей использовалась следующая процедура. После определения 50 Рис. 2.5: Оптимизированные геометрии трипептида аланина. Различные конформации, молекулы соответствующие минимумам на поверхности потенциальной энергии, представленной на рисунке 2.4, отмечены соответствующими цифрами. Под каждой структурой приведен набор углов φ и ψ, полученных с учетом релаксации всех степеней свободы в системе. В скобках указаны величины этих углов, найденные без учета релаксации. Энергии молекул приведены над каждой из них, при этом энергии даны в эВ и отсчитаны от энергии состояния 1 (энергия этого состояния приведена в атомных единицах (а.е.)). В скобках указаны энергии, вычисленные без учета релаксации всех степеней свободы в системе. Пунктирными линиями показаны основные водородные связи в системе. Их длины приведены в ангстремах. 51 устойчивой структуры молекулы, фиксировались все степени свободы системы и менялись лишь углы φ и ψ в центральной аминокислоте. Таким методом были рассчитаны все потенциальные поверхности, представленные в этом разделе. Данный метод позволяет эффективно получать информацию об основных конформациях, соответствующих минимумам на поверхности потенциальной энергии. Таким образом, были определены соответствующие им углы φ и ψ. Заметим, что абсолютные значения энергий, соответствующих различным конформациям, определены не совсем точно, поскольку данный метод расчета не учитывает релаксацию всех атомов при кручении молекулы. Вычисления потенциальной поверхности цепочки с учетом ее релаксации требуют в 20-30 раз больше компьютерного времени. Систематическое исследование роли релаксации при формировании поверхности потенциальной энергии с учетом всех электронов системы в работе не проводилось. Однако, была выполнена полная оптимизация структур полипептидов, соответствующих различным минимумам на поверхности потенциальной энергии с учетом всех степеней свободы молекулы. На рисунке 2.5 сравниваются стабильные состояния, соответствующие трипептиду аланина с учетом релаксации молекулы и без учета. Как видно из этого сравнения, характерные двугранные углы φ и ψ меняются в пределах 10-ти процентной погрешности, что может быть объяснено незначительным влиянием остальных степеней свободы на значение двугранных углов в полипептиде вблизи минимума энергии. В результате релаксации по остальным степеням свободы происходит небольшая перестройка боковых атомов (или радикалов в случае больших аминокислот), что приводит к понижению энергии системы. В связи с этим, относительная энергия минимумов может измениться при учете полной релаксации молекулы. В данной работе рассчитаны поверхности потенциальной энергии полипептидов на сетке с шагом 18o . Выполнение расчета с более мелким шагом не имело бы смысла, вследствие того, что учет всех степеней свободы приводил бы к большим изменениям углов φ и ψ, чем шаг сканирования. 52 На поверхности потенциальной энергии трипептида аланина, в отличии от поверхности потенциальной энергии трипептида глицина [52], существует дополнительный максимум при φ = 120o ±50o , ψ = 30o ±30o . Он возникает при перекрытии боковых СН3 - радикалов аланина, которые отсутствуют у глицина. Отметим, что не все минимумы на поверхности потенциальной энергии соответствуют тем или иным устойчивым конформациям полипептида. Например, минимума 6 на реальной многомерной энергетической гиперповерхности не существует. Это связано с тем, что при построении энергетической поверхности учитывались только две степени свободы. Поэтому для достоверного определения устойчивых конформаций молекулы необходимо производить оптимизацию структур, соответствующих минимумам, показанных на рисунке 2.5, с учетом всех степеней свободы. Таблица 2.1: Сравнение двугранных углов φ и ψ, соответствующих различным конформациям трипептида аланина, номера которых указаны в первой колонке. состояние φ, [77] ψ [77] φ [78] ψ [78] φ ψ 1 -168.4 170.5 -157.2 159.8 -157.4 166.2 2 - - -60.7 -40.7 - - 3 63.8 32.7 67.0 30.2 64.7 30.5 4 - - - - -166.9 -52.1 5 74.1 -57.3 76.0 -55.4 72.0 -60.5 6 -128.0 29.7 -130.9 22.3 -119.1 13.6 7 - - - - 57.9 -136.3 В [77] и [78] были рассчитаны значения двугранных углов φ и ψ для дипептидов глицина и аланина. Поскольку в дипептиде и трипептиде влияние крайних аминокислот весьма незначительно, то значения двугранных углов, соответствующих различным устойчивым конформациям в трипептиде и дипептиде оказываются близкими. В таблице 2.1 произведено сравнение значений двугранных углов друг 53 с другом. В ранних работах структуры дипептидов исследовались в рамках теории Хартри-Фока. Так в [77], значения φ и ψ были получены с помощью метода HF/631+G*, а в [78]- с помощью метода HF/6-31G**. Видно, что данные этих работ в целом согласуются друг с другом и с расчетом выполненным в данной работе (3-я колонка, таблица 2.1). Некоторые различия могут быть объяснены влиянием третьего аланина в трипептиде на конформационные свойства, а также пренебрежением многоэлектронных корреляций в теории Хартри-Фока, в рамках которой выполнены расчеты в [77, 78]. Рис. 2.6: Барьеры для переходов между состояниями 1 ↔ 2 трипептида аланина. Кружками и квадратами соответственно показаны барьеры без и с учетом релаксации всех степеней свободы в системе. Из рисунка 2.4 видно, что некоторые области на потенциальной поверхности являются запрещенными. В этих областях потенциальная энергия молекулы заметно возрастает из-за сближения отдельных атомов в процессе кручения полипептида. Учет релаксации молекул хотя и уменьшает значения энергии системы, мало влияет на положение запрещенных зон. На рисунке 2.4 видны две выраженные области вблизи значений углов φ и ψ (0, 0) и (0, 180) градусов соответственно. 54 В первой области происходит сближение атомов водорода и кислорода на расстояния значительно меньшие характерной длины связи в молекуле. При этом возникает сильное межатомное отталкивание, обусловленное перекрытием электронных оболочек атомов и обменным взаимодействием электронов. Второй максимум соответствует сближению двух атомов кислорода на расстояние порядка длины связи, что также приводит к увеличению энергии системы за счет кулоновского отталкивания этих атомов. Рассмотрим подробнее энергетический барьер для перехода между наиболее глубокими минимумами 1 ↔ 2, отмеченный стрелкой на рисунке 2.4. Зависимость энергии от переменной сканирования показана на рисунке 2.6. Для более точного определения высоты барьера для данного перехода была проведена дополнительная оптимизация структуры полипептида по всем степеням свободы, кроме двугранных углов φ и ψ, отвечающих переменной сканирования. В результате оптимизации высота барьера уменьшилась на ≈ 0.03 эВ (см. рис. 2.6). На основе анализа этих барьеров можно сделать оценку характерного времени перехода из одного состояния в другое. Для этого необходимо воспользоваться формулой Аррениуса, которая имеет вид: ∆E 1 = Ωe− kT τ (2.1) где τ - характерное время перехода системы из одного состояния в другое, Ω предэкспоненциальный фактор, определяющий частоту подхода системы к барьеру, ∆E- высота барьера, T - температура системы, k - постоянная Больцмана. Чтобы проверить применимость этой модели для анализа динамики цепочек аланина был проведен тестовый расчет и оценено характерное время перехода из одного устойчивого состояния в другое для дипептида аланина, поскольку дипептид аланина исследовался ранее. На рисунке 2.7 показаны барьеры для переходов между двумя устойчивыми состояниями аналога дипептида аланина ((S)-α-(формиламино)пропанамид). Из 55 0.06 ( ) 0.04 0.02 . 1 . 2 0.00 -0.02 -0.04 0 20 40 60 80 ( .) 100 120 Рис. 2.7: Барьеры для переходов между состояниями 1 ↔ 2 аналога дипептида аланина рассчитанные методом B3LYP/6-31+G(2d,p) с учетом релаксации всех степеней свободы в системе. Структуры устойчивых состояний 1 и 2 показаны вблизи соответствующих минимумов. этого рисунка видно, что для перехода 1 → 2: ∆E1→2 = 0.047 эВ, а для перехода 2 → 1: ∆E2→1 = 0.079 эВ. В настоящей работе с использованием функционала B3LYP была рассчитана частота Ω для аналога дипептида аланина, которая со1→2 2→1 ставила 42.87 см−1 , поэтому получаем τ2×Ala ∼ 17 пс и τ2×Ala ∼ 5. Этот результат находится в прекрасном согласии с результатом [85], полученным на основе моле1→2 2→1 кулярной динамики, предсказывающим τ2×Ala ∼ 19 и τ2×Ala ∼ 7. Данное сравнение показывает, что формула (2.1) может быть использована для оценки времен перехода между различными устойчивыми состояниями молекулы. Используя метод B3LYP/6-31G(2d,p), были рассчитаны характерные частоты для цепочек аланина. Для трипептида аланина частота равна 32.04 см−1 . Из рисунка 2.6 следует, что для перехода 1 → 2: ∆E1→2 = 0.066 эВ, а для перехода 1→2 3→1 2 → 1: ∆E2→1 = 0.114 эВ. В результате, τ3×Ala ∼ 13 пс и τ3×Ala ∼ 86 пс. Заметим, что эти времена могут быть измерены методами ЯМР [76, 96]. 56 2.2.5 Поверхность потенциальной энергии гексапептида аланина в конформации листа Рис. 2.8: Поверхность потенциальной энергии гексапептида аланина со вторичной структурой листа, рассчитанная методом B3LYP/6-31G(2d,p). Энергии приведены в эВ, ккал/моль и Кельвинах. Цифрами отмечены минимумы на потенциальной поверхности. Стрелками показаны переходы между различными устойчивыми конформациями молекулы. На рисунке 2.8 приведена поверхность потенциальной энергии в зависимости от углов φ и ψ, рассчитанная для гексапептида аланина со вторичной структурой листа. Конформации, соответствующие основным минимумам на энергетической поверхности приведены на рис. 2.9. В целом, энергетические поверхности трипептида и гексапептида очень похожи, что говорит о том, что в конформации листа энергетическая поверхность формируется в основном за счет взаимодействий соседних аминокислот. Как и в случае трипептида, на поверхности потенциальной энергии гексапептида аланина наблюдается 2 основных минимума. Барьер перехода между ними приведен на рис. 2.10. На энергетической поверхности 2.8 он показан стрелкой. Из рисунка 2.10 видно, что высота барьера для перехода 1 → 2 заметно больше высоты барьера для перехода 2 → 1. Для перехода 1 → 2 высота 57 Рис. 2.9: Оптимизированные геометрии гексапептида аланина со вторичной структурой листа. Конформации молекул, соответствующие минимумам на поверхности потенциальной энергии представленной на рисунке 2.8, отмечены соответствующими цифрами. Под каждой структурой приведен набор углов φ и ψ, рассчитанных с учетом релаксации всех степеней свободы в системе. В скобках указаны величины этих углов, вычисленные без учета релаксации. Соответствующие конформациям значения энергии приведены над каждой из них, при этом они даны в эВ и отсчитаны от энергии состояния 1 (энергия этого состояния приведена в а.е.). В скобках указаны энергии, вычисленные без учета релаксации всех степеней свободы в системе. Пунктирными линиями показаны основные водородные связи в системе. Их длины приведены в ангстремах. 58 барьера составляет 0.095 эВ, а для перехода 2 → 1 она равна 0.023 эВ. Частота колебаний гексапептида для рассматриваемой координаты, рассчитанная методом B3LYP/STO-3G составила 6.24 см−1 . В результате, при комнатной температуре 1→2 2→1 времена переходов составляют: τ6×Ala ∼ 211 пс и τ6×Ala ∼ 13 пс. Рис. 2.10: Барьеры для переходов между конформациями 1 ↔ 2 гексапептида аланина со вторичной структурой листа. Кружками и квадратами соответственно показаны барьеры, вычисленные без и с учетом релаксации всех атомов в системе. 2.2.6 Поверхность потенциальной энергии гексапептида аланина в конформации спирали Перейдем к рассмотрению гексапептида аланина со вторичной структурой спирали. Поверхность потенциальной энергии для этого полипептида приведена на рис. 2.11. На ней видны 2 центральные запрещенные области примерно при тех же значения углов φ и ψ, что и на остальных энергетических поверхностях. В дополнение к двум центральным максимумам на поверхности гексапептида аланина со вторичной структурой спирали наблюдается максимум при φ ∼ 180o и ψ ∼ 40o . 59 Рис. 2.11: Поверхность потенциальной энергии гексапептида аланина со вторичной структурой спирали, рассчитанная методом B3LYP/6-31G(2d,p). Энергии приведены в эВ, ккал/моль и Кельвинах. Цифрами отмечены минимумы на потенциальной поверхности. Возникновение этого максимума обусловлено сильным сближением боковых радикалов крайних аминокислот гексапептида. Положение минимумов заметно меняется по сравнению с поверхностями, которые обсуждались в предыдущих разделах. Эти отличия обусловлены влиянием вторичной структуры полипептида на его конформационные свойства. Геометрии конформаций, соответствующие наиболее выраженным минимумам, приведены на рис. 2.12. Следует отметить, что с учетом релаксации всех степеней свободы молекулы значение углов φ и ψ соответствующих некоторым минимумам на поверхностях потенциальной энергии для гексапептидов аланина значительно меняется (см., например, состояния 1, 4, 5 на рисунке 2.9 и состояния 2, 4 на рисунке 2.12). Это фактически означает, что вблизи этих минимумов поверхность потенциальной энергии гексапептида аланина с учетом релаксации всех степеней свободы молекулы 60 сильно отличается от поверхности потенциальной энергии, рассчитанной без учета релаксации. Расчет поверхности потенциальной энергии полипептида, без учета релаксации является трудоемкой задачей в рамках ТФП. Так, например, для расчета поверхности потенциальной энергии гексапептида, рассмотренной в настоящей работе, потребовалось ∼ 2000 часов компьютерного времени компьютера класса 2.4 ГГц, Pentium Xeon. Расчет потенциальной поверхности с учетом релаксации всех степеней свободы молекулы потребовал бы примерно в 20-30 раз больше компьютерного времени, что составляет ∼ 5 лет работы компьютера упомянутого класса. Подобный расчет был бы неоправданно дорогим, поскольку поверхность потенциальной энергии, рассчитанная без учета релаксации, уже содержит весьма большой объем полезной информации. Так, с помощью этой поверхности можно эффективно определять различные состояния полипептида, которые могут в дальнейшем быть использованы как начальные конфигурации для оптимизации системы по всем степеням свободы. Для цепочки из шести аланинов конформация спирали является энергетически менее выгодной, чем конформация листа. Разница энергий составляет 0.234 эВ. Это связано с тем, что в конформации листа несколько больше водородных связей (∼ 7), чем в конформации спирали (∼ 4 − 5), возникающих между атомами кислорода и атомами водорода, связанными с атомами азота. Именно подобные водородные связи заметно понижают энергию системы. 2.2.7 Сравнение результатов расчета с экспериментальными данными В настоящее время стало возможным экспериментальное определение пространственной структуры многих белков. Зная структуру белка, можно определить углы φ и ψ ее характеризующие. На рисунке 2.13а представлена карта запрещенных и разрешенных конформаций аланина (стерическая диаграмма Рамачандрана) взятая из [66]. Она получена чисто из геометрических соображений. При этом структура полипептида предпо- 61 Рис. 2.12: Оптимизированные геометрии гексапептида аланина со вторичной структурой спирали. Конформации молекул, соответствующие минимумам на поверхности потенциальной энергии, представленной на рисунке 2.11, отмечены соответствующими цифрами. Под каждой структурой приведен набор углов φ и ψ, рассчитанных с учетом релаксации всех степеней свободы в системе. В скобках указаны величины этих углов, вычисленные без учета релаксации. Соответствующие конформациям значения энергии приведены над каждой из них, при этом они даны в эВ и отсчитаны от энергии состояния 1 (энергия этого состояния приведена в а.е.). В скобках указаны энергии, вычисленные без учета релаксации всех степеней свободы в системе. Пунктирными линиями показаны основные водородные связи в системе. Их длины приведены в ангстремах. 62 Рис. 2.13: Сравнение значений углов φ и ψ, соответствующих аланиновым звеньям 50 белков, взятых случайным образом из базы данных для белков [75, 97], со стерической диаграммой поли-аланина [66] (часть а)). Сравнение значений углов φ и ψ аланиновых звеньев ряда белков, построенных на основе базы данных для белков [75,97], с минимумами на рассчитанных поверхностях потенциальной энергии для: б) трипептида аланина; в) гексапептида аланина в конформации листа; г) гексапептида аланина в конформации спирали. Прозрачные ромбы соответствуют аланинам в окружении аланинов, тогда как заполненные кружки соответствуют аланинам в окружении других аминокислот. Пунктирными эллипсами помечены области повышенной концентрации наблюдаемых углов. 63 лагается фиксированой, определяемой межатомными радиусами ван дер Ваальсовского взаимодействия. В зависимости от величины расстояний между атомами, на стерической диаграмме различают три области: полностью разрешенную, условно разрешенную и запрещенную. Конформация считается полностью разрешенной, если расстояние между атомами различных аминокислот превышает некоторое критическое значение rij ≥ rmax . Условно разрешенными считаются области, в которых расстояния между отдельными атомами различных аминокислот находятся в интервале rmin ≤ rij < rmax . Все остальные состояния считаются запрещенными. Значения rmin и rmax определяются типами пар атомов, и могут быть найдены во множестве учебников (см., например, [66]). На рисунке 2.13а белым цветом показаны полностью разрешенные области, светло-серым условно разрешенные области, а темно-серым запрещенные области. На этом рисунке точками отмечены углы, соответствующие основным геометриям аланина, периодическое повторение которых приводит к возникновению цепочек с определенной вторичной структурой. В таблице 2.2 приведены значения углов φ и ψ соответствующие основным типам вторичных структур поли-аланина. В иллюстративных целях на рисунке 2.13а эти точки изображены небольшими окружностями, внутри котоL рых приведены соответствующие типы вторичных структур. Так, 2R 7 , 27 : правая L и левая спираль 27 ; 3R 10 , 310 : правая и левая спираль 310 ; αR , αL : правая и левая α−спираль (413 ); πR , πL : правая и левая π−спираль (516 ); ↑↑, ↑↓ параллельный и антипараллельный β лист. βI , βII соответствуют β−изгибам I и II рода соответственно. Однако, не все из перечисленных выше структур в равной мере присутствуют в аланиновых звеньях белков. На рисунке 2.13а показано распределение значений углов φ и ψ аланиновых звеньев 50 белков, взятых случайным образом из базы данных для белков [75,97]. В данной работе были взяты белки со следующими PDB кодами: 1ALD, 1BRP, 1BTC, 1C1L, 1C1M, 1CCA, 1CCR, 1CMS, 1CTY, 1EST, 1GBT, 1HBG, 1LEC, 1LEH, 1LH1, 1LTE, 1MBA, 1MBS, 1MPP, 1MUP, 1POC, 64 Таблица 2.2: Значения углов φ и ψ соответствующие основным типам вторичных структур поли-аланина. тип структуры ψ (град.) ψ (град.) правая (левая) спираль 27 -78 (78) 59 (-59) правая (левая) спираль 310 -49 (49) -26 (26) правая (левая) α−спираль (413 ) -57 (57) -47 (47) правая (левая) π−спираль (516 ) -57 (57) -70 (70) параллельный β лист (↑↑) -119 113 антипараллельный β лист (↑↓) -139 135 β−изгиб I рода -90 0 β−изгиб II рода 90 0 1RCB, 1SHG, 1YEB 2AAA, 2APR, 2C2C, 2CNA, 2IMM, 2LHB, 2MHR, 2RHE, 2STV, 351C, 3APP, 3PEP, 1GKU, 1AA2, 1G8X, 1AFA, 2SCQ, 1CX2, 1CFB, 1A00, 1MT5, 1IL8, 1ICW, 1GOS, 1PRH, 1C1G . Видно, что можно выделить четыре основные области, в пределах которых распределены почти все экспериментальные точки. На рисунке 2.13 эти области схематически обозначены пунктирными эллипсами. Следует подчеркнуть, что подобное разбиение носит исключительно иллюстративный характер и служит для облегчения понимания экспериментально наблюдаемых данных и упрощения дальнейшего обсуждения. Каждая из областей соответствует различным типам вторичной структуры поли-аланина. Так, область I соответствует параллельным и антипараллельным β−листам. Область II праR вой спирали 2R 7 . Область III правой αR −спирали, правой спирали 310 , правой πR −спирали и β−изгибу I рода. Область IV левой αL −спирали, левой спирали 3L10 , левой πL −спирали и β−изгибу II рода. Видно, что в некоторых случаях внутри одной области присутствуют нескольких вторичных структур и однозначно сопоставить точки какому-либо типу вторичной структуры на основе имеющихся экспериментальных данных нельзя. 65 Перейдем теперь к сравнению экспериментально наблюдаемых значений углов φ и ψ в белках с положением минимумов на поверхности потенциальной энергии рассчитанной для полипептидов. Отметим, что подобного рода сравнение ранее не проводилось, и сделано в настоящей работе впервые. Целью этого сравнения является установление соответствия рассчитанных углов φ и ψ, соответствующих различным устойчивых состояниям полипептидных цепочек, углам φ и ψ наблюдаемым в эксперименте, а также сопоставление вторичной структуры рассчитанных конформаций полипептидов вторичным структурам Рамачандрана. Область I можно сопоставить минимумам 1 на поверхностях потенциальной энергии трипептида аланина (рис. 2.13б) и гексапептида аланина со вторичной структурой листа (рис. 2.13в). Эти состояния в точности соответствуют цепочкам аланина в состоянии β-листа (см. рис. 2.5 и 2.9). На поверхности потенциальной энергии для гексапептида аланина со вторичной структурой спирали (рис. 2.13г) минимума в этой области потенциальной поверхности не возникает. Область II соответствует минимумам 2 на поверхностях 2.13б и 2.13в, а также минимуму 3 на поверхности потенциальной энергии 2.13г. На стерической диаграмме поли-аланина область II соответствует правой спирали 2R 7 . Структура состояний 2 на поверхностях 2.13б и 2.13в отличается от структуры этой спирали. Фрагменту спирали 2R 7 соответствуют лишь центральные аланины, которым соответствуют углы φ и ψ на рисунках 2.13б и 2.13в. Поэтому можно судить о состояниях 2 как о смешанных состояниях, в которых центральная часть имеет конформацию спирали, а крайние - конформацию листа. В реальных белках полноценная спираль 2R 7 образуется крайне редко, поскольку соответствующая ей область на стерической диаграмме лежит на самом краю запрещенной области, а также угол схождения N − H и C = O групп практически прямой, что невыгодно для образования водородной связи. Состояние 3 на поверхности 2.13г тоже является смешанным состоянием. Здесь можно выделить один виток спирали 3R 10 и два витка спирали 2R 7 с характерным водородным связям между атомами (см. 66 рис. 2.12). Области III соответствуют структура правой αR −спирали, правой спирали 3R 10 , правой πR −спирали и β−изгиба I типа. Область III можно сопоставить минимумам 6, 5 и 4 на поверхностях 2.13б, 2.13в, и 2.13г, соответственно. Состояние 6 на поверхности потенциальной энергии трипептида аланина не может соответствовать ни одной вторичной структуре, характерной для этой области на потенциальной поверхности, поскольку полипептид слишком короткий. В этой области потенциальной поверхности наиболее вероятными для аланина являются структуры правой αR −спирали и β−изгиба. Однако, для формирования одного витка такой спирали (или для формирования изгиба) необходимо минимум четыре аминокислоты. Состояние 5 на потенциальной поверхности гексапептида аланина 2.13в можно охарактеризовать как несформировавшийся β−изгиб, поскольку аланин в котором меняются двугранные углы принимает состояние β−изгиба, а соседний с ним аланин находится в состоянии листа (см. рис. 2.9). Состояние 4 на потенциальной поверхности гексапептида аланина 2.13г заметно изменяется при учете релаксации молекулы по всем степеням свободы, и попадает за рамки области III. По характерным водородным связям, в состоянии 4 можно выделить R фрагмент спирали 2R 7 и фрагмент спирали 310 . Тот факт, что точка, соответствую- щая минимуму 4 лежит за пределами областей II и III, объясняется тем, что углы φ и ψ, представленные на рисунке 2.13г, соответствуют аминокислоте на стыке фрагментов двух спиралей. Это приводит к значительным искажениям структуры аминокислоты. Области IV соответствуют структура левой αL −спирали, левой спирали 3L10 , левой πL −спирали и β−изгиба II типа. Фрагменты с такими типами вторичной структуры возникают в аланиновых звеньях белков крайне редко. Отметим тот факт, что для формирования всех этих структур необходимо как минимум четыре аминокислоты, поэтому, возникающий на потенциальной поверхности для трипептида аланина минимум 3, не может быть отнесен к той или иной вторичной 67 структуре. На поверхностях потенциальной энергии для гексапептидов области IV можно сопоставить состояния 3 и 2 на поверхностях 2.13в и 2.13г соответственно. Состояние 3 на поверхности 2.13в соответствует несформировавшемуся β−изгибу, поскольку аланин, в котором меняются двугранные углы, принимает состояние β−изгиба, а соседний с ним аланин находится в состоянии листа (см. рис. 2.9). Состояние 2 на поверхности 2.13г лежит за пределами области IV, однако учет релаксации молекулы по всем степеням свободы заметно сдвигает минимум по поверхности и он попадает в разрешенную зону для левой αL −спирали и левой спирали 3L10 (см. рис. 2.12). Структура состояния 2 напоминает структуру левой спирали 3L10 (см. рис. 2.12). Основные отличия вызваны недостаточной длиной полипептида для формирования правильной спиралевидной структуры. Также следует отметить, что состояние 1 на поверхности 2.13г совпадает со структурой левой спирали 2L7 на стерической диаграмме 2.13а, хотя и является смешанным (здесь присутствуют два витка левой спирали 2L7 и один виток левой спирали 3L10 ). Это совпадение вызвано тем, что углы φ и ψ на рисунке 2.13г определены для аланина, из спирали 2L7 . 2.3 Конформационные переходы в три- и гексапептидах глицина 2.3.1 Оптимизированные геометрии полипептидов глицина Для изучения кручения цепочек аминокислот вдоль полипептидной цепи необходимо задать начальную структуру молекулы. С увеличением размера системы возрастает количество ее стабильных изомерных состояний, отличающихся лишь своей вторичной структурой. В настоящей работе исследованы цепочки аминокислот с двумя наиболее распространенными видами вторичной структуры, именуемыми конформациями спирали и листа. На рисунке 2.14 показана структура трех цепочек, которые были исследованы 68 Рис. 2.14: Оптимизированные геометрии полипептидных цепочек глицина, рассчитанные методами B3LYP/6-31++G(d,p). а) Трипептид глицина; б) Гексапептид глицина в конформации листа; в) Гексапептид глицина в конформации спирали. Энергии под каждым изображением приведены в атомных единицах. в данной работе. Геометрии цепочек были получены в рамках ТФП с использованием функционала B3LYP. На рисунке 2.14а показан трипептид глицина. В данной работе был исследован трипептид в конформации листа, поскольку при данной длине цепочки спиралевидной структуры еще не образуется. На рисунках 2.14б и 2.14в представлены гексапептиды со вторичной структурой листа и спирали соответственно, которые характеризуются четырьмя наборами углов φ и ψ. При изменении углов φ и ψ в центральной аминокислоте полипептид может принимать состояния заметно отличающиеся от структуры листа и спирали. В этих случаях для удобства обсуждения полипептид относится к типу листа или спирали, если структура листа или спирали возникает при определенных значениях углов φ и ψ в центральной аминокислоте. Энергии молекул приведены рядом с их изображениями на рисунке 2.14 в атомных единицах. 2.3.2 Поверхность потенциальной энергии трипептида глицина На рисунке 2.15 показана поверхность потенциальной энергии трипептида глицина, рассчитанная методом B3LYP/6-31G(2d,p). Шкала энергии приведена в электрон-вольтах, ккал/моль и Кельвинах и отсчитана от глобального минимума данной поверхности. Как видно из рисунка, на энергетической поверхности наблюдается несколько минимумов, они обозначены цифрами в порядке возрастания их энергии. Каждо69 Рис. 2.15: Поверхность потенциальной энергии трипептида глицина, рассчитанная методом B3LYP/6-31G(2d,p). Энергии приведены в эВ, ккал/моль и Кельвинах. Цифрами помечены минимумы на потенциальной поверхности. Стрелками показаны рассматриваемые переходы между различными конформациями молекулы. му минимуму соответствует устойчивое изомерное состояние молекулы. В случае трипептида таких состояний три. Они представлены на рисунке 2.16. Пунктирными линиями на рисунке показаны основные водородные связи в системе, которые определены как связи между атомами водорода и атомами кислорода, расположенными на расстоянии не превышающем 3 ангстрема. Как видно из этого рисунка, геометрии, соответствующие различным устойчивым состояниям, заметно отличаются друг от друга. Для исследования потенциальных поверхностей использовалась следующая процедура. После определения устойчивой структуры молекулы, фиксировались все степени свободы системы и менялись лишь углы φ и ψ в центральной аминокислоте. Таким методом были рассчитаны все потенциальные поверхности, представленные в этом разделе. Данный метод позволяет эффективно получать информацию об основных конформациях, соответствующих минимумам на поверхности потенциальной энергии. Таким образом, были определены соответствующие им углы φ и ψ. Заметим, что абсолют70 Рис. 2.16: Оптимизированные геометрии трипептида глицина. Различные геометрии, соответствующие минимумам на поверхности потенциальной энергии, представленной на рисунке 2.15, отмечены соответствующими цифрами. Под каждой структурой приведен набор углов φ и ψ, полученных с учетом релаксации всех степеней свободы в системе. В скобках указаны величины этих углов, найденные без учета релаксации. Значения энергии молекулярных структур приведены над каждой из конформаций, при этом энергии приведены в эВ и отсчитаны от энергии состояния 1 (энергия этого состояния приведена в атомных единицах (а.е.)). В скобках указаны энергии, полученные без учета релаксации всех степеней свободы в системе. Пунктирными линиями показаны основные водородные связи в системе. Их длины приведены в ангстремах. 71 ные значения энергий, соответствующих различным конформациям, определены не совсем точно, поскольку данный метод расчета не учитывает релаксацию всех атомов при кручении молекулы. Вычисления потенциальной поверхности цепочки с учетом ее релаксации требуют в 20-30 раз больше компьютерного времени. Систематическое исследование роли релаксации при формировании поверхности потенциальной энергии с учетом всех электронов системы в работе не проводилось. Однако, была выполнена полная оптимизация структур полипептидов, соответствующих различным минимумам на поверхности потенциальной энергии с учетом всех степеней свободы молекулы. На рисунке 2.16 сравниваются стабильные состояния, соответствующие трипептиду глицина с учетом релаксации молекулы и без учета. Как видно из этого сравнения, характерные двугранные углы φ и ψ меняются в пределах 10-ти процентной погрешности, что может быть объяснено незначительным влиянием остальных степеней свободы на значение двугранных углов в полипептиде вблизи минимума энергии. В результате релаксации по остальным степеням свободы происходит небольшая перестройка боковых атомов (или радикалов в случае больших аминокислот), что приводит к понижению энергии системы. В связи с этим, относительная энергия минимумов может измениться при учете полной релаксации молекулы. В данной работе рассчитаны поверхности потенциальной энергии полипептидов на сетке с шагом 18o . Выполнение расчета с более мелким шагом не имело бы смысла, вследствие того, что учет всех степеней свободы приводил бы к большим изменениям углов φ и ψ, чем шаг сканирования. В [77] и [78] были рассчитаны значения двугранных углов φ и ψ для дипептидов глицина и аланина. Поскольку в дипептиде и трипептиде влияние крайних аминокислот весьма незначительно, то значения двугранных углов, соответствующих различным устойчивым конформациям в трипептиде и дипептиде оказываются близкими. В таблице 2.3 произведено сравнение значений двугранных углов друг с другом. В ранних работах структуры дипептидов исследовались в рамках теории 72 Хартри-Фока. Так в [77], значения φ и ψ были получены с помощью метода HF/631+G*, а в [78]- с помощью метода HF/6-31G**. Видно, что данные этих работ в целом согласуются друг с другом и с расчетом выполненным в данной работе (3-я колонка, таблица 2.3). Некоторые различия могут быть объяснены влиянием третьего глицина в трипептиде на конформационные свойства, а также пренебрежением многоэлектронных корреляций в теории Хартри-Фока, в рамках которой выполнены расчеты в [77, 78]. Таблица 2.3: Сравнение двугранных углов φ и ψ, соответствующих различным конформациям трипептида глицина, номера которых указаны в первой колонке. состояние φ, [77] ψ [77] φ [78] ψ [78] φ ψ 80.1 -70.2 1 - - 76.0 -55.4 2 -180.0 180.0 -157.2 159.8 -164.2 176.2 3 -85.2 67.4 -85.8 79.0 -81.2 62.8 Рис. 2.17: Иллюстрация межатомного отталкивательного взаимодействия в трипептиде глицина, обусловленного O − H (часть а) и O − O (часть б) связями. Из рисунка 2.15 видно, что некоторые области на потенциальной поверхности являются запрещенными. В этих областях потенциальная энергия молекулы заметно возрастает из-за сближения отдельных атомов в процессе кручения полипептида. Учет релаксации молекул хотя и уменьшает значения энергии системы, 73 мало влияет на положение запрещенных зон. На рисунке 2.15 видны две выраженные области вблизи значений углов φ и ψ (0, 0) и (0, 180) градусов соответственно. В первой области происходит сближение атомов водорода и кислорода на расстояния значительно меньшие характерной длины связи в молекуле (см. рисунок 2.17, часть а). При этом возникает сильное межатомное отталкивание, обусловленное перекрытием электронных оболочек атомов и обменным взаимодействием электронов. Второй максимум соответствует сближению двух атомов кислорода на расстояние порядка длины связи (см. рисунок 2.17, часть б), что также приводит к увеличению энергии системы за счет кулоновского отталкивания этих атомов. Как видно из рисунка 2.15, на поверхности потенциальной энергии трипептида существуют три явно выраженных минимума, разделенных барьерами. На рисунке 2.18 изображены эти барьеры для переходов 2 ↔ 1 и 2 ↔ 3. На рисунке 2.18 показаны барьеры, рассчитанные без и с учетом релаксации всех степеней свободы в системе. Сами переходы показаны стрелками на рисунке 2.15. Из рисунка 2.18 видно, что учет релаксации заметно понижает высоту барьера перехода, а также влияет на относительную энергию минимумов. Используя метод B3LYP/6-31G(2d,p), были рассчитаны характерные частоты переходов между различными состояниями для цепочек глицина. Для трипептида глицина частота равна 33.49 см−1 Из рисунка 2.18 следует, что для перехода 2 → 3: ∆E2→3 = 0.103 эВ, а для перехода 3 → 2: ∆E3→2 = 0.132 эВ. В результате, 2→3 3→2 τ3×Gly ∼ 54 пс и τ3×Gly ∼ 164 пс. Заметим, что эти времена могут быть измерены методами ЯМР [76, 96]. 2.3.3 Поверхность потенциальной энергии гексапептида глицина в конформации листа На рисунке 2.19 приведена поверхность потенциальной энергии гексапептида глицина в конформации листа в зависимости от двугранных углов φ и ψ. На рис. 2.19 видны две явно выраженные центральные запрещенные области, обусловленные 74 Рис. 2.18: Барьеры для переходов между состояниями 2 ↔ 1 (верхний рисунок) и состояниями 2 ↔ 3 (нижний рисунок) трипептида глицина. Кружками и квадратами соответственно показаны барьеры без и с учетом релаксации всех атомов в системе. 75 Рис. 2.19: Поверхность потенциальной энергии гексапептида глицина со вторичной структурой листа, рассчитанная методом B3LYP/6-31G(2d,p). Энергии приведены в эВ, ккал/моль и Кельвинах. Цифрами помечены минимумы на потенциальной поверхности. Стрелками показаны рассмотренные переходы между различными конформациями молекулы. отталкиванием атомов кислорода и водорода при их сближении друг с другом (см. рис. 2.17) Как и в случае трипептида глицина, видны три характерных минимума (1-3). Соответствующие им геометрии молекул и значения двугранных углов приведены на рис. 2.20. Возникновение этих минимумов на потенциальной поверхности обусловлено, как и в случае трипептида глицина, образованием водородных связей между атомами кислорода и водорода, связанными с атомами азота полипептидной цепи (см. рис. 2.20). Вследствие того, что механизм возникновения этих минимумов аналогичен случаю трипептида глицина, значения двугранных углов соответствующих конформаций также близки. На поверхности потенциальной энергии гексапептида глицина возникает в дополнение к основным еще несколько дополнительных минимумов (4-5). Их возникновение обусловлено образованием водородных связей между атомами кислорода 76 Рис. 2.20: Оптимизированные конформации гексапептида глицина со вторичной структурой листа, соответствующие минимумам на поверхности потенциальной энергии. Номера конформаций соответствуют номерам на поверхности потенциальной энергии, изображенной на рисунке 2.19. Для каждой конформации приведены углы φ и ψ, вычисленные с учетом релаксации всех степеней свободы в системе. В скобках указаны величины этих углов без учета релаксации. Над каждой из молекул приведена ее энергия в эВ отсчитанная от энергии состояния 1 (энергия этого состояния приведена в а.е.). В скобках указаны значения энергии полученные без учета релаксации всех степеней свободы в системе. Пунктирными линиями показаны основные водородные связи в системе. Их длины приведены в ангстремах. 77 Рис. 2.21: Барьеры для переходов между состояниями 1 ↔ 2 гексапептида глицина со вторичной структурой листа. Кружками и квадратами соответственно показаны барьеры вычисленные без и с учетом релаксации всех степеней свободы в системе. и водорода из аминокислот, отстоящих далеко друг от друга в аминокислотной последовательности. Эти минимумы отсутствуют в трипептиде глицина, поскольку этот полипептид еще слишком короткий для формирования необходимых водородных связей. Энергетические барьеры для перехода между минимумами 1 и 2 представлены на рис. 2.21. На этом рисунке приведена зависимость энергии от переменной сканирования, которая меняется вдоль пути, показанного стрелкой на рисунке 2.19. Эта зависимость была рассчитана как с оптимизацией всех степеней свободы системы, так и без нее. В случае гексапептида глицина высота барьера для перехода 1 → 2 оказывается практически такой же как и в трипептиде глицина в то время как высота барьера для перехода 2 → 1 заметно снижается. Высоты барьеров для этих переходов составляют 0.128 эВ и 0.028 эВ соответственно. Частота колебаний гексапептида для степени свободы, ответственной за рассмотренный переход, была рассчитана методом B3LYP/6-31G(2d,p) и составила 15.45 см−1 . Тогда, ис- 78 пользуя уравнение (2.1) при комнатной температуре, несложно вычислить времена 2→1 1→2 соответствующих переходов: τ6×Gly ∼ 305 пс, τ6×Gly ∼ 6 пс. 2.3.4 Поверхность потенциальной энергии гексапептида глицина в конформации спирали Рис. 2.22: Поверхность потенциальной энергии гексапептида глицина со вторичной структурой спирали, рассчитанная методом B3LYP/6-31G(2d,p). Энергии приведены в эВ, ккал/моль и Кельвинах. Цифрами отмечены минимумы на потенциальной поверхности. Перейдем к рассмотрению гексапептида глицина со вторичной структурой спирали. Поверхность потенциальной энергии для этого полипептида приведена на рис. 2.22. На ней видны 2 центральные запрещенные области при тех же значения углов φ и ψ что и на остальных энергетических поверхностях. Однако, положение минимумов заметно меняется по сравнению с поверхностями, которые обсуждались в предыдущих разделах. Эти отличия обусловлены влиянием вторичной структуры полипептида на его конформационные свойства. Геометрии конформаций, соответствующие наиболее выраженным минимумам, приведены на рис. 2.23. 79 Рис. 2.23: Оптимизированные геометрии гексапептида глицина со вторичной структурой спирали. Конформации молекул, соответствующие минимумам на поверхности потенциальной энергии, представленной на рисунке 2.22, отмечены соответствующими цифрами. Под каждой структурой приведен набор углов φ и ψ, рассчитанных с учетом релаксации всех степеней свободы в системе. В скобках указаны величины этих углов, вычисленные без учета релаксации. Соответствующие конформациям значения энергии приведены над каждой из них, при этом они даны в эВ и отсчитаны от энергии состояния 1 (энергия этого состояния приведена в а.е.). В скобках указаны энергии, вычисленные без учета релаксации всех степеней свободы в системе. Пунктирными линиями показаны основные водородные связи в системе. Их длины приведены в ангстремах. 80 Следует отметить, что с учетом релаксации всех степеней свободы молекулы значение углов φ и ψ соответствующих некоторым минимумам на поверхностях потенциальной энергии для гексапептидов глицина значительно меняется (см. например состояния 1, 4, 5 на рис. 2.20 и состояния 3, 4 на рис. 2.23). Это фактически означает, что вблизи этих минимумов поверхность потенциальной энергии гексапептида глицина с учетом релаксации всех степеней свободы молекулы сильно отличается от поверхности потенциальной энергии, рассчитанной без учета релаксации. Расчет поверхности потенциальной энергии полипептида, без учета релаксации является трудоемкой задачей в рамках ТФП. Так, например, для расчета поверхности потенциальной энергии гексапептида, рассмотренной в настоящей работе, потребовалось ∼ 1000 часов компьютерного времени компьютера класса 2.4 ГГц, Pentium Xeon. Расчет потенциальной поверхности с учетом релаксации всех степеней свободы молекулы потребовал бы примерно в 20-30 раз больше компьютерного времени, что составляет ∼ 3 года работы компьютера упомянутого класса. Подобный расчет был бы неоправданно дорогим, поскольку поверхность потенциальной энергии, рассчитанная без учета релаксации, уже содержит весьма большой объем полезной информации. Так, с помощью этой поверхности можно эффективно определять различные состояния полипептида, которые могут в дальнейшем быть использованы как начальные конфигурации для оптимизации системы по всем степеням свободы. Для шести глицинов конформация спирали является энергетически менее выгодной, чем конформация листа. Разница энергий составляет 0.054 эВ. Это связано с тем, что в конформации листа заметно больше водородных связей (∼ 6), чем в конформации спирали (∼ 4), возникающих между атомами кислорода и атомами водорода, связанными с атомами азота. Именно подобные водородные связи заметно понижают энергию системы. 81 2.3.5 Сравнение результатов расчета с экспериментальными данными В настоящее время стало возможным экспериментальное определение структуры многих белков. Зная структуру белка, можно определить углы φ и ψ ее характеризующие. Рис. 2.24: Сравнение значений углов φ и ψ, соответствующих глициновым звеньям 50 белков, взятых случайным образом из базы данных для белков [75, 97], со стерической диаграммой поли-глицина [66] (часть a)). Сравнение значений углов φ и ψ глициновых звеньев ряда белков, построенных на основе базы данных для белков [75,97], с минимумами на рассчитанных поверхностях потенциальной энергии для: b) трипептида глицина; c) гексапептида глицина в конформации листа; d) гексапептида глицина в конформации спирали; Прозрачные ромбы соответствуют глицинам в окружении глицинов, тогда как заполненные кружки соответствуют глицинам в окружении других аминокислот. Пунктирными эллипсами помечены области повышенной концентрации наблюдаемых углов. На рисунке 2.24а представлена карта запрещенных и разрешенных конформа82 ций глицина (стерическая диаграмма Рамачандрана) взятая из [66]. Она получена из чисто геометрических соображений. При этом структура полипептида предполагается фиксированой, определяемой межатомными радиусами ван дер Ваальсовского взаимодействия. В зависимости от величины расстояний между атомами, на стерической диаграмме различают три области: полностью разрешенную, условно разрешенную и запрещенную. Конформация считается полностью разрешенной, если расстояние между атомами различных аминокислот превышает некоторое критическое значение rij ≥ rmax . Условно разрешенными считаются области, в которых расстояния между отдельными атомами различных аминокислот находятся в интервале rmin ≤ rij < rmax . Все остальные состояния считаются запрещенными. Значения rmin и rmax определяются типами пар атомов, и могут быть найдены во множестве учебников (см., например, [66]). На рисунке 2.24а белым цветом показаны полностью разрешенные области, светло-серым условно разрешенные области, а темно-серым запрещенные области. На этом рисунке точками отмечены углы, соответствующие основным геометриям глицина, периодическое повторение которых приводит к возникновению цепочек с определенной вторичной структурой. В таблице 2.4 приведены значения углов φ и ψ соответствующие основным типам вторичных структур поли-глицина. В иллюстративных целях на рисунке 2.24а эти точки изображены небольшими окружностями, внутри котоL рых приведены соответствующие типы вторичных структур. Так, 2R 7 , 27 : правая L и левая спираль 27 ; 3R 10 , 310 : правая и левая спираль 310 ; αR , αL : правая и левая α−спираль (413 ); πR , πL : правая и левая π−спираль (516 ); ↑↑, ↑↓ параллельный и антипараллельный β лист. βI , βII соответствуют β−изгибам I и II рода соответственно. Однако, не все из перечисленных выше структур в равной мере присутствуют в белках. На рисунке 2.24а показано распределение значений углов φ и ψ всех глициновых звеньев 50 белков случайно выбранных из базы данных для белков [75,97]. В данной работе были взяты белки со следующими PDB кодами: 1ALD, 1BRP, 1BTC, 83 Таблица 2.4: Значения углов φ и ψ соответствующие основным типам вторичных структур поли-глицина. тип структуры ψ (град) ψ (град) правая (левая) спираль 27 -78 (78) 59 (-59) правая (левая) спираль 310 -49 (49) -26 (26) правая (левая) α−спираль (413 ) -57 (57) -47 (47) правая (левая) π−спираль (516 ) -57 (57) -70 (70) параллельный β лист (↑↑) -119 113 антипараллельный β лист (↑↓) -139 135 β−изгиб I рода -90 0 β−изгиб II рода 90 0 1C1L, 1C1M, 1CCA, 1CCR, 1CMS, 1CTY, 1EST, 1GBT, 1HBG, 1LEC, 1LEH, 1LH1, 1LTE, 1MBA, 1MBS, 1MPP, 1MUP, 1POC, 1RCB, 1SHG, 1YEB 2AAA, 2APR, 2C2C, 2CNA, 2IMM, 2LHB, 2MHR, 2RHE, 2STV, 351C, 3APP, 3PEP, 3WRP, 4APE, 4TNC, 6TAA, 8ADH, 1AA2, 2SCQ, 1CX2, 1CFB, 1MT5, 1ICW, 1GOS, 1PRH, 1C1G. Видно, что можно выделить четыре основные области, в пределах которых распределены почти все экспериментальные точки. На рисунке 2.24 эти области схематически обозначены пунктирными эллипсами. Следует подчеркнуть, что подобное разбиение носит исключительно иллюстративный характер и служит для облегчения понимания экспериментально наблюдаемых данных и упрощения дальнейшего обсуждения. Каждая из областей соответствует различным типам геометрической вторичной структуры поли-глицина. Так, область I соответствует параллельным и антипараллельным β−листам. Область II правой спирали 2R 7 . Область III правой αR −спирали, правой спирали 3R 10 , правой πR −спирали и β−изгибу I типа. Область IV левой αL −спирали, левой спирали 3L10 и β−изгибу II типа. Видно, что в некоторых случаях внутри одной области присутствуют несколько вторичных структур 84 и однозначно сопоставить точки какому-либо типу вторичной структуры на основе имеющихся экспериментальных данных нельзя. Из сравнения проведенного на рисунке 2.24а видно, что спирали πL и 2L7 в эксперименте практически не наблюдаются. Перейдем теперь к сравнению экспериментально наблюдаемых значений углов φ и ψ в белках с положением минимумов на поверхности потенциальной энергии рассчитанной для полипептидов. Отметим, что подобного рода сравнение ранее не проводилось, и сделано в настоящей работе впервые. Целью этого сравнения является установление соответствия рассчитанных углов φ и ψ, соответствующих различным устойчивых состояниям полипептидных цепочек, углам φ и ψ наблюдаемым в эксперименте, а также сопоставление вторичной структуры рассчитанных конформаций полипептидов вторичным структурам Рамачандрана. Область I соответствует минимумам 2, 1 и 5 на поверхностях потенциальной энергии трипептида глицина (рис. 2.24б), гексапептида глицина со вторичной структурой листа (рис. 2.24в), и гексапептида глицина со вторичной структурой спирали (рис. 2.24г), соответственно. Состояния 2 и 1 на рисунках 2.24б и 2.24в в точности соответствуют цепочкам глицина в состоянии β-листа (см. рис. 2.16 и 2.20). Состояние 5 на рисунке 2.24г является смешанным состоянием. Здесь центральная аминокислота имеет конформацию листа, в то время как крайние аминокислоты- конформацию спирали. Область II соответствует минимумам 3, 2 и 1 на поверхностях 2.24б, 2.24в и 2.24г соответственно. На стерической диаграмме поли-глицина (см. рис. 2.24а) эта область соответствует правой спирали 2R 7 . Структура состояний 3 и 2 на поверхностях 2.24б и 2.24в отличается от структуры этой спирали. Фрагменту спирали 2R 7 соответствуют лишь центральные глицины, которым соответствуют углы φ и ψ на рисунках 2.24б и 2.24в. Поэтому можно судить о состояниях 3 и 2 как о смешанных состояниях, в которых центральная часть имеет конформацию спирали, а крайние- конформацию листа. Состояние 1 на поверхности 2.24г тоже 85 является смешанным состоянием. Здесь можно выделить один виток спирали 3R 10 и два витка спирали 2R 7 с характерными водородными связями между атомами ′ Ci−1 − O · · · H − Ni (см. рис. 2.23). Данный анализ показывает возможность существования устойчивого смешанного состояния глициновой цепи в области углов φ и ψ соответствующей спирали 2R 7. Области III соответствуют структура правой αR −спирали, правой спирали 3R 10 , правой πR −спирали и β−изгиба I типа. Область III можно сопоставить минимуму 5 на поверхности потенциальной энергии 2.24в. Это состояние можно охарактеризовать как несформировавшийся β−изгиб, поскольку глицин в котором меняются двугранные углы принимает состояние β−изгиба, а соседний с ним глицин находится в состоянии листа (см. рис. 2.20). На потенциальных поверхностях 2.24б и 2.24г минимумов в области III вообще не возникает. Этот факт связан с тем, что в этой области для глицина наиболее вероятной после β−изгиба является структура правой αR −спирали [66]. Для формирования одного витка такой спирали необходимо четыре аминокислоты, поэтому трипептид глицина оказывается слишком коротким. Шести аминокислот оказывается также недостаточно для формирования устойчивого фрагмента спирали, поскольку из шести аминокислот может получиться только полтора витка спирали в которых будет недостаточно водородных связей для стабилизации молекулы. Области IV соответствуют структура левой αL −спирали, левой спирали 3L10 и β−изгиба II типа. Отметим тот факт, что для формирования всех этих структур необходимо как минимум четыре аминокислоты, поэтому на потенциальной поверхности для трипептида глицина (рис. 2.24б) в этой области минимумов не возникает. На поверхностях потенциальной энергии для гексапептидов области IV можно сопоставить состояния 4 и 3 на поверхностях 2.24в и 2.24г соответственно. Состояние 4 на поверхности 2.24в соответствует несформировавшемуся β−изгибу, поскольку глицин в котором меняются двугранные углы принимает состояние β−изгиба, а соседний с ним глицин находится в состоянии листа (см. рис. 86 2.20). Состояние 3 на поверхности 2.24г соответствует деформированному витку левой αL −спирали, который оказывается энергетически выгодным в этой области потенциальной поверхности (см. рис. 2.23). Отметим еще несколько особенностей, наблюдаемых на рассчитанных потенциальных поверхностях. На всех трех обсуждаемых поверхностях потенциальной энергии присутствует минимум при φ ∼ 80o и ψ ∼ −70o . На стерической диаграмме поли-глицина эта область соответствует структуре левой спирали 2L7 . Так, в состояниях 1, 3 и 2 соответственно на поверхностях потенциальной энергии 2.24б, 2.24в и 2.24г можно увидеть фрагменты этой структуры (см. рис. 2.16, 2.20 и 2.23). Также следует отметить, что состояние 4 на поверхности 2.24г напоминает структуру левой αL −спирали деформированной из-за недостаточного размера полипептида. 87 Глава 3 Статистическая модель Рассмотрим полипептид, состоящий из n аминокислот. Полипептид может быть найден в одном из множества изомерных состояний, которые имеют различную энергию. Группа изомерных состояний со схожими характерными физическими свойствами называется фазовым состоянием полипептида. Таким образом, связанное состояние α-спирали соответствует одной фазе, в то время как всевозможные несвязанные водородными связями случайные конформациии можно отнести к фазовому состоянию статистического клубка. Фазовый переход - это трансформация полипептида из одного фазового состояния в другое, т. е. переход из упорядоченной конформации α-спирали в группу случайных несвязанных конформаций. Характерные структурные изменения полипептида аланина, совершающего фазовый переход α-спираль↔статистический клубок, представлены на Рис. 3.1. На рисунке показана лишь одна характерная конформация полипептида в состоянии статистического клубка, в то время как существует около 1030 различных конформаций полипептида, состоящего из 21 аланина (см. более подробно в [6]) Фазовый переход может быть первого или второго рода. Фазовый переход первого рода характеризуется резким изменением внутренней энергии системы относительно ее температуры. При фазовом переходе первого рода система либо по- 88 Рис. 3.1: Характерные структурные изменения в полипептиде при фазовом переходе αспираль↔статистический клубок. глощает, либо выделяет определенное количество энергии, теплоемкость при этом как функция температуры имеет выраженный пик [2]. В данной диссертации проведено исследование проявления этих свойств в системах полипептдных цепочек аланина различной длины. 3.1 Гамильтониан полипептидной цепи Для описания фазового перехода спираль-клубок наиболее важными являются крутильные степени свободы полипептидной цепи [5,6,33,34]. Эти стапени свободы определены для каждой аминокислоты полипептида, за исключением крайних, и характеризуются двумя двугранными углами φi и ψi (см. Рис.2.1) Оба угла задаются положением четырех соседних атомов полипептидной цепи. Угол φi определен как двугранный угол между плоскостями, сформированными ′ ′ атомами (Ci−1 − Ni − Ciα ) и (Ni − Ciα − Ci ). Угол ψi определен как двугранный угол ′ ′ между плоскостями (Ni − Ciα − Ci ) и (Ciα − Ci − Ni+1 ). Атомы пронумерованы с NH2 - конца полипептида. Углы φi и ψi принимают все возможные значения в интервале [−180◦ ;180◦ ]. Для однозначного определения, углы φi и ψi отсчитываются по часовой стрелке, если смотреть на молекулу с NH2 - конца (см. Рис. 2.1). Это наиболее распространенный способ задания углов [52–55, 76]. Функция Гамильтона полипептидной цепи строится как сумма ее потенциаль89 ной, кинетической и колебательной энергий. Для полипептидной цепи, в определенной j-ой конформации и состоящей из n аминокислот и N атомов, получаем: −6 ) 3N ∑ p2i P2 1 ( (j) 2 (j) 2 (j) 2 + I1 Ω1 + I2 Ω2 + I3 Ω3 + + U ({x}), Hj = 2M 2 2mi i=1 (3.1) (j) где P, M , I1,2,3 , Ω1,2,3 , импульс всего полипептида, его масса, три главных момента инерции и частоты вращения. pi , xi и mi импульс, координата и обобщенная масса, описывающие движение системы вдоль i-той степени свободы. U ({x}) - потенциальная энергия системы, которая является функцией координат атомов. Можно разбить все степени свободы полипептида на два класса: жесткие и мягкие степени свободы. Будем называть жесткими те степени свободы, которые соответствуют изменению длины связей, углов и особых двугранных углов (см Рис. 2.1). Степени свободы, соответствующие углам φi и ψi будем называть мягкими. Жесткие степени свободы могут рассматриваться в гармоническом приближении, так как характерная энергия, необходимая для заметного изменения структуры системы составляет единицы электронвольт, что значительно превышает характерную тепловуб энергию при комнатной температуре (0.026 eV) [22–24, 54, 55, 98]. Функция Гамильтона полипептида может быть переписана в терминах жестких и мягких степеней свободы. Переходя от набора декартовых координат {x} к набору обобщенных координат {q}, соответствующему жестким и мягким степеням свободы, получаем: ls ∑ ls ) ∑ psi psj 1 ( (j) 2 P2 (j) 2 (j) 2 + I Ω + I2 Ω2 + I3 Ω3 + Hj = gij 2M 2 1 1 2 i=1 j=l + lh ls ∑ ∑ i=1 j=ls +1 gij psi phj + lh ∑ lh ∑ i=ls +1 j=ls +1 gij phi phj + U ({q s }, {q h }), 2 (3.2) где q s и q h обобщенные координаты, соответствующие жестким и мягким степеням свободы, а ps и ph соответствующие им обобщенные импульсы. ls и lh число жестких и мягких степеней свободы в системе, которое удовлетворяет соотношению 90 3N − 6 = ls + lh . U ({q s }, {q h }) в уравнении (3.2) потенциальная энергия системы как функция от мягких и жестких степеней свободы. 1/gij имеет значение обобщенной массы, и gij определен следующим образом: gij = 3N −6 ∑ λ=1 1 ∂qi ∂qj . mλ ∂xλ ∂xλ (3.3) Здесь xλ и mλ обобщенная координата в декартовом пространстве и обобщенная масса соответствующая степени свободы с индексом λ. qi и qj обозначают мягкие или жесткие степени свободы в новом пространстве. Как обсуждалось в [43], движение системы по мягким и жестким степеням свободы происходит на различных временных масштабах. Характерная частота колебаний, соответствующая мягим степеням свободы порядка 100 cm−1 , в то время как для жестких степеней свободы она составляет больше 1000 cm−1 [43]. Следовательно, движение системы по мягким степеням свободы не связано с движением по жестким степеням свободы. Поэтому пятый член в уравнении (3.2), который описывает кинетическую энергию жесткой подсистемы может быть диагонализован. Соответствующий набор обобщенных координат {q̃ s } описывает нормальные моды колебаний в жесткой подсистеме: h ) ∑ P2 1 ( (j) 2 (j) 2 (j) 2 Hj = + I Ω + I2 Ω2 + I3 Ω3 + 2M 2 1 1 i=1 l + ls ∑ ls ∑ i=1 j=1 gij ( ( )2 ( )2 ) p̃hi µhi ωi2 q̃ih + 2 2µhi psi psj + U ({χ}) + U ({φ, ψ}). 2 (3.4) Здесь ωi и µhi частота a i-ой жесткой нормальной моды и соответствующая обобщенная масса. Отметим, что четвертый член в (3.2) исчезает в случае, когда жесткие и мягкие моды не связаны. Последние два члена в (3.4) описывают потенциальную энергию системы как функцию от мягких степеней свободы. Для каждой аминокислоты существуют две мягкие степени свободы, соответствующие углам 91 φi и ψi (см. Рис. 2.1). Некоторые дополнительные мягкие степени свободы возникают в боковых радикалах аминокислот. Типичный пример - угол χi , который описывает вращение бокового радикала вдоль связи Ciα − Ciβ (см. Рис. 2.1). Угол χi определен как двугранный угол между плоскостями, заданными атома′ β . Отметим, что обозначения ми (Ci − Ciα − Ciβ ) и связями Ciα − Ciβ и Ciβ − Hi1 χ, φ и ψ используются для упрощения и для дальнейшего изложения теоретической модели. Набор этих двугранных углов задает набор мягких степеней свободы полипептида:{q s } ≡ {χ, φ, ψ}. Отметим, что обобщенные массы 1/gij зависят от выбора обобщенных координат. Однако эта зависимость может быть опущена, если система рассматривается вблизи ее равновесного положения. В таком случае движение полипептида по мягким степеням свободы может быть рассмотрено как движение системы связанных нелинейных осцилляторов. Обобщенные массы вблизи равновесного положения могут быть записаны в следующим образом: ls ∑ ( s ) ∂ (1/gij ) 1 1 s ( s )+ = q − q , k k 0 gij ∂qks qs =qs gij {qi0 } k=1 k (3.5) k0 где qks0 обозначает значение k-ой мягкой степени свободы в положении равновесия. Второй член в (3.5) обозначает зависимость обобщенной массы от координат и может быть опущен, если система находится вблизи точки равновесия. Все информация о нелинейности осцилляторов содержится в функциях потенциальной энергии U ({χ}) в U ({φ, ψ}) в уравнении (3.4). Правомерность приближения о независимости массы от координат также обсуждалась в [43]. В настоящей работе координатная зависимость обобщенной массы gij не учитывается, и этот вопрос оставлен для дальнейшего исследования. 92 3.2 Статистическая сумма Статистическая сумма полипептида построена в рамках классической механики, так как расчет молекулярной динамики полипептида, с которым произведено сравнение, выполнен также на основе уравнений движения классической механики. Однако, представлены формализ может быть легко обобщен на случай квантовомеханического описания системы. Все термодинамические свойства системы определяются ее статистической суммой, которая может быть представлена через Гамильтониан системы следующим образом [99]: ∫ Z= ( ) H exp − dΓ, kT (3.6) где H - Гамильтониан системы, k и T - константа Больцмана и температура, соответственно, и dΓ элемент фазового пространства. Подставляя (3.4) в (3.6) получаем статистическую сумму системы в определенной конформации j. Соответственно, статистическая сумма системы может быть разложена следующим образом: Z= 1 (2π~)3N Z1 · Z2 · Z3 · Z4 · Z5 , (3.7) где ( [ ( )]) 1 P2 M21 M22 M23 = exp − − + (j) + (j) d3 P · d3 Q · d3 M · d3 Φ = (j) kT 2M 2I1 2I2 2I3 √ (1) (2) (3) = 64π 5 Vj M 3/2 Ij Ij Ij (kT )3 (3.8) ∫ Z1 ∫ Z2 = ( lh 1 ∑ exp − kT i=1 ∫ Z3 = ( ( ( )2 ( )2 )) p̃hi µhi ωi2 q̃ih (2πkT )lh lh h lh h q̃ = p̃ · d d , (3.9) + ∏lh 2 2µhi i=1 ωi ls 1 ∑ (p̃si )2 exp − kT i=1 2µsi ) 93 ls s d p̃ = √ ls ∏ √ s (2πkT ) µi , ls i=1 (3.10) ∫ Z4 = Z5 = 1 (2π~)(lφ +lψ )/2 ( ) U ({χ̃}) exp − dlχ χ̃s , kT ∫ ( U ({φ̃, ψ̃}) exp − kT (3.11) ) dlφ φ̃s · dlψ ψ̃ s . (3.12) Z1 , уравнение (3.8), описывает вклад в статсумму движения полипептида как жесткого тела. Здесь Vj удельный объем полипептида в j-ом конформационном состоянии и M - момент импульса полипептида. Z2 , уравнение (3.9), учитывает вклад жестких степеней свободы полипептида. Z3 , уравнение (3.10), описывает вклад в статсумму кинетической энергии мягких степеней свободы. Z4 , уравнение (3.11), и Z5 , уравнение (3.12), описывают вклад в статсумму потенциальной энергии мягких степеней свободы. Интегрирование по фазовому пространству в уравнениях (3.8)-(3.12) производится по пространству обобщенных координат и импульсов. При выводе уравнений (3.10)-(3.12) была диагонализована квадратичная форма обобщенных импульсов, соответствующих мягким степеням свободы в уравнении (3.4), и была произведена трансформация qis → q̃is , psi → p̃si . В уравнении (3.10), µsi - обобщенная масса i-той нормальной мягкой колебательной моды, связанная с gij в уравнении. (3.3). χ̃,φ̃ и ψ̃ в уравнениях. (3.11)-(3.12) обозначают мягкие крутильные степени свободы, которые были соответствующим образом трансформированы. Отметим, что q̃is и p̃si являются канонически сопряженными координатами. lχ , lφ и lψ в уравнениях. (3.11)-(3.12) количество степеней свободы в системе, соответствующих χ, φ и ψ. Отметим, что ls = lχ + lφ + lψ . Интегралы в уравнениях (3.8)-(3.10) могут быть решены аналитически, но для интегрирования по углам χ, φ и ψ в уравнениях (3.11)-(3.12) необходимо знание явного вида поверхности потенциальной энергии системы. Однако, потенциальная энергия полипептида, соответствующая крутильной степени свободы χ не 94 зависит от конформации полипептида в случае нейтрального неполярного радикала в простых аминокислотах (например, аланин, глицин) [43]. Следовательно, крутильная степень свободы, соответствующая углу χ оказывает минимальное влияние на фазовый переход α-спираль↔статистический клубок. Потенциальная энергия полипептида, соответствующая этим степеням свободы хорошо описывается следующей функцией, как следует из потенциала молекулярной механики, уравнение (1.77): U (χi ) = kχi [1 + cos (3χi )] , (3.13) где kχi параметр жесткости потенциала. Так как kχi = kχ , подставляя уравнение (3.13) в уравнение (3.11) и интегрируя по 2π, получаем: [ Z4 = ( ) ( )]lχ kχ kχ 2π exp − I0 = (2π)lχ B(kT ), kT kT (3.14) где I0 (x) - модифицированная функция Бесселя первого рода, и [ ( ) ( )]lχ kχ kχ B(kT ) = exp − I0 . kT kT (3.15) Подставляя Z1 -Z5 в уравнения (3.7), получаем выражение для статсуммы полипептида в определенной конформации j: Zj √  (1) (2) (3) ∏ls √ s Ij Ij Ij µ i i=1  B(kT ) · (kT )3N −3− l2s =  ∏ ls l h ωi (2π) 2 −lχ π~3N i=1 ∫ π ∫ π U ({φ,ψ}) ... e− kT dφ1 . . . dφn dψ1 . . . dψn = −π −π ∫ π ∫ π U ({φ,ψ}) 3N −3− l2s = Aj · B(kT ) · (kT ) ... e− kT dφ1 . . . dφn dψ1 . . . dψn(3.16) ,  Vj · M 3/2 · −π −π Aj обозначает множитель в квадратных скобках. Отметим, что обобщенные массы µhi сократились и не вошли в выражение для статсуммы. 95 Так как полипептид может существовать в различных конформациях, необходимо просуммировать вклады всех возможных конформаций Zj , для того, чтобы получить полную статсумму полипептида. Статсумма ансамбля N невзаимодействующих полипептидов имеет следующий вид: Z= ( ξ ∑ )N Zj ( 3N −3− l2s B(kT ) · (kT ) = j=1 ∫ · ∫ π Aj j=1 π e ... −π ξ ∑ − −π U ({φ,ψ}) kT dφ1 . . . dφn dψ1 . . . dψn )N , (3.17) где Zj определено в (3.16) и ξ - общее число всевозможных конформаций полипептида. Уравнение (3.17) выведено с минимальным количеством предположений о системе. Оно общее, однако, его использование для конкретной молекулярной системы затруднительно. Выражение (3.17) может быть упрощено, если сделать дополнительные предположения о структуре системы. Для простоты, последующие выражения написаны только для одного полипептида, а не для N . Обобщение на случай N статистически независимых полипептидов всегда может быть сделано в соответствии с (3.17). Можно предположить, что множители Aj в (3.17) зависят от конформации полипептида. Однако, в связи с тем, что значения удельного объема, моментов инерции и частот нормальных мод в различных конформациях близки [6, 100], значения Aj во всех этих конформациях могут считаться равными, как минимум в нулевом приближении. Следовательно, Aj ≡ A. Аминокислоты могут считаться статистически независимыми в любой конформации полипептида. Этот факт не столь очевиден и не был тщательно исследован на данное время. Статистическая независимость небольших неполярных аминокислот изучалась в [76] с использованием время-корелляционных функций между различными аминокислотами. В данной диссертации этот вопрос также был исследован для полипептидов аланина и установлена степень применимости данного приближения. 96 С вышеупомянутыми предположениями, статистическая сумма полипептида сводится к следующему выражению: 3N −3− l2s Z = A · B(kT ) · (kT ) ξ n ∫ ∏ ∑ j=1 i=1 π −π ∫ π −π ( exp − (j) ϵi (φ, ψ) kT ) dφdψ, (3.18) (j) где ϵi (φ, ψ) - потенциальная энергия i-той аминокислоты в полипептиде, который находится в одной из ξ конформаций, обозначенных как j. Потенциальная энергия аминокислоты является функцией двугранных углов φ и ψ. В уравнении (3.18) статсумма суммируется по всем конформациям полипептида. Однако, в случае перехода α-спирали в статистический клубок, достаточно провести суммирование лишь по тем конформациям, которые вовлечены в данный переход. Необходимо отметить, что уравнение (3.18) достаточно общее и может быть использовано для описания процесса фолдинга белков. Статсумма в уравнении (3.18) определяется поверхностью потенциальной энергии аминокислоты в нативном состоянии белка и в конформации статистического клубка. Поверхность потенциальной энергии может быть рассчитана с использованием подходов из первых принципов, таких как ТФП, комбинированно с теориями молекулярной механики, как продемонстрировано [5, 6] и в данной диссертации. Для белка, содержащего 20 различных аминокислот необходимо рассчитать 40 различных поверхностей потенциальной энергии, в то время как для описания процесса фолдинга полипептида, состоящего из одинаковых аминокислот, достаточно и одной поверхности потенциальной энергии. Может быть сделано дальнейшее упрощение выражения для статсуммы (3.18) в случае полипептида, состоящего из одинаковых аминокислот, если предположить, что каждая аминокислота в нем может существовать только в двух состояниях связанном и несвязанном. Аминокислота находится в связанном состоянии, когда она формирует водородную связь с соседней аминокислотой. В несвязаннос состоянии у аминокислоты нет водородных связей. В сформированной α-спирали все 97 аминокислоты в связанном состоянии, в то время как в состоянии статистического клубка все аминокислоты в несвязанном состоянии. Все возможные конформации полипептида, совершающего фазовый переход αспираль↔статистический клубок, могут быть разбиты на четыре различные группы: I. полностью свернутое состояние полипептида (α-спираль), в котором все аминокислоты находятся в связанном состоянии. II. частично свернутое состояние полипептида (сосуществование фаз), в котором существует ядро из λ аминокислот, находящихся в связанном состоянии и n − λ аминокислот находятся в несвязанном состоянии. III. полностью развернутое состояние (статистический клубок), в котором все аминокислоты находятся в несвязанном состоянии. IV. перемешивание фаз, при котором два или более фрагментов полипептида, находящихся в связанном состоянии разделены некоторым количеством аминокислот в несвязанном состоянии. С вышеперечисленными предположениями, статсумма полипептида (3.18), состоящего из n одинаковых аминокислот может быть записана в следующем виде: [ 3N −3− l2s Z = A · B(kT ) · (kT ) βZbn−1 Zu +β n−4 ∑ i=1 ∑ (n−3)/2 + i=2 βi n−i−3 ∑ k=i (i + 1)Zbn−i−1 Zui+1 + Zun +  (k − 1)!(n − k − 3)! Zbk+3i Zun−k−3i  i!(i − 1)!(k − i)!(n − k − i − 3)! (3.19) Здесь первый и третий члены в квадратных скобках описывают статсумму полипептида в фазе α-спирали и статистического клубка, соответственно. Второй член учитывает возможность сосуществования двух фаз. Суммирование во втором члене в (3.19) производится до n − 4, так как самая короткая α-спираль состоит из четырех аминокислот. Последний член в квадратных скобках учитывает 98 ситуацию перемешивания фаз. Первое суммирование в этом члене производится по всем отдельным спиральным фрагментам, второе суммирование идет по всем аминокислотам при фиксированном количестве фрагментов. Конформации полипептида с двумя или более спиральными фрагментами энергетически невыгодны. Как показывает расчет, вклад четвертого члена в статсумму становится существенным лишь для больших полипептидов, состоящих их более чем 100 аминокислот. Для описания фазового перехода в небольших полипептидах этот член может быть опущен при построении статсуммы. Zb и Zu вклады в статсумму каждой аминокислоты, находящейся либо в связанном, либо в несвязанном состоянии, соответственно. Выражения для Zb и Zu имеют следующий вид: ( (b) ) ϵ (φ, ψ) Zb = exp − dφdψ kT −π −π ) ( (u) ∫ π∫ π ϵ (φ, ψ) Zu = dφdψ exp − kT −π −π (∫ π ∫ π ) )3 ( (b) ϵ (φ, ψ) + ϵ(u) (φ, ψ) β = dφdψ , exp − kT −π −π ∫ π ∫ π (3.20) (3.21) (3.22) где ϵ(b) (φ, ψ) и ϵ(u) (φ, ψ) потенциальные энергии аминокислоты, находящейся в связанном или несвязанном состоянии, соответственно. β - фактор, учитывающей потерю энтропии при инициации спирали. Подставляя (3.20), (3.21) и (3.22) в уравнение (3.19), получаем итоговое выражение для статсуммы полипептида совершающего фазовый переход α-спираль↔статистический клубок. Этот результат может быть использован для расчета всех термодинамических характеристик системы. ϵ(b) (φ, ψ) и ϵ(u) (φ, ψ) определяют статсумму полипептида. Эти зависимости могут быть рассчитаны из первых принципов на основе ТФП [5, 6]. 99 3.3 Термодинамические характеристики полипептида при фазовом переходе первого рода теплоемкость системы имеет выраженный пик (см. Рис. 3.2) . Рис. 3.2: Зависимость теплоемкости от температуры системы, совершающей фазовый переход. Пик теплоемкости характеризуется температурой перехода T0 , максимальным значением теплоемкости C0 , температурным диапазоном фазового перехода ∆W и удельной теплотой Q, которую также называют скрытой теплотой фазового перехода (см. Рис. 3.2). Все эти характеристики могут быть рассчитаны если известна зависимость теплоемкости от температуры. Зависимость теплоемкости от температуры определена статсуммой системы следующим образом [99]: C(T ) = kT ∂ 2 T ln Z . ∂T 2 (3.23) Характеристики фазового перехода определяются следующими уравнениями: 100 dC(T ) =0 dT T =T0 C0 = C(T0 ) C0 C(T0 ± ∆W ) = 2 ∫ (3.24) (3.25) (3.26) ∞ Q= C(T )dT. (3.27) 0 К сожалению, не возможно получить аналитических зависимостей для T0 , C0 , ∆W и Q для статсуммы, определенной в (3.19), так как интегралы в (3.20) и (3.21) не могут быть рассчитаны аналитически. Однако, качественная зависимость этих характеристик может быть понята, если предположить, что все конформационные состояния полипептида в определенной фазе имеют одинаковую энергию. Такая модель обычно называется двухуровневой моделью [4–6] и подходит для качественного анализа фазового перехода в полипептидных цепочках, если рассматривать фазовый переход между двумя такими фазами, статсумма системы может быть записана следующим образом: [ Z ≈ Z0 ] η2 − ∆E 1 + A e kT , η1 (3.28) где Z0 статсумма системы в первой фазе, ∆E = E2 − E1 энергетическая разница между состояниями полипептида в разных фазах, η1 и η2 количества изомерных состояний полипептида в первой и второй фазе, соответственно. A = A2 /A1 коэффициент, зависящий от масс, удельных объемов, нормальных мод и моментов импульса полипептида в двух фазах. Подставляя уравнение (3.28) в уравнение (3.23), получаем выражение для теплоемкости в рамках двухуровневой модели: ∆E A ηη21 ∆E 2 e−( kT ) C(T ) = )2 . ( η2 −( ∆E ) 2 kT kT 1 + A η1 e (3.29) Подставляя уравнение (3.29) в уравнения (3.24)-(3.27) и решая их, получаем выражения для T0 , C0 , ∆W и Q, которые имеют следующий вид: 101 ∆E ∆E ( )= , ∆S k ln A ηη21 [ ( )]2 k η2 ∆S 2 ln A , C0 ≈ = 4 η1 4k √ √ ∆E 64 ln 2 64 ln 2 k∆E ∆W ≈ , [ ( )]2 = π π ∆S 2 k ln A ηη21 ∫ Q = C(T )dT = ∆E. T0 ≈ (3.30) (3.31) (3.32) (3.33) Здесь ∆S = k ln Aη2 − k ln η1 изменение энтропии системы и M - масса полипептида. ∆S и ∆E - основные термодинамические параметры в рассматриваемой задаче, так как они определяют зависимость характеристик фазового перехода. Из уравнений (3.30)-(3.32) следует, что T0 ∼ ∆E , ∆S 102 C0 ∼ ∆S 2 , Q ∼ ∆E and ∆W ∼ ∆E . ∆S 2 Глава 4 Фазовые переходы в полипептидах 4.1 Точность потенциала молекулярной механики Рис. 4.1: Оптимизированные геометрии полипептидов аланина: a) Трипептид аланина; b) Гексапептид аланина а конформации β-листа. Для установления точности потенциала молекулярной механики проведено сравнение поверхностей потенциальной энергии три- и гексапептида аланина, расчитанными с использованием ТФП и форсфилда CHARMM27. Оптимизированные геометрии полипептидов, которые были использованы для расчета приведены на Рис.4.1. 103 Разница между поверхностями потенциальной энергии, рассчитанными с использованием форсфилда CHARMM27 и с использованием функционала B3LYP [54] приведена на Рис. 4.2 Рис. 4.2: Разница между поверхностями потенциальной энергии, рассчитанными с использованием форсфилда CHARMM27 и с использованием функционала B3LYP [54] для трипептида аланина (слева) и гексапептида аланина (справа). Относительные энергии приведены в эВ. Эквипотенциальные линии показаны для энергий -0.10, -0.05 0, 0.05 и 0.1 эВ. Для оценки средней относительной ошибки использовалось следующее выражение: ∫ 2 |EB3LY P (φ, ψ) − ECHARM M 27 (φ, ψ)|dφdψ · 100%, η= ∫ |EB3LY P (φ, ψ) + ECHARM M 27 (φ, ψ)|dφdψ (4.1) где EB3LY P (φ, ψ) и ECHARM M 27 (φ, ψ) потенциальные энергии, рассчитанные в рамках ТФП и молекулярной динамики, соответственно. Численный результат расчета следующтй: η3×Ala = 27.6 % и η6×Ala = 23.4 %. Проведенное сравнение показывает, что потенциалы молекулярной механики хороши лишь для качественного описания процессов в сложных молекулярных системах. 104 4.2 Поверхность потенциальной энергии полипептидов аланина Для построения статсуммы необходимо рассчитать поверхность потенциальной энергии аминокислоты в связанном и несвязанном состояниях. Рис. 4.3: Поверхности потенциальной энергии для разных аминокислот из полипептида аланина, состоящего из 21 аминокислоты, рассчитанные как функции двугранных углов φ и ψ в: a) втором аланине аланине, b) третьем аланине, c) четвертом аланине d) пятом аланине and e) десятом аланине. Аминокислоты пронумерованы с NH2 -конца полипептида. Энергия отсчитана от самого низкого минимума на поверхности потенциальной энергии и приведена в эВ. Эквипотенциальные длинии показаны для энергий 1.8, 1.6, 1.4, 1.2, 1.0, 0.8, 0.6, 0.4 и 0.2 эВ. На поверхности потенциальной энергии центральных аминокислот можно выделить выраженный минимум φ = −81◦ и ψ = −71◦ , соответствующий вторичной структуре спирали. Поверхность потенциальной энергии зависит от номера аминокислты в поли105 Рис. 4.4: Полипептид аланина в конформации α-спирали. Штриховые линии показывают водородные связи в системе. Рис. показывает, что вторая аминокислота имеет только одну водородную связь, в то время как пятая образует две водородные связи с соседними аминокислотами. пептиде, см. Рис. 4.3. Этот факт обусловлен тем, что центральные аминокислоты имеют больше водородных связей, чем крайние. Таким образом, изменение углов φ и ψ в крайних аминокислотах ведет к разрыву лишь одной водородной связи, см. Рис. 4.4) Рис. 4.3 показывает, что поверхности потенциальной энергии уже четвертой и центральной аминокислот полипептида очень схожи. Этот факт позволяет сделать вывод о том, что все аминокислоты полипептида, кроме крайних можно рассматривать как идентичные. Каждая аминокислота в центре полипептида формирует две водородные связи. Однако, так как в этих связях участвуют две аминокислоты, то эффективно существует лишь одна водородная связь на каждую аминокислоту (см. Рис. 4.4). Поэтому, для определения поверхности потенциальной энергии одной аминокислоты в связанной ϵ(b) (φ, ψ) и несвязанной ϵ(u) (φ, ψ) конформации используется поверхность потенциальной энергии второй аминокислоты в полипептиде (см. Рис. 4.3a), потому что только эта аминокислота образует лишь одну водородную связь с соседними аминокислотами (см. Рис. 4.4). 106 Поверхность потенциальной энергии второй аминокислоты (см. Рис. 4.3a) имеет глобальный минимум при φ = −81◦ и ψ = −66◦ , который соответствует связанной конформации. Поэтому часть поверхности потенциальной энергии вблизи этого минимума соответствует поверхности потенциальной энергии связанного состояния аминокислоты. Поверхность потенциальной энергии определена энергией водородной связи, которая для аланина равна EHB =0.142 эВ. Это значение получено из разницы энергий между глобальным минимумом и энергией плато при φ ∈ (−90◦ .. − 100◦ ) и ψ ∈ (0◦ ..60◦ ) (см. Рис. 4.3a). Следовательно, часть поверхности потенциальной энергии с энергией меньше EHB соответствует связанному состоянию аминокислоты, а часть с энергией больше EHB - несвязанному (см. Рис. 4.5). 4.3 Фазовый переход α-спираль↔статистический клубок в полипептидах аланина 4.3.1 Внутренняя энергия полипептида Зная поверхности потенциальной энергии, можно построить статсумму согласно уравнению (3.19) и численно рассчитать все термодинамические характеристики системы. На Рис. 4.6 показана зависимости внутренней энергии от температуры, рассчитанные для полипептидов, состоящих из 21, 30, 40, 50 и 100 аминокислот. Толстые черные линии соответствуют результатам, полученным в рамках статистической модели. Точки соответствуют результатам расчетов на основе молекулярной динамики. Из Рис. 4.6 видно, что при увеличении размера полипептида фазовый переход становится более выраженным. На основе молекулярной динамики можно также рассчитать зависимость внутренней энергии системы от температуры. Теплоемкость определяется как произ107 Рис. 4.5: Поверхность потенциальной энергии аланина в конформации α−спирали (a) и статистического клубка (b). И поверхность потенциальной энергии для второй аминокислоты в полипептиде (c), которая используется для построения поверхностей потенциальной энергии аланина в конформации α−спирали и клубка. Часть поверхности потенциальной энергии, показанной на графике (с) с энергией меньше EHB соответствует конформации спирали, а часть с энергией больше EHB соответствует состоянию клубка. Энергии отсчитаны в эВ. Эквипотенциальные линии на графике a) приведены для энергий 0.05 и 0.1 и 0.15 эВ; на графике b) приведены для энергий 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 и 0.9 эВ; на графике c) приведены для энергий 1.8, 1.6, 1.4, 1.2, 1.0, 0.8, 0.6, 0.4 и 0.2 эВ. 108 Рис. 4.6: Зависимости внутренней энергии от температуры, рассчитанные для полипептидов, состоящих из 21, 30, 40, 50 и 100 аминокислот. Толстые черные линии соответствуют результатам, полученным в рамках статистической модели. Точки соответствуют результатам расчетов на основе молекулярной динамики, которые были фитированы с использованием уравнения (4.2). Фитирующие функции показаны тонкими сплошными линиями. Параметры фитирования приведены в Таблице 4.1. 109 водная энергии системы по температуре. Однако, результаты расчета на основе молекулярной динамики имеют заметный разброс (см. Рис. 4.6), что не позволяет напрямую взять производную энергии по температуре. Поэтому результаты молекулярной динамики были фитированы функцией следующего вида: [ ] ∆E T − T0 E(T ) = E0 + arctan + aT, π γ (4.2) где E0 , ∆E, T0 , γ и a параметры фитирования. Данная фитирующая функция уже использовалась при описании зависимости энергии полипептида от температуры [20,30]. Соответствующие значения параметров фитирования приведены в таблице 4.1. Таблица 4.1: Параметры, использованные в уравнении (4.2) для фитирования результатов молекулярнодинамических расчетов. n E0 ∆E/π γ T0 a 21 11.38±0.24 1.37±0.10 79.4±7.6 670.0±2.0 0.0471±0.0003 30 13.61±0.58 1.50±0.16 37.9±7.3 747.4±3.3 0.0699±0.0008 40 16.80±0.39 1.991±0.083 26.6±2.2 785.7±1.8 0.0939±0.0005 50 19.94±0.79 2.59±0.21 29.4±5.5 786.6±2.9 0.118±0.0010 100 29.95±0.67 4.00±0.16 10.5±2.0 801.1±1.1 0.2437±0.0009 Из Рис. 4.6 видно, что результаты стат. модели находятся в достаточно хорошем согласии с результатами молекулярной динамики. Тем не менее, существуют определенные различия результатов. Как видно из Рис. 4.6 скрытая теплота фазового перехода, рассчитаная на основе стат. модели больше, чем полученная из расчетов молекулярной динамики. Это происходит из-за того, что в рамках статистического подхода потенциальная энергия полипептида переоценена. Длинные полипептидв (состоящие из больше чем 50 аминокислот) могут формировать короткоживущие водородные связи в состоянии статистического клубка. Эти водо110 родные связи понижают потенциальную энергию полипептида в состоянии клубка. Однако, динамические водородные связи пока никак не учтены при построении статистической суммы. Дополнительно, различия между двумя подходами могут возникать и из-за недостаточной точности расчетов молекулярной механики, так как длительные расчеты требуют большого количества компьютерного времени. И вправду, для полипептида, состоящего из 100 аминокислот всего 3-5 расчетных точек попали в диапазон фазового перехода (см. Рис. 4.6). 4.3.2 Теплоемкость полипептидов аланина Зависимость теплоемкости полипептидов аланина от температуры представлена на Рис. 4.7. Результаты, полученные с использованием статистического подхода показаны толстой сплошной линией, результаты, полученные на основе молекулярной динамики, показаны тонкой линией. Пунктирной линией показаны результаты, полученные на основе формализма Цимма-Брагга [7]. C300 обозначает теплоемкость при 300 K◦ , которая приведена в таблице 4.2. Таблица 4.2: Параметры, характеризующие пик теплоемкости на Рис. 4.7, рассчитанные с помощью теоретического метода. Теплоемкость при 300 K, C300 , температура перехода T0 , максимальное значение теплоемкости C0 , температурный диапазон фазового перехода ∆T и удельная теплота Q показаны как функции длины полипептида, n. n C300 (meV/K) T0 (K) C0 (eV/K) ∆T (K) Q (eV) 21 1.951 740 0.027 90 1.741 30 2.725 780 0.051 75 2.727 40 3.584 805 0.084 55 3.527 50 4.443 815 0.123 50 4.628 100 8.740 835 0.392 29 8.960 111 Рис. 4.7: Зависимости теплоемкости от температуры, рассчитанные для полипептидов аланина, состоящих из 21, 30, 40, 50 и 100 аминокислот Результаты, полученные с использованием статистического подхода показаны толстой сплошной линией, результаты, полученные на основе молекулярной динамики, показаны тонкой линией. Пунктирной линией показаны результаты, полученные на основе формализма Цимма-Брагга [7]. C300 обозначает теплоемкость при 300 K◦ , которая приведена в таблице 4.2 . 112 В рамках двухуровневой модели было показано, что для фазового перехода первого рода справедливы следующие соотношения: ∆E = const ∆S ∼ ∆S 2 ∼ n2 T0 ∼ C0 (4.3) Q ∼ ∆E ∼ n ∆E 1 ∆T ∼ ∼ . 2 ∆S n Здесь ∆E и ∆S изменения энергии и энтропии системы при фазовом переходе, а n - количество аминокислот в полипептиде. На Рис.. 4.8 показана зависимость термодинамических характеристик фазового перехода C0 , ∆T , T0 и Q от размера полипептида. Квадратами и треугольниками показаны зависимости, полученные с использованием статистического и молекулярнодинамического подходов, соответственно. 4.3.3 Расчет параметров Цимма-Брагга Альтернативным теоретическим подходом к изучению фазового переходя спираль-клубок был предложен Циммом и Браггом в [7]. В их работе процесс формирования α-спирали в полипептиде был рассмотрен в рамках простой двухуровневой статистической модели. Эта модель содержала три принципиальных параметра: (i) константа s, описывающая вероятность образования связи аминокислотой к части полипептида, которая находится в конформации α-спирали, (ii) специальный корректирующий фактор инициации спирали σ и, (iii) минимально количество аминокислот, которые могут находиться в состоянии статистического клубка межу двумя α-спиральными фрагментами полипептида. Предполагая, что полипептид имеет только один спиральный участок, стат. сумма, полученная в теории Цимма и Брагга запишется следующим образом: 113 Рис. 4.8: Параметры фазового перехода C0 , ∆T , T0 и Q как функции длины полипептида. Квадратами и треугольниками показаны зависимости, полученные с использованием статистического и молекулярно-динамического подходов, соответственно. n−3 ∑ (n − k − 2)sk , Q=1 +σ n (4.4) k=1 где n + 1 число аминокислот в полипептиде, s и σ - параметры теории ЦиммаБрагга. Стат. сумма, которая получена в данной работе (уравнение (3.19))может быть переписана в следующем виде:  Z = 1 + βs(T )3 ∑ (n−1)−3  (n − k − 3)s(T )k  ξ(T ). (4.5) k=1 Здесь n - число аминокислот в полипептиде и функции s(T ) и ξ(T ) определены как: 114 ( (b) ) ϵ (φ,ψ) exp − dφdψ kT −π −π ( (u) ) s(T ) = ∫ π ∫ π (φ,ψ) exp − ϵ kT dφdψ −π −π [∫ π ∫ π ( (u) ) ]n ϵ (φ, ψ) ξ(T ) = dφdψ , exp − kT −π −π ∫π ∫π (4.6) (4.7) Сравнивая выражения (4.4) и (4.5) можно выразить параметры Цимма-Брагга как: σ(T ) = β(T )s(T )3 , (4.8) где β(T ) определено в уравнении (3.22). Зависимость параметров Цимма-Брагга s и σ приведена на Рис. 4.9 Параметры теории Цимма-Брагга рассматривались в более ранних работах [21,43,101]. На Рис. 4.9 таже представлены параметры Цимма-Брагга, рассчитанные в [43] с использованием матричного формализма построения статсуммы, изложенного в [9]. Энергии различных конформаций полипептида были рассчитаны с использованием форсфилда, описанного в [47]. Различия между результатами данной работы и [43] в первую очередь связаны с различными форсфилдами. Параметр σ был также рассчитан в [43]. Однако он не был систематически изучен в широком интервале температур, поэтому он не приведен на Рис. 4.9. Этот параметр очень чувствителен к форсфилду и принимает значения 10−9.0 − 10−3.6 . В данной работе σ = 10−3.4 при 860 K◦ . Зная параметры s и σ можно построить статсумму полипептида в форме предложеной в [7], и на ее оснве рассчитать все термодинамические характеристики системы. Зависимость теплоемкости от температуры, рассчитанная в рамках формализма Цимма и Брагга показан на Рис. 4.7 пунктирной линией. Из Рис. 4.7 видно, что результаты модели Цимма-Брагга находятся в согласии с результатами предложенной стат. модели. Важным отличием теории ЦиммаБрагга является то, что она учитывает состояния полипептида с несколькими 115 Рис. 4.9: Зависимость параметров теории Цимма-Брагга [7] s (график a) и σ (график b) от температуры. Параметр s описывает вклад с статсумму связанной аминокислоты относительно несвязанной. Параметр σ описывает потерю энтропии, связанную с инициацией спирали. Параметр s был также рассчитан в [43], используя три различных форсфилда, показанных звездочками, треугольниками и квадратами на графике а. спиральными фрагментами. Однако, их статистический вес подавлен фактором инициации спирали. Учет таких состояний важен для больших полипептидов, состоящих из более чем 50 аминокислот. 4.3.4 Спиральность полипептидов аланина Спиральность это важная характеристика полипептида, которая может быть измерена экспериментально [37–40]. Она характеризует долю аминокислот, находящуюся в спиральном состоянии. В рамках рассматриваемой статистической модели спиральность полипептида может быть определена следующим образом: 116 ∑n−4 i+1 n−i−1 i=0 (i + 1)(n − i − 1)Zu Zb ), fα = ( ∑ n+1 Z n−i−1 + βZ n−1 Z n Zun + β n−4 u b b i=1 (i + 1)Zu где n - число аминокислот в полипептиде, Zb , Zu вклабы в статсумму связанных и несвязанных конформаций аминокислот. Зависимость спиральности от температуры, рассчитанная с использованием статистического подхода для полипептидов, состоящих из 21, 30, 40, 50 и 100 аминокислот показана на Рис. 4.10. Рис. 4.10: Зависимость спиральности от температуры, рассчитанная с использованием статистического подхода для полипептидов, состоящих из 21, 30, 40, 50 и 100 аминокислот. Во вкладке показана спиральность полипептида аланина, состоящего из 21 аминокислоты, полученная на основе расчетов молекулярной динамики. Излом на зависимости спиральности от температуры соответствует фазовому переходу. Как видно из Рис. 4.10, с увеличением длины полипептида излом спиральности становится все более резким и фазовый переход становится более выраженным. 117 4.3.5 Корреляции разных аминокислот в полипептиде Важным вопросом является статистическая независимость аминокислот в полипептиде при разных температурах. Другими словами, на сколько конформация одной аминокислоты влияет на конформацию другой. На Рис. 4.11 показано среднеквадратичное отклонение углов φ и ψ, рассчитанное, используя уравнение (4.9 для полипептида аланина, состоящего из 21 аминокислоты. Отклонения отсчитывались относительно десятой аминокислоты полипептида при температуре 300 K (верхний график) и при 1000 K (нижний график). Среднеквадратичное отклонение углов φ и ψ определяется следующим образом: ∑ j<=M RM SD(φi ) = j=1 ∑ j<=M RM SD(ψi ) = j=1 √ √ 1 (φi − φ10 )2 M (4.9) 1 (ψi − ψ10 )2 , M где i номер аминокислоты в полипептиде, а M число шагов молекулярной динамики. При низких температурах отклонение углов в центральных аминокислотах меньше, чем в крайних в связи с тем, что крайние аминокислоты умеют меньше водородных связей. При высоких температурах отклонения в крайних аминокислотах очень близки к отклонениям в центральных, что подтверждает факт, что в состоянии клубка нет жестких водородных связей. В состоянии статистического клубка (и в центральной части α−спирали) отклонения углов φ и ψ не зависят от расстояния между аминокислотами. Этот факт позволяет сделать заключение о том, что в определенной фазе (спирали или клубка) аминокислоты являются статистически независимыми. 118 Рис. 4.11: Среднеквадратичное отклонение углов φ и ψ, рассчитанное, используя уравнение (4.9) для полипептида аланина, состоящего из 21 аминокислоты. Отклонения отсчитывались относительно десятой аминокислоты полипептида при температуре 300 K (верхний график) и при 1000 K (нижний график). 119 Глава 5 Сворачивание полипептидов и белков в водной среде 5.1 Введение Белки - биологические полимеры, состоящие из элементарных структурных единиц, аминокислот. Будучи синтезированным на рибосоме, белок попадает во внутреннюю среду клетки, где он сворачивается в свою уникальную трехмерную структуру. Процесс образования трехмерной структуры белка также называют процессом фолдинга белка. Правильное сворачивание белка в трехмерную структуру крайне важно для его правильного функционирования. Несмотря на большое количество работ, посвященных исследованию фолдинга белков, этот процесс все еще не окончательно изучен. С современным состоянием науки в области экспериментального и теоретического исследования фолдинга белка можно ознакомиться в следующих недавних обзорах и в ссылках внутри них [1, 102–105]. В данной главе представлен новый теоретический метод описывающий процесс сворачивания белка. Представленный теоретический метод описывает переход свернутое↔развернутое состояние в однодоменных белках как фазовый переход первого рода в конечной системе. Предложенный теоретический метод ос- 120 новывается на теории, разработанной для описания перехода спираль↔клубок в полипептидах, который был изложен предыдущих главах 2,3,4 диссертации. Способ построения статистической суммы без использования свободных параметров для системы, совершающей переход спираль↔клубок в вакууме, обсуждался в главе 3. В главе 4 были рассчитаны поверхности потенциальной энергии полиаланинов различной длины относительно их крутильных степеней свободы. Расчет поверхностей потенциальной энергии был выполнен в рамках классической молекулярной механики. Далее, поверхности потенциальной энергии были использованы для построения статистической суммы полипептида, на основе которой были получены различные термодинамические характеристики полипептидов аланина как функции длины полипептида и температуры. В данной главе строится статистическая сумма белка в вакууме, что является дальнейшим обобщением формализма, представленного в секции 3.2. Статсумма строится, учитывая свернутое, развернутое и частично свернутое состояния белка. Такой способ построения статсуммы хорошо согласуется с нуклеационнымконденсационным сценарием фолдинга белка, который является очень распространенным сценарием сворачивания глобулярных белков [106]. Данный сценарий предполагает, что на начальной стадии сворачивания белка формируется нативноподобное гидрофобное ядро фолдинга, в то время как на более поздних стадиях фолдинга все остальные аминокислоты также приобретают нативную конформацию. Данная глава основа на результатах, опубликованных в [107, 108]. Для корректного описания фолдинга белка крайне важно учитывать взаимодействия между белком и молекулами растворителя. Известно, что гидрофобные взаимодействия являются основной движущей силой сворачивания белков [109]. В диссертации представлен метод, с помощью которого можно построить статсумму белка в водном окружении, учитывая гидрофобные эффекты. Основной отличительной чертой предложенного метода является то, что он может быть применен для различных конкретных белков, в отличии от обобщенных и модельных мето- 121 дов. Гидрофобные взаимодействия в системе учитываются на основе статистическо механического формализма развитого в [110] для описания термодинамических характеристик процесса растворения ароматических и алифатических углеводородов в воде. Однако, учет исключительно гидрофобных взаимодействий не достаточен для правильного описания энергий всех конформационных состояний белка, так как электростатические взаимодействия в системе также играют существенную роль. В данной работе электростатические взаимодействия учитываются способом, схожим с изложенным в [111]. Разработанная теоретическая модель фолдинга применена для описания термодинамических свойств двух глобулярных белков - стафилококковой нуклеазы и метмиоглобина. Эти белки имеют простую двухстадийную кинетику фолдинга и демонстрируют два перехода свернутое↔развернутое состояние, которые связаны с холодной и тепловой денатурациями [112, 113]. Сравнение результатов теоретической модели с результатами экспериментальных измерений показывает достаточно высокую точность предложенной модели для описания различных термодинамических характеристик системы, например, температуру тепловой и холодной денатурации, увеличение остаточной теплоемкости денатурированного белка и др. Данная глава организована следующим образом. В секции 5.2.1 представлен теоретический формализм построения статсуммы белка в водном окружении, и обсуждены предположения, выдвинутые о системе при построении статсуммы. В секции 5.3 обсуждаются результаты, полученные с помощью теоретической модели в применении к описанию перехода свернутое↔развернутое состояние в двух белках: стафилококковой нуклеазе и метмиоглобине. 122 5.2 Теоретические методы 5.2.1 Статсумма белка Для изучения термодинамических свойств системы необходимо исследовать поверхность ее потенциальной энергии как функцию всех степеней свободы. Число степеней свободы в таких макромолекулярных системах как белки огромно, поэтому для описания их термодинамических свойств необходима разработка модельных методов. Наиболее важными для фолдинга степенями свободы белка являются крутильные степени свободы вдоль его полипептидной цепи, как обсуждалось в главах 2,3. Эти степени свободы определены для каждой аминокислоты белка за исключением крайних. Крутильные степени свободы описываются двумя двугранными углами φi и ψi (см. определение φi и ψi на Рис. 2.1) Гамильтониан белка строится как сумма членов соответствующих его потенциальной, кинетической и колебательной энергиям. Предполагая гармоничность жестких степеней свободы белка, по аналогии с уравнением (3.17), можно получить следующее выражение для статсуммы белка в вакууме, находящемся в заданном конформационном состоянии j: ∫ ∫ 3N −3− l2s Zj = Aj (kT ) ... φ∈Γj e−ϵj ({φ,ψ})/kT dφ1 ...dφn dψ1 ...dψn , (5.1) ψ∈Γj где T - температура, k - константа Больцмана, N - общее число атомов в белке, ls - число мягких степеней свободы, а Aj определяется следующим образом:  √ √ (1) (2) (3) ∏ls s(j) µi  i=1  Vj · M · Ij Ij Ij =  . ∏ ls 3N −6−ls (j) ωi (2π) 2 π~3N i=1  3/2 Aj (5.2) Aj - множитель, который зависит от массы белка M , его трех главных моментов (1,2,3) инерции Ij (j) , удельного объема Vj , частот жестких нормальных колебательных s(j) мод ωi и обобщенных масс µi , соответствующих мягким степеням свободы (см. 123 секцию 3.1). ϵi в уравнении. (5.1) описывает зависимость потенциальной энергии системы от мягких степеней свободы. Интегрирование в уравнении (5.1) производится по определенной части фазового пространства системы (по подпространству Γj ), соответствующей мягким степеням свободы φ и ψ. Вид статсуммы в форме уравнения (5.1) позволяет избежать многомерного интегрирования по всему пространству координат и провести интегрирование только по статистически значимой части фазового пространства. ϵj в уравнении (5.1) обозначает поверхность потенциальной энергии белка как функцию крутильных степеней свободы вблизи j-ого конформационного состояния белка. Отметим, что в общем случае правильный выбор всех статистически значимых конформаций белка и соответствующего пространства Γj не является очевидным, и требует детального анализа степеней свободы каждой конкретной системы. Можно ожидать, что множители Aj в уравнении (5.1) зависят от выбранной конформации белка. Однако, в связи с тем, что удельные объемы, моменты инерции и частоты нормальных колебательных мод системы в различных конформациях можно предполагать достаточно одинаковыми [100], величины Aj во всех конформация становятся практически равными, по крайней мере в нулевом гармоническом приближении, т.е. Aj ≡ A. Другое упрощение интегрирования в уравнении (5.1) возникает из статистической независимости аминокислот: к рамках заданного конформационного состояния j все аминокислоты могут считаться статистически независимыми, т.е. конкретное конформационное состояние i-ой аминокислоты, характеризующееся углами φi ∈ Γj и ψi ∈ Γj не влияет на поверхность потенциальной энергии всех остальных аминокислот, и наоборот. Это предположение хорошо применимо для жестких конформационных состояний белка, таких как нативное состояние. В нативном состоянии все атомы белка двигаются в гармоническом потенциале вблизи их положений равновесия. Однако, в развернутом состоянии подвижность полипептидной цепи приводит к существенным изменениям расстояний между атомами и, следовательно, к существенному изменению 124 взаимодействий между атомами. Аккуратный (как аналитический, так и численный) учет взаимодействия между удаленными атомами белка в развернутом состоянии чрезвычайно сложен (см. [114] для примера аналитического описания взаимодействий в развернутом состоянии белка). В данной работе все аминокислоты, находящиеся в развернутом состоянии, рассматриваются как движущиеся в идентичном для всех аминокислот усредненном поле, которое создается остальными аминокислотами. Поправки к этому приближению отложены для дальнейших исследований. С вышеупомянутыми предположениями о системе, статсумма белка Zp (без какого-либо растворителя) имеет следующий вид: ( ) ξ a ∫ π ∫ π (j) ls ∑ ∏ ϵ (φ , ψ ) i i exp − i Zp = A · (kT )3N −3− 2 dφi dψi , kT −π −π j=1 i=1 (5.3) где суммирование по j включает все ξ статистически значимых конформаций бел(j) ка, a - число аминокислот в белке и ϵi - поверхность потенциальной энергии как функция крутильных степеней свободы φi и ψi i-ой аминокислоты в j-ом (j) конформационном состоянии белка. Способ построения ϵa (φi , ψi ) для различных конформационных состояний выбранного конкретного белка будет обсужден ниже. Углы φ и ψ считаются двумя единственными мягкими степенями свободы каждой аминокислоты белка, поэтому общее число мягких степеней свободы следующее - ls = 2a. Статсумма в уравнении (5.3) может быть еще больше упрощена, если предположить, (i) что каждая аминокислота в белке может находиться только в двух конформациях: нативной конформации и конформации статистического клубка; (ii) поверхности потенциальной энергии аминокислот идентичны. Это предположение касается как нативного, так и денатурированного состояния. Данное предположение не является достаточно точным для описания термодинамических свойств отдельных аминокислот, однако является достаточно обоснованным в случае анализа термодинамических свойств белка как целого. Окончательное заключение о 125 точности вышеизложенного предположения может быть сделано на основе сравнения теоретических результатов, полученных на его основе, с результатами экспериментальных измерений. Это сравнение приведено в секции 5.3 диссертации. Аминокислоты белка, находящегося в нативном состоянии, колеблются в жестком гармоническом потенциале. Профиль потенциальной энергии аминокислоты в нативной конформации не должен быть сильно чувствительным к конкретному типу аминокислоты и может быть принят как, например, профиль потенциальной энергии аминокислоты аланина в конформации α-спирали (см. Рис. 4.3). Используя аналогичные аргументы, профиль потенциальной энергии аминокислот в развернутом состоянии белка может быть аппроксимирован, например, профилем потенциальной энергии аланина в развернутом состоянии полипептида (см. секцию 4.2, в которой приведено обсуждение поверхностей потенциальной энергии аланинов). Действительно, в развернутом состоянии белка разумно предположить, что при пренебрежении дальнодействующими взаимодействиями аминокислот, разница поверхностей потенциальной энергии различных аминокислот вызвана пространственным перекрытием боковых радикалов аминокислот. Это хорошо видно на поверхности потенциальной энергии аланина при значении двугранного угла φ > 0◦ , показанной на Рис. 4.3). Но часть поверхности потенциальной энергии при φ > 0◦ дает минимальный вклад в энтропию аминокислот при температурах близких к комнатной. Этот факт позволяет пренебречь различиями поверхностей потенциальной энергии разных аминокислот в денатурированном состоянии белка, по крайней мере, в нулевом приближении. Вышеупомянутое предположение об идентичности поверхностей потенциальной энергии аминокислот должно особенно хорошо выполняться для белков, нативная структура которых богата спиралями. Стафилококковая нуклеаза, которая рассмотрена в данной работе, явно имеет высокое содержание α-спиралей. Другим аргументом, который позволяет подтвердить обсуждаемое предположение для более широкого круга белков, является высокая жесткость нативной структуры 126 белков с высоким содержанием как спиралей, так и β-листов. Ниже сделанные о системе предположения подтверждаются сравнением результатов теоретической модели с данными экспериментальных измерений α/β богатого белка метмиоглобина, проведенными в [113]. В предложенной теоретической модели фолдинга небольших однодоменных белков, обладающих простой близкой к двухстадийной кинетикой фолдинга, белок, совершающий переход свернутое↔развернутое состояние, предполагается находящимся в одном из следующих трех возможных состояний: полностью развернутое состояние, полностью свернутое состояние и частично свернутое состояние. В частично свернутом состоянии часть аминокислот из подвижных участков белка без выраженной вторичной структуры находятся в развернутом состоянии, в то время как остальные аминокислоты находятся в свернутой конформации. Статсумма белка, находящегося в вышеперечисленных состояниях, записывается следующим образом: Zp = Z0 + a ∑ κ! Zi , (i − (a − κ))!(a − i)! i=a−κ (5.4) где Zi определен в уравнении (5.1), Z0 - статсуммы белка в полностью развернутом состоянии, a - общее число аминокислот в белке, и κ - число аминокислот в подвижных участках белка. Факториальный член уравнении (5.4) учитывает состояния, в которых различные аминокислоты из подвижных участков независимо переходят в нативную конформацию. Суммирование в уравнении (5.4) производится по всем частично свернутым состояния белка, в которых a − κ - минимально возможное количество аминокислот, одновременно находящихся в нативном состоянии. Факториальный член описывает количество способов выбрать i − (a − κ) аминокислот из подвижных участков аминокислотной последовательности белка, в котором общее количество аминокислот в подвижных участках равно κ. В итоге, статсумма белка белка в вакууме имеет следующий вид: Zp = Z̃p · A(kT )3N −3−a , 127 (5.5) где Z̃p Zb Zu a ∑ κ!Zbi Zua−i exp (i · E0 /kT ) = + (i − (a − κ))!(a − i)! i=a−κ ( ) ∫ π∫ π ϵb (φ, ψ) = exp − dφdψ kT −π −π ( ) ∫ π∫ π ϵu (φ, ψ) = exp − dφdψ. kT −π −π Zua (5.6) (5.7) (5.8) Здесь был опущен тривиальный множитель, описывающий движение центра тяжести белка, который не имеет значения для рассматриваемой задачи, ϵb (φ, ψ) (b обозначает bound) - поверхность потенциальной энергии аминокислоты в нативной конформации, и ϵu (φ, ψ) (u обозначает unbound) - поверхность потенциальной энергии аминокислоты в конформации статистического клубка. Поверхность потенциальной энергии аминокислоты предполагается функцией только двух двугранных углов φ и ψ. ϵ0b и ϵ0u обозначают глобальный минимум на поверхности потенциальной энергии аминокислоты в нативной конформации и конформации статистического клубка, соответственно. В вышеописанных обозначениях потенциальная энергия аминокислоты как функция улов φ и ψ записывается так: ϵ0u,b + ϵu,b (φ, ψ). Член E0 в уравнении (5.6) определен как разница энергий между глобальными минимумами потенциальной энергии аминокислоты в нативной конформации и конформации статистического клубка, т.е. i.e. E0 = ϵ0u − ϵ0b . Поверхность потенциальной энергии аминокислот как функция углов φ и ψ была рассчитана и проанализирована в главе 4. В природе белки выполняют свои функции в водной среде. Поэтому, для теоретического описания перехода свернутое↔развернутое состояние в водной среде необходимо учесть эффекты, связанные с влиянием растворителя. 5.2.2 Статистическая сумма белка в водной среде В данной секции рассчитывается E0 и строится статсумма белка в водном окружении. 128 Статсумма Z бесконечно разреженного раствора белков может быть построена следующим образом: Z= ξ ∑ (j) Z̃p(j) ZW , (5.9) j=1 (j) где ZW - статсумма всех молекул воды в j-ом конформационном состоянии белка, (j) и Z̃p - статсумма белка в j-ом конформационном состоянии, в которой множи- тель, описывающий вклад жестких степеней свободы системы далее будет опущен. Это делается для упрощения выражений, ввиду того, что жесткие степени свободы дают лишь постоянный вклад в теплоемкость белка, так как теплоемкость ансамбля гармонических осцилляторов постоянна. Далее, для упрощения записей, опустим также тильду, Z̃p ≡ Zp . В системе существует два типа молекул воды: (i) молекулы в чистой воде и (ii) молекулы, взаимодействующие с белком. Только молекулы воды, находящиеся вблизи поверхности белка могут рассматриваться как участвующие в переходе свернутое↔развернутое состояние, так как они затронуты изменением гидрофобной поверхности белка. Эта поверхность равна поверхности доступной для растворителя (ПДР) гидрофобных аминокислот белка. Количество молекул воды, взаимодействующих с белком, пропорционально ПДР и включает в себя только молекулы воды, находящиеся в первой сольватационной оболочке. Естественно, ПДР белка зависит от его конформации. Наибольший вклад в изменение свободной энергии системы в связи с изменением ПДР белка вносят боковые радикалы аминокислот, так как вклад в изменение свободной энергии, связанный с сольватацией полипептидной цепи, достаточно мал [2]. Следовательно, необходимо учитывать лишь изменение ПДР, связанное с сольватацией боковых радикалов аминокислот. Все молекулы воды рассматриваются как статистически независимые, т.е. энергетический спектр состояний отдельной молекулы воды и частоты ее колебаний не зависят от конкретного состояния всех остальных молекул воды в системе. 129 В таком приближении статсумма всей системы Z может быть факторизована и имеет следующий вид: Z= ξ ∑ Zp(j) ZsYc (j) ZwNt −Yc (j) , (5.10) j=1 где ξ - общее число возможных состояний белка, Zs - статсумма молекулы воды, затронутой взаимодействием с белком, и Zw - статсумма молекулы воды в чистой воде. Yc (j) - число молекул воды, взаимодействующих с белком в его j-ом конформационном состоянии. Nt - общее число молекул воды в системе. Для упрощения выражений, в последующих уравнениях молекулы воды, не взаимодействующие с белком ни в каком из его конформационных состояний, не учитываются, т.е. Nt = maxj {Yc (j)}. Построение статсуммы воды основывается на формализме, развитом в [110]. Здесь приведены только наиболее важные выражения из вышеупомянутой работы. Статсумма молекулы воды в чистой воде записывается так: Zw = 4 ∑ [ξl fl exp(−El /kT )] , (5.11) l=0 где суммирование проводится по 5 возможным состояниям молекулы воды (состоянием, в которых молекула воды имеет 4,3,2,1 или 0 водородных связей с соседними молекулами). El - энергии этих состояний, ξl - комбинаторные множители, равные 1,4,6,4,1 для l = 0, 1, 2, 3, 4, соответственно. Они описывают количество возможностей сформировать заданное количество водородных связей между молекулами. Факторы fl в уравнении (5.11) описывают вклад в статсумму молекулы, связанный с ее трансляционными и вращательными колебаниями. В гармоническом приближении fl можно записать как: [ ]−3 [ ]−3 (T ) (L) fl = 1 − exp(−hνl /kT ) 1 − exp(−hνl /kT ) , (T ) где νl (L) и νl (5.12) - частоты трансляционных и вращательных колебаний молекулы воды в ее l-ом состоянии, соответственно. Эти частоты получены в [110] и приведены в таблице 5.1. Вклад внутренних колебаний молекулы воды не учтен в 130 Число водородных связей 0 1 2 3 4 Энергетический уровень, Ei (kcal/mol) 6.670 4.970 3.870 2.030 0 Энергетический уровень, Eis (kcal/mol) 6.431 4.731 3.631 1.791 -0.564 Трансляционные частоты, νi , cm−1 26 86 61 57 210 Крутильные частоты, νi , cm−1 197 374 500 750 750 (T ) (L) Таблица 5.1: Параметры статсуммы воды, в соответствии с [110] уравнении (5.11), так как частоты этих колебаний практически не зависят от взаимодействия с окружающими молекулами воды. Статсуммы молекулы воды из первой сольватационной оболочки белка имеет следующий вид: Zs = 4 ∑ [ξl fl exp(−Els /kT )] , (5.13) l=0 где fl определены в уравнении (5.12), и Els обозначает энергетические уровни молекулы воды, взаимодействующей с алифатическими углеводородами аминокислот белка. Величины энергий Els приведены в таблице 5.1. Для простоты все боковые радикалы аминокислот белка, обретающие взаимодействие с молекулами воды при сольватации гидрофобного ядра, считаются алифатическими, так как большая часть гидрофобных аминокислот белка состоит из алифатических углеводородов и схожих с ними. В принципе, используя результаты экспериментальных измерений свободной энергии растворения различных типов боковых радикалов, приведенные в [115] и связанных работах, возможно учесть различные типы боковых радикалов белка. Однако, такая поправка потребует репараметризации теории, представленной в [110], и приведет к появлению∼ 20 · 5 дополнительных параметров. В данной работе подобного рода задача не решается, так как подобного рода улучшения теоретической модели сделают ее слишком громоздкой и затруднят понимание основных физических факторов, влияющих на переход свернутое↔развернутое состояние. 131 Теоретическая модель также должна учитывать электростатическое взаимодействие заряженных групп белка с водой. Наличие электрического поля около поверхности белка приводит к переориентации молекул H2 O вблизи заряженных групп ввиду взаимодействия дипольного момента молекулы воды с электрическим полем. Дополнительный множитель в статсумме (5.11), связанный с вышеупомянутым эффектом, имеет следующий вид: ( ZE = 1 4π ∫ ) )α ( E · d cos θ exp − sin θdθdφ , kT (5.14) где E - напряженность электрического поля, d - абсолютное значение дипольного момента молекулы H2 O, α - отношения числа молекул воды, взаимодействующих с электростатическим полем белка (NE ) к числу молекул воды, взаимодействующих с поверхностью внутренних аминокислот белка, доступных для растворителя в полностью развернутом состоянии белка, (Nw ), т.е. α = NE /Nw . Отметим, что эффекты, связанные с электростатическим взаимодействием, оказываются более выраженными в нативной конформации белка. Это происходит по причине того, что противоположно заряженные радикалы белка в конформации статистического клубка в среднем ближе друг к другу ввиду подвижности полипептидного остова, в то время как в нативной конформации положения противоположно заряженных радикалов фиксированы жесткой трехмерной структурой белка. Интегрируя уравнение (5.14), множитель ZE для статсуммы одной молекулы H2 O может быть записан следующим образом: ( ZE = kT sinh Ed [ Ed ] )α kT . (5.15) Это уравнение показывает как электростатическое поле входит в выражение для статсуммы. В общем случае, E зависит от местоположения в пространстве относительно белка. Однако, в данной работе этой зависимостью пренебрегается, и E рассматривается как параметр, характеризующий среднее, характерное 132 эффективное электрическое поле, создаваемое белком. Пусть Ns - число молекул воды, взаимодействующих с поверхностью белка в его нативном состоянии, т.е. Nt = Ns + Nw ; где Nt определено в уравнении (5.10). Число молекул воды, взаимодействующих с белком (Yc ) можно рассматривать как линейно зависящее от количества аминокислот, находящихся в развернутой конформации, т.е. Yc = Ns + iNw /a, где i - число аминокислот в развернутой конформации статистического клубка, и a - общее число аминокислот в белке. Тогда статсумма системы (5.10) с учетом множителя (5.15) запишется следующим образом: Z= ZsNs · ξ ( ∑ )i(j) ( )a−i(j) N /a Zb ZwNw /a ZE w exp (i · E0 /kT ) Zu ZsNw /a , (5.16) j=1 где i(j) обозначает количество аминокислот, находящихся в свернутой конформации когда белок находится в j-ом конформационном состоянии. Учитывая статистические множители для аминокислот, находящихся в свернутом и развернутом состоянии по аналогии с тем, как это было сделано для белка в вакууме (см. уравнение (5.6)), из уравнения (5.16) получаем следующее финальное выражение для статсуммы: Z = (Zs )Ns × [ × Zua ZsNw + (5.17) ] )i κ! exp (i · E0 /kT ) ( N /a Zb ZwNw /a ZE w (Zu ZsNw /a )a−i , (i − (a − κ))!(a − i)! i=a−κ a ∑ где член в квадратных скобках учитывает все статистически значимые конформации белка. Построив статсумму системы, с ее помощью можно вычислить все термодинамические характеристики как, например, энтропию, свободную энергию, теплоемкость и т.д Свободная энергия (F ) и теплоемкость (c) системы могут быть вычислены на основе статсуммы следующим образом: 133 F (T ) = −kT ln Z(T ), ∂ 2 F (T ) c(T ) = −T . ∂T 2 (5.18) (5.19) В этой главе диссертации анализируются зависимости теплоемкости белков от температуры, и результаты теоретической модели сравниваются с экспериментальными данными измерения теплоемкости белков. 5.3 Результаты и дискуссия В этой секции рассчитана зависимость теплоемкости от температуры для двух глобулярных белков - метмиоглобина и стафилококковой нуклеазы, и результаты сравнены с экспериментальными данными, представленными в работах [112,113]. На рис. 5.1 представлены структуры этих небольших глобулярных белков, состоящих примерно из 150 аминокислот. В определенных экспериментальных условиях , определяемых концентрацией соли и рН, метмиоглобин и стафилококковая нуклеаза дважды претерпевают конформационные изменения (сворачиваютсяразворачиваются), что выражается в появлении двух пиков на кривой зависимости теплоемкости от температуры (будет обсуждаться позднее). Пик при низкой температуре соответствует холодной денатурации протеинов. Пик, появляющийся при высокой температуре, отражает переход от свернутой формы к развернутой. Наличие экспериментально установленных значений для теплоемкостей этих двух протеинов, наличие холодной денатурации и двухстадийная кинетика фолдинга определили выбор этих белков в качестве модели для теоретических расчетов 5.3.1 Теплоемкость стафилококковой нуклеазы Стафилококковая или микрококковая нуклеаза (S7 нуклеаза) - малоспецифичный фермент, который гидролизует одноцепочечные и двухцепочечные нуклеино134 Рис. 5.1: a) Структура стафилококковой нуклеазы (PDB ID 1EYD [116]), и b) метмиоглобин лошади (PDB ID 1YMB [117]). Изображение получено с использованием программы VMD [67]. Рисунок адаптирован [107]. вые кислоты, но предпочтительным субстратом являются одноцепочечные молекулы [118]. Структура этого белка, состоящего из 149 аминокислот, показана на рис. 5.1a. Для оценки ПДР стафилококковой нуклеазы в свернутом состоянии была использована 3D-структура белка, полученная из базе данных PDB [75] (PDB ID 1EYD). При помощи параметризации потенциала молекулярной механики CHARMM27 [24] и программы NAMD [57], была выполнена оптимизация структуры протеина и рассчитана ПДР c использованием пробного радиуса молекулы растворителя, равным 1.4 Å. Значение ПДР для радикалов боковой цепи протеина в свернутой конформации равно Sf =6858 Å2 . При вычислении ПДР для развернутого фермента значения всех углов φ и ψ были приняты равными 180◦ , что соответствует полностью распрямленному состоянию. Затем была выполнена оптимизация структуры с фиксированными углами φ и ψ. Оптимизированная геометрия распрямленной молекулы имеет минимальную зависимость от значения диэлектрической восприимчивости растворителя, поэтому значение диэлектрической восприимчивости было выбра135 но равным 20, для того чтобы имитировать экранирование зарядов растворителем. Значение ПДР радикалов боковой цепи в выпрямленной конформации равно Su =15813 Å2 . Изменение числа молекул воды, которые взаимодействуют с протеином вследствие процесса разворачивания белка, может быть вычислено следующим образом: Nw = (Su − Sf )n2/3 , (5.20) где Su = 15813 Å2 и Sf = 6858 Å2 - значение ПДР в свернутой и развернутой конформации белка, соответственно, n - плотность молекул воды. Объем одного моля воды равен 18 cm3 , поэтому n ≈ 30 Å−3 Чтобы учесть эффекты, вызванные электростатическим взаимодействием молекул воды с заряженными группами белка, необходимо оценить силу среднего электростатического поля E в уравнении (5.15). Это поле может быть оценено как E · d = kT , где d - это это дипольный момент молекулы воды, k - постоянная Больцмана, а T = 300K - комнатная температура. Согласно этой оценке, характерная энергия электростатического взаимодействия молекулы воды равна тепловой энергии на степень свободы молекулы. Общее число молекул воды, которое взаимодействует с электростатическим полем протеина может быть установлено, зная дебаевский радиус экранирования заряда в электролите следующим образом: NE = Nq 4πρ 3 λ , 3 d (5.21) где Nq - число заряженных групп в протеине, ρ - плотность воды, а λ - Дебаевский радиус экранирования. Дебаевский радиус экранирования симметричного электролита определяется по следующей формуле [119]: √ λd = ϵϵ0 kT , 2NA e2 I 136 (5.22) где ϵ0 - диэлектрическая проницаемость вакуума, ϵ - диэлектрическая постоянная, NA - число Авогадро, e - элементарный заряд электрона, а I - ионная сила электролита. Эксперименты по денатурации стафилококковой нуклеазы и метмиоглобина были выполнены в 100 mM буфере NaCl и 10 mM буфере ацетата натрия, соответственно [112,113]. Дебаевский радиус экранирования в воде с 10 и 100 mМ концентрациями ионов равны при комнатной температуре соответственно λd =30 Å и λd =10 Å. Описанный метод позволяет установить число молекул воды (NE ) взаимодействующих с электрическим полем, созданным заряженными группами протеина. Следует иметь в виду, что это приблизительная качественная оценка, поскольку среднее электрическое поле считается постоянным внутри сферы радиусом λd , хотя на самом деле оно может и меняться. Таким образом, на расстоянии ∼15 Å от точечного заряда, энергия взаимодействия молекулы воды с электрическим полем становится равной∼ 0.02 kT (для этой оценки использована линейно растущая с расстоянием диэлектрическая восприимчивость ϵ = 6R, как получено в [120] для атомов полностью доступных для растворителя). Тем не менее, более точный анализ, учитывающий пространственные вариации электрического поля, значительно не изменит представленных здесь результатов, поскольку они базируются на физически корректной картине эффекта и реалистических значениях всех физических величин. При физиологических условиях стафилококковая нуклеаза имеет 8 заряженных аминокислот [121]. Значение α для этого белка варьирует в интервале 1.29 - 31.27 для λd ∈[10..30] Å. В численном анализе используется типичное значение α равное 2.5. Заметим, что число молекул NE , взаимодействующих с электростатическим полем, и сила электростатического поля E должны рассматриваться как параметры модели. В этой работе точный расчет электрического поля белка с учетом его пространственной зависимости не проводился. Вместо этого были введены па- 137 раметры α и E. Эти параметры могут быть интерпретированы как эффективные значения числа молекул воды и силы электростатического поля соответственно. Заметим, что число молекул воды α и напряженность поля E - не независимые параметры модели, потому что выбирая более высокое значение E и более низкое значение α, или наоборот, можно получить тот же профиль теплоемкости. Зависимость профиля теплоемкости от величины параметров α и E в данной работе не рассматривалась. Всюду в дальнейшем, все исследования зависимости теплоемкости протеина от энергии E0 , выполнены при фиксированных значениях α и E, равных 2.5 и 0.58 kcal/mol соответственно. Важным параметром, введенным в уравнение (5.6), является параметр E0 , описывающий разницу энергий в двух состояниях белка, нормализованную на один аминокислотный остаток. Этот параметр описывает как потерю энергии вследствие разнесения гидрофобных групп протеина, которые в нативном белке притягиваются благодаря силам Ван-дер-Ваальса, так и ее увеличение в результате Ван-дер-Ваальсовского взаимодействия с молекулами воды гидрофобных групп белка, когда последний находится в развернутом состоянии. При этом, разница в электростатической энергии белка в свернутом и развернутом состояниях также учтена в E0 . Разница в электростатических энергиях может зависеть от различных характеристик системы, таких как концентрация ионов в растворителе и рН, расположение заряженных сайтов в нативном белке, распределение расстояний между заряженными аминокислотами в развернутом белке. Таким образом, точный расчет E0 , весьма затруднителен. Это отдельная задача, решение которой выходит за рамки данной работы. Вместо этого, в настоящей работе разница энергий между двумя конформационными состояниями белка рассматривается в качестве параметра модели. E0 считается зависимым от внешних свойств системы, в частности от рН раствора. Другой характеристикой, описывающий переход белка из одной конформации в другую, является кооперативность. В нашей модели он описывается в уравне- 138 значение pH 7.0 5.0 4.5 3.88 3.23 E0 (kcal/mol) 0.789 0.795 0.803 0.819 0.890 Таблица 5.2: Значения E0 для стафилококковой нуклеазы при различных pH раствора. нии. (5.4) параметром κ. κ учитывает число аминокислотных остатков в сворачиваемой области белка. Стафилококковая нуклеаза имеет двухстадийную кинетику фолдинга, и только 5-10% аминокислот находятся в подвижных участках белка. Таким образом, значение κ для этого протеина мало. Оно может быть принято равным 149 · 7% ≈ 10 аминокислот. Значения E0 для рассматриваемого белка при различных значениях рН представлено в таблице 5.2. При анализе вариаций термодинамических свойств системы в процессе фолдинга можно пренебречь всеми вкладами в свободную энергию системы, которые в температурном диапазоне -50◦ C - 150◦ изменяются незначительно. Поэтому, из выражения для общей свободной энергии системы F можно исключить все слабо меняющиеся факторы F0 следующим образом: ( δF = F − F0 = −(kT ln Z − kT ln Z0 ) = −kT ln ) Z . Z0 (5.23) Из уравнения (5.23) следует, что вычитание F0 соответствует делению общей статсуммы Z на статсуммы подсистем (Z0 ) с медленно изменяющимися термодинамическими свойствами. Поэтому, с целью упрощения выражения, можно разделить статсумму в уравнении (5.17) на статсумму полностью развернутого белка (на Zua ZsNw ) и на статсумму Ns свободных молекул воды (на ZwNs ). Таким образом, уравнение (5.17) можно переписать следующим образом: ( Z= Zs Zw )Ns ( a ∑ κ! exp (i · E0 /kT ) 1+ (i − (a − κ))!(a − i)! i=a−κ ( Zb Zu )i ( Zw ZE Zs )iNw /a ) . (5.24) С использованием уравнения (5.19) можно вычислить теплоемкость системы 139 следующим образом: c(T ) = A + B(T − T0 ) − T ∂ 2 F (T ) , ∂T 2 (5.25) где члены A и B отвечают за абсолютное значение и наклон кривой теплоемкости соответственно. Эти факторы учитывают вклад жестких гармонических форм колебания в систему (член A) и ангармонических поправок в колебания (члены B и T0 ). В эти факторы включены также вклады жестких колебательных мод белка и теплоемкость полностью развернутой конформации. В количественном анализе для совпадения с экспериментальными измерениями значения A, B и T0 были скорректированы. Тем не менее, факторы A, B и T0 не должны рассматриваться как параметры модели, поскольку их значения не имеют отношения к термодинамическим характеристикам перехода свернутое↔развернутое состояние и зависят не только от свойств протеина, но и от свойств раствора, концентрации протеина и ионов и т.д. Для стафилококковой нуклеазы в уравнении (5.25) были использованы следующие значения: A = 1.25 JK−1 g−1 , B = 6.25 · 10−3 JK−2 g−1 и T0 =323 ◦ K. Зависимости теплоемкости от температуры стафилококковой нуклеазы рассчитанные при различных pH растворителя показаны на рис. 5.2 сплошными линиями. Результаты экспериментальных измерений из [112] показаны символами. Из рис. 5.2 видно, что в диапазоне pH между 3.78 и 7.0 стафилококковая нуклеаза имеет два перехода свернутое↔развернутое состояние. При значении pH менее 3.23 пики на зависимости теплоемкости от температуы отсутствуют. Это означает, что белок находится в денатурированном состоянии во всем диапазоне экспериментально измеренных температур. Сравнение теоретических результатов с экспериментальными данными показывает, что теоретическая модель лучше воспроизводит экспериментальное поведение профиля теплоемкости белка при более высоких значениях pH раствора. Пик в зависимости теплоемкости от температуры при более высоких температурах, 140 Рис. 5.2: Зависимости теплоемкости от температуры стафилококковой нуклеазы (см. рис. 5.1a) при различных pH растворителя. Сплошными линиями показаны результаты теоретической модели, а символами показаны результаты экспериментальных измерений, выполненных в [112]. Рисунок адаптирован из [107]. связаный со стандартной тепловой денатурацией белка, хорошо воспроизводится теоретической моделью при значениях pH в районе 4.5-7.0. Отклонения при низких температурах могут быть связаны с неточностью статистическо механической модели воды при температурах близких к температуре замерзания. Точность теоретической модели при низких значениях pH около 3.88 также вполне разумная. Отклонение теоретических кривых от экспериментальных скорее всего возникает по причине изменения свойств раствора при высоких концентрациях протонов, или в связи с изменением парциальных зарядов боковых радикалов белка при значениях pH далеких от физиологических. Несмотря на некоторые различия между результатами теоретической модели и данными экспериментальных измерений, проявляющиеся в определенном интервале температур и значений pH, общая точность теоретической модели может 141 быть охарактеризована как весьма высокая, особенно принимая во внимания всю сложность процессов сопровождающих структурные переходы в больших биологических молекулах. 5.3.2 Теплоемкость метмиоглобина Метмиоглобин - окисленная форма белка миоглобина. Функция миоглобина заключается в обратимом связывании кислорода в мышечных и костных тканях [122]. Метмиоглобин состоит из 153 аминокислот, и его структура показана на рис. 5.1 справа. Для вычисления ПДР боковых радикалов метмиоглобина использовалась в точности такая же процедура, как и для стафилококковой нуклеазы (см. дискуссию в предыдущей секции). ПДР в свернутом и развернутом состоянии белка равна 6847 Å2 и 16926 Å2 , соответственно. Таким образом, 984 молекулы H2 O взаимодействуют с гидрофобной поверхностью метмиоглобина в денатурированном состоянии. Электростатическое взаимодействие молекул воды с метмиоглобином учтено таким же образом, как и для стафилококковой нуклеазы: параметр α в уравнении (5.15) был выбран равным 2.5. А значит всего 10950 молекул H2 O вовлечено в электростатическое взаимодействие с метмиоглобином в его нативном состоянии. Эффективная напряженность электрического поля была выбрана такой же, как и для нуклеазы. Параметр κ в уравнении (5.4), который описывает кооперативность перехода свернутое↔развернутое состояние, у метмиоглобина существенно отличается от стафилококковой нуклеазы. Конформационный переход в метмиоглобине менее кооперативен, чем переход в нуклеазе, так как у метмиоглобина существуют выраженные промежуточные, частично свернутые состояния [123]. Таким образом, в то время как жесткое ядро фолдинга уже сформировалось, вплоть до 1/3 аминокислот метмиоглобина могут находиться в подвижном несвязанном состоянии, 142 значение pH 4.10 3.70 3.84 3.5 E0 (kcal/mol) 1.128 1.150 1.165 1.2 Таблица 5.3: Значения E0 для метмиоглобина при различных pH раствора. т.е. параметр κ в уравнении (5.4) равен 50. Значения E0 в уравнении (5.6) отличаются от значений для стафилококковой нуклеазы и приведены в таблице 5.3. В проведенных расчетах были использованы следующие значения параметров: A = 1.6 JK−1 g−1 , B = 8.25 · 10−3 JK−2 g−1 и T0 =323 ◦ K. Отметим, что значения вышеперечисленных параметров в уравнении (5.25) рассматривались как свободные и были выбраны так, чтобы теоретическая модель имела наилучшее согласие с экспериментальными данными. Рис. 5.3: Зависимость теплоемкости лошадиного метмиоглобина от температуры (см. рис. 5.1b) при различных значениях pH раствора. Сплошными линиями показаны результаты, полученные с помощью теоретической модели. Символами показаны экспериментальные данные из [113]. Рисунок адаптирован из [107]. На рис. 5.3 сплошными линиями показаны зависимости теплоемкости метмио143 глобина от температуры, полученные с помощью разработанной теоретической модели. Экспериментальные данные из [113] показаны символами. Метмиоглобин имеет два перехода нативное↔денатурированное состояние при значениях pH превышающих 3.5, которые соответствуют холодной и тепловой денатурациям. Поэтому, как видно из рис. 5.3, зависимость теплоемкости белка от температуры имеет два характерных пика. Из рис. 5.3 также видно, что при значениях pH меньших 3.84 белок находится только в денатурированном состоянии. Сравнение результатов разработанной теоретической модели с результатами экспериментальных измерений показывает, что теоретическая модель также хорошо применима и для метмиоглобина. Хорошее согласие теоретически рассчитанных и экспериментально измеренных профилей зависимости теплоемкости от температуры в широком диапазоне температур и значений pH показывает, что теоретическая модель правильно описывает термодинамические характеристики процесса фолдинга белка. Представленная в данной главе теория включает в себя ряд параметров, а именно разницу энергий двух фаз E0 , эффективную напряженность электрического поля белка E, число взаимодействующих с полем молекул воды α, параметр κ, описывающий кооперативность фазового переходы, и другие параметры, введенные в [110] при построении статсуммы воды. Три параметра - E, E0 и κ зависят от свойств каждого конкретного белка и от pH раствора. Значения этих параметров изменялись для наилучшего воспроизводства экспериментальных данных. Все остальные параметры модели, такие как, например, энергии различных состояний молекулы воды, частоты ее колебательных и вращательных осцилляций и др., можно считать фиксированными и универсальными для всех протеинов. Несмотря на модельные особенности представленного теоретического метода отметим, что сложное поведение профиля зависимости теплоемкости от температуры и особенности этого профиля хорошо воспроизводятся предложенной теоретической моделью, содержащей всего лишь несколько параметров. Это было 144 показано на примере двух белков, и этот результат может считаться существенным достижением. Хорошее согласие теоретической модели и экспериментальных измерений позволяет в дальнейшем использовать модель для предсказания особенностей конформационных переходов в различных биомолекулярных системах. Действительно, из рис. 5.2 и 5.3 можно извлечь много полезной информации о профилях теплоемкости, такой как: выгнутый изгиб профиля теплоемкости полностью денатурированного белка, температуры тепловой и холодной денатураций, абсолютные значения теплоемкостей в точках фазового перехода, уширение пиков теплоемкости. Еще две особенности, которые хорошо воспроизводятся предложенной статистическо механической моделью - это уменьшение теплоемкости белка в нативном состоянии по сравнению с белком в денатурированном состоянии, и асимметрия пиков теплоемкости. 145 Заключение Эта работа посвящена теоретическому изучению конформационных переходов в полипептидах и белках используя методы статистической физики. Конформационные переходы или фолдинг полипептидов и белков рассматривается как фазовый переход в системе конечного размера. Диссертация начинается с анализа поверхностей потенциальной энергии три- и гексапептидов аланина и глицина с использованием методов из первых принципов, а именно теории функционала плотности. Анализ поверхностей потенциальной энергии позволил выделить две различных типа степеней свободы в системе: так называемые "мягкие"и "жесткие"степени свободы, соответствующие колебаниям ковалентных связей в полипептиде и кручению вдоль остова полипептидной цепи, соответственно. Разделение степеней свободы в системе на два типа позволило построить статистическую сумму полипептида, совершающего переход спираль↔клубок, зная поверхность его потенциальной энергии как функцию только крутильных степеней свободы. В главе 3 диссертации представлен новый теоретический метод, описывающий переход спираль↔клубок в полипептидах. Предложенный метод основывается на построении статсуммы конечной системы, совершающей фазовый переход переход, без использования свободных параметров. Вся необходимая информация для построения статсуммы может быть рассчитана на основе теории функционала плотности и других теоретических методов из первых принципов, а также на основе потенциалов молекулярной механики. Предложенный метод является эффективной альтернативой существующим теоретическим подходам для описа- 146 ния переходов спираль-клубок, так как он не содержит модельных параметров. Он дает универсальный рецепт описания конформационных переходов в сложных биомолекулярных системах. Статсумма полипептида строится с использованием минимально возможного количества предположений о системе, что делает предложенный теоретический подход более общим и универсальным по сравнению с другими теоретическими методами. Детальный анализ перехода α-спираль↔статистический клубок в полипептидах аланина различной длины проведен в главе 4. Поверхность потенциальной энергии полипептидов была рассчитана относительно их крутильных степеней свободы, и была построена статсумма системы без использования свободных параметров. На основе этой статсуммы были вычислены и проанализированы зависимости от температуры теплоемкости, внутренней энергии и спиральности полипептидов, состоящих из 21, 30, 40, 50 и 100 аминокислот аланина. Также вышеперечисленные термодинамические характеристики были получены из расчетов на основе молекулярной динамики. Результаты молекулярно-динамических симуляций были сравнены результатами статистическо-механического метода. Проведенное сравнение подтвердило применимость предложенного теоретического метода и установило рамки его точности. Было показано, что теплоемкость полипептидов аланина имеет пик при определенной температуре. Параметры этого пика (т.е. максимальное значение теплоемкости, ширина на полувысоте, температура максимума, площадь под пиком) были проанализированы в зависимости от длины полипептида. Основываясь на предсказаниях двухуровневой модели, было показано, что переход α-спираль↔статистический клубок может рассматриваться как пример фазового перехода первого рода в конечной системе. В диссертации установлено соответствие развитого теоретического метода с альтернативным полуэмпирическим методом, предложенным Циммом (Zimm)и Браггом (Bragg) в [7]. Для этой цели были рассчитаны параметры полуэмпирической статистической модели Цимма и Брагга. Величины рассчитанных параметров 147 были сравнены с предыдущими расчетами, выполненными в [43]. В главе 5 изложена новая статистическо-механическая модель, описывающая переход свернутое↔развернутое состояние в глобулярных однодоменных белках. Модель основывается на построении статсуммы системы как суммы по всем статистически существенным конформационным состояниям белка. Статсумма каждого состояния является произведением статсуммы белка в заданном конформационном состоянии, статсуммы молекул воды в чистой воде и статсуммы молекул воды, взаимодействующих с белком. Предложенная теоретическая модель содержит определенное количество параметров, ответственных за различные физические свойства системы. Параметры, используемые в теоретической модели получены на основе доступных экспериментальных данных, а три из них (разница энергий двух различных фаз, кооперативность перехода и эффективная напряженность электрического поля вблизи поверхности белка) рассматриваются как свободные и зависящие от конкретного белка и свойств раствора, в частности pH. Предсказания разработанной теоретической модели были сравнены с результатами экспериментальных измерений зависимости теплоемкости от температуры стафилококковой нуклеазы и метмиоглобина. Экспериментальные данные были получены при различных значениях pH раствора. Разработанная теоретическая модель оказалась в состоянии воспроизвести достаточно хорошо в рамках единого формализма большое количество особенностей профиля зависимости теплоемкости от температуры. К хорошо воспроизводимым особенностям можно отнести температуру тепловой и холодной денатураций и соответствующие значения теплоемкости, характерный температурный диапазон переходов, связанных с тепловой и холодной денатурациями, различие теплоемкости белка в нативном и денатурированном состояниях. Хорошее согласие результатов, полученных с использованием предложенного формализма, с результатами экспериментальных измерений показало, что предло- 148 женная теоретическая модель может быть использована, с определенными изменениями, для анализа термодинамических свойств большого количества различных биомолекулярных систем. Дальнейшее развитие модели может быть направлено на ее применение для описания влияния мутаций на стабильность белков, анализ сборки и стабильности белковых комплексов и агломератов, для описания процесса кристаллизации белков и т.д. 149 Публикации автора по теме диссертации [A1] A. V. Yakubovich, A. V. Solov’yov, W. Greiner, Conformational changes in polypeptides and proteins, International Journal of Quantum Chemistry 110, 257-269, (2010). [A2] A. V. Yakubovich, I. A. Solov’yov, A. V. Solov’yov, W. Greiner, Phase transitions in polypeptides: analysis of energy fluctuations, European Physical Journal D 51, 25-32, (2009). [A3] A. V. Yakubovich, A. V. Solov’yov, W. Greiner, Statistical mechanics model for protein folding, AIP Conference Proceedings, New York 1197, 186-200, (2009). [A4] I. A. Solov’yov, A. V. Yakubovich, A. V. Solov’yov, W. Greiner, Alpha-helix . Coil Phase Transition: Analysis of Ab Initio Theory Predictions, European Physical Journal D 46, 227-240, (2008). [A5] A. V. Yakubovich, I. A. Solov’yov, A. V. Solov’yov, W. Greiner, Ab Initio theory of alpha-helix ↔ Coil Phase Transition, European Physical Journal D 46, 215-225, (2008). [A6] A. V. Yakubovich, I. A. Solov’yov, A. V. Solov’yov, Towards the understanding of structure formation and dynamics in bio-nano systems, Journal of Physics: Conference Series 129, 012040-(1-9), (2008). [A7] A .V. Yakubovich, I. A. Solov’yov, A. V. Solov’yov, W. Greiner, On the theory of phase transitions in polypeptides, Imperial College Press, London 150 241-260, (2008). [A8] A. V. Yakubovich, I. A. Solov’yov, A. V. Solov’yov, W. Greiner, Nano-scale phase transitions, Europhysics News 38, 10, (2007). [A9] А. В. Якубович, И. А. Соловьев, А. В. Соловьев, В. Грайнер, О фрагментации биомолекул: фрагментация дипептида аланина вдоль полипептидной цепи, Журнал Экспериментальной и Теоретической Физики 130, 534-543 (2006). [A10] I. A. Solov’yov, A. V. Yakubovich, A. V. Solov’yov, W. Greiner, Ab initio study of alanine polypeptide chain twisting, Physical Review E 73, 021916(1-10), (2006). [A11] И. А. Соловьев, А. В. Якубович, А. В. Соловьев, В. Грайнер, Поверхность потенциальной энергии полипептидов аланина, Журнал Экспериментальной и Теоретической Физики, 129, 356-370, (2006). [A12] A. V. Yakubovich, I. A. Solov’yov, A. V. Solov’yov, W. Greiner, Phase transition in polypeptides: a step towards the understanding of protein folding, European Physical Journal D 40, 363-367, (2006) (Highlight Paper). [A13] А. В. Якубович, И. А. Соловьев, А. В. Соловьев, В. Грайнер, Конформации полипептидов глицина, Химическая Физика 25, 11-23, (2006). [A14] A. V. Yakubovich, I. A. Solov’yov, A. V. Solov’yov, W. Greiner, Conformational changes in glycine tri- and hexa- polypeptide, European Physical Journal D 39, 23-34, (2006). 151 Литература [1] Shakhnovich, E. 2006. Protein folding thermodynamics and dynamics: Where physics, chemistry, and biology meet. Chem. Rev. 106:1559–1588. [2] Finkelstein, A. and O. Ptitsyn. 2002. Protein Physics. A Course of Lectures. Elsevier Books, Oxford. [3] Shea, J.-E. and C. L. Brooks. 2001. From folding theories to folding proteins: A review and assessment of simulation studies of protein folding and unfolding. Ann. Rev. Phys. Chem. 52:499–535. [4] Prabhu, N. V. and K. A. Sharp. 2005. Heat capacity in proteins. Ann. Rev. Phys. Chem. 56:521–548. [5] Yakubovich, A., I. Solov’yov, A. Solov’yov, and W. Greiner. 2007. Ab initio description of phase transitions in finite bio- nano-systems. Europhys. News. 38:10–10. [6] Yakubovich, A., I. Solov’yov, A. Solov’yov, and W. Greiner. 2006. Phase transition in polypeptides: a step towards the understanding of protein folding. Eur. Phys. J. D. 40:363–367. [7] Zimm, B. and J. Bragg. 1959. Theory of the phase transition between helix and random coil in polypeptide chains. J. Chem. Phys. 31:526–535. [8] Gibbs, J. and E. DiMarzio. 1959. Statistical mechanics of helix-coil transitions in biological macromolecules. J. Phys. Chem. 30:271–282. 152 [9] Lifson, S. and A. Roig. 1961. On the theory of helix-coil transition in polypeptides. J. Chem. Phys. 34:1963–1974. [10] Schellman, J. A. 1958. The factors affecting the stability of hydrogen-bonded polypeptide structures in solution. J. Phys. Chem. 62:1485–1494. [11] Lifson, S. 1964. Partition function of linear-chain molecules. J. Chem. Phys. 40:3705–3710. [12] Poland, D. and H. A. Scheraga. 1966. Phase transitions in one dimension and the helix-coil transition in polyamino acids. J. Chem. Phys. 45:1456–1463. [13] Poland, D. and H. A. Scheraga. 1966. Kinetics of the helix-coil transition in polyamino acids. J. Chem. Phys. 45:2071–2090. [14] Go, N. and H. A. Scheraga. 1976. On the use of classical statistical mechanics in the treatment of polymer chain conformation. Macromolecules. 9:535–542. [15] Ooi, T. and M. Oobatake. 1991. Prediction of the thermodynamics of protein unfolding: The helix-coil transition of poly(l-alanine). Proc. Natl. Acad. Sci. USA. 88:2859–2863. [16] Gomez, J., V. J. Hilser, D. Xie, and E. Freire. 1995. The heat capacity of proteins. Proteins: Struct., Func., Gen. 22:404–412. [17] Tobias, D. J. and C. L. Brooks III. 1991. Thermodynamics and mechanism of α helix initiation in alanine and valine peptides. Biochem. 30:6059–6070. [18] Garcia, A. E. and K. Y. Sanbonmatsu. 2002. α-helical stabilization by side chain shielding of backbone hydrogen bonds. Proc. Natl. Acad. Sci. USA. 99:2781–2787. [19] Nymeyer, H. and A. E. Garcia. 2003. Simulation of the folding equilibrium of α-helical peptides: A comparison of the generalized born approximation with explicit solvent. Proc. Natl. Acad. Sci. USA. 100:13934–13939. 153 [20] Irbäck, A. and F. Sjunnesson. 2004. Folding thermodynamics of three β-sheet peptides: A model study. Proteins: Struct., Func., Gen. 56:110–116. [21] Shental-Bechor, D., S. Kirca, N. Ben-Tal, and T. Haliloglu. 2005. Monte carlo studies of folding, dynamics and stability in α-helices. Biophys. J. 88:2391–2402. [22] Scott, W. and W. van Gunsteren. 1995. The GROMOS software package for biomolecular simulations. In E. Clementi and G. Corongiu, editors, Methods and Techniques in Computational Chemistry: METECC-95. STEF, Cagliari, Italy, pages 397–434. [23] Cornell, W., P. Cieplak, C. Bayly, I. Gould, K. Merz, D. Ferguson, D. Spellmeyer, T. Fox, J. Caldwell, and P. Kollman. 1995. A second generation force field for the simulation of proteins, nucleic acids, and organic molecules. J. Am. Chem. Soc. 117:5179–5197. [24] MacKerell, A., D. Bashford, M. Bellott, R. Dunbrack, J. Evanseck, M. Field, S. Fischer, J. Gao, H. Guo, S. Ha, D. Joseph-McCarthy, L. Kuchnir, K. Kuczera, F. Lau, C. M. ans S. Michnick, T. Ngo, D. Nguyen, B. Prodhom, W. Reiher, B. Roux, M. Schlenkrich, J. Smith, R. Stote, J. Straub, M. Watanabe, J. Wiorkiewicz-Kuczera, D. Yin, and M. Karplus. 1998. All-atom empirical potential for molecular modeling and dynamics studies of proteins. J. Phys. Chem. B. 102:3586–3616. [25] Chen, C., Y. Xiao, and L. Zhang. 2005. A directed essential dynamics simulation of peptide folding. Biophys. J. 88:3276–3285. [26] Duan, Y. and P. A. Kollman. 1998. Pathways to a protein folding intermediate observed in a 1-microsecond simulation in aqueous solution. Science. 282:740– 744. 154 [27] Liwo, A., M. Khalili, and H. A. Scheraga. 2005. Ab initio simulations of protein-folding pathways by molecular dynamics with the united-residue model of polypeptide chains. Proc. Natl. Acad. Sci. USA. 102:2362–2367. [28] Ding, F., N. V. Dokholyan, S. V. Buldyrev, H. E. Stanley, and E. I. Shakhnovich. 2002. Direct molecular dynamics observation of protein folding transition state ensamble. Biophys. J. 83:3525–3532. [29] Pande, V. S., I. Baker, J. Chapman, S. P. Elmer, S. M. Larson, Y. M. Rhee, M. R. Shirts, C. D. Snow, E. J. Sorin, and B. Zagrovic. 2002. Atomistic protein folding simulations on the submillisecond time scale using worldwide distributed computing. Biopolymers. 68:91–109. [30] Irbäck, A., B. Samuelsson, F. Sjunnesson, and S. Wallin. 2003. Thermodynamics of α- and β-structure formation in proteins. Biophys. J. 85:1466–1473. [31] Kubelka, J., J. Hofrichter, and W. A. Eaton. 2004. The protein folding speed limit. Curr. Opin. Struct. Biol. 14:76–88. [32] Lipman, E. A., B. Schuler, O. Bakajin, and W. A. Eaton. 2003. Single-molecule measurement of protein folding kinetics. Science. 301:1233–1235. [33] He, S. and H. A. Scheraga. 1998. Macromolecular conformational dynamics in torsion angle space. J. Chem. Phys. 108:271–286. [34] He, S. and H. A. Scheraga. 1998. Brownian dynamics simulations of protein folding. J. Chem. Phys. 108:287–300. [35] Fujita, S., E. Blaisten-Borojas, M. Torres, and S. V. Godoy. 1981. Helix-coil transition of polypeptides on the basis of correlated walks. J. Chem. Phys. 75:3097–3102. [36] Cárdenas, A. E. and R. Elber. 2003. Atomically detailed simulation of helix formation with the stochastic difference equations. Biophys. J. 85:2919–2939. 155 [37] Scholtz, J. M., S. Marqusee, R. L. Baldwin, E. J. York, J. M. Stewart, M. Santoro, and D. W. Bolen. 1991. Calorimetric determination of the enthalpy change for the α−helix to coil transition of an alanine peptide in water. Proc. Natl. Acad. Sci. USA. 88:2854–2858. [38] Lednev, I. K., A. S. Karnoup, M. C. Sparrow, and S. A. Asher. 2001. Transient UV raman spectroscopy finds no crossing barrier between the peptide α−helix and fully random coil conformation. J. Am. Chem. Soc. 123:2388–2392. [39] Thompson, P. A., W. A. Eaton, and J. Hofrichter. 1997. Laser temperature jump study of the helix-coil kinetics of an alanine peptide interpreted with a ’kinetic zipper’ model. Biochem. 36:9200–9210. [40] Williams, S., R. G. Thimothy P. Causgrove, K. S. Fang, R. H. Callender, W. H. Woodruff, and R. B. Dyer. 1996. Fast events in protein folding: Helix melting and formation in a small peptide. Biochem. 35:691–697. [41] Kromhout, R. A. and B. Linder. 2001. Predictions of conformational enthalpy and heat capacity from the zimm-bragg theory. J. Phys. Chem. B. 105:4987–4991. [42] Chakrabartty, A., T. Kortemme, and R. L. Baldwin. 1994. Helix propensities of the amino acids measured in alanine-based peptides without helix-stabilizing side-chain interactions. Prot. Sci. 3:843–852. [43] Go, M., N. Go, and H. A. Scheraga. 1970. Molecular theory of the helix-coil transition in polyamino acids. II. numerical evaluation of s and σ for polyglycine and poly-l-alanine in the absence (for s and σ) and presence (for σ) of solvent. J. Chem. Phys. 52:2060–2079. [44] Scheraga, H. A., J. A. Villa, and D. R. Ripoll. 2002. Helix-coil transitions revisited. Biophys. Chem. 01-102:255–265. 156 [45] Wojćik, J., K.-H. Altmann, and H. Scheraga. 1990. Helix-coil stability constants for the naturally occurring amino acids in water. XXIV. halfcystine parameters from random poly(hydroxybutylglutamine-co-S-methylthioL-cysteine). Biopolymers. 30:121–134. [46] Scott, R. A. and H. A. Scheraga. 1966. Conformational analysis of macromolecules. III. helical structures of polyglicine and poly-l-alanine. J. Chem. Phys. 45:2091–2101. [47] Ooi, T., R. A. Scott, G. Vanderkooi, and H. A. Scheraga. 1967. Conformational analysis of macromolecules. iv. helical structures of poly-l-alanine, poly-lvaline, poly-β-methyl-l-aspartate, poly-γ-methyl-l-glutamate and poly-l-tyrosine. J. Chem. Phys. 46:4410–4426. [48] Wang, L., T. O’Connell, A. Tropsha, and J. Hermans. 1995. Thermodynamic parameters for the helix-coil transition of oligopeptides: Molecular dynamics simulation with the peptide growth method. Proc. Natl. Acad. Sci. USA. 92:10924–10928. [49] Foresman, J. B. and A. leen Frisch. 1996. Exploring Chemistry with Electronic Structure Methods. Pittsburgh, PA: Gaussian Inc. [50] Becke, A. 1988. Density-functional exchange-energy approximation with correct asymptotic-behavior. Phys. Rev. A. 38:3098–3100. [51] Lee, C., W. Yang, and R. Parr. 1988. Development of the colle-salvetti correlation-energy formula into a functional of the electron-density. Phys. Rev. B. 37:785–789. [52] Yakubovich, A., I. Solov’yov, A. Solov’yov, and W. Greiner. 2006. Conformational changes in glycine tri- and hexapeptide. Eur. Phys. J. D. 39:23–34. 157 [53] Yakubovich, A., I. Solov’yov, A. Solov’yov, and W.Greiner. 2006. Conformations of glycine polypeptides. Khimicheskaya Fizika (Chemical Physics) (in Russian). 25:11–23. [54] Solov’yov, I., A. Yakubovich, A. Solov’yov, and W. Greiner. 2006. Ab initio study of alanine polypeptide chain twisting. Phys. Rev. E. 73:021916–(1–10). [55] Solov’yov, I., A. Yakubovich, A. Solov’yov, and W. Greiner. 2006. Potential energy surface for alanine polypeptide chains. J. Exp. Theor. Phys. 102:314–326. [56] Rapaport, D. 2004. The Art of Molecular Dynamics Simulation. Cambridge University Press. [57] Phillips, J. C., R. Braun, W. Wang, and et al. 2005. Scalable molecular dynamics with namd. J. Comp. Chem. 26:1781–1802. [58] Frenkel, D. and B. J. Smit. 2002. Understanding Molecular Simulation:From Algorithms to Applications. Academic Press, Elsevier, USA. [59] Coffey, W., Y. Kalmykov, and J. Waldron. 2004. The Langevin Equation, volume 14 of World Scientific in Contemporary Chemical Physics. World Scientific Publishing Co. [60] Reif, F. 1965. Fundamentals of Statistical and Thermal Physics. McGraw Hill New York. [61] Henriques, E. and A. Solov’yov. 2006. Abstract at the WE-Heraeus-Seminar. [62] Henriques, E. and A. Solov’yov. 2007. A rational method for probing macromolecules dissocation: the antibody-hapten system. Eur. Phys. J. D. 46:471–481. [63] Sotomayor, M., D. P. Corey, and K. Schulten. 2005. In search of the hair-cell gating spring: Elastic properties of ankyrin and cadherin repeats. Science. 13:669– 682. 158 [64] Gullingsrud, J. and K. Schulten. 2004. Lipid bilayer pressure profiles and mechanosensitive channel gating. Biophys. J. 86:3496–3509. [65] Nelson, D. L. and M. M. Cox. 2005. Principles of Biochemistry. W.H. Freeman and Company, New York. [66] Voet, D. and J. Voet. 2004. Biochemistry. John Willey and Sons, Inc., USA. [67] Humphrey, W., A. Dalke, and K. Schulten. 1996. Vmd - visual molecular dynamics. J. Molec. Graphics. 14:33–38. [68] Karas, M. and F. Hillenkamp. 1988. Laser desorption ionization of proteins with molecular masses exceeding 10000 daltons. Anal. Chem. 60:2299–2301. [69] Hillenkamp, F. and M. Karas. 2000. Matrix-assisted laser desorption/ionisation, an experience. Int. J. of Mass Spect. 200:71–77. [70] Karas, M., U. Bahr, I. Fournier, M. Gluckmann, and A. Pfenninger. 2003. The initial-ion velocity as a marker for different desorption-ionization mechanisms in maldi. Int. J. of Mass Spect. 226:239–248. [71] Wind, M. and W. Lehmann. 2004. Element and molecular mass spectrometry - an emerging analytical dream team in the life sciences. J. Anal. At. Spect. 19:20–25. [72] Fenn, J., M. Mann, C. Meng, S. Wong, and C. Whitehouse. 1989. Electrospray ionization for mass-spectrometry of large biomolecules. Science. 246:64–71. [73] Bröndsted-Nielsen, S., J. Andersen, P. Hvelplund, B. Liu, and S. Tomita. 2004. Biomolecular ions in accelerators and storage rings. J. Phys. B: At. Mol. Opt. Phys. 37:25–56. [74] Mülberg, A. 2004. Protein Folding. St. Petersburg University Press. [75] 2010. Protein data bank. http://www.rcsb.org/. 159 [76] Rubin, A. 2004. Biophysics: Theoretical Biophysics. Moscow University Press "Nauka". [77] Head-Gordon, T., M. Head-Gordon, M. Frisch, C. Brooks, and J. Poplet. 1991. Teoretical-study of blocked glycine and alanine peptide analogs. J. Am. Chem. Soc. 113:5989–5997. [78] Gould, I., W. Cornell, and I. Hillier. 1994. A quantum-mechanical investigation of the conformational energetics of the alanine and glycine dipeptides in the gas-phase and in aqueous-solution. J. Am. Chem. Soc. 116:9250–9256. [79] Wang, Z. and Y. Duan. 2004. Solvation effects on alanine dipeptide: A mp2/ccpvtz//mp2/6-31g** study of (phi, psi) energy maps and conformers in the gas phase, ether, and water. J. Comp. Chem. 25:1699–1716. [80] Perczel, A., O. Farkas, I. Jákli, I. Topol, and I. Csizmadia. 2003. Peptide models. 13. extrapolation of low-level hartree-fock data of peptide conformation to large basis set scf, mp2, dft, and ccsd(t) results. the ramachandran surface of alanine dipeptide computed at various levels of theory. J. Comp. Chem. 24:1026–1042. [81] Húdaky, I., P. Húdaky, and A. Perczel. 2004. Solvation model induced structural changes in peptides. a quantum chemical study on ramachandran surfaces and conformers of alanine diamide using the polarizable continuum model. J. Comp. Chem. 25:1522–1531. [82] Improta, R. and V. Barone. 2004. Assessing the reliability of density functional methods in the conformational study of polypeptides: The treatment of intraresidue nonbonding interactions. J. Comp. Chem. 25:1333–1341. [83] Vargas, R., J. Garza, B. Hay, and D. Dixon. 2002. Conformational study of the alanine dipeptide at the mp2 and dft levels. J. Phys. Chem. A. 106:3213–3218. 160 [84] Kaschner, R. and D. Hohl. 1998. Density functional theory and biomolecules: A study of glycine, alanine, and their oligopeptides. J. Phys. Chem. A. 102:5111– 5116. [85] Wei, D., H. Guo, and D. Salahub. 2001. Conformational dynamics of an alanine dipeptide analog: An ab initio molecular dynamics study. Phys. Rev. E. 64:011907–(1–4). [86] Wu, X. and S. Sung. 1999. Simulation of peptide folding with explicit water - a mean solvation method. Proteins: Structure, Function and Genetics. 34:295. [87] Pliego-Pastrana, P. and M. Carbajal-Tinoco. 2003. Effective pair potentials between protein amino acids. Phys. Rev. E. 68:011903. [88] Mu, Y. and G. Stock. 2002. Conformational dynamics of trialanine in water: A molecular dynamics study. J. Phys. Chem. B. 106:5294–5301. [89] Mu, Y., D. Kosov, and G. Stock. 2003. Conformational dynamics of trialanine in water. 2. comparison of amber, charmm, gromos, and opls force fields to nmr and infrared experiments. J. Phys. Chem. B. 107:5064–5073. [90] Nguyen, P. and G. Stock. 2003. Nonequilibrium molecular-dynamics study of the vibrational energy relaxation of peptides in water. J. Chem. Phys. 119:11350– 11358. [91] Torii, H. and M. Tasumi. 1998. Ab initio molecular orbital study of the amide 1 vibrational interactions between the peptide groups in di- and tripeptides and considerations on the conformation of the extended helix. Journ. of Ram. Spect. 29:81–86. [92] Schweitzer-Stenner, R., F. Eker, Q. Huang, and K. Griebenow. 2001. Dihedral angles of trialanine in d2o determined by combining ftir and polarized visible raman spectroscopy. J. Am. Chem. Soc. 123:9628–9633. 161 [93] Levy, Y. and O. Becker. 2001. Energy landscapes of conformationally constrained peptides. J. Chem. Phys. 114:993–1009. [94] Shi, Z., C. Olson, G. Rose, R. Baldwin, and N. Kallenbach. 2002. Polyproline 2 structure in a sequence of seven alanine residues. Proc. Natl. Acad. Sci. USA. 99:9190–9195. [95] Garcia, A. 2004. Characterization of non-alpha helical conformations in ala peptides. Polymer. 45:669–676. [96] Bax, A. 2003. Weak alignment offers new nmr opportunities to study protein structure and dynamics. Prot. Sci. 12:1–16. [97] Sheik, S., P. Sundararajan, A. Hussain, and K. Sekar. 2002. Ramachandran plot on the web. Bioinformatics. 18:1548–1549. [98] Solov’yov, I., A. Yakubovich, A. Solov’yov, and W. Greiner. 2006. On the fragmentation of biomolecules: fragmentation of alanine dipeptide along the polypeptide chain. J. Exp. Theor. Phys. 103:463–471. [99] Landau, L. and E. Lifshitz. 1959. Statistical Physics. London-Paris, Pergamon Press. [100] Krimm, S. and J. Bandekar. 1980. Vibrational analysis of peptides, polypeptides, and proteins. v. normal vibrations of β-turns. Biopolymers. 19:1–29. [101] Nowak, C., V. G. Rostiashvilli, and T. A. Viglis. 1967. Globular structures of a helix-coil copolymer: Self-consistent treatment. J. Chem. Phys. 46:4410–4426. [102] Muñoz, V. 2007. Conformational dynamics and ensembles in protein folding. Annu. Rev. Biophys. Biomol. Struct. 36:395–412. [103] Dill, K. A., S. B. Ozkan, M. S. Shell, and T. R. Weikl. 2008. The protein folding problem. Annu. Rev. Biophys. 37:289–316. 162 [104] Onuchic, J. N. and P. G. Wolynes. 2004. Theory of protein folding. Curr. Op. Struct. Biol. 14:70–75. [105] Prabhu, N. V. and K. A. Sharp. 2006. Protein-solvent interactions. Chem. Rev. 106:1616–1623. [106] Noetling, B. and D. A. Agard. 2008. How general is the nucleationcondensation mechanism? Proteins. 73:754–764. [107] Yakubovich, A., A. Solov’yov, and W. Greiner. 2009. Statistical mechanics model for protein folding. AIP Conf. Proc. 1197:186–200. [108] Yakubovich, A., A. Solov’yov, and W. Greiner. 2010. Conformational changes in polypeptides and proteins. Int. J. Quant. Chem. 110:257–269. [109] Kumar, S., C.-J. Tsai, and R. Nussinov. 2002. Maximal stabilities of reversible two-state proteins. Biochemistry. 41:5359–5374. [110] Griffith, J. H. and H. Scheraga. 2004. Statistical thrmodynamics of aquesous solutions. i. water structure, solutions with non-polar solutes, and hydrophobic ineractions. J. Mol. Struc. 682:97–113. [111] Bakk, A., J. S. Hoye, and A. Hansen. 2002. Apolar and polar solvation thermodynamics related to the protein unfolding process. Biophys J. 82:713–719. [112] Griko, Y., P. Privalov, J. Aturtevant, and S. Venyaminov. 1988. Cold denaturation of staphyloccocal nuclease. Proc. Natl. Acad. Sci. USA. 85:3343– 3347. [113] Privalov, P. 1997. Thermodynamics of protein folding. Journal Of Chemical Thermodynamics. 29:447–474. [114] Cubrovic, M., O. Obolensky, and A. Solov’yov. 2009. Semistiff polymer model of unfolded proteins and its application to nmr residual dipolar couplings. Eur. Phys. J. D. 51:41–49. 163 [115] Makhatadze, G. and P. Privalov. 1993. Contribution to hydration to protein folding thermodynamics. i. the enthalpy of hydration. J. Mol. Biol. 232:639–659. [116] Chen, J., Z. Lu, J. Sakon, and W. Stites. 2000. Increasing the thermostability of staphylococcal nuclease: implications for the origin of protein thermostability. J.Mol.Biol. 303:125–130. [117] Evans, S. and G. Brayer. 1990. High-resolution study of the three-dimensional structure of horse heart metmyoglobin. J.Mol.Biol. 213:885–897. [118] Cotton, F. A., J. Edward E. Hazen, and M. J. Legg. 1979. Staphylococcal nuclease: Proposed mechanism of action based on structure of enzyme-thymidine 3’,5’-bisphosphate-calcium ion complex at 1.5-a resolution. Proc. Natl. Acad. Sci. USA. 76:2551–2555. [119] Russel, W., D. Saville, and W. Schowalter. 1989. Colloidal Dispersions. Cambridge University Press. [120] Mallik, B. and T. L. A. Masunov. 2002. Distance and exposure dependent effective dielectric function. J. Comp. Chem. 23:1090–1099. [121] Zhou, H.-X. 2002. Residual charge interactions in unfolded staphylococcal nuclease can be explained by the gaussian-chain model. Biophys J. 83:2981– 2986. [122] Collman, J. P., R. Boulatov, C. J. Sunderland, and L. Fu. 2004. Functional analogues of cytochrome c oxidase, myoglobin, and hemoglobin. Chem. Rev. 104:561–588. [123] Shortle, D. and M. S. Ackerman. 2001. Persistence of native-like topology in a denatured protein in 8 m urea. Science. 293:487–489. 164

КОНФОРМАЦИОННЫЕ ПЕРЕХОДЫ В БЕЛКАХ И ПОЛИПЕПТИДАХ

Related documents

Products

Support

КОНФОРМАЦИОННЫЕ ПЕРЕХОДЫ В БЕЛКАХ И ПОЛИПЕПТИДАХ

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib