Document 676927

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОУВПО “Челябинский государственный университет”
УДК 541.69:541.572+615.781.6
Код ГРНТИ 31
УТВЕРЖДАЮ
Ректор ГОУВПО “ЧелГУ”
д.э.н., профессор Шатин А.Ю.
“____” ______________ 2008 г.
_________________________
подпись
М.П.
ОТЧЕТ
по проекту: Создание параллельной версии программного комплекса для дизайна
супрамолекулярных комплексов органических соединений
вид отчета: итоговый
Руководитель проекта: _________________________(к.х.н., доцент Потемкин В.А.)
подпись
г. Челябинск 2008 г.
СПИСОК ОСНОВНЫХ ИСПОЛНИТЕЛЕЙ
Научный руководитель,
<Потемкин В.А.>
подпись, дата
<к.х.н., доцент>
с.н.с.
<к.х.н., доцент>
подпись, дата
с.н.с.
<к.х.н., доцент>
подпись, дата
м.н.с.
<аспирант>
подпись, дата
м.н.с.
<аспирант>
подпись, дата
м.н.с.
<аспирант>
подпись, дата
лаборант
<студент>
подпись, дата
<Гришина М.А.>
<Ефремова О.А.>
<Ившина Н.Н.>
<Тореева Н.А.>
<Афонькина Е.С.>
<Галимова О.Р.>
2
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
7
I. МЕТОДЫ МОДЕЛИРОВАНИЯ СУПРАМОЛЕКУЛЯРНЫХ КОМПЛЕКСОВ
8
I.1. Приближение супермолекулы
8
I.2. Дискретные модели для учета влияния растворителя
9
I.3. Моделирование комплексов в рамках континуумных подходов
11
II. ПРЕДЛАГАЕМЫЕ ПОДХОДЫ К МОДЕЛИРОВАНИЮ СТРОЕНИЯ И СВОЙСТВ
СУПРАМОЛЕКУЛЯРНЫХ СОЕДИНЕНИЙ
16
II.1. Генетический алгоритм Mech для прогноза строения и свойств молекулярных
ассоциатов в органических веществах
16
II.2. Алгоритм MOPS для моделирования строения и свойств ассоциатов
конформационно подвижных молекул
23
III. РЕАЛИЗАЦИЯ ПРОТОТИПОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ
МОДЕЛИРОВАНИЯ СТРОЕНИЯ И СВОЙСТВ СУПРАМОЛЕКУЛЯРНЫХ
СОЕДИНЕНИЙ
28
III.1. Технология распараллеливания OpenTS
28
III.2. Использование Т-Системы с открытой архитектурой (OpenTS) для
28
распараллеливания
III.3. Реализация параллельного прототипа алгоритма MOPS
29
III.3.1. Учет периодических граничных условий для моделирования
квазибесконечных кристаллических структур супрамолекулярных комплексов
34
III.4. Реализация параллельного прототипа алгоритма BiS
36
III.5. Программа и методика испытаний системы BiS (ПС BiS)
44
III.5.1. Состав предъявляемой программной документации
44
III.5.2. Технические требования
45
III.5.3. Порядок проведения испытаний
45
III.5.4. Методы испытаний
47
III.6. Сравнение производительностей последовательной версии программы с
51
параллельной Т-версией программы
IV. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ ПОСТАВЛЕННЫХ ЗАДАЧ
56
IV.1. Моделирование комплексов акриданов с окислителями
56
IV.2. Моделирование водного окружения двойной спирали ДНК
63
IV.3. Исследование комплексов “хозяин - гость” для газовых гидратов
68
3
IV.4. Исследование механизма туберкулостатического действия гетероциклических
соединений с подандной цепью
73
ВЫВОДЫ
77
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ
79
4
Реферат
Отчет 84 с., 32 рис., 6 табл., 78 источников.
Проведен
анализ
научно-технической
литературы
и
других
материалов,
относящихся к разрабатываемой теме. Произведен подбор алгоритмов для решения задач
виртуального дизайна супрамолекулярных комплексов и обоснование способов решения
поставленных задач. Проведено сопоставление ожидаемых показателей предполагаемого
ПО с существующими показателями аналогичных методов. Осуществлен выбор объектов
исследования – новых перспективных материалов для расчета. Разработана общая
методика создания ПО для решения задач виртуального дизайна супрамолекулярных
комплексов. Разработаны параллельные прототипы ПО MOPS и BiS для решения задач
виртуального дизайна супрамолекулярных комплексов. Проведены тестовые расчеты для
получения
конкретных
значений
энергетических
и
геометрических
параметров
супрамолекулярных комплексов. Произведено моделирование комплексов производных
акридана с окислителями. На основе проведенных исследований предложен механизм
окисления акриданов. Поскольку акриданы являются модельной системой для имитации
никотинамидадениндинуклеотидов (НАДН) – основных участников энергообеспечения
клеток, предложен новый механизм окисления НАДН. Проведено моделирование
комплекса
ДНК
с
водным
окружением
и
лекарственными
средствами
класса
противоопухолевых ДНК-антиметаболитов (14 комплексов). Геометрия полученных
комплексов хорошо согласуется с известными данными рентгеноструктурного анализа.
Показано, что наиболее активные лекарственные средства незначительно изменяют
геометрию свободной ДНК и ее водного окружения, что является важным для дизайна
новых
перспективных
противоопухолевых
лекарственных
средств
класса
ДНК-
антиметаболитов. В рамках параллельной версии алгоритма MOPS смоделированы
клатратные гидратные комплексы гексафторида серы в воде. Структура модельных
комплексов подтверждена на настоящий момент данными рентгеноструктурного анализа,
структурной
нейтронографии,
ИК
и
КР-спектроскопии.
Воспроизведен
ряд
термодинамических характеристик данных комплексов, в частности энтальпии плавления
и их зависимость от давления. Подготовлены интерфейсные подпрограммы для процедур
ввода исходных данных, их предварительной обработки и вывода конечных результатов
моделирования.
Созданы
супрамолекулярных
подпрограммы
комплексов
и
учета
наносистем;
конформационной
созданы
подвижности
подпрограммы
учета
поливариантности структур супрамолекулярных комплексов и наносистем; введены
5
периодические
граничные
условия
для
моделирования
квазибесконечных
кристаллических структур супрамолекулярных комплексов. Произведен дизайн и
моделирование супрамолекулярных комплексов и наносистем с учетом конформационной
подвижности, поливариантности
структур
Произведено
известных
сопоставление
и периодических граничных
экспериментальных
условий.
данных
для
супрамолекулярных комплексов с результатами моделирования. Составлены программа и
методика испытаний программного обеспечения. Проведены испытания программного
обеспечения на суперкомпьютерах семейства СКИФ в среде OpenTS.
6
ВВЕДЕНИЕ
Параллельные вычислительные машины на основе кластерных технологий,
возникшие для высокопроизводительных научных вычислений, получают всё более
широкое распространение. Этому способствуют как непрерывное падение цен на них, так
и постоянное усложнение решаемых задач.
Для программирования на кластерных установках используется интерфейс MPI
(Message Passing Interface).
В то же время, современные технологии высокоуровневого распараллеливания
программ для мультикомпьютерных систем являются привлекательной альтернативой
классическому MPI.
По нашему мнению, новейшие технологии высокоуровневого распараллеливания
могут использоваться для получения эффективных и надежных реализаций многих
реальных
суперкомпьютерных
приложений,
значительно
сокращают
усилия
на
программирование в сравнении с использованием просто MPI.
В данной работе мы рассматриваем программу для расчёта лекарственных средств
и
использование
Т-Системы
с
открытой
архитектурой
(OpenTS)
для
её
распараллеливания. Последовательная версия программы реализована на языке Fortran.
7
I. МЕТОДЫ МОДЕЛИРОВАНИЯ СУПРАМОЛЕКУЛЯРНЫХ
КОМПЛЕКСОВ
Согласно классификации Дж.Томази и М.Персико [1] методы моделирования
комплексов делятся на 4 вида: первая группа методов использует термодинамические
вириальные функции; вторая – использует континуальный учет взаимодействия данной
молекулы с окружением; третья группа относится к молекулярным подходам, где
осуществляется непосредственное моделирование комплексов молекул; четвертая группа
– молекулярно-динамическое моделирование больших ансамблей частиц. У каждого из
видов
моделирования
имеются
свои
достоинства
и
недостатки.
Наиболее
распространенные подходы отражены в данной главе.
I.1. Приближение супермолекулы
Для учета влияния специфической сольватации, образования супрамолекулярных
комплексов с катализатором, реагентом в методах квантовой химии и молекулярной
механики широкое применение получило приближение супермолекулы, которое основано
на явном включении большого числа молекул среды в систему, которая рассчитывается
квантово-химическим методом или методами молекулярной механики [2 - 4]. При этом
изучение взаимодействий в системах реагент-растворитель, реагент-катализатор, реагентсубстрат производится построением наиболее выгодных комплексов и оценкой
характеристик таких комплексов.
В большинстве работ с использованием приближения супермолекулы авторы
придерживаются следующей схемы [5]:
1)
Детально изучается взаимодействие компонентов комплекса. Этот
этап включает приближение одной молекулы к другой с различных направлений,
вращение вокруг собственных локальных осей и вокруг второй молекулы, что
позволяет получить данные об основных наиболее выгодных взаимных
расположениях, энергиях взаимодействия в этих положениях, расстояниях между
молекулами и их возможной подвижности. Под ней понимают форму
потенциальной поверхности при таких удалениях молекул от положения
равновесия, когда все связи, существовавшие в положении равновесия,
разорваны. На этом же этапе получают информацию о том, в каких положениях
молекулы существенно изменяют свойства, интересующие авторов.
8
2)
Изучается влияние появления третьей, четвертой и т.д. молекул на
строение комплекса и уточняются данные комплексообразовании. На этом этапе
увеличивают число молекул. При этом, в систему могут включаться и инородные
молекулы, например, молекулы растворителя. В таком случае используют данные
о положении локальных минимумов, полученных на первом этапе, и лишь
уточняют положение молекул растворителя.
3)
В изучаемую схему вводится максимально возможное число
молекулы, для которого удается выполнить расчет. Для такой супермолекулы
вычисляются все интересующие авторов величины.
Аналогичным образом могут быть построены комплексы реагента с катализатором,
субстратом. Однако следует отметить, что применение данного подхода требует
значительных затрат времени и не всегда возможно. Связано это, прежде всего, с тем, что
в молекулах, входящих в состав супрамолекулярного комплекса, может быть несколько
центров ассоциации, и даже построение комплексов из двух молекул может привести к
значительному количеству структур. Поэтому построение структур ассоциатов часто
производится методами молекулярной динамики и Монте-Карло [6 – 9]. В этом случае
методы квантовой химии и молекулярной механики используются на стадии оптимизации
геометрии полученного ассоциата и расчете его характеристик. Однако использование
данного подхода возможно для построения комплексов, в состав которых входит
ограниченное число молекул, поскольку рассмотрение систем, включающих большое
количество атомов, требует значительных затрат расчетного времени. С целью
сокращения расчетного времени разработаны так называемые дискретные теории,
которые
также
позволяют
учитывать
максимально
возможное
число
молекул
растворителя, однако последние рассматриваются в несколько упрощенной форме.
I.2. Дискретные модели для учета влияния растворителя
Примером применения дискретных моделей является рассмотрение водных
растворов на основе ST-2 модели молекул воды Штилленгера и Рамана [3]. Согласно этой
модели, каждая молекула воды включает четыре точечных заряда, расположенных внутри
простой сферы Леннард-Джонса. В случае жесткой ST2-модели четыре точечных заряда
расположены в вершинах тетраэдра, в центре которого находится атом кислорода. Два из
этих зарядов положительны (+0.2357 е) – атомы водорода, и два отрицательны (-0.2357 е)–
обозначают неподеленные электронные пары атома кислорода. Модель может быть
гибкой, если ввести растяжение ОН-связи и изменение угла НОН.
9
Взаимодействие между молекулами воды описывается потенциалом ЛеннардДжонса, к которому добавлен член, учитывающий электростатическое взаимодействие:
V H 2O  H 2O
 
 4 W  W
 rO1O2

12


   W

 rO O

 1 2




6

4 q1q 2
   i j S (rO O ) ,
1 2
 i , j 1 rij

где q1i и q2j - заряды на атомах водорода или электронной паре кислорода первой и
второй молекул воды. Величины W и W являются параметрами данного уравнения
(W=0.317 кДж/моль, W=3.10 Å).
Функция S-это «функция переключения», моделирующая электростатическое
взаимодействие таким образом, что суммарное поведение имитирует мягкие заряженные
сферы на расстояниях, больших RU=3.128 Å, и жесткие незаряженные сферы на
расстояниях, меньших RL=2.016 Å:
0  r  RL
0

2
 (r  R L ) (3RU  R L  2r )
S (r )  
R L  r  RU
3
(
R

R
)
U
L

1
RU  r
Взаимодействие
растворенного
вещества
с
растворителем
описывается
потенциалом Леннард-Джонса с поправкой на электростатические взаимодействия:
V H 2O  раств.в  в о


 4  W  
пов сем атомам 

раст.в  в а
 
  

 rO
12

 
  

 rO



6
 4 q j q

 j 1 r j



W   
2
где q - заряд атома  в молекуле растворенного вещества. Величины  и 
являются параметрами, зависящими от сорта атома.
Использование данного подхода во многих случаях позволяет неплохо описать
свойства соединений с учетом влияния растворителя, однако его применение ограничено
необходимостью введения параметров молекул ( и ). Поэтому предложено
использование полуконтинуумных теорий, позволяющих учитывать в явном виде
10
молекулы растворителя, расположенные вокруг молекулы растворенного вещества в
первом слое или нескольких первых сольватных слоях, т.е. первые сольватные слои
считаются дискретными. Остальная часть растворителя рассматривается как непрерывная
среда (континуум).
I.3. Моделирование комплексов в рамках континуумных подходов
Наиболее современными методами моделирования являются методы, основанные
на применении теории Синаноглу [2, 3, 5, 7] для описания систем, в которых отсутствуют
специфические взаимодействия (образование водородных связей, комплексов с переносом
заряда и других стабилизированных аддуктов) и не проявляется поляризующее влияние
среды на молекулу. В этом случае полная энергия растворенной молекулы представляется
в виде:
E=E0+ES (1)
где E0 - энергия изолированной молекулы; ES - энергия взаимодействия
растворенной молекулы со средой.
Величину ES можно представить как сумму следующих членов:
ES=Ees+Edisp+Ecav+Erep (2)
где
Ees
-
электростатическая
энергия
взаимодействия
постоянного
и
индуцированного дипольных моментов молекулы с окружением; Edisp - дисперсионная
энергия; Ecav - энергия образования полости в диэлектрике, в которую помещается
растворенная молекула (энергия кавитации); Erep - энергия отталкивания валентно
несвязанных атомов.
Существенным
недостатком
соотношения
(1)
является
предположение
о
неизменности электронной структуры растворяемой молекулы при переходе из
«свободного пространства» в раствор, т.е. E0 считается постоянной. Однако в
действительности она может существенно меняться. Эта проблема может быть решена с
включением в гамильтониан дополнительного члена Û , учитывающего все члены в
разложении (2)
Hˆ  Hˆ 0  Uˆ
11
где Ĥ 0 - гамильтониан изолированной молекулы; Û - оператор, описывающий
взаимодействие растворенной молекулы со средой.
Поскольку такая схема требует значительных затрат машинного времени, поэтому
чаще всего ограничиваются учетом только электростатических взаимодействий. Эта
составляющая является наиболее существенной. Для ее вычисления предложено два
подхода. Один из них – так называемый «несамосогласованный» – вычисляет E с
волновыми функциями, полученными из расчета изолированной молекулы [5]. Во втором,
«самосогласованном» подходе решается полная многоэлектронная задача [5]:
H   E ,
электронный гамильтониан которой представляет собой сумму гамильтониана молекулы в
газовой фазе (H0) и члена, учитывающего взаимодействие со средой (HS):
H  H 0  H S
Определение гамильтониана HS требует введения ряда модельных представлений о
характере взаимодействий растворенной молекулы с растворителем.
Исторически первым из них был метод точечных диполей [2, 5]. В рамках этого
подхода HS представляется в виде:
HS 
D N
Z  r 
1  D M  d rdi
  3   n 3d dn 
f  d i rdi
rdn 
d
n
где d – дипольный момент молекулы растворителя, rdi rdn – расстояния дипольэлектрон диполь-ядро соответственно, и суммирование ведется по диполям D, электронам
M и ядрам N, f – масштабный фактор.
Недостатком данного подхода является то, что он не учитывает размеров молекул
окружения, что может быть очень важным.
Этого недостатка лишен метод точечных зарядов [2, 5]. В данной модели
HS 
K N
Z q
1  K M qk
 
  n k
f  k i rik
rnk
k
n



k нумерует точечные заряды.
12
Сложность методов точечных зарядов и точечных диполей заключается в
определении наиболее подходящих мест расстановки точечных диполей или зарядов
вокруг рассматриваемой молекулы. Решение этой проблемы предложил Клопман [2, 3].
Он сольватную модель, согласно которой каждый атом молекулы окружен воображаемой
частицей «сольватоном», заряд которого равен по величине, но противоположен по знаку
заряду атома молекулы, с которым сольватон контактирует. Для атома с суммарным
зарядом qA и радиусом rA, энергия взаимодействия с сольватоном, обладающим зарядом -
qA, определяется формулой:

U  

1  (q A ) 2
(1  1 /  )

2  rA
Позже эта модель была доработана Констансиэлем и Тапиа [3]. В результате, была
получена модель «виртуального заряда», согласно которой в присутствии молекулы,
несущей поляризующий заряд Q0, поляризованное окружение образует на поверхности
полости внешний «виртуальный» заряд Q:
Q=Q0
где выражение для  подобрано эмпирически:   (1  1 /  ) .
Полная энергия взаимодействия молекулы с окружением равна:
Q02 Q0 Q Q 2
Q02
U


 U0 
(2   )
2a
a
2a
2a
где a – радиус полости, U0 – энергия растворенного вещества в вакууме. Разность U
и U0 дает энергию сольватации частицы.
В методе самосогласованного поля реакции (SCRF) точно рассчитывается реакция
окружения на поляризующее действие комплексообразователя. Молекулу можно
представить как n точечных зарядов qi, расположенных в точках ri внутри сферы с
радиусом a. Выражение для потенциала в точке P (определяемой вектором r) было
определено Кирквудом как [3, 5]:
13
 q
q
V (r )    i  i
a
i 
 r  ri
l

(l  1)(1   )  rri 
 2  Pl (cos  i ) (3)

l  0  ( l  1)  l  a 


Первый член есть кулоновский потенциал в вакууме, а второй член – потенциал,
создаваемый в точке P диэлектриком-континуумом.
Потенциальная энергия взаимодействия молекулы с окружением определяется как:
U
1
 (r )V (r )d
2
где ( r) – зарядовое распределение в молекуле,
или выражением с использованием дискретных зарядов.
U
1
 q iV (ri ) (4)
2 i
Для молекулярной системы с ядрами зарядом ZA, находящимся при RA, и
электронами при ri уравнения (3 и 4) можно использовать для получения общего
выражения для U.
Подставляя
члены,
соответствующие
ядер-ядерному,
электрон-ядерному
и
электрон-электронному взаимодействиям. Представляя соответствующий оператор U в
виде суммы членов, соответствующих ядер-ядерному, электрон-ядерному и электронэлектронному взаимодействиям, получим:
l
l
l

N M

 (l  1)(1   )  1  1 N
1 M  ri rj 
 RA RB 
 RAri 


U  
Z
Z
P
(cos

)

Z
P
(cos

)

P (cos ij ) 


AB
A
Ai
   A B 2  l
2  l
2  l


2 i, j  a 
 a 
 a 
l  0   (l  1)  l  a 2 A, B
A
i


В этом уравнении N нумерует ядра, M-электроны, при этом положении ядер (RA,
RB) полагаются фиксированными.
Дисперсионная энергия может быть рассчитана по модифицированному варианту
теории Синаноглу [5], согласно которому Edisp представляется в виде суммы по
дискретным cлоям, окружающим молекулу a.

E disp   Vabeff (rn ) Z n
n 1
14
где Zn – число молекул окружения в n-ом слое, rn – эффективный радиус n-го слоя,
а Vabeff – эффективный межмолекулярный потенциал.
Vabeff (r )  Vab (r ) Bab (r )
Здесь Vab – потенциал, описывающий газофазное взаимодействие между
молекулами a и b, а Bab учитывает изменение межмолекулярного взаимодействия при
переносе в конденсированную фазу.
Возможные виды потенциала описаны в работах [9, 10], при этом кроме
дискретного подхода возможна и интегральная форма для расчета Edisp, однако ее
недостатком
является
необходимость
введения
масштабного
коэффициента,
вычисляемого из эмпирических данных.
Вклад
кавитационной
энергии
считается
пропорциональным
A,
где
-
поверхностное натяжение среды, A – площадь поверхности образовавшейся полости,
которая в сферическом случае определяется через объем (V) или радиус сферы (a) как:
A=4,835V2/3=4a2
С учетом того, что при расчетах необходима не макроскопическая величина A, а ее
микроскопический аналог, имеем следующее выражение для расчета Ecav:
 d ln  1 2

E cav  4,835 AVa2 / 3 K b (Vb / Va ) 1 
 GT 
d ln T 3


Kb – константа, зависящая от соотношения эффективных объемов (Vb/Va) –
молекул и обеспечивающая переход от плоской макроповерхности к сферической
микроскопических размеров. Выражение в квадратных скобках учитывает коэффициент
температурного
расширения
среды.
Данный
подход
лежит
в
основе
широко
используемого метода, названного Polarizable Continuum Model (PCM) [11, 12].
Таким образом, применение данных подходов может быть использовано для
оценки влияния растворителя, катализатора, реагента на реакционную способность
вещества. Данные подходы требуют введения ряда модельных представлений, что
снижает надежность методов. Поэтому был предложен ряд оригинальных подходов к
моделированию супрамолекулярных комплексов.
15
II. ПРЕДЛАГАЕМЫЕ ПОДХОДЫ К МОДЕЛИРОВАНИЮ СТРОЕНИЯ И
СВОЙСТВ СУПРАМОЛЕКУЛЯРНЫХ СОЕДИНЕНИЙ
II.1. Генетический алгоритм Mech для прогноза строения и свойств
молекулярных ассоциатов в органических веществах
На настоящий момент для решения задач прогноза строения и свойств
супрамолекулярных комплексов активно используются методы молекулярной механики и
Монте-Карло, позволяющие выявить возможные варианты комплексов, энергии и
вероятности их образования, времена жизни. К настоящему времени проведено
достаточно большое число серьезных исследований структуры таких систем [5 – 9].
Однако методы молекулярной динамики и Монте-Карло требуют чрезвычайной точности
в использовании силового поля, корректности в учете взаимодействий, серьезного
компьютерного времени, что позволяет решать многие вопросы глобальной структуры, но
во многом ограничивает возможности рассмотрения частных задач строения, свойств и
реакционной способности.
Другой распространенный метод заключается в примерном предположении состава
и структуры комплекса и последующей оптимизации геометрии предполагаемой
структуры в рамках тех или иных методов (атом-атомных потенциальных функций,
молекулярной механики, квантовохимических методов). Однако данный метод имеет ряд
недостатков. Так априорное предположение примерной структуры комплекса возможно
лишь для относительно несложных соединений и для малых систем (димеров, тримеров).
В случае же полифункциональных соединений не всегда представляется возможным
разумно предположить структуру даже димера. В этом случае производится серия
попыток построить вторую молекулу с разных сторон и в различной ориентации по
отношению к первой. Понятно, что такая процедура является достаточно трудоемкой и не
застрахованной от ошибок объективного и субъективного характера (неверное исходное
предположение структуры). Кроме того, в этом случае может быть смоделирован один
или несколько комплексов, в то время как в веществе вариантов ассоциированных
структур может быть значительно больше. В то же время данный метод поиска может
быть в существенной степени модифицирован, а риск совершения ошибки субъективного
характера
существенно
снижен
путем
использования
генетических
алгоритмов
оптимизации.
Если считать молекулы жесткими и расположить центр масс первой молекулы в
центре координат, то далее для построения димера требуется определить расположение и
16
ориентацию второй молекулы относительно первой. Предположить строение димера
удобно в сферических координатах. Для этого достаточно задать расположение второй
молекулы с помощью углов θ2 и φ2, образуемых с координатными осями прямой,
соединяющей центры масс молекул, а также ориентацию в виде углов поворота α2, β2 и γ2
относительно ее главных осей вращения, как показано на Рис. 1.
Если углы θ2, φ2, α2, β2 и γ2 предположены правильно, то далее задача построения
димера сводится к одномерной минимизации энергии по длине радиус-вектора R2,
соединяющего центры масс молекул. Таким образом, параметры θ2, φ2, α2, β2 и γ2
определяют строение димера с точностью до расстояния между центрами масс. Тогда для
построения тримера достаточно иметь набор параметров θ2, φ2, α2, β2 и γ2 для второй
молекулы и θ3, φ3, α3, β3 и γ3 для третьей молекулы, а затем произвести оптимизацию по
Z
γ2
R2
θ
Y
2
φ
β
2
2
α
X
2
Рис. 1
Параметры оптимизации в димере
двум параметрам R2 и R3. Аналогично можно строить тетрамер и высшие ассоциаты.
Наибольшей проблемой при этом остается удачный выбор угловых величин θ i, φi, αi, βi и
γi. Обычно этот выбор во многом определяется интуицией и опытом исследователя.
Однако
в
нетривиальных
случаях
полифункциональных
соединений
примерное
расположение молекул является неочевидным. Довольно простым примером может
служить, например, взаимное расположение и ориентация двух молекул глицерина (Рис.
1). В этом случае можно перебрать несколько вариантов примерного взаимного
расположения и ориентации частиц, тогда данная задача во многом приобретает
комбинаторный характер, что используется в некоторых известных подходах [13].
17
Однако, в отличие от традиционной комбинаторики, параметры взаимного
расположения и ориентации являются не дискретными. В таких случаях для построения
ассоциата может быть использован алгоритм Монте-Карло, в котором, в качестве
параметров оптимизации выступают параметры взаимного расположения и ориентации
{θ, φ, α, β, γ}. Такие подходы достаточно распространены на настоящий момент, однако
достаточная надежность определения структуры комплекса достигается лишь при
большом
числе
шагов.
Поэтому
в
данной
работе
предложено
использование
генетического алгоритма оптимизации для поиска наиболее энергетически выгодных
структур комплексов.
В терминологии генетических алгоритмов [14, 15] набор параметров оптимизации
(в данном случае {θ, φ, α, β, γ}) носит название “генетического кода” ассоциата, каждый
параметр оптимизации которого выполняет, в таком случае, роль “гена”. Комплекс из N
молекул, таким образом, описывается набором из 5(N-1) генов.
Поскольку
строение
ассоциата
заведомо
неизвестно,
то
первоначально
используется набор случайных структур ассоциата, то есть набор из М множеств
параметров ассоциата {θ, φ, α, β, γ}1, {θ, φ, α, β, γ}2, {θ, φ, α, β, γ}3, …, {θ, φ, α, β, γ}М.
Данный набор множеств в генетических алгоритмах носит название “популяции”. Размер
популяции зависит от решаемой задачи, величины генетического кода и обычно
составляет от ста до сотен тысяч. Для каждой из полученных структур производится
оптимизация длин радиус-векторов Rj и вычисляется потенциальная энергия в рамках
того или иного силового поля. То есть каждому набору параметров оптимизации {θ, φ, α,
β, γ}i соответствует энергия Ei. Для каждой структуры i вычисляется вероятность ее
обнаружения (pi) в веществе среди всех прочих полученных случайных структур:
pi 
exp(  E i / kT )
M
 exp(  E
j 1
j
/ kT )
Из популяции выбирается пара “родителей”, то есть две структуры комплексов и,
соответственно, два множества параметров оптимизации {θ, φ, α, β, γ}j и {θ, φ, α, β, γ}k.
Выбор родителей осуществляется случайно с учетом их вероятности pi. Далее
производится операция “скрещивания”. При этом случайный участок генетического кода
одного из родителей заменяет соответствующий участок у другого, как это показано на
Рис. 2.
18
Рис. 2
Процедура “скрещивания” в генетическом алгоритме
При этом у полученных в результате “детей” может возникнуть “мутация”, то есть
величина одного из параметров оптимизации, заключенная в случайно выбранном гене,
заменяется на случайное значение. Таким образом, путем “скрещивания” и “мутации”
создается новая пара множеств параметров структур супрамолекулярных соединений
(новое “поколение”, в терминологии генетических алгоритмов). Для вновь полученных
наборов параметров в декартовых координатах формируются структуры комплексов,
производится оптимизация длин радиус-векторов и вычисляется потенциальная энергия.
Если вновь полученная структура имеет более низкую энергию, чем какая-либо структура
популяции, то она заменяет одну из менее выгодных структур в “популяции” (слабая
особь заменяется более сильной). Из вновь полученной популяции вновь выбирается пара
“родителей” и формируется новое “поколение” путем “скрещивания”, “мутации”, замены
менее выгодных структур. Число поколений в генетических алгоритмах определяется
типом решаемой проблемы, размером генетического кода и величиной популяции и
обычно составляет от одной тысячи до сотен тысяч. По окончании “эволюции” получается
“популяция” наиболее выгодных структур комплексов, для каждой из которых
определены энергия и вероятность обнаружения.
Предложенный алгоритм для построения наиболее выгодных комплексов получил
название Mech [16].
Существенное использование генератора случайных чисел во многом роднит
генетические алгоритмы с методами Монте-Карло, однако процесс генетической
оптимизации включает в себя параллельную оптимизацию структур “популяции”. При
этом выгодные фрагменты ассоциированных структур в ходе эволюции сохраняются и
19
оптимизируются только невыгодные характеристики ассоциатов. По этой причине
скорость достижения минимума в генетическом алгоритме намного превосходит
традиционные методы оптимизации, что детально проиллюстрировано в работе [14].
Серьезным недостатком генетических алгоритмов являются невысокие показатели при
оптимизации континуальных величин, однако во многих задачах эти величины могут быть
представлены в виде дискретных значений с малыми интервалами. Такой прием был
использован, например, в конформационном анализе [15], где в качестве генетического
кода был использован набор торсионных углов, изменяющихся с шагом в 10о.
Проверка
работоспособности
предложенного
алгоритма
проведена
в
последовательном режиме на выборке из 137 соединений, относящихся к различным
классам, включающих атомы C, H, N, O, F, Cl, Br, I, как образующих устойчивые
супрамолекулярные комплексы, так и не образующие таковых. Для соединений
производилось построение комплексов в рамках описанного генетического алгоритма с
использованием силового поля ММ3 [17 – 19] при вероятностном учете энергии
взаимодействия с молекулами окружения в веществе в рамках модели MERA [20] по
методу, описанному в [21]. Размер “популяций” - 1000, число “поколений” - 10000,
дискретность изменения угловых параметров оптимизации – 100.
Критерием качества моделирования может являться рассмотрение геометрических
и энергетических характеристик получаемых комплексов. Рассмотрение полученных
комплексов показало удовлетворительное соответствие их геометрии известным данным.
Так для карбоновых кислот наблюдаются циклические водородносвязанные димеры.
Также ассоциаты с водородными связями наблюдаются для спиртов (Рис. 3а). Наиболее
выгодные ассоциаты нормальных алканов образуются при параллельном расположении
углеводородных цепей (Рис. 3б). Для ароматических соединений обнаруживается два
различных варианта ассоциации: параллельное расположение плоскостей ароматических
колец и практически ортогональное (Рис. 3в). Преимущество того или иного типа
ассоциации определяется видом ароматической системы и характером заместителей.
Характеристикой ассоциации может являться энергия образования комплексов. В
Полученные тенденция в энергиях образования комплексов соответствует известным
данным. Получаемые энергии образования наиболее выгодных парных ассоциатов
коррелируют с энтальпиями испарения соединений, что также является показателем
качества моделирования. График взаимосвязи энергии образования наиболее выгодных
димеров и энтальпии испарения ΔНи приведен на Рис. 4. Зависимость представленная на
графике описывается уравнением ΔНи = 4.53 – 1.078 Е2. Коэффициент корреляции R =
0.856; критерий Фишера F=148; стандартное отклонение σ = 0.76.
20
а)
б)
в)
Рис. 3
Структуры комплексов: а) пример водородносвязанного комплекса (димер
этанола); б) параллельная ориентация углеводородных цепей н-углеводородов
(димер н-декана), в) комплексы, характерные для ароматических аминов с
параллельным (димер бензола) и ортогональным расположением ароматических колец
(димер амилбензола с π-стэкингом)
Очевидно, что ряд соединений может переходить в газообразное состояние в виде
комплексов. Поэтому для получения более точного выражения требуется учет энергий
всех возможных комплексов и вероятностей их распада. Действительно, учет энергии
образования наиболее выгодных комплексов и вероятности их распада позволяет
получить уравнение вида
ΔH и  a 0  a1 E 2
exp( E 3 / cT )
exp( E 2 / cT )
 a1 E 3
exp( E 2 / cT )  exp( E 3 / cT )
exp( E 2 / cT )  exp( E 3 / cT )
(1)
где Т – абсолютная температура;
а0, а1, с – константы (а0 = 3.35 ккал/моль; а1 = 3.15; с = 14.6 кал/(моль·К)).
Коэффициент корреляции 0.890; σ = 0.67; F = 190.
21
ΔНи., ккал/моль
14
13
12
11
10
9
8
7
6
5
-6
-5
-4
-3
-2
-1
Е2, ккал/моль
Рис. 4
Зависимость энтальпии испарения соединений от энергии образования димеров
Расчет объемов молекул и наиболее выгодных комплексов производился в рамках
модели MERA [20]. Плотности веществ вычислялась в соответствии с известной
формулой
  Ky
M
N AV
где ρ – плотность; Ку - коэффициент плотности упаковки; M – масса моля молекул
или ассоциатов; NA – число Авогадро, V – объем молекулы или ассоциата.
Ранее проведенные расчеты плотностей веществ в рамках модели MERA по
данным о строении единственной молекулы [20] с вероятностным учетом влияния
ассоциации на молекулярный объем [21] показали удовлетворительные результаты
(коэффициент корреляции R = 0.9950; критерий Фишера F = 17600; стандартное
отклонение σ. = 0.0512; средняя относительная погрешность σотн. = 3.43%). Плотности,
вычисленные из характеристик комплексов также коррелируют с экспериментальными с
коэффициентом корреляции 0.9953 (Рис. 5) стандартное отклонение расчета плотности
составляет σ = 0.0475; коэффициент Фишера F = 14300; средняя относительная
погрешность σотн = 3.16%.
Таким образом, данный алгоритм может быть реализован в параллельном варианте на
суперкомпьютерах
семейства
“СКИФ”
для
прогноза
строения
и
свойств
22
супрамолекулярных комплексов. Существенным недостатком данного алгоритма является
предположение о жесткости молекул, что ограничивает его использование для
конформационно подвижных молекул. Для исследования супрамолекулярных комплексов
конформационно-подвижных молекул для реализации в параллельном варианте может
быть предложен новый алгоритм MOPS.
3.6
3.2
2.8
d4
20
2.4
2.0
1.6
1.2
0.8
0.4
0.4
0.8
1.2
1.6
2.0
2.4
2.8
3.2

3.6
а)
Рис. 5
Расчетные (2, г/мл) и экспериментальные плотности веществ (d420, г/мл
II.2. Алгоритм MOPS для моделирования строения и свойств ассоциатов
конформационно подвижных молекул
Принципиально структура молекулярных ассоциатов может быть смоделирована
аналогично уже реализованному на суперкомпьютерах семейства “СКИФ” алгоритму
MultiGen для поиска геометрии, отвечающей минимуму потенциальной энергии
молекулы. Однако даже для тримера гексана на каждом шаге алгоритма потребуется
перемещение атомов вдоль 180 мод нормальных колебаний в прямом и обратном
направлении, что требует значительного времени расчета. Поэтому в алгоритме MOPS
рассматриваются только трансляционные и вращательные степени свободы, а также
степени свободы внутреннего вращения каждой молекулы ассоциата. В этом случае для
тримера гексана имеются 9 степеней свободы поступательного движения, столько же –
вращательного движения и 15 степеней свободы внутреннего вращения. Таким образом,
при данных ограничениях необходимо перемещение атомов вдоль 33 мод. Чтобы
избежать возможности попадания в локальный минимум предварительно производится
23
симплексный поиск наиболее удачных расположений молекул комплекса. Важной
особенностью алгоритма является использование комбинированного силового поля
ММ3/MERA [20, 22]. При этом внутримолекулярные характеристики описываются в
силовом
поле
ММ3.
Использование
силового
поля
дает
MERA
возможность
континуального учета влияния среды, например, растворителя. Блок-схема алгоритма
соответствует Рис. 6.
Предложенный алгоритм для построения наиболее выгодных ассоциатов получил
название MOPS [23].
Для проверки работоспособности предложенного алгоритма также использована
выборка из 137 соединений, включающих атомы C, H, N, O, F, Cl, Br, I, как образующих
устойчивые
комплексы,
моделирования
может
так
и
являться
не
образующие
рассмотрение
таковых.
Критерием
геометрических
и
качества
энергетических
характеристик получаемых комплексов. Рассмотрение полученных комплексов также
показало удовлетворительное соответствие их геометрии известным данным. Полученные
тенденция в энергиях образования комплексов также соответствует известным данным.
Низкие энергии образования комплексов галогенсодержащих соединений говорят об их
существенной
ассоциации
в
жидкой
фазе.
Последнее
не
противоречит
ранее
обнаруженным в кристаллической фазе комплексам галогенсодержащих соединений [24,
25]. При этом так же, как и в работах [24, 25], имеются две тенденции в образовании
ассоциатов: 1) непосредственное образование контактов Hal…Hal, что наблюдается для
некоторых иодсодержащих и бромсодержащих соединений (например, 2-бром-2метилпропан); 2) ассоциация углеводородных частей с вытеснением галогена на
периферию, что наблюдается для большинства галогенароматических соединений.
Последнее вполне объяснимо хорошей ассоциацией ароматических частей молекул, о чем
говорят и низкие энергии образования ассоциатов алкилароматических соединений.
Получаемые энергии образования наиболее выгодных парных ассоциатов
коррелируют с энтальпиями испарения соединений, что также является показателем
качества моделирования. График взаимосвязи энергии образования наиболее выгодных
димеров и энтальпии испарения ΔНи приведен на Рис. 7. Зависимость представленная на
графике описывается уравнением ΔНи = 5.37 – 0.915 Е2. Коэффициент корреляции R =
0.9494; критерий Фишера F = 502.9; стандартное отклонение σ = 0.47.
Для получения более точного выражения требуется учет энергий всех возможных
комплексов и вероятностей их распада. Действительно, учет энергии образования
наиболее выгодных комплексов и вероятности их распада согласно уравнению (1)
позволяет получить более точную модель с коэффициентами а0 = 3.64 ккал/моль; а1 =
24
Исходная (примерная)
геометрия комплекса
Минимизация энергии по
координатам атомов. Поиск
локального минимума
(минимума нулевого
приближения М0).
Расчет матрицы силовых
постоянных. Решение прямой
спектральной задачи. Расчет
частот и мод нормальных
колебаний.
Перемещение атомов вдоль каждой из
колебательных мод как в
положительном, так и в отрицательном
направлении до преодоления
ближайшего максимума энергии.
Минимизация энергии по
координатам атомов. Поиск
локального минимума Мn.
Да
Распараллеливаемая
процедура
Mn < Mn-1
Нет
Окончательная геометрия
молекулы.
Рис. 7
Принципиальная блок-схема алгоритма поиска геометрии, отвечающей минимуму
потенциальной энергии молекулы
25
14
13
ΔНисп. , ккал/моль
12
11
10
9
8
7
6
5
4
-9
-8
-7
-6
-5
-4
-3
-2
-1
0
1
E2, ккал/моль
Рис. 7
Зависимость энтальпии испарения соединений от энергии образования комплексов
3.40; с = 15.5 кал/(моль·К). Коэффициент корреляции 0.928; σ = 0.56; F = 312. Учитывая
динамичность структур ассоциатов в жидкой фазе для получения более точного уравнения
следует принимать во внимание вероятности и энергии образования всех реальных
комплексов (не только самых выгодных).
Проведенный расчет объемов молекул и плотностей веществ в рамках модели
MERA [20] показал, что плотности, вычисленные из характеристик комплексов (Рис. 8)
3.5
3.0
2.5
4
20
2.0
d
1.5
1.0
0.5
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0

Рис. 8
Расчетные (2, г/мл) и экспериментальные плотности веществ (d420, г/мл)
26
также коррелируют с экспериментальными с коэффициентами корреляции 0.9996,
стандартное отклонение расчета плотности составляет σ = 0.0096; коэффициент Фишера F
= 351000; средняя относительная погрешность σотн = 0.64%.
27
III. РЕАЛИЗАЦИЯ ПРОТОТИПОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ
МОДЕЛИРОВАНИЯ СТРОЕНИЯ И СВОЙСТВ СУПРАМОЛЕКУЛЯРНЫХ
СОЕДИНЕНИЙ
III.1. Технология распараллеливания OpenTS
OpenTS является технологией распараллеливания программ, базирующейся на
идеологии и принципах Т-Системы.
OpenTS предоставляет язык программирования T++. Язык Т++ представляет собой
очень простой параллельный диалект С++ и предназначен для эффективной реализации
динамического распараллеливания. Он позволяет смешивать чистую функциональную и
императивную мощь C++ на уровне T-вызовов.
Для работы мы использовали кроссовую версию OpenTS версии 3.1.
III.2. Использование Т-Системы с открытой архитектурой (OpenTS) для
распараллеливания
После более детального изучения исходного кода на языке Fortran, мы пришли к
выводу,
что
для
реализации
параллельной
версии
программы
потребуются
незначительные изменения оригинального кода. Эти изменения были связаны с тем, что
наблюдалась зависимость по данным от результатов работы функции, которая нами была
выбрана в качестве Т-функции (или гранулы параллелизма). Кроме того, решалась
проблема по сокращению обьёма входных данных в Т-функцию, что позволило резко
уменьшить накладные расходы по их доставке.
Реализация на основе OpenTS получилась довольно простая: сделана замена
Fortran-функции, вычисляющей энергию взаимодействия, на T-функцию.
Кроме того, в соответствии со спецификой параллельных вычислений в OpenTS,
изменён подход к организации параметров для Т-функции: все глобальные массивы
данных из фортрановских common-блоков оформлены в виде одной структуры.
Таким образом, все свои входные данные Т-функция получает через входные
параметры, и выходные данные возвращает тоже через выходные параметры.
Алгоритм работы Т-версии программы выглядит так:
28
основная подпрограмма осуществляет поворот молекулы лекарственного средства в
полярных координатах, изменяя углы Θ и φ. При каждом изменении угла производится
вызов Т-функции. Т-функция строит для молекулы модельный рецептор и вычисляет
энергию взаимодействия в системе “модельный рецептор - лекарственное средство”. Эта
энергия записывается в выходные данные Т-функции. Таким образом осуществляется
поиск наиболее выгодной (низкой по энергии) ориентации молекулы в модельном
рецепторе.
III.3. Реализация параллельного прототипа алгоритма MOPS
Разработан прототип параллельной версии ПО MOPS для решения задач
виртуального дизайна супрамолекулярных комплексов. Созданный прототип ПО
реализован в среде OpenTS для платформы Linux на КУ “СКИФ - Переяславль”. В
реализованном ПО на настоящий момент созданы блок ввода исходной геометрии
супрамолекулярного комплекса, параллельная процедура tmops, реализующая поиск
локальных минимумов потенциальной энергии комплекса и блок вывода промежуточных
результатов. Проведенные тестовые испытания производительности ПО показали
следующее (Таблица 1): ускорение на 16 процессорах составляет 4.2. Имеются
возможности дальнейшей оптимизации оптимизации прототипа, снижения числа
передаваемых переменных и массивов в процедуру tmops с целью ускорения работы., что
и предполагается сделать на третьем этапе работы по проекту.
Результаты расчетов параллельного прототипа ПО совпадают с результатами
последовательного
аналога.
Проведенные
тестовые
расчеты
для
группы
супрамолекулярных комплексов производных тетразина, а также металлокомплексов
Таблица 1
Результаты испытаний производительности ПО MOPS на КУ “СКИФ Переяславль”
Число процессоров Время выполнения, с Ускорение
1
10389
1.0
2
6082
1.7
4
3932
2.6
8
2928
3.5
16
2474
4.2
29
производных тетразина, триазина и пиримидина показывают соответствие результатов
экспериментальным данным по геометрическим параметрам структур супрамолекулярных
комплексов и энергиям их образования. Отклонение геометрических характеристик
модельных комплексов от экспериментальных по длинам связей не превышает 0.02 Ǻ;
отклонение геометрических характеристик модельных комплексов от экспериментальных
по валентным углам не превышает 10. Внешний вид модельных комплексов представлен
на Рис. 9.
Показаны возможности расчета ряда спектральных и электронных свойств
супрамолекулярных комплексов. Расчет электронных характеристик супрамолекулярных
комплексов проводился в базисе DFT B3LYP/6-311G(d,p) с использованием ПО GAMESS
[26] на КУ “СКИФ - Переяславль”. Анализ электронных характеристик и квантово-
а)
б)
в)
Рис. 9
Примеры модельных комплексов: а) супрамолекулярный комплекс производного
тетразина с двумя молекулами бензтриазола (красными точками обозначены
критические точки связей; желтыми – критические точки циклов); б) металлокомплекс
катиона меди с тремя молекулами производного тетразина (молекулярный магнетик); в)
металлокомплекс с супрамолекулярным компонентом катиона меди с тремя молекулами
производного тетразина (молекулярный магнетик).
30
топологическое исследование электронной плотности осуществлялось в рамках теории
AIM с использованием ПО AIMPAC Р.Бэйдера [27]. Показано, что среднеквадратичное
отклонение расчетных и экспериментальных значений электронной плотности в
критических точках связей составляет 0.14 е/Ǻ3 (относительная погрешность 7.4 %);
среднеквадратичное отклонение минимального значения гессиана электронной плотности
в критических точках связей составляет 1.8 е/Ǻ5 (11 %); среднеквадратичное отклонение
среднего значения гессиана электронной плотности в критических точках связей
составляет 1.9 е/Ǻ5 (13 %); среднеквадратичное отклонение максимального значения
гессиана электронной плотности в критических точках связей составляет 4.4 е/Ǻ5 (34 %);
среднеквдадратичное отклонение значений объемов атомных бассейнов составляет 1.4 Ǻ3
(14 %); среднеквдадратичное отклонение значений зарядов атомных бассейнов составляет
0.10 е (2.6 %); среднеквдадратичное отклонение значений гамильтонианов атомных
бассейнов составляет 0.80 а.е. (2.4 %). Распределение отклонений расчетных и
экспериментальных значений показано на Рис. 10.
Решение прямой спектральной задачи колебательной спектроскопии проводилось
ab initio в базисе MIDI (3-21G(d,p)) с эффективным остовным потенциалом Хуцинага [28].
Квантово-химические расчеты выполнялись с использованием программы GAMESS [26]
на
КУ
“СКИФ
-
Переяславль”.
Показано
удовлетворительное
соответствие
экспериментальных и расчетных спектров. Расчетный спектр имеет систематическое
смещение на 40 см-1. При образовании всех комплексов тетразина наблюдается сдвиг в
высокочастотную область полос валентных и деформационных колебаний тетразинового
азота и –N=N- группы, для комплексов с [Cu(H20)2]Cl2и с MnCl22H2O исчезает полоса ОН колебаний, что полностью согласуется с экспериментальными спектрами и
предложенными структурами.
Таким образом, показано, что структуры модельных комплексов хорошо
воспроизводят данные экспериментальных исследований.
Решение прямой спектральной задачи спектроскопии в видимой и УФ областях
проводилось ab initio в базисе MIDI (3-21G(d,p)) с эффективным остовным потенциалом
Хуцинага [28]. Для расчета электронных переходов производился учет конфигурационных
взаимодействий 3 верхних занятых и 3 нижних виртуальных уровней. Квантовохимические расчеты выполнялись с использованием программы GAMESS [26] на КУ
“СКИФ - Переяславль”. Показано удовлетворительное соответствие экспериментальных и
расчетных спектров, что подтверждает предложенное строение комплексов. Расчетный
спектр имеет систематическое смещение на 30 нм.
31
а) 70
б) 50
Expected Normal
Expected Normal
45
60
40
50
35
30
40
25
No. of obs.
No. of obs.
30
20
20
15
10
10
5
0
0
-1.5
-1.0
-0.5
0.0
0.5
1.0
-6
-4
-2
0
exp - calc , e/A 3
в)45
2
4
6
0
10
20
1, e/A5
г) 110
Expected Normal
Expected Normal
100
40
90
35
80
30
70
25
60
20
50
No. of obs.
No. of obs.
15
10
40
30
20
5
10
0
0
-6
-4
-2
0
2
4
6
8
-40
-30
-20
2, e/A
Histogram: Var1
K-S d=.14020, p<.05 ; Lilliefors p<.01
Expected Normal
д)
-10
3, e/A5
5
е)
70
Histogram: Var2
K-S d=.13955, p<.05 ; Lilliefors p<.01
Expected Normal
70
60
60
50
50
40
40
30
30
No. of obs.
No. of obs.
20
10
20
10
0
0
-8
-6
-4
-2
0
2
4
-0.8
-0.6
-0.4
-0.2
3
0.0
0.2
0.4
0.6
0.8
Nexp-Ncalc, e
Vexp-Vcalc, A
Histogram: Var3
K-S d=.24718, p<.01 ; Lilliefors p<.01
Expected Normal
ж)
55
50
45
40
35
30
25
No. of obs.
20
15
10
5
0
-5
-4
-3
-2
-1
0
1
2
3
4
Hexp-Hcalc, a.u.
Рис. 10
Распределение отклонений расчетных и экспериментальных значений:
электронной плотности; б) минимального значения гессиана электронной плотности; в)
среднего значения гессиана электронной плотности; г) максимального значения гессиана
электронной плотности; д) объемов атомных бассейнов; е) зарядов атомных бассейнов;
ж) гамильтонианов атомных бассейнов
32
Пример
расчетного
и
экспериментально
наблюдаемого
ИК-спектра
для
соединения, показанного на Рис. 9а проиллюстрирован на Рис. 11.
а)
б)
Рис. 11
Расчетный (а) и экспериментальный (б) ИК-спектры для комплекса на Рис. 9а
33
Таким образом, разработан прототип параллельной версии ПО MOPS для решения
задач виртуального дизайна супрамолекулярных комплексов, проведены тестовые
испытания
производительности
ПО,
произведен
тестовые
расчеты
для
группы
супрамолекулярных комплексов, а также металлокомплексов, показаны возможности
расчета ряда спектральных и электронных свойств супрамолекулярных комплексов.
III.3.1. Учет периодических граничных условий для моделирования
квазибесконечных кристаллических структур супрамолекулярных комплексов
Подпрограммы учета периодических граничных условий для моделирования
квазибесконечных кристаллических структур супрамолекулярных комплексов включают
расчет потенциальной энергии в рамках силового поля MERA [22, 23]. Потенциальная
энергия взаимодействий в системе вычисляется как сумма внутри- и межмолекулярных
электростатических и ван-дер-ваальсовых взаимодействий:
ETOT = EQ + EV + EQI + EVI
где EQ и EV - энергии внутримолекулярных кулоновских и ван-дер-ваальсовых
взаимодействий, соответственно;
EQI и EVI - энергии межмолекулярных кулоновских и ван-дер-ваальсовых
взаимодействий, соответственно.
Энергия внутримолекулярных кулоновских взаимодействий рассчитывается по
известной формуле:
N
EQ  
N
qi q j
 4
i 1 j  i 1
0
Rij
где N – число атомов в кластере;
qi, qi – заряды на атомах i и j;
Rij – расстояние между атомами i и j; ε0 – диэлектрическая проницаемость
вакуума.
Энергия внутримолекулярных ван-дер-ваальсовых взаимодействий рассчитывается
с использованием потенциала Леннард-Джонса:
34

 Rije
EV      2U ij 
 Rij
i 1 j i 1


N
где
Rije
N
6

 Re
  U ij  ij

 Rij






12




– равновесное расстояние ван-дер-ваальсова контакта атомов i и j, равное
сумме их ван-дер-ваальсовых радиусов, рассчитанных в рамках модели MERA [22];
Uij – глубина минимума потенциальной энергии взаимодействия атомов i и j.
Рассчитывается в рамках модели MERA в соответствии с формулой [23]:
U ij 
7kRije
48
где α – постоянная, равная 6.662·10-14 м/К;
k – постоянная Больцмана.
Энергия межмолекулярных кулоновских взаимодействий рассчитывается по
формуле:
M
M
EQI  
i 1 j 1
qi q j
40


1
1
1



( Rij  kb) ( Rij  kc) 
ij  ka)
  ( R
k

где М – число атомов в кристаллической ячейке;
a, b, c – параметры ячейки.
Энергия межмолекулярных ван-дер-ваальсовых взаимодействий и водородных
связей рассчитывается по формуле:
M M




6
1
1
1
1
1
1
  U ij Rije12 

EVI   pij   2U ij Rije 




 ( R  ka) 6 ( R  kb) 6 ( R  kc) 6 
 ( R  ka)12 ( R  kb)12 ( R  kc)12  

i 1 j 1
ij
ij
ij
ij
ij
ij





Для введения частичной разупорядоченности производилась варьирование степени
заполнения позиций в пределах ячеек с дополнительной вариацией ориентаций молекул в
и последующей оптимизацией ориентационных характеристик всех молекул в ячейке.
Вариация
степени
заполнения
и
ориентации
производилась
с
использованием
генетического алгоритма [29]. Оптимизация ориентационных характеристик всех молекул
ячейки производится с использованием квази-ньютоновских методов.
35
III.4. Реализация параллельного прототипа алгоритма BiS
Для моделирования супрамолекулярных комплексов “рецептор – лекарственное
средство” создан параллельный прототип ПО BiS. Блок-схема алгоритма представлена на
Рис. 12.
На первом шаге строится псевдо-атомное окружение, комплементарное к наиболее
активной молекуле выборки. В каждой точке поверхности молекулы можно определить
потенциал
кулоновских
комплементарное
поле.
и
ван-дер-ваальсовых
Потенциал
взаимодействий
кулоновских
взаимодействий
и
смоделировать
в
m-ой
точке
поверхности определяется по известной формуле
N
 mq  
i 1
qi
k
Rim
(3.1)
где N- число атомов рассматриваемой структуры, qi – заряд атома i, Rim –
расстояние от точки m до атома i, k – коэффициент пересчета в единицы СИ.
Для расчета потенциала ван-дер-ваальсовых взаимодействий, наводимых на точку
m, по аналогии с кулоновским предложено использование следующего уравнения [30 33]:

VDW
m
N
2 3 ri3
i 1
6
Rim
 2 Vim
(3.2)
где Vim- глубина минимума потенциальной энергии в соответствии с потенциалом
Леннард-Джонса, ri – ван-дер-ваальсовый радиус атома i.
Расчет величин Vim и ri может быть произведен в рамках модели MERA [34]. В
данном уравнении для упрощения расчетов использован только член притяжения в вандер-ваальсовых взаимодействиях.
36
ВВОД
Выборка соединений, координат атомов и
величин биологических активностей
соединений
Создание псевдоатомного окружения
Оптимизация ориентации молекул в
псевдоатомном поле
Распараллеливаемые
процедуры
Уточнение потенциалов поля (зарядов и
радиусов псевдоатомов)




ВЫВОД
-Молекулы, ориентированные в псевдоатомном рецепторе.
Энергии и силы взаимодействия в модельном комплексе
“рецептор – лиганд”.
Зависимость биологической активности от характеристик
взаимодействия в системе “рецептор – лиганд”.
Рекомендации к дизайну новых перспективных лекарственных
средств.
Рис. 12
Блок-схема алгоритма BiS
qm  
 mq
N
k
R
i 1
im
 mVDW
rm 
3
2Vim ri3
2 
6
Rim
i 1
N
3
Комплементарное поле строится в виде псевдоатомного окружения молекулы. В
точках поверхности строятся пробные сферы (псевдоатомы) с зарядами и радиусами,
комплементарными полю в данной точке. Заряд и радиус пробной сферы вычисляются по
формулам
37
На следующем шаге производится оптимизация ориентации второй молекулы в
поле, комплементарном первой молекуле, с использованием комбинации симплексного и
квази-ньютоновского методов до достижения минимума совокупной вероятности
контакта (P) ее атомов со всеми точками модельного рецептора.
M
P  1   (1  p m )
m 1
где
 E 
p m  exp   m 
 RT 
N 
kq q
(r  r ) 6
(r  r )12 
E m    i m  2Vim m 6 i  Vim m 12i 
Rim
Rim
i 1  Rim

(3.3)
где N – число атомов во второй молекуле.
При этом вторая молекула может иметь размеры, значительно отличающиеся от
размеров первой молекулы. Расположение пробных сфер на поверхности второй
молекулы позволяет учесть конформационную подстройку рецептора под размер
встраиваемой молекулы.
В найденной ориентации второй молекулы уточняется комплементарное поле
рецептора путем добавки потенциалов поля второй молекулы к имеющимся:
 mq   mq   mq ' ;  mVDW   mVDW   mVDW '
Потенциалы поля второй молекулы  mq ' и  mVDW ' вычисляются аналогично
потенциалам первой молекулы по формулам (3.1, 3.2). Аналогичная процедура
осуществляется для третьей, четвертой и всех последующих молекул выборки. По
окончании процедуры производится рассмотрение расположения первой, второй и т.д.
молекул выборки в уточненном комплементарном поле. Процедура прекращается, если
различие потенциала поля на новом и предыдущем шаге не превышает заданного предела.
После этого строится линейная зависимость между величиной биологической
активности соединения и параметрами взаимодействий псевдо-атомов модельного
рецептора с молекулой. В качестве параметров взаимодействий могут быть использованы
энергии взаимодействия, рассчитанные по уравнению (3.3), и силы Fm:
38
N
Fm  
i 1
Полученное
уравнение
позволяет
dE
dRim
выделить
те
псевдо-атомы
модельного
рецептора, взаимодействие с которыми определяет величину биологической активности
соединений. Данные псевдо-атомы моделируют активные центры рецептора. Фрагменты
лекарственного средства, расположенные вблизи активных центров, определяют
фармакофорную часть молекулы.
На основе предложенного алгоритма не сложно предложить новый подход к
дизайну перспективных лекарственных средств. В рамках данного подхода производится
комбинаторная замена атомов или фрагментов на другие атомы или фрагменты у
наиболее активной молекулы с целью получения более активного соединения. Вновь
полученное соединение помещается в модельный рецептор. На основе характеристик
взаимодействия
соединения
с
модельным
рецептором
вычисляется
величина
биологической активности. Если полученное значение находится на достаточно высоком
уровне – перспективное соединение может быть синтезировано. Данный подход к дизайну
перспективных лекарственных средств реализован в рамках алгоритма BiS.
Таким образом, алгоритм BiS позволяет определить строение комплексов
“модельный рецептор – лиганд”, установить взаимосвязь биологической активности с
параметрами строения таких комплексов, выявить фармакофорные фрагменты молекулы.
В рамках последовательной версии данного подхода уже рассмотрены ингибиторы ацилкоА-холестеринтрансферазы, ингибиторы 5НТ1А рецептора, ингибиторы фактора Ха,
ингибиторы ВИЧ1-протеазы, анельгезирующие, анестезирующие, антибактериальные (3
вида штаммов), антиоксидантные, противоопухолевые (7 механизмов действия в
соответствии
с
классификацией
National
Cancer
Institute),
психотропные,
нейролептические, антиконвульсантные, противовоспалительные (3 механизма действия),
антихолинэстеразные, радиозащитные (2 механизма действия), туберкулостатические,
антиаритмические,
прогестагенные,
вазорелаксантные,
противогерпесные
средства,
субстраты различных изоформ цитохрома Р450 [35 – 50]. Определены внешние виды
комплексов “модельный рецептор – лиганд”, найдены уравнения, позволяющие с высокой
точностью описать величину активности соединений.
В реализованном ПО на настоящий момент созданы блок ввода исходной
геометрии молекул лекарственных средств, процедуры создания модельного рецептора,
создания эффективной суперпозиции лекарственных средств, установления связи
39
биологической активностями с параметрами взаимодействия в системе “модельный
рецептор - лекарственное средство”, вывода основных результатов расчета.
Тестовые расчеты проведены для агонистов 5НТ1А-рецептора (транквилизаторные
средства)
и
ингибиторов
дигидрофолатредуктазы
(противоопухолевые
и
туберкулостатические средства). Результаты расчетов параллельного прототипа ПО
совпадают с результатами последовательного аналога. Коэффициенты корреляции
расчетных и экспериментальных значений биологической активности по оценке
“скользящий контроль” – не ниже 0.95.
Результаты
лекарственное
моделирования
средство”
в
супрамолекулярных
рамках
алгоритма
BiS
комплексов
“рецептор
сопоставлены
с
–
данными
рентгеноструктурного анализа (РСА).
Для проверки качества ориентации молекул с использованием предложенного
подхода в Protein Data Bank [51] проведен отбор данных РСА комплексов рецепторов с
лекарственными средствами. Среди них ДНК-антиметаболиты, ингибиторы p38 MAPкиназы, риновируса HRV14, термолизина, эластазы, циклин-зависимой киназы (CDK2) и
дигидрофолатредуктазы.
Результаты
сравнения
экспериментальной
и
расчетной
ориентации, приведенные в Таблице 2, показали, что точность ориентации существенно
превосходит имеющиеся аналоги. Так, в работе [52] отклонение координат атомов (rMAX)
по выборке ингибиторов риновируса HRV14 достигает 4.77 Å (соединение 1r09), для
ингибиторов термолизина - 11.14 Å (соединение 5tln), эластазы - 10.01 Å (соединение
1inc), а для ингибиторов CDK2 - 18.70 Å (соединение 1ian). При использовании алгоритма
BiS для ориентации соединений тех же выборок отклонения rMAX, как правило, не
превышают 2Å (Таблица 3).
Таким образом, данные результаты сопоставления показывают превосходство
алгоритма BiS над мировыми аналогами.
Примеры комплексов “модельный рецептор – лекарственное средство” и
“дигидрофолатредуктаза – лекарственное средство” для молекулы противоопухолевого
препарата представлены на Рис. 13 и 14, соответственно.
Таким образом, разработан прототип параллельной версии ПО MOPS для решения
задач виртуального дизайна супрамолекулярных комплексов, проведены тестовые
испытания производительности ПО, произведен тестовые расчеты для группы агонистов
5НТ1А-рецептора (транквилизаторные средства) и ингибиторов дигидрофолатредуктазы
(противоопухолевые и туберкулостатические средства), показаны возможности прогноза
биологической активности соединений.
40
Таблица 2
Среднеквадратичные отклонения истинных и предсказанных координат атомов
молекул (), максимальное смещение координат атомов (rMAX), а также углы между
главными осями вращения экспериментально определенной ориентации и предсказанной
(α1, α2, α3) (название соединений соответствует названию в Protein Data Bank).
В скобках указано название соединения, которое является стандартом.
, Å rMAX, Å α1, 0 α2, 0 α3, 0
Вид активности
соединение
Ингибиторы риновируса
1hri
0.14
0.15
5.7
6.9
5.9
HRV14 (1ruc)
1hrv
0.28
0.41
4.2
4.1
2.1
1r09
0.29
0.48
2.6
4.8
4.3
1ruc
0.00
0.00
0.0
0.0
0.0
1rue
0.02
0.04
3.4
5.5
4.7
1rug
0.00
0.00
0.0
0.0
0.0
1vrh
0.35
0.64
2.2
2.0
1.4
2r04
0.18
0.22
0.3
1.3
1.2
2r06
0.00
0.00
0.0
0.0
0.0
2r07
0.08
0.15
0.2
1.4
1.4
2rs5
0.14
0.15
0.1
0.8
0.8
1r08
0.31
0.42
0.5
1.7
1.7
2hwb
0.18
0.26
4.7
5.0
3.0
2hwc
0.14
0.24
4.9
7.0
6.0
1rud
0.29
0.35
6.4
6.5
8.7
1ruh
0.30
0.38
6.5
5.8
9.0
1rui
0.29
0.35
6.4
6.5
8.7
2rm2
0.32
0.42
7.0
7.0
0.5
2rr1
0.28
0.32
6.4
6.6
8.6
2rs1
0.29
0.36
6.4
6.5
8.7
2rs3
0.36
0.40
6.2
7.7
4.2
1thl
0.87
1.93
2.2
1.8
1.8
1tmn
0.45
0.92
4.0
4.3
3.9
1tlp
0.80
1.71
6.0
4.4
6.6
5tln
1.26
2.25
7.7
2.5
7.6
4tmn
0.18
0.31
6.5
2.7
6.3
Ингибиторы термолизина (5tmn)
41
ингибиторы эластазы (1eau)
ингибиторы CDK2 (1bkx)
ДНК-антиметаболиты (1ims)
ДНК/РНК-антиметаболиты (1rg7)
3tmn
0.94
1.66
5.0
5.0
3.2
5tmn
0.00
0.00
0.0
0.0
0.0
6tmn
0.01
0.02
0.1
0.1
0.1
1b0e
0.72
1.20
4.2
5.0
5.4
1bma
0.84
1.59
8.6
7.8
4.8
1eas
0.95
1.73
7.0
2.4
7.4
1eat
0.96
1.80
6.6
2.2
6.9
1eau
0.00
0.00
0.0
0.0
0.0
1ela
0.73
1.33
2.8
3.3
1.9
1elb
0.80
1.30
6.1
7.1
7.5
1elc
0.86
1.74
7.0
8.4
7.0
1eld
0.97
1.86
5.2
4.4
2.9
1ele
0.98
1.92
5.0
6.4
4.6
1inc
0.83
1.28
3.0
4.9
4.8
4est
0.20
0.35
1.2
2.4
2.4
7est
0.98
1.49
5.0
3.3
3.7
1agw
0.80
1.24
8.8
8.5
3.6
1aq1
0.66
1.23
1.9
4.6
4.3
1atp
0.70
1.36
2.6
2.7
0.9
1bkx
0.00
0.00
0.0
0.0
0.0
1ckp
0.26
0.56
7.0
8.9
4.9
2csn
0.74
1.09
7.2
7.2
1.2
1fgi
0.81
1.64
3.3
4.3
2.7
2hck
0.81
1.63
1.8
1.7
1.0
1ian
0.24
0.43
2.5
2.7
1.6
1stc
0.72
1.46
7.9
8.6
6.3
1ydr
0.97
1.81
1.6
5.7
5.9
1yds
0.68
1.11
1.1
4.3
4.5
1ydt
1.14
2.17
1.1
5.7
5.5
1d35
0.24
0.35
6.4
6.5
1.4
1d37
0.61
1.02
8.8
8.9
1.4
1ims
0.00
0.00
0.0
0.0
0.0
1rg7
0.00
0.00
0.0
0.0
0.0
42
Hfp1
1.05
2.02
8.0
9.0
5.8
ингибиторы p38 MAP-киназы
1a9u
0.77
1.37
5.2
7.8
7.6
(1bl7)
1bl6
0.51
0.92
1.2
8.3
8.4
1bl7
0.00
0.00
0.0
0.0
0.0
1bmk
0.50
1.00
2.6
6.8
7.2
1di9
0.80
1.28
5.2
6.9
8.3
1ian
1.36
2.74
5.9
1.8
6.2
1kv1
0.00
0.00
0.0
0.0
0.0
1kv2
1.07
2.03
6.9
7.4
7.4
Рис. 13
Комплекс “модельный рецептор – лекарственное средство”, полученный при
моделировании алгоритмом BiS, на примере противоопухолевого средства - ингибитора
дигидрофолатредуктазы
43
Рис. 14
Комплекс “дигидрофолатредуктазы – лекарственное средство” на примере
противоопухолевого средства – ингибитора дигидрофолатредуктазы
III.5. Программа и методика испытаний системы BiS (ПС BiS)
Объектом испытаний является программная система BIS (далее по тексту
документа – ПС BIS), предназначенная для моделирования супрамолекулярных
комплексов “рецептор – лекарственное средство”. Цель испытаний моделирования
супрамолекулярных комплексов “рецептор – лекарственное средство
Испытания проводятся с целью проверки работоспособности ПС BIS и её соответствия
требованиям технического задания (ТЗ) по составу, а также по функциональным и
техническим характеристикам.
III.5.1. Состав предъявляемой программной документации
На испытания предъявляется следующая программная документация:
спецификация;
текст программы;
44
описание программы;
руководство оператора;
файл с установочным пакетом ПС BIS в формате rpm.
III.5.2. Технические требования
Требования к функциональным характеристикам
ПС BIS должна обеспечивать
возможность поиска энергии и силы взаимодействия супрамолекулярных комплексов
“рецептор – лекарственное средство” в мультиконформационном режиме, исходя из
произвольной геометрии молекулы;
Должна присутствовать возможность просмотра результатов работы тестового
примера в удобном виде.
Требования к техническим характеристикам
ПС BIS должна использовать преимущества параллельной архитектуры, в
частности:
обеспечивать
возможность
распределения
вычислительной
нагрузки
на
вычислительные узлы кластерного уровня в процессе оптимизации ориентации молекул в
псевдоатомном поле и в процессе уточнения потенциалов поля (зарядов и радиусов
псевдоатомов)
при
моделировании
супрамолекулярных
комплексов
“рецептор
–
лекарственное средство”;
обеспечивать ускорение процесса конформационного поиска при увеличении числа
используемых вычислительных узлов.
Требования к программной документации
Состав предъявляемой программной документации должен соответствовать составу,
указанному в пункте 3 данного документа.
III.5.3. Порядок проведения испытаний
Технические условия проведения испытаний
45
Для проведения испытаний используется кластерный уровень суперкомпьютера
семейства «СКИФ» в составе:
управляющей ЭВМ, оснащенной стандартными средствами, необходимыми для
работы оператора (монитор, клавиатура);
вычислительных узлов кластерного уровня (базовые вычислительные модули
кластерного уровня, БВМ КУ);
системной сети кластера (Fast Ethernet), объединяющей вычислительные узлы;
вспомогательной сети (как правило, семейства Ethernet, с поддержкой TCP/IP),
объединяющей управляющую ЭВМ и вычислительные узлы.
ПС BIS должна функционировать под операционной системой Linux Fedora Core 9, на
которой предустановлено и нормально функционирует программные средства Open MPI
1.2.7 и LAM MPI .
Программный комплекс ПС BIS считается работоспособным, если он обеспечивает
правильное выполнение проверок.
Состав и порядок проверок при испытаниях ПС BIS:
Испытания наличия и полноты состава набора программного средства.
Испытания процесса инсталляции программного средства.
Испытания наличия и полноты функциональных возможностей программного
средства.
Возможности вычисления энергий и сил взаимодействия в модельных комплексах
“рецептор - лиганд”, а также потенциалов псевдоатомного поля. Различие потенциалов
поля не должно превышать величины 0.0005 в процедуре самосогласования.
Возможности
определения
зависимостей
биологической
активности
от
характеристик взаимодействия в модельном комплексе «рецептор-лиганд». Коэффициент
корреляции
расчетной
и
экспериментальной
биологической
активности
должен
находиться в пределах 0.95 – 1. Коэффициент корреляции расчетной и экспериментальной
биологической активности по оценке "скользящий контроль" должен находиться в
пределах 0.95 – 1. Стандартное отклонение биологической активности расчетной от
экспериментальной не должно превышать 0.05.
Испытание величины коэффициента утилизации вычислительной мощности.
46
III.5.4. Методы испытаний
Общие положения
Критерием соответствия ПС BIS требованиям ТЗ является выполнение следующих
условий:
состав ПС BIS соответствует требованиям, приведенным в ТЗ;
ПС BIS демонстрирует работоспособность на выполняемом наборе тестов, в которых
присутствуют проверки на соответствие всем пунктам требований к функциональным и
техническим характеристикам, указанным в ТЗ (тесты могут быть представлены
дополнительно на машинном носителе).
Методы проведения отдельных проверок
Испытания наличия и полноты состава программного средства.
Проверяется
наличие
RPM-пакетов,
содержащих
ПС
BIS,
а
также
наличие
сопровождающей программный комплекс документации в соответствии с разделом 3
настоящего документа.
Предоставляются два rpm-пакета:
bis-1.1-1.src.rpm;
bis-1.1-1.i386.rpm;
Метод проверки:
непосредственный просмотр предоставленной документации,
просмотр на управляющей ЭВМ файлов, расположенных на предоставляемом
носителе (CD ROM, содержащий ПС BIS) или на жестком диске — в том случае, если
данные файлы были предварительно скопированы на жесткий диск управляющей ЭВМ.
Просмотр производится с использованием стандартных команд интерпретатора shell и
системной
утилиты
ls.
Просмотр
содержимого
предоставленных
rpm-пакетов
производится посредством выполнения команды:
# rpm -qpl rpm_file_name
где rpm_file_name – имя файла просматриваемого rpm-пакетa.
Испытания процесса инсталляции программного средства.
47
Проверяется обеспечение возможности инсталляции компонентов программного
комплекса ПС BIS с использованием стандартной утилиты rpm и rpm-пакетов,
содержащих подготовленные к инсталляции компоненты ПС BIS.
Метод проверки: установка ПС BIS на управляющую ЭВМ суперкомпьютера
(frontend) с использованием стандартной утилиты для работы с rpm-пакетами –
программы rpm.
Для
установки
ПС
BIS
с использованием предоставленных
rpm-пакетов
необходимо установить на управляющей ЭВМ пакет bis, выполнив команду:
# rpm -Uvh bis -1.1-1.i386.rpm
или можно архивный файл с исходными текстами ПС BIS скопировать в домашний
каталог пользователя и далее выполнить команду:
$ cp source.tcc.tgz ~<user>
$ tar zxvf source.tcc.tgz
Установка основного пакета bis (bis-1.1-1.i386.rpm) должна производиться с
правами суперпользователя.
Проверка корректности результатов установки указанных пакетов производиться
посредством выполнения команды:
# rpm -qa | grep bis
Выполнение перечисленных команд должно завершиться корректно (без сообщений об
ошибках).
Два архивных файла с набором тестовых заданий test1.tgz и test2.tgz должны быть
скопированы в домашний каталог пользователя и разархивированы командой
$ cp test1.tgz ~<user>
$ tar zxvf test1.tgz
$ cp test2.tgz ~<user>
$ tar zxvf test2.tgz
Испытания наличия и полноты функциональных возможностей программного
средства.
Все шаги испытаний, описанные в данном и следующем разделах, должны производиться
на управляющей ЭВМ от имени обычного пользователя в специально созданном каталоге
пользователя (в дальнейшем данный каталог будем называть рабочим каталогом). Общая
схема работы системы BIS приводится в документе "Описания программы".
48
Предварительные действия
Перед проведением описанных в данном и следующем разделах шагов испытаний
необходимо:
скопировать исполняемый файл t-bis в каталоги со входными данными test1/ и test2/;
подготовить текстовый файл nodes.txt, где перечислить узлы, которые
будут задействованы программой mpirun.
Возможности оптимизации без конформационного поиска.
Метод проверки: выполнение команд
$ cd ~<user>/test1/
$ cat nodes.txt
frontend
node-11
node-12
node-13
node-14
node-21
node-22
node-23
node-24
$ lamboot -v ./nodes.txt
$ /usr/bin/mpirun -np 16 ./t-bis 2>&1 | tee result-16.txt
$ lamhalt
Команда t-bis производит поиск энергии и силы взаимодействия и поиск
зависимости биологической активности от характеристик взаимодействия в модельном
комплексе «рецептор-лиганд».
Результатом успешного выполнения команды является создание результирующего
файла result-16.txt с выходными данными – энергиями взимодействия. Наличие файла
проверяется при помощи системной утилиты ls.
49
Описание представления информации в файле result-8.txt и ее интерпретация
приводится в "Руководстве оператора".
Во всех тестовых заданиях результаты расчетов в файле
result-8.txt
должны совпадать с точностью до 3-его знака после запятой.
Испытание величины коэффициента утилизации вычислительной мощности,
обеспечиваемой ПС BIS.
Метод проверки: производится вычисление коэффициента утилизации вычислительной
мощности с использованием результатов замеров времени обработки эталонного набора
текстов при использовании для классификации одного вычислительного узла (данное
время будем обозначать t1) четырех вычислительных узлов (t4), шестнадцати
вычислительных узлов (t16).
Для проведения данной проверки необходимо выполнить следующие действия:
выполнить предварительные действия, описанные в разделе «Предварительные
действия» настоящей методики;
исполнить команды
$ cd test1
test1$ lamboot -v ./nodes.txt
test1$ /usr/bin/mpirun –np 1 ./t-bis 2>&1 | tee result-1.txt
test1$ lamhalt
Зафиксировать время (t1), затраченное на обработку текстов при использовании четырех
вычислительных узлов ;
исполнить команды
$ cd test1
test1$ lamboot -v ./nodes.txt
test1$ /usr/bin/mpirun –np 4 ./t-bis 2>&1 | tee result-4.txt
test1$ lamhalt
Зафиксировать время (t4), затраченное на обработку текстов при использовании
четырех вычислительных узлов;
Зафиксировать время (t16), затраченное на обработку текстов при использовании
шестнадцати вычислительных узлов;
по формуле
k1=(t1*1)/(t4*4)
50
k2=(t4*4)/(t16*16)
вычислить два значения коэффициента утилизации вычислительной мощности.
Аналогичные проверки провести для теста 2 (каталог test2/)
III.6. Сравнение производительностей последовательной версии программы с
параллельной Т-версией программы
Обе версии программы тестировались на кластере “СКИФ Первенец-М”, имеющем
следующую конфигурацию:

операционная система Linux;

ядро 2.4.27;

число вычислительных узлов (процессоров) 16 (32), тип процессора Intel
Pentium III 600 MHz;

тип управляющей (вспомогательной) сети Fast Ethernet;

Предельная пиковая (реальная на задаче Linpack) производительность 20
(11) Gflops.
В качестве MPI использовался LAM MPI 7.0.6. Тестирование проводилось для
числа процессоров от 1 до 24. Последовательная версия программы запускалась на одном
процессоре, Т-версия запускалась на подсети кластера из 1-24 процессоров. Для каждого
прогона замерялось время выполнения программы в секундах.
В Таблице 3 и на Рис. 15, 16 представлены результаты тестирования.
Обе версии программы также тестировались на кластере “СКИФ К-1000”,
имеющем следующую конфигурацию:

операционная система Linux;

тип управляющей (вспомогательной) сети InfiniBand;

Предельная пиковая (реальная на задаче Linpack) производительность 2.5
Tflops.
В качестве MPI использовался OpenMPI 1.2.5. Тестирование проводилось для числа
процессоров от 1 до 111. Последовательная версия программы запускалась на одном
процессоре. Для каждого прогона замерялось время выполнения программы в секундах.
В Таблице 4 и на Рис. 17, 18 представлены результаты тестирования.
51
Таблица 3
Сравнение времени выполнения Т-версии и последовательной версии программына
кластере “СКИФ Первенец-М”
Количество
процессоров
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Время выполнения
последовательной версии, с
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
1764
Время выполнения Тверсии программы
3298
1724
1162
788
701
636
530
427
390
377
376
374
340
315
289
288
370
499
620
732
732
731
663
661
Ускорение
0.53
1.02
1.52
2.24
2.52
2.77
3.33
4.13
4.52
4.68
4.69
4.72
5.19
5.60
6.10
6.13
4.77
3.54
2.85
2.41
2.41
2.41
2.66
2.67
3500
3000
Время, сек
2500
2000
1500
1000
500
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Число процессоров
Время выполнения последовательной версии, сек
Время выполнения Т-версии, сек
Рис. 15
Сравнение времени выполнения последовательной и Т-версии программы. Кластер "СКИФ
Первенец-М", LAM MPI 7.0.6, OpenTS v.3.1
52
7.00
6.00
Ускорение
5.00
4.00
3.00
2.00
1.00
0.00
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Число процессоров
Ускорение Т-версии программы
Последовательная версия программы
Рис. 16
График ускорения Т-версии относительно последовательной версии программы. Кластер
"СКИФ Первенец-М", LAM MPI 7.0.6, OpenTS v.3.1
Таблица 4
Сравнение времени выполнения Т-версии и последовательной версии программына
кластере “СКИФ К-1000”
Количество
процессоров
Время выполнения
последовательной версии, с
Время выполнения Т-версии
программы
Ускорение
2
2042.164
1432.826
1.425
4
2042.164
532.156
3.837
8
2042.164
307.310
6.645
12
2042.164
194.853
10.480
16
2042.164
136.465
14.965
20
2042.164
117.949
17.314
24
2042.164
103.886
19.658
28
2042.164
85.496
23.886
32
2042.164
87.536
23.329
37
2042.164
67.220
30.380
111
2042.164
37.552
54.382
53
Последовательная версия
Т-версия
2200
2000
1800
1600
Время, с
1400
1200
1000
800
600
400
200
0
0
20
40
60
80
100
120
Число процессоров
Рис. 17
Сравнение времени выполнения последовательной и Т-версии программы. Кластер "СКИФ
К-1000”
54
60
50
Ускорение
40
30
20
10
0
0
20
40
60
80
100
120
Число процессоров
Рис. 18
График ускорения Т-версии относительно последовательной версии программы. Кластер "СКИФ
К-1000"
Наши исследования показали следующее:

параллельная реализация программы с помощью Т-Системы с открытой
архитектурой (OpenTS) компактна и проста;

потребовались лишь незначительные изменения исходного кода, чтобы
сделать Т-версию программы;

получено ускорение работы параллельной версии программы относительно
её последовательного аналога.
Тем самым, Т-Система с открытой архитектурой (OpenTS) показала себя как
эффективное средство для реализации параллельных версий прикладных программ, а
предложенное ПО может быть использовано для демонстрации преимуществ ГРИДсервиса на его основе.
55
IV. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ ПОСТАВЛЕННЫХ
ЗАДАЧ
IV.1. Моделирование комплексов акриданов с окислителями
Проблема отщепления гидрид-аниона от дигидропиридинов и их аналогов имеет
фундаментальное значение для органической и биоорганической химии и остается
предметом многочисленных исследований и дискуссий уже почти три десятилетия [53 –
56].
Важность
понимания
этого
механизма
объясняется
тем,
что
конверсия
дигидропиридинов с переносом гидрид-аниона лежит в основе важнейших процессов в
живой природе, протекающих с участием никотинамидадениндинуклеотидов (НАДННАД,
НАД(Ф)Н-НАД(Ф))
–
основных
участников
процессов
метаболизма
и
энергообеспечения клетки [57 - 59]. Основной парадокс подобных процессов заключается
в отрыве гидрид-аниона от атома углерода дигидропиридинов (например, [60]). Процесс
отрыва гидрид-аниона вполне логичен для гидридов металлов. В подобных системах
происходит смещение электронной плотности вдоль связи Н-Ме от атома металла к атому
водорода, что обеспечивает возможность отрыва гидрид-аниона от атома металла. Что
касается С-Н связей, характеризующихся незначительным смещением электронной
плотности от атома водорода к атому углерода, процесс отрыва гидрид-аниона кажется
невероятным. Для выяснения причин, определяющих протекание данного процесса в
системах, подобных системе НАДН и убихинона, на настоящий момент проведено
множество экспериментальных исследований (например, [60 – 64]). Среди них важное
место занимают производные акридана, для которых на настоящий момент проведены
исследования реакций с производными бензохинона, а также другими окислителями,
имитирующими убихинон. Определены теплоты реакций, ЭПР-спектры реакционной
ячейки, окислительно-восстановительные потенциалы, константы депротонирования
участников реакций и т.д. Однако проведенные исследования не дают полного ответа о
механизме и причинах подобных процессов. Для выяснения природы данного явления
необходима
включающих
совокупность
рассмотрение
экспериментальных
электронных,
и
теоретических
энергетических
и
исследований,
геометрических
характеристик как участников реакций, так и процессов в целом. Поэтому в настоящей
работе рассмотрены реакции 9-R-10-метил-9,10-дигидроакридинов (I) (схема 1) с такими
окислителями, как дихлордициано-п-бензохинон (DDQ), тетрацианэтилен (TCNE), хлорат
железа, 2-(п-трифторметилбензил)-малононитрил (S). Данные реакции интересны еще и в
связи с тем, что в ряде случаев они могут протекать не только по направлению
56
R
Схема 1.
+
R H
[O]
II
N
CH3
H
N
I CH3
III
R=H (a); CH3 (b); Et (c); Ph (d);
CH2COOEt
(e);
C(Me)HCOOEt
(f);
+
CH2Ph (g); i-Pr (h); 1-CH2C10H7 (i); t-Bu
N
(j); CMe2COOMe (k)
CH3
расщепления С-Н связи (с образованием продукта II), но и по направлению расщепления
С-С связи (с образованием продукта III) [60].
Для каждого из рассмотренных соединений I и окислителей определена геометрия
структур, соответствующих глобальному минимуму потенциальной энергии. Показано,
что система колец молекул I имеет непланарное строение (Рис. 19). Такое строение
молекулы в случае соединения Ia приводит к неэквивалентному окружению атомов
водорода в положении 9. Данные результаты моделирования хорошо согласуются с
исследованиями, приведенными в [60].
Для оценки качества моделирования структур молекул проведено сопоставление
расчетной геометрии с результатами рентгеноструктурного исследования [65, 66]
незамещенных по атому N9 аналогов (9-R-9,10-дигидроакридинов IV) (Таблица 5)
(R=СН3, i-Pr, t-Bu). Показано, что расчетные длины связей, валентные углы
б)
Рис. 19
Геометрическое строение молекул акриданов на примере соединения Ie: а) вид со
стороны бензольного кольца, б) вид со стороны атома азота N9
57
Таблица 5
Длины связей С9-С15 (rC9-C15, Å), валентные углы С11-С9-С15 (α1, 0), C14-C9-C15
(α2, 0), C11-C9-C14 (α3, 0)
1
2
3
H
R15
11
12
4
8
14
9
7
2
6
13
N
1
3
5
4
CH3
R15
H
11
9
14
12
N
H
13
8
7
6
5
IV
I
Соединение
rC9-C15
α1
α2
α3
Ib (расч.)
1.543
108.8
108.8
113.9
IVb (РСА)
1.531
110.9
110.1
111.2
Ih (расч.)
1.560
107.7
112.3
113.0
IVh (РСА)
1.554
113.4
110.2
110.4
Ij (расч.)
1.576
110.7
110.7
111.4
IVj (РСА)
1.556(6)
113.8(4)
113.4(4)
109.5
неплохо согласуются с данными рентгеноструктурного анализа соответствующих
аналогов. Так, отклонение длин связей не превышает 0,02 Å, валентных углов – 2.70.
Результаты сравнения позволяют предположить, что используемые методы адекватно
описывают геометрию молекул I. Поэтому для каждой из расчетных структур найдены
энергетические,
электронные,
геометрические
и
орбитальные
характеристики
с
использованием комплекса квантовохимических (DFT B3LYP/6-311G(d,p)), молекулярномеханических методов (силовое поле ММ3), а также модели MERA [23] Найдена
зависимость потенциала окисления соединений I от энергии их высшей занятой
молекулярной
орбитали,
рассчитанной
(DFT
B3LYP/6-311G(d,p)).
Коэффициент
корреляции составил K=0.95, что показывает возможность использования данных
подходов для оценки электронных характеристик рассмотренных молекул.
Сравнение энергий ВЗМО и НСМО соединений I и перечисленных окислителей
показывает, что соединения I обладают значительно более высокой энергией ВЗМО, а
значит, и более выраженными нуклеофильными свойствами, нежели рассмотренные
окислители. Поэтому наиболее вероятным электронным переходом в системах
“соединение I-окислитель” является электронный переход с ВЗМО молекулы I на НСМО
окислителя (Схема 2). Более того, в случае такого окислителя, как DDQ, этот электронный
58
Схема 2.
переход не требует дополнительных энергетических затрат (данный переход выделен на
схеме 2 жирной линией).
По этой причине приведенные в [62] константы скорости реакции с DDQ в
несколько раз превышают константы скорости реакций с TCNE. Перенос электронной
плотности с молекулы I на молекулу окислителя объясняет образование катион-радикала
I+•, регистрируемого в ЭПР-спектрах реакционной смеси [60].
Для оценки возможности электронного переноса в рамках алгоритма MOPS,
проведено моделирование комплексов окислителей с молекулами I. Данный алгоритм
осуществляет поиск наиболее выгодных структур комплексов вдоль колебательных мод
гессиана с континуальным учетом растворителя (в данном случае при расчетах
использованы характеристики CH3CN, в котором проводилась реакция соединений I с
окислителями [60]), что позволяет определять структуру наиболее выгодного комплекса
независимо от первоначального расположения молекул друг относительно друга.
Обнаружено, что в случае сопряженных систем (DDQ, TCNE, S) наиболее выгодным
является параллельное расположение колец акридана и окислителя (Рис. 20а, б). В случае
хлората железа наблюдается ориентация хлорат-анионов и катиона железа по дуге,
охватывающей систему акридана (Рис. 20в). Несмотря на кажущиеся отличия в строении,
для
всех
комплексов,
независимо
от
окислителя,
характерна
координация
электроотрицательных атомов кислорода или азота окислителя около положительно
заряженного атома водорода H(9) молекулы I, что может инициировать его отщепление. В
случае хлората железа и DDQ расстояние между атомом кислорода окислителя и атомом
водорода соединения I составляет 2.8 ÷ 2.9 Å, что соответствует расстоянию ван-дер59
N
O
N
N
Cl
N
Cl
N
N
O
N
N
б)
а)
O
N
O
N
O
O
O
Cl
Fe
Cl
O
O
O
O
O Cl
N
O
N
O
O
в)
г)
Рис. 20
Структуры модельных комплексов соединений I c окислителями на примере: а)
соединения Ic и DDQ; б) Ib и TCNE; в) Ik и Fe(ClO4)3, г) Ic и S
ваальсового контакта. В случае TCNE доминируeт взаимодействие делокализованных
электронных облаков, сходное со стэкинг-взаимодействиями. Как следствие, не
наблюдается контакта H(9)…N (межъядерное расстояние 3.5 Å).
Таким образом, процесс переноса водорода может начинаться с образования
комплекса “соединение I – окислитель”, сопровождающегося переносом электронной
плотности с ВЗМО молекулы I на НСМО окислителя. При этом на молекуле I в комплексе
концентрируется положительный заряд, равный 0,13 ÷ 0,17 а.е. Кроме того, при переносе
электронной плотности с молекулы I на окислитель происходит увеличение заряда (по
60
Малликену) на атоме водорода H(9) соединения I (так, например, до образования
комплекса с DDQ в соединении Ib он равен +0.135, после - +0.151) и понижение заряда на
атоме кислорода окислителя (в DDQ заряд атома кислорода равен -0.241, в комплексе с
соединением
Ib
он становится равным
-0.290). Данный
процесс приводит
к
дополнительному электростатическому связыванию между атомами водорода молекулы I
и кислорода окислителя, что может инициировать процесс отщепления водорода от
молекулы I. Связывание атомов водорода и кислорода в полученных при моделировании
комплексах акриданов с DDQ, Fe(ClO4)3, TCNE подтверждается проведенным в рамках
теории AIM [27] топологическим анализом электронной плотности, определенной DFT/6311G(d,p). Показано, что помимо критических точек (3,-1) электронной плотности,
определяющих стэкинг-взаимодействия, имеется критическая точка (3,-1), находящаяся в
пространстве между ядрами атома водорода акридана и атома кислорода окислителя,
определяющая их связывание (Рис. 21). Таким образом, соединение I выступает в роли
частицы, передающей электронную плотность окислителю, и в роли частицы,
отщепляющей водород. При отщеплении водорода происходит образование частицы II.
Однако существенное распределение НСМО на атоме углерода C(9), а также его высокая
стерическая доступность при отрыве водорода позволяют участвовать данному атому в
обратном процессе рекомбинации – процессе присоединения водорода и образования
частицы I+•. Тогда, чем более устойчивым, или, другими словами, термодинамически
Критическая точка
(3,-1) в пространстве
между ядрами атома
кислорода окислителя
и атома водорода
соединения I.
Критические точки
(3,-1) стэкингвзаимодействия
циклов соединения
I и DDQ.
Рис. 21
Критические точки (3,-1) электронной плотности на примере комплекса
соединения Iс с DDQ
61
стабильным является катион II, тем более вероятным является протекание только прямого
процесса – отщепления водорода от соединения I. Действительно, найдена зависимость
потенциалов восстановления катионов II (EII), характеризующих их реакционную
способность, от теплоты образования катионов II (HFII) (К=0.83).
В том случае, если данный процесс является обратимым, то есть образовавшийся
катион II вследствие низкой стабильности присоединяет атом водорода по атому углерода
С(9) с максимальной заселенностью НСМО, образуется нестабильная частица I+•. В
последней происходит другой из возможных вариантов деструкции – отщепление
заместителя R и стабилизация за счет образования катиона III. Действительно, в случае
производных акридана, взаимодействующих с окислителями преимущественно по
направлению образования продукта III [60], соответствующие катионы II обладают
низкой стабильностью и высоким распределением НСМО орбитали на атоме С(9)
(pНСМО=0,207-0.219) [21]. Катионы II, обладающие низким распределением НСМО на
атоме С(9) (pНСМО=0,186-0,207), имеют низкую реакционную способность по отношению к
атому водорода, поэтому отщепляют его необратимо.
Найдены зависимости логарифма константы скорости (lnk) реакции соединений I с
окислителями DDQ и TCNE от энергии (ΔEDDQ и ETCNE) образования соответствующих
комплексов “соединение I-окислитель”, а также от доли (dC(9)) свободной поверхности
атома углерода С(9) катиона II. Полученные зависимости описывают величину lnk с
коэффициентами корреляции 0,99 и 0,93 соответственно (Рис. 22):
lnkDDQ=251+204•dC(9)+302•ΔEDDQ
lnkTCNE=-15.9+274•dC(9)+ 11,7•ΔETCNE
где ΔEDDQ=EI•DDQ-EI-EDDQ и ΔETCNE=EI•TCNE-EI-ETCNE. При этом EDDQ, ETCNE и EI полная энергия молекул DDQ, TCNE и I; EI•DDQ и EI•TCNE - полная энергия комплексов
“соединение I-окислитель”.
Величины
полных
энергий
рассчитаны
DFT/6-311-G(d,p),
величины
dC(9)
рассчитаны с использованием алгоритма Коннолли [67].
Данные взаимосвязи вполне подтверждают принятые выше предположения.
Таким
образом,
проведенное
моделирование
процессов
взаимодействия
производных акридана с окислителями показало, что суммарный процесс – отщепление
гидрид-аниона у производных акридана окислителями – является следствием переноса
электронной плотности с ВЗМО акридана на НСМО окислителя с образованием
комплексов “акридан-окислитель” и отрывом в данном комплексе атома водорода от
62
16
8
14
6
12
4
10
2
lnk (Obs.)
lnk(Obs.)
8
6
0
-2
4
-4
2
-6
0
-8
-2
-10
-4
-4
-2
0
2
4
6
8
10
12
14
16
-12
- 10
-8
-6
-4
lnk (pred.)
-2
0
2
4
6
8
lnk (Pred.)
б)
a)
Рис. 22
Зависимость расчетной (Pred.) и экспериментальной (Obs.) величины lnk для
реакции I с: а) DDQ, б) TCNE
производного акридана молекулой окислителя. Найдены зависимости логарифмов
констант
скоростей
окислитель”.
от
Качество
параметров
строения
моделирования
модельных
проверено
при
комплексов
“акридан-
сопоставлении
расчетных
характеристик рассмотренных частиц с экспериментальными данными по потенциалам
окисления, данными РСА, константами скоростей процессов.
IV.2. Моделирование водного окружения двойной спирали ДНК
Нуклеиновые кислоты, а также процессы, протекающие в живых организмах с их
участием, представляют серьезный интерес. Изучение ДНК, в том числе влияния его
водного окружения является важнейшей задачей, имеющей как фундаментальное, так и
прикладное значение (например, при создании новых лекарственных препаратов).
Существующие представления о расположении молекул воды относительно ДНК не дают
общих характеристик распределения (например, [68]). Поэтому предприняты вывода
функции, описывающей распределение молекул воды вокруг ДНК, а также рассмотрены
некоторые
взаимодействия
d(GpCpTpApGpC)
с
в
системе
на
противоопухолевым
примере
комплекса
лекарственным
фрагмента
средством
ДНК
4'-эпи-4'-(2-
деоксифукозо)-дауномицином (Рис. 23).
Согласно данным РСА (Protein Data Bank [69]) кристаллическая структура
комплекса ДНК с лекарственным средством имеет пространственную группу симметрии
Р41212. Параметры кристаллической ячейки: а = b = 28.12 Å, c = 52.98 Å, α = β = γ = 90˚.
63
O
O
OH
OH
OMe
O
OH
O
O
H2N
O
O
HO
OH
Рис. 23
Структура лекарственного средства
Разрешение 1.3 Å. Кристаллическая ячейка комплекса содержит также 544
молекулы воды.
Геометрия водного окружения оптимизирована в рамках алгоритма MOPS.
Проведена оценка симметрии водного окружения комплекса в рамках алгоритма,
описанного в [70]. Сольватная оболочка была условно разделена на две части:
внутреннюю и внешнюю. Критерием разделения послужил радиус нуклеиновой кислоты,
определенный как среднее арифметическое из расстояний от главной оси ДНК до всех
атомов комплекса. С учетом среднеквадратичного отклонения получено четыре значения
среднего радиуса: 3.35Å; 5.86Å, 8.37Å и 9,05Å. Восемь полученных систем приведены к
минимуму потенциальной энергии водного окружения по геометрическим параметрам и
рассчитаны степени симметрии массивов молекул воды относительно поворотных и
зеркально-поворотных осей с первого по шестой порядков.
Из средних значений степеней симметрии по всем рассматриваемым элементам
видно, что при увеличении и удалении молекул воды от оси спирали нуклеиновой
кислоты их симметричность возрастает (Таблица 6). Внешнее водное окружение является
наиболее симметричным и практически не изменяется при изменении числа молекул
воды. Из всего этого можно сделать вывод о том, что ДНК влияет на структуру ближнего
водного окружения, причем влияние это ослабляется при удалении от главной оси
спирали и исчезает на расстоянии, примерно соответствующему истинному радиусу
нуклеиновой кислоты. Данный эффект достигается за счет расположения молекул воды
64
Таблица 6
Радиус нуклеиновой кислоты (R, Å), количество молекул воды и среднее значение
степени симметрии водного окружения систем с комплексом (Nкомп, Symкомп) и с ДНК
(NДНК, SymДНК).
Окружение
Внутреннее
Внешнее
R
3,35
5,86
8,37
9,05
9,05
8,37
5,86
3,35
Nкомп
0
41
135
177
367
409
503
544
0,023
0,093
0,186
0,993
0,999
1,000
1,000
Symкомп
NДНК
54
330
825
969
663
807
1302
1578
SymДНК
0,075
0,083
0,774
0,967
0,435
0,758
1,000
1,000
преимущественно в пустотах больших бороздок. Таким образом, большая часть молекул
воды, подобно ДНК, принимает форму спирали.
Из
оптимизированной
структуры
комплекса
были
извлечены
молекулы
лекарственного средства. Проведена повторная оптимизация геометрии массива молекул
воды. Аналогично комплексу определены характеристики симметрии водного окружения
ДНК (Таблица 6). При увеличении молекул воды и при удалении от оси спирали
симметричность водного окружения возрастает. В данном случае также проявляется
влияние хиральной нуклеиновой кислоты, которое осуществляется за счет образования
спиральных структур с большим количеством молекул воды в большой бороздке по
сравнению с малой.
Для выявления закономерностей в расположении молекул воды был рассмотрен
характер их распределения по направлениям, перпендикулярным оси спирали ДНК с
интервалом в 15˚. Введена прямоугольная декартова система координат путем
проецирования всех атомов на плоскость, перпендикулярную оси спирали ДНК, так,
чтобы сама ось проходила через центр такой системы. Найдены углы между радиусвекторами до молекул воды и положительным направлением оси х по формуле:
 yi 

x
 i
i  arctan 
где xi , yi – координаты x и y атома кислорода i-й молекулы воды. Выбраны 12
направлений по 15˚ от -90˚ до 90˚. Для каждого из них построена гистограмма
65
распределения. На основе гистограмм построены кривые распределения так, что за
координаты x взяты середины ширин столбцов, а за y – высоты столбцов.
Оказалось, что молекулы воды распределяются вдоль различных направлений
схоже. Вероятность обнаружения воды при малых расстояниях стремится к нулю, имеется
только один максимум и при бесконечно больших расстояниях стремится к некоторому
предельному значению. Попытка использования функции распределения молекул в
жидкости Кирквуда [71] и полиноминальных уравнений различных степеней для описания
полученных зависимостей не привела к адекватным результатам. Поэтому была
использована эмпирически выведенная функция:
W ( R) 
a0  a1 R 2
b0  b1 R  b2 R 2
где a0, a1, b0, b1, b2 – коэффициенты; R – длина радиус-вектора до атома кислорода
молекулы воды. Средний коэффициент корреляции 0,93. На основе значений максимумов
функций,
и
распределения
соответствующих
плотности
им
расстояний,
вероятности
построены
обнаружения
радиальные
молекул
воды
и
кривые
кривые
распределения наиболее вероятного расстояния от главной оси ДНК до молекул воды
(Рис. 24). Исходя из диаграмм видно, что вода в большей степени концентрируется в
направлениях 45˚, 135˚, 225˚ и 315˚. Наименьшая плотность достигается при 0˚, 75˚, 180˚ и
255˚. Расстояние изменяется в более узких пределах и в среднем составляет 9,8Å.
В системе без лекарственного средства происходят изменения в характере распределения
молекул воды по направлениям (Рис. 24). Плотность вероятности значительно
уменьшается при 60˚, 240˚ и увеличивается при 75˚ и 255˚. Это связано с тем, что при
выходе объемных молекул лекарства, нафтаценильные остатки которых ориентированы
вдоль одного и того же направления, из ДНК, близлежащие молекулы водного окружения
стремятся их заполнить. В данной системе это молекулы воды в направлениях 60˚ и 240˚.
После чего молекулы дальнего окружения стремятся занять места ближних. Такое
поведение водного окружения, в конечном счете, приводит к его стягиванию к главной
оси нуклеиновой кислоты, что и проявляется в уменьшении среднего расстояния до точки
с максимальной концентрацией воды до 8,5Å.
Проведен анализ межмолекулярных взаимодействий в системах комплекс-вода и
ДНК-вода. Для этого были найдены все возможные контакты между парами атомов N–H,
O–H и P–H молекул воды и комплекса, длина которых меньше суммы ван-дер-ваальсовых
радиусов соответствующих атомов. Оказалось, что 148 молекул воды (27%) образуют 236
контактов с комплексом, из которых 125 (53%) – водородные связи. В системе ДНК-вода в
66
90˚
120˚
105˚
0.06
90˚
75˚
0.05
135˚
60˚
45˚
0.04
150˚
120˚
0.02
165˚
0˚
195˚
345˚
210˚
330˚
225˚
315˚
255˚
30˚
4
165˚
15˚
2
0.00
240˚
45˚
6
0.01
180˚
60˚
8
150˚
15˚
75˚
12
10
135˚
30˚
0.03
105˚
285˚
300˚
180˚
0
0˚
Å
195˚
345˚
210˚
330˚
225˚
315˚
240˚
255˚
285˚
300˚
270˚
270˚
Рис. 24
Радиальные диаграммы распределения вероятности (слева) и расстояния до
максимума плотности вероятности обнаружения молекул воды (справа) для водного
окружения комплекса (пунктирная линия) и ДНК (сплошная линия)
связывании участвуют 177 молекул воды (33%), образуя 271 контакт с нуклеиновой
кислотой, среди которых 92 (34%) представляют собой водородные связи.
На гистограмме распределения числа контактов по расстояниям для структуры с
лекарством имеются три максимума (Рис. 25). Первый в области 1,7Å соответствует
водородным связям с участием атомов N молекулы ДНК, причем в данной системе около
70% этих связей образует атом N гуанина в положении 7, блокирование которого
предположительно
и
обеспечивает
антиметаболическое
действие
лекарственного
средства. Второй в области 2,2Å отвечает водородным связям с участием групп О–Н
молекул воды. Третий в области 2,6Å – более длинным контактам. Для структуры без
лекарства, первый максимум на 60% составляют водородные связи между атомами азота
гуанина и группой О–Н молекул воды, на 40% – азоты аденина. Максимум в области 2,2Å
исчезает, а в области 2,6Å усиливается. Это объясняется, во-первых, образованием на
расстоянии 2,2Å водородных связей между молекулами воды и лекарственного средства,
и, во-вторых, можно предположить, что после разрушения комплекса возникает
конкуренция воды за активные центры ДНК, способные образовывать водородные связи.
При этом молекулам воды, стремящимся максимально приблизиться к активному центру,
из-за стерических затруднений приходиться удаляться на некоторое равновесное
расстояние, что и проявляется в увеличении III максимума.
Таким образом, в ходе проведенного исследования было определено, что
симметричность водного окружения увеличивается при увеличении числа молекул воды и
67
90
80
70
60
N
50
40
30
20
10
0
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
R, А
Рис. 25
Гистограммы распределения числа сокращенных контактов по их длинам,
образуемых молекулами воды с комплексом (черный) и ДНК (серый)
удалении от главной оси ДНК и практически исчезает на расстоянии, равном радиусу
нуклеиновой кислоты, что связано с расположением молекул воды преимущественно в
полостях больших бороздок. Показано, что характер распределения молекул воды по
направлениям, ортогональным оси ДНК подчиняется эмпирической функции со средним
коэффициентом корреляции 0,93. Определено, что наиболее короткие контакты с
молекулами воды образуют атомы N гуанина и аденина (до 1,9Å).
IV.3. Исследование комплексов “хозяин - гость” для газовых гидратов
Клатратные гидраты - это соединения включения, в которых каркас хозяина
построен из водородносвязанных молекул воды, а полиэдрические полости этого каркаса
способны включать широкий ряд молекул гостя от водорода и гелия до больших
органических молекул. В случае, если в качестве гостя выступают газообразные при
нормальных условиях вещества, соединения часто называют газовыми гидратами. При
небольших давлениях (десятки МПа) подавляющее большинство из них относятся к трем
структурным типам – двум кубическим [72, 73] и гексагональному (structure H) [74].
Гидратные каркасы всех этих структур содержат несколько типов полиэдрических
полостей, для кубической структуры-I это D (512, это обозначение показывает, что полиэдр
68
имеет 12 пятиугольных граней) и T (51262) полости, для кубической структуры-II - D и H
(51264), структура Н - D, D’ (435663) и E (51268).
При повышении давления во многих системах происходит образование новых, более
плотных гидратов. В последние годы выполнены многочисленные структурные и физикохимические исследования гидратов, образующихся в системах вода - азот, водород,
инертные газы, метан, и некоторых других. Например, в системе аргон – вода в области
давлений до 3 ГПа показано существование четырех гидратов с разной структурой.
Гидрат аргона КС-II, существующий при атмосферном давлении, стабилен до давления
460 МПа. В интервале 460-760 МПа существует гидрат структуры Н с пятикратным
заполнением большой полости атомами аргона. Структуры гидратов, существующих при
давлении выше 760 МПа относятся к принципиально новым структурным типам. Все
атомы аргона в этих структурах имеют одинаковое окружение молекулами воды, т.е. обе
структуры могут быть представлены как объединение полиэдрических полостей одного
типа. Гидраты такого типа обнаружены и в системах метан – вода и тетрагидрофуран –
вода.
Система гексафторид серы – вода является представителем большого класса систем
с характерным размером молекул гостя порядка 6 Å, в которых при атмосферном
давлении образуются клатратные гидраты кубической структуры. Гость здесь заполняет
только большие полости каркаса (1 молекула на полость), малые полости остаются
вакантными. Характерная стехиометрия таких гидратов
G*17H2O. На Рис. 26
представлена Р,t-проекция фазовой диаграммы системы гексафторид серы—вода,
изученная в работе [75]. По изломам на кривой плавления можно судить, что в интервале
давлений до 1.3 GPa в системе гексафторид серы—вода образуется по крайней мере три
гидрата. Гидрат h1 (гидрат состава SF6.17H2O [76, 77]) стабилен вплоть до 33,2 МПа. Далее
при движении по давлению «снизу вверх» ветвь разложения этого гидрата l1h1l2
прослеживается вплоть до 58 МПа (10.5С), т.е. в Р,Т-область, где он метастабилен. При
повторных циклах плавление-кристаллизация или длительной экспозиции в этой области
кристаллизуется другая твердая фаза h2. Кривая разложения этого гидрата l1h2l2
прослеживается в интервале давлений от 33,2 до 131,9 МПа. При давлении 131.9 МПа на
кривой разложения гидрата имеется четкий излом, соответствующий появлению в системе
нового гидрата h3. Инконгруэнтное разложение гидрата h2 (линия l1h1s) наблюдалось при
давлениях до 201.5 МПа, т.е. существенно превышающих те, при которых гидрат
стабилен. Линия разложения гидрата h3 была изучена до давления 1.3 GPa. Ранее нами
производились дифракционные исследования образцов гидратов гексафторида серы,
находящихся в области стабильности этого гидрата. Все полученные порошкограммы
69
Рис. 26
Фазовая диаграмма системы SF6 – H2O
соответствовали КС-I, т.е. структуре гидрата h2. Наиболее правдоподобным объяснением
этого наблюдения предполагалось существование метастабильного гидрата h2 в области
стабильности гидрата h3, хотя степень “передавливания” (до 450 МПа от ожидаемого
давления перехода!) вызывало удивление, особенно учитывая тот факт, что на фазовой
диаграмме метастабильная ветвь разложения гидрата h2 прослеживалась только до
давления в 201.5 МПа.
Обнаруженный ранее тип фазового превращения ранее для газовых гидратов
описан не был, в связи с чем интересно рассмотреть вопрос о движущих силах этого
превращения. Наиболее правдоподобным здесь представляется объяснение, связанное с
уменьшением суммарного объема системы за счет заполнения пустот в гидратном
каркасе. Следует отметить, что подобное явление – эффект сверхгидратации - хорошо
известно для некоторых цеолитов. Так, например, при сжатии натролита в водной среде в
цеолитный каркас входят дополнительные молекулы воды, что приводит к увеличению
объема твердой фазы, общий объем системы при этом уменьшается. Обсудим этот вопрос
подробнее, взяв в качестве примера рассматриваемые гидраты гексафторида серы.
Хорошо известно, что величина свободной энергии Гиббса G = E-TS+PV. Рассмотрим
вклад различных термов в свободную энергию гидрата h3 при давлении 0.9 ГПа.
70
В рассматриваемых условиях нас прежде всего интересует вклад во внутреннюю
энергию всех видов внутри- и межмолекулярных взаимодействий в гидратах h2 и h3,
соответственно мы можем при этом считать внутреннюю энергию гидрата равной сумме
энергий этих взаимодействий. Рассчитанная с помощью алгоритма MOPS энергия внутрии межмолекулярных взаимодействий (E) в зависимости от степени заполнения малых
полостей при давлении 0.9 GPa была пересчитана в изменение внутренней энергии
гидрата данного состава при включении в малые полости каркаса 1 моля гексафторида
серы. Из Рис. 27 видно, что включение молекул гексафторида серы в малые полости во
всех случаях приводит к увеличению внутренней энергии гидрата, причем. из-за весьма
«плотного» их расположения потенциальная поверхность системы имеет большое число
локальных минимумов со значительно различающимися энергиями. С хорошей точностью
можно считать, что ориентации молекул гексафторида в малых полостях будут
120
100
E, kcal/mol
80
60
40
20
0
0.0
0.2
0.4
0.6
0.8
1.0
1.2
s
Рис. 27
Расчетная энергия клатратного гидрата гексафторида серы в зависимости от
степени заполнения малых полостей
71
соответствовать таковым с минимальной энергией. Таким образом, при изменении
степени заполнения малых полостей в пределах 0 - 0.33 величина проигрыша в энергии
системы за счет заполнения малых полостей (EISO) составляет 60 – 70 кДж в расчете на
моль гексафторида серы. Снижение свободной энергии здесь достигается за счет
уменьшения терма PV и небольшого увеличения энтропии за счет конфигурационной
составляющей (для y = 0.3 конфигурационная энтропия составляет 1.5 кДж/моль SF6).
Мольный объем чистого гексафторида серы при давлении 0.9 ГПа составляет 57 см3, что
дает величину PV = 51.3 кДж/моль SF6. Формальное сложение полученных величин дает
небольшой рост свободной энергии гидрата при включении молекул гексафторида серы в
малые полости, т.е. можно ожидать обратного процесса – разложения гидрата, что
противоречит экспериментальным данным. С другой стороны, из приведенных оценок
видно, что абсолютная величина EISO в рассматриваемых условиях близка к PV, что
указывает
на
разумность
сделанного
выше
предположения
о
движущей
силе
рассматриваемого фазового превращения.
Из Рис. 27 видно, что величина EISO экспоненциально растет с увеличением
степени заполнения малых полостей; достижение больших степеней заполнения здесь
представляется маловероятным при любых давлениях. В настоящее время в литературе
описано всего два примера клатратных гидратов, существующих при давлениях
значительно превышающих 5 МПа – гидраты водорода и метана; структуры этих
соединений не похожи на классические структуры клатратных гидратов. Фактором,
позволяющим им существовать в столь широком диапазоне давлений по всей вероятности
является хорошая «подгонка» размера и формы полостей каркаса к размеру и форме
гостевых молекул, что позволяет достичь выигрыша в плотности упаковки по сравнению с
фазами индивидуальных компонентов. Если такая «подгонка» требует слишком сильного
искажения каркаса, эффективная упаковка кристаллической структуры гидрата становится
невозможной и при некотором давлении достигается верхняя барическая граница
существования гидрата, как это наблюдалось на ряде примеров. Как рассмотрено выше,
структура гидрата h3 всегда будет содержать некоторую долю вакантных полостей, что
позволяет
ожидать
гидратообразования,
наличие
в
и
в
этой
подтверждено
с
системе
верхней
использованием
барической
метода
границы
Рамановской
спектроскопии.
72
IV.4. Исследование механизма туберкулостатического действия
гетероциклических соединений с подандной цепью
На настоящий момент известно большое количество противотуберкулезных
средств, таких как изониазид, рифампицин, пиразинамид, стрептомицин, этамбутол и
другие. Но при их применении быстро развивается резистентность туберкулезных
бактерий. Что делает данные лекарственные средства неэффективными по отношению к
этой
бактерии.
Поэтому
создание
новых
противотуберкулезных
лекарственных
препаратов является важной задачей в развитии медицины и химии.
Многослойная мембрана клетки Mycobacterium tuberculosis является серьезным
препятствием
для
достижения
лекарственным
средством
рецептора
дигидрофолатредуктазы. Для проникновения через неполярную клеточную мембрану
молекула должна иметь липофильную часть, которой является подандная цепь.
Рассмотрены несколько производных дигидропиримидина, содержащие подандные
цепи (Рис. 28) [78], а также все наиболее вероятные фрагменты рассматриваемых
соединений.
H
H3C
N
H
Y
Y
N
CH3
H
H
H3C
O
NH
O
HN
O
O
CH3
R
H3C
O
N
N
N
O
O
X
R
O
N
CH3
X
O
1а-в
CH3
CH3
O
2а,б
Рис. 28
Рассматриваемые соединения дигидропиримидинов:
1: а. (RR) X=-OCH2CH2O-, Y = O, б (RS) X= -(OCH2CH2)2-O-, Y = S;
в.г. (RS) X= -(OCH2CH2)4-O-, Y = O,
2: а. (RS) X = -CH2CH2-, R=Ph; б. (RR) X = -CH2CH2OCH2CH2-, R=Ph
Показано, что молекулы с подандными цепями должны проявлять достаточно
низкую биологическую активность. Так расчетная величина pMIC не превышает 0.97, в то
время как действительная величина активности для этих соединений варьируется в
интервале 3 – 5. Таким образом, можно предположить, что после проникновения
соединения, содержащего подандную цепь, происходит разрыв связи в этой цепи с
образованием небольших фрагментов, которые имеют большую активность, чем исходная
молекула (Рис. 29).
73
Рис. 29
Разрыв связи в соединении с подандными цепями и образование про-лекарства
Разрыв в подандной цепи происходит по наиболее уязвимым связям, которыми
являются связи между кислородом и углеродом. Наиболее вероятное отщепление
подандной цепи происходит посредством гидролиза эфирного фрагмента между циклом и
подандной цепью (Рис. 29). При этом образуются более активные молекулы,
проявляющие биологическую активность в интервале 3.41 – 4.33. Таким образом,
образуются эффективные лекарственные средства из исходных соединений (Рис. 30), что
подтверждает предположение о подандах как про-лекрствах. Кроме того, расчетные
энергии разрыва С-О связей (полуэмпирическое квантовохимическое приближение РМ3)
действительно коррелируют с биологической активностью подандов.
Из анализа фрагментов следует, что наибольшей активностью обладают
соединения, не имеющие фрагментов подандной цепи. В результате рассмотрения
ориентации дигидропиримидинов в модельном рецепторе позволяет выявить их
фармакофорную
(соответствующие
антифармакофорную
соединений
(Рис.
атомы
(соответствующие
31).
атомы
Фармакофорные
выделены
выделены
фрагменты
серым
черным
находятся
цветом)
цветом)
на
и
части
периферии
ароматического цикла и водородах, находящихся на внешней части, а также этильный
фрагмент
оксиацильного радикала.
Отсюда, данные периферические фрагменты
соединений повышают величину биологической активности.
Рис. 30
Активный компонент
74
Рис. 31
Строение молекулы и фармакофорные (серый цвет) и антифармакофорные
(черный цвет) части соединения
Анифармакофорными
частями
молекулы
являются
пиримидиновое
кольцо
и
сложноэфирная группа оксиацильного радикала. Остаток подандной цепи молекулы (1б)
понижает величину биологической активности. Из данного анализа следует, что
подандная цепь препятствует встраиванию в модельный рецептор и наиболее выгодной
ориентации фармакофорных частей молекулы относительно областей рецептора.
Данные осколки, не содержащие подандных цепей, имеют сходное строение с
известными лекарственными средствами (например, [78]). Оксиацильный радикал
располагается над бензольным кольцом. Бензольное кольцо в свою очередь, повернуто
перпендикулярно пиримидиновому кольцу (Рис. 31). Проведенный анализ строения
фрагментов подтверждает предположение об образовании лекарства из соединений,
содержащих подандные цепи.
Моделирование комплексов соединений с модельных рецептором с помощью
алгоритма ВiS показало, что расположение фрагментов подандов в модельном рецепторе
соответствует
расположению
молекул
лекарственных
средств
(Рис.
32).
Так
дигидропиримидиновое кольцо располагается возле положительно заряженной части
рецептора. Оксиацильный радикал направлен к отрицательно заряженной области. В
большинстве случаев ароматический заместитель располагается в липофильной части.
Для некоторых молекул (1б и 2а) ароматическое кольцо находится возле
отрицательно заряженной части рецептора, а у молекулы (1в) - в липофильной области.
Таким образом, предложен механизм действия туберкулостатических соединений,
содержащих в своем составе подандные цепи. После проникновения молекулы в бактерию
75
Рис. 32
Расположение лекарственного средства и фрагмента молекулы с подандной цепью
в модельном рецепторе (полый круг – нейтрально заряженная часть рецептора,
закрашенный круг – положительно заряженная часть, квадрат – отрицательно заряженная
часть)
Mycobacterium tuberculosis происходит гидролиз связи между циклом и подандной цепью,
в результате которого происходит образование лекарственного средства.
76
ВЫВОДЫ
Таким образом, проведен анализ научно-технической литературы и других
материалов, относящихся к разрабатываемой теме. Произведен подбор алгоритмов для
решения задач виртуального дизайна супрамолекулярных комплексов и обоснование
способов решения поставленных задач. Проведено сопоставление ожидаемых показателей
предполагаемого
ПО
с
существующими
показателями
аналогичных
методов.
Осуществлен выбор объектов исследования – новых перспективных материалов для
расчета. Разработана общая методика создания ПО для решения задач виртуального
дизайна
супрамолекулярных
комплексов.
Созданы
последовательные
версии
предложенных алгоритмов. Разработаны параллельные прототипы ПО MOPS и BiS для
решения задач виртуального дизайна супрамолекулярных комплексов. Проведены
тестовые расчеты для получения конкретных значений энергетических и геометрических
параметров супрамолекулярных комплексов. Подготовлены интерфейсные подпрограммы
для процедур ввода исходных данных, их предварительной обработки и вывода конечных
результатов
моделирования.
Созданы
подпрограммы
учета
конформационной
подвижности супрамолекулярных комплексов и наносистем; созданы подпрограммы
учета поливариантности структур супрамолекулярных комплексов и наносистем; введены
периодические
граничные
условия
для
моделирования
квазибесконечных
кристаллических структур супрамолекулярных комплексов. Произведен дизайн и
моделирование супрамолекулярных комплексов и наносистем с учетом конформационной
подвижности, поливариантности
структур
Произведено
известных
сопоставление
супрамолекулярных
моделирование
комплексов
комплексов
с
и периодических граничных
экспериментальных
результатами
производных
акридана
данных
моделирования.
с
условий.
для
Произведено
окислителями.
На
основе
проведенных исследований предложен механизм окисления акриданов. Поскольку
акриданы
являются
модельной
системой
для
имитации
никотинамидадениндинуклеотидов (НАДН) – основных участников энергообеспечения
клеток, предложен новый механизм окисления НАДН. Проведено моделирование
комплекса
ДНК
с
водным
окружением
и
лекарственными
средствами
класса
противоопухолевых ДНК-антиметаболитов (14 комплексов). Геометрия полученных
комплексов хорошо согласуется с известными данными рентгеноструктурного анализа.
Показано, что наиболее активные лекарственные средства незначительно изменяют
геометрию свободной ДНК и ее водного окружения, что является важным для дизайна
новых
перспективных
противоопухолевых
лекарственных
средств
класса
ДНК77
антиметаболитов. В рамках параллельной версии алгоритма MOPS смоделированы
клатратные гидратные комплексы гексафторида серы в воде. Структура модельных
комплексов подтверждена на настоящий момент данными рентгеноструктурного анализа,
структурной
нейтронографии,
ИК
и
КР-спектроскопии.
Воспроизведен
ряд
термодинамических характеристик данных комплексов, в частности энтальпии плавления
и их зависимость от давления. Составлены программа и методика испытаний
программного обеспечения. Проведены испытания программного обеспечения на
суперкомпьютерах семейства СКИФ в среде OpenTS. Тем самым, Т-Система с открытой
архитектурой (OpenTS) показала себя как эффективное средство для реализации
параллельных версий прикладных программ, а предложенное ПО может быть
использовано для демонстрации преимуществ ГРИД-сервиса на его основе.
По результатам проведенных работ опубликованы 3 статьи в журнале Drugs of the
Future, 1 статья в Журнале структурной химии, 1 статья в журнале Computer-Aided
Molecular Design, 1 статья в журнале Drug Discovery Today и 2 тезисов докладов в
материалах Симпозиума Screening, MedChem and ADMET Europe (Stockholm, Sweden, 19 –
20.02.08). Направлены в печать 2 статьи в Журнал структурной химии и Химикофармацевтический журнал. Результаты работы доложены на Симпозиумах: Virtual
Discovery (London, Great Britain, 24 – 25.10.07 и Palm Springs, USA, 21 - 24.01.08), XIX
Симпозиуме “Современная химическая физика” (Туапсе, 22.09.07 – 03.10.07), Screening,
MedChem and ADMET Europe (Stockholm, Sweden, 19 – 20.02.08).
78
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ
1. Tomasi J., Persico M. Molecular Interactions in Solution: An Overview of Methods Based on
Continuous Distributions of the Solvent// Chem. Rev.- 1994.- V. 94.- P. 2027 – 2094.
2. Минкин В.И., Симкин Б.Я., Миняев Р.М. Квантовая химия органических соединений.
Механизмы реакций. М.: Химия. 1986.- 248 с.
3. Салем Л. Электроны в химических реакциях. М.: Мир, 1985.- 285 с.
4. Pullman A. The theory of chemical reactions/ Daudel R., Pullman A., Salem L., Veillard A.,
1981.- Reidel: Dordrecht.- V.2.- P. 1.
5. Абронин И.А., Бурштейн К.Я., Жидомиров Г.М. Квантовохимические расчеты
влияния растворителя на электронную структуру и реакционную способность
молекул// Журн. Структ. Химии.- 1980.- №2.- C. 145 - 164.
6. Рабинович А.Л., Рипатти П.О. Монте-Карловское исследование межмолекулярных
взаимодействий в углеводородных цепях// Журн. физ. химии.- 1998.- Т. 72.- № 4.- С.
590 – 594.
7. Рабинович
А.Л.,
Рипатти
П.О.,
Балабаев
Н.К.
Молекулярно-динамическое
исследование характеристик диацилглицеролипидов в монослоях// Журн. физ. химии.2000.- Т. 74.- № 11.- С. 1809 – 1815.
8. Наберухин Ю.И., Лучников В.А., Маленков Г.Г., Желиговская Е.А. Пространственная
локализация и динамика молекул воды с хорошим тетраэдрическим окружением//
Журн. структ. химии.- 1997.- Т. 38.- № 4.- С. 593 – 600.
9. Зоркий
П.М.,
Соколов
моделирование
больших
Е.В.,
Маленков
кластеров
и
Г.Г.,
Ланшина
квазипериодических
Л.В
Компьютерное
моделей
бензола,
имитирующих структуру жидкой фазы.// Журн. физ. Химии.- 2000.-V. 74.- № 11.- С.
1951 - 1956.
10. Гиршфельдкр Дж., Кертисс Ч., Берд Р. Молекулярная теория газов и жидкостей.- М.:
ИЛ, 1961.- 930 с.
11. Cossi M., Barone V., Mennucci B., Tomasi J. Ab initio study of ionic solutions by a
polarizable continuum dielectric model// Chem. Phys. Lett.- 1998.- V. 286.- P. 253 – 260.
12. Cossi M., Barone V., Cammi R., Tomasi J. Ab initio study of solvated molecules: a new
implementation of the polarizable continuum model// Chem. Phys. Lett.- 1996.- V. 255.- P.
327 - 335.
13. Wales D.J., Hodges M.P. Global minima of water clusters (H2O)n, n≤21, described by an
empirical potential // Chem. Phys. Lett.- 1998.-V. 286.- P. 65 - 72.
79
14. Zacharias C.R., Dal Pino A., Lemes M.R.. Combining genetic algorithm and simulated
annealing: a molecular geometry optimization study.// J. Mol. Struct. (Theochem).- 1998.- V.
430.- P. 29 – 39.
15. Keser M., Stupp S.I.A genetic algorithm for conformational search of organic molecules:
implications for materials chemistry// Computers Chem.- 1998.- V. 22.- P. 345 – 351.
16. Гришина М.А., Барташевич Е.В., Потемкин В.А., Белик А.В. Генетический алгоритм
для прогноза строения и свойств молекулярных агломератов в органических
веществах// Журн.структ.химии.– 2002.- Т.43.- №6.- С. 1128 – 1133.
17. Allinger N.L., Li F., Yan L Molecular Mechanics. The MM3 Force Field for Alkenes.// J.
Comput. Chem.- 1990.-V. 11.- P. 848 - 867.
18. Allinger N.L., Li F., Yan L., Tai J.C. Molecular Mechanics (MM3) Calculations on
Conjugated Hydrocarbons // J. Comput. Chem.- 1990.-V. 11.- P. 868 - 895.
19. Lii J.-H., Allinger N. L. Directional Hydrogen Bonding in the MM3 Force Field // J.
Comput. Chem.- 1998.-V. 19.- P. 1001 - 1016.
20. Потемкин В.А., Барташевич Е.В., Белик А.В. Модель расчета атомных объемных
характеристик в молекулярных системах// Журн. Физ. химии.- 1998.- Т. 72.- № 4.- С.
650 - 656.
21. Шильников В.И., Кузьмин В.С., Стручков Ю.Т. Вычисление объемов и поверхностей
атомов и молекул// Журн.структ.химии.- 1993.- Т. 34.- № 4. С. 98-106.
22. Потемкин В.А., Барташевич Е.В., Белик А.В. Новые подходы к прогнозу
термодинамических параметров веществ по молекулярным данным// Журн. физ.
химии.- 1996.- Т. 70.- № 3.- С. 448 - 452.
23. Гришина М.А., Барташевич Е.В., Потемкин В.А., Белик А.В. Генетический алгоритм
для прогноза строения и свойств молекулярных агломератов в органических
веществах// Журн. структ. химии.- 2002.- Т. 43.- № 6.- С. 1128 – 1133.
24. Гринева О.В., Зоркий П.М. Энергия межмолекулярного взаимодействия в кристаллах
хлорсодержащих соединений// Журн. физ. химии.- 1998.- V.72.- № 4.- С. 714 - 720.
25. Гринева О.В., Зоркий П.М. Агрегация атомов галогена в галогенорганических
кристаллах с малым содержанием галогена.// Журн. физ. химии.- 2000.-V. 74.- № 11.С. 1937 - 1943.
26. Schmidt M.W., Baldridge K.K., Boatz J.A., Elbert S.T., Gordon M.S., Jensen J.H., Koseki
S., Matsunaga N., Nguyen K.A., Su S.J., Windus T.L., Dupuis M., Montgomery J.A. General
Atomic and Molecular Electronic Structure System// J.Comput.Chem.- 1993.- V. 14.- P.
1347-1363.
80
27. Bader R.F.W. Atoms in Molecules. A Quantum Theory.- Oxford: Clarendon Press, 1990.256 p.
28. Huzinaga S., Andzelm J., Klobukowski M. et al. Gaussian Basis Sets for Molecular
Calculations.- Netherlands: Amsterdam: Elsevier, 1984.
29. Gill P.E., Murray W., Wright M.H. Practical Optimization.- N.Y.: Academic Press, 1981.
30. Grishina M.A., Bartashevich E.V., Pereyaslavskaya E.S. and Potemkin V.A. A Novel
Techniques for Virtual Discovery for Study of Multistage Bioprocesses// Drugs of the
Future.- 2007.- Vol. 32, Suppl. A.- P. 27.
31. Pereyaslavskaya E.S., Potemkin V.A., Grishina M.A., Bartashevich E.V. The analysis of
pharmacophoric parts of DHFR – inhibitors using 3D-QSAR algorithm BiS/MC and X-ray
data// Drugs of the Future.- 2007.- Vol. 32, Suppl. A.- P. 87.
32. Grishina M.A., Potemkin V.A. A novel approach to pattern recognition for drugs// Drugs of
the Future.- 2007.- Vol. 32, Suppl. A.- P. 112.
33. Потемкин В.А., Гришина М.А., Барташевич Е.В. Моделирование ориентации молекул
лекарственных средств в полости рецептора в рамках алгоритма BiS// Журн. структ.
химии.- 2007.- Т. 48.- № 1.- С. 153 – 158.
34. Потемкин В.А., Барташевич Е.В., Белик А.В. Модель расчета атомных объемных
характеристик в молекулярных системах// Журн. Физ. химии.- 1998.- Т. 72.- № 4.- С.
650 - 656.
35. Potemkin V.A., Bartashevich E.V., Grishina M.A., Guccione S. An Alternative Method for
3D-QSAR and the Alignment of Molecular Structures: BiS (Biological Substrate Search)//
in: Rational Approaches to Drug Design.- Barcelona: Prous Science Publishers, 2001.- P.
349 – 353.
36. Барташевич
Е.В.,
Потемкин
В.А.,
Гришина
М.А.,
Белик
А.В.
Метод
мультиконформационного моделирования пространственной формы молекулы// Журн.
структ. химии. –2002 - Т. 43.- № 6.- С. 1120 – 1127.
37. Grishina M.A., Potemkin V.A., Rusinov G.L., Bartashevich E.V., Guccione S., Perspicace S,
Chupakhin O.N. Comparing a BiS (Biological Substrate Search) alignment of anticancer
DNA and DNA/RNA antimetabolites into their active sites with .pdb co-crystals// “From
Genes to Drugs via Crystallography”, 33rd crystallographic course, Erice, Italy, 23 May – 2
June 2002.- Book of Abstracts.- Erice, 2002 - P. 48.
38. Potemkin V.A., Bartashevich E.V., Beccari A.R., Grishina M.A., Guccione S. An
Alternative Method for 3D-QSAR and the Alignment of Molecular Structures: BiS
(Biological Substrate Search)// 13th European Symposium on Quantitative Structure-Activity
81
Relationships, Düsseldorf, Germany, 27 August-1 September, 2000.- Book of Abstracts.Dusseldorf, 2000.- P. 110.
39. Mikuchina K., Potemkin V., Grishina M., Laufer S. 3D QSAR analysis and pharmacophore
modelling of p38 MAP kinase inhibitors using BiS algorithm// Arch. Pharm. Pharm. Med.
Chem.- 2002.- V. 335.- № 1.- P. C74.
40. Потемкин
В.А.,
Гришина
М.А.,
Белик
А.В.,
Чупахин
О.Н.
Исследование
количественной взаимосвязи структура – антибактериальная активность производных
хинолона// Хим.-фарм. журн.- 2002.- Т. 36.- № 1.- С. 22 – 25.
41. Grishina M.A., Potemkin V.A. Theoretical investigation of interactions in the molecular
systems “receptor-ligand” for DNA and DNA/RNA-antimetabolites // IX International
Seminar on Inclusion Compounds (ISIC-9), Novosibirsk, June 23-27, 2003, Book of
Abstracts, Novosibirsk, 2003. P. 73.
42. Потемкин В.А., Гришина М.А., Федорова О.В., Русинов Г.Л., Овчинникова И.Г.,
Ишметова Р.И. Теоретическое исследование противотуберкулезной активности
мембранотропных подандов// Хим.-фарм. журн.- 2003.- Т. 37.- № 9.- С. 24 – 28.
43. Mikouchina K., Potemkin V., Laufer S. Modellstudie zurOrientierung von Hemmstoffen im
aktiven Zentrum der p38 MAP Kinase
– Anwendung von BIS-Algorithmen//
Doktorandentagung, Dusseldorf, Germany, 07 – 09 Marz 2003.- Book of Abstracts.Dusseldorf, 2003.- P. 54.
44. Pogrebnoy A.A., Ryabinin V.E., Potemkin V.A., Bartashevich E.V., Grishina M.A. Method
of preliminary selection of substances specific in relation to P450 isoforms// 13 th
International Conference on Cytochromes P450. Biochemistry, Piophysics and Drug
Metabolism. Prague, Czech Republic, 29 June – 3 July, 2003.- Book of Abstracts.- Prague,
2003.- S167 – 168.
45. Потемкин В.А., Гришина М.А., Пожиленкова Г.В., Микушина К.М., Лауфер С.
Генетический
алгоритм
молекулярного
3D
дизайна
биологически
активных
соединений// Биомедицинская химия.- 2004. Т. 50.- Прил. № 1.- С. 42 – 48.
46. Гришина М.А., Потемкин В.А., Микушина К.М., Пожиленкова Г.В., Лауфер С.
Комбинированный подход к анализу биологической активности соединений//
Биомедицинская химия.- 2004. Т. 50.- Прил. № 1.- С. 68 – 76.
47. Погребной А.А., Рябинин В.Е., Барташевич Е.В., Гришина М.А., Потемкин В.А.
Подход
к
отбору
веществ
с
заданными
метаболическими
свойствами//
Биомедицинская химия.- 2004. Т. 50.- Прил. № 1.- С. 77 – 84.
82
48. Потемкин В.А., Гришина М.А., Барташевич Е.В., Зракова Т.Ю., Погребной А.А.
Моделирование взаимодействий изоформы 2Е1 цитохрома Р450 человека с
субстратами// Биофизика.- 2005.- Т. 50.- № 3.- С. 418 – 422.
49. Гришина М.А., Погребной А.А., Потемкин В.А., Зракова Т.Ю. Теоретическое
исследование субстратной специфичности изоформ цитохрома Р450// Хим.-фарм.
журн.- 2005.- Т. 39.- № 10.- С. 3 – 7.
50. Grishina M.A., Mikushina K.M., Potemkin V.A. Modelling of orientation of p38 MAPkinase inhibitors in the receptor pocket within 3D-QSAR algorithm BiS// The 16th European
Symposium on Quantitative Structure - Activity Relationships and Molecular Modelling,
Mediterranean Sea, Italy, 10-17 September 2006. - Book of Abstracts. – Stampa:
ITALGRAF snc (PG), 2006. – P. 241.
51. Berman H.M., Westbrook J., Feng Z., Gilliland G., Bhat T.N., Weissig H., Shindyalov I.N.,
Bourne P.E. The protein data bank// Nucleic Acids Research.- 2000.- 28.- P. 235 – 242.
52. Cosgrove D.A., Bayada D.M., Johnson A.P. A novel method of aligning molecules by local
surface shape similarity// J. Comput.-Aided Mol. Design.- 2000.- 14.- P. 573 - 591.
53. Косовер Э. Пиридинил-радикалы в биологии. В кн. Свободные радикалы в биологии
(ред. У.Прайор). М.: Мир, т. 2, С. 9.
54. Постовский И.Я., Чупахин О.Н., Матерн А.И. // Химия гетероцикл. соед. - 1984. - 10. С. 1299 - 1314.
55. Ohno A. // J. Phys. Org. Chem. - 1995. - 8 (N 9). - P. 567 - 576.
56. Fukuzumi S. // Bull. Chem. Soc. Jpn. - 2006. - 79 (N 2). - P. 177 – 195.
57. Кнорре Д.Г., Мызина С.Д. Биологическая химия. - М.: Высш. шк., 2002. - 479 с.
58. Тюкавкина Н.А., Бауков Ю.И.// Биоорганическая химия. М.: Дрофа, 2005. - С. 440.
59. Варфоломеев С.Д. Химическая энзимология. М.: Академия, 2005. - C.480.
60. Fukuzumi S., Tokuda Y., Kitano Y., Okamoto T., Otera J.// J. Am. Chem. Soc.- 1993.- 115.P. 8960 - 8968.
61. Zhu X.-Q, Cao L., Liu Ya., Yang Yu., Lu J.-Yo., Wang J.-Sh., Cheng J.-P. // Chem. Eur. J.2003.- 9.- Р. 3937 - 3945.
62. Fukuzumi S., Ohkubo K., Tokuda Y., Suenobu T. // J. Am. Chem. Soc.- 2000.- 122.- Р. 4286
- 4294.
63. Zhu X.-Q., Li H.-R., Li Q., Ai T., Lu J.-Yo., Yang Yu., Cheng J.P.// Chem. Eur. J.- 2003.9.- Р. 871 - 880.
64. Fukuzumi S., Koumitsu S., Hironaka K., Tanaka T.// J. Am. Chem. Soc. - 1987.- 109 (N 2).Р. 305 - 316.
65. Chu S.S.C., Rosenstein R.D.// Acta Cryst., B.- 1979.- 35.- P. 480 - 482.
83
66. Chu S.S.C., Rosenstein R.D., Napoleone V.// Acta Cryst., B.- 1980.- 36.- P. 2505 - 2507.
67. Connolly M.L.// J. Appl. Cryst.- 1983.- V. 16.- P. 548 - 558.
68. Weerasinge S., Smith P., Mohan V. et al// J. Аm. Сhem. Soc.– 1995.– 117.– P. 2147 – 2158.
69. Berman H.M., Westbrook J., Feng Z., Gilliland G., Bhat T.N., Weissig H., Shindyalov I.N.,
Bourne P.E.// Nucleic Acids Research.- 2000.- 28.- P. 235 – 242.
70. Марков В.М., Потемкин В.А., Белик А.В. // Журн. структур. химии. – 2001. – 42 (№ 1).
– С. 91 – 100.
71. Скрышевский А.Ф. Структурный анализ жидкостей и аморфных тел. – М.: Высш. шк.,
1980. – 328 c.
72. Jeffrey G.A. in: Comprehensive Supramolecular Chemistry, Vol. 6/ Еds.: J.L. Atwood,
J.E.D. Davies, D.D. MacNicol, F. Vögtle.- Oxford: Pergamon, 1996.- P. 757 – 788.
73. Dyadin Yu.A., Bondaryuk I.V., Zhurko F.V. in: Inclusion Compounds.- Vol. 5./ Eds. J.L.
Atwood, J.E.D. Davies, MacNicol.- Oxford: Oxford University Press.- 1991.- P. 213 – 275.
74. Ripmeester J.A., Ratcliffe C.I., Tse J.S., Powel B.M.// Nature.- 1987.- Vol. 325.- P. 135 –
136.
75. Dyadin Yu.A., Larionov E.G., Manakov A.Yu. et al// J. Incl. Phenom.- 2002.- Vol. 42.- P.
213 – 218.
76. Stackelberg V.M., Muller H.R.// Z. Elecktrochem..- 1954.- Vol. 58.- P. 25.
77. Sortland L.D., Robinson D.B.// Canad. J. Chem. Eng.- 1964.- Vol. 42.- P. 38 – 42.
78. Potemkin V.A., Grishina M.A., Fedorova O.V.,. Rusinov G.L, Ovchinnikova I.G., Ishmetova
R.I.// Pharmaceutical Chemistry Journal. 2003. Т. 9. С. 17.
84
Download