Учреждение Российской академии наук Институт органической химии им. Н.Д. Зелинского РАН

advertisement
Учреждение Российской академии наук
Институт органической химии им. Н.Д. Зелинского РАН
на правах рукописи
Стройлов Виктор Сергеевич
Моделирование координации биологически активных
соединений с терапевтическими мишенями
02.00.15 кинетика и катализ
02.00.04 физическая химия
Автореферат
на соискание ученой степени
кандидата химических наук
Москва 2010
Работа выполнена в отделе №58 Института органической химии
им. Н.Д. Зелинского РАН
Научный руководитель:
кандидат химических наук, с.н.с.
Чилов Гермес Григорьевич
Официальные оппоненты:
доктор химических наук, профессор
Кустов Леонид Модестович
кандидат химических наук, с.н.с.
Лакатош Сергей Александрович
Ведущая организация:
Химический факультет
МГУ имени М.В. Ломоносова
Защита состоится 21 декабря 2010 г. в 10 часов на заседании Диссертационного
совета Д 02.222.02 при Институте органической химии им. Н.Д. Зелинского
РАН по адресу: 119992 Москва, Ленинский пр-т, д. 47
С диссертацией можно ознакомиться в библиотеке Института органической
химии им. Н.Д. Зелинского РАН.
Автореферат разослан ___ ноября 2010 г.
Ученый секретарь
диссертационного совета,
кандидат химических наук
Елисеев О.Л.
2
Общая характеристика работы
Актуальность темы. Помимо традиционного подхода к поиску новых
биологически активных соединений, на сегодняшний день большое
распространение получил направленный поиск ингибиторов, действующих на
заранее определенную терапевтическую мишень. Для успешного поиска
соединений, обладающих заданными качествами, необходимо существенное
развитие целых областей научного знания на стыке химии, физики и биологии.
Благодаря развитию экспериментальных методов структурной биологии, в
настоящее время известны трехмерные структуры многих белков, в том числе
являющихся терапевтическими мишенями различных заболеваний. Располагая
структурной информацией, можно с помощью методов теоретической химии
моделировать свободную энергию и геометрию координации химических
соединений в активных центрах белков и рассчитывать специфичность их
действия по отношению к мишени выбранного заболевания, а также профиль
селективности по отношению к остальным мишеням. В настоящее время
существует множество методов молекулярного моделирования, однако тот факт,
что во многих случаях их точность оказывается неудовлетворительной,
демонстрирует необходимость в ее повышении.
Настоящая работа посвящена исследованию особенностей применения
методов моделирования свободной энергии и геометрии координации
низкомолекулярных соединений с терапевтическими мишенями в направленном
поиске новых биологически активных молекул.
Цель работы. В работе преследовались следующие основные цели:
1. Моделирование структур и свободных энергий образования комплексов
киназ с их ингибиторами методом молекулярного докинга для
предсказания селективности киназных ингибиторов.
2. Исследование факторов, влияющих на точность моделирования
координации органических соединений с белками методом докинга
применительно к поиску новых соединений, в особенности –
фрагментных соединений, связывающихся с заданным белком –
терапевтической мишенью.
3. Направленный поиск новых соединений, способных к координации и
ингибированию каталитической активности ферментов киназ.
Научная новизна и практическая значимость работы.
Проведено
исследование
точности
моделирования
профилей
термодинамической и конформационной совместимости ряда лекарств и
лекарственных кандидатов с протеинкиназами – терапевтическими мишенями
3
онкологических заболеваний - методом молекулярного докинга. Показана
высокая точность данного метода (77%), делающая его пригодным для решения
широкого спектра задач направленного поиска новых биологически активных
соединений.
Показано, что использование информации о консервативных направленных
взаимодействиях между ферментом и его ингибиторами позволяет повысить
эффективность поиска новых активных ингибиторов ферментативной
активности в среднем в 1,5 раза.
Методом виртуального скрининга обнаружены новые производные
2-гидроксифенола, способные к координации в активном центре и
ингибированию ферментативной активности протеинкиназ EphA2 и ACK1, а
также 18 других тирозинкиназ.
Предложена методика направленного поиска молекулярных фрагментов,
способных к координации в активных центрах белков. С использованием
разработанной
методики
найдено
4
соединения,
ингибирующих
ферментативную активность протеинкиназы CDK2 - терапевтической мишени
онкологических заболеваний - в микромолярной концентрации.
Полученные результаты могут служить основой для дальнейшей
разработки методов направленного поиска низкомолекулярных ингибиторов,
способных к координации с терапевтическими мишенями различных
заболеваний.
Апробация работы. Основные результаты работы были представлены на
Московском международном конгрессе "БИОТЕХНОЛОГИЯ: состояние и
перспективы развития" (Москва, 2009), IV Российском симпозиуме "Белки и
пептиды" (Казань, 2009), международной конференции ACS Fall 2010 (Бостон,
США, 2010) и IV молодежной конференции ИОХ РАН (Москва, 2010).
Публикации. По теме диссертации опубликовано 4 статьи и 5 тезисов в
сборниках докладов научных конференций.
Структура и объем работы. Работа изложена на __ страницах
машинописного текста, содержит __ рисунков, __ таблиц и состоит из
введения, обзора литературы, экспериментальной части, обсуждения
полученных результатов, выводов и списка цитируемой литературы.
Библиография насчитывает __ наименований.
4
Основное содержание работы
1. Использованные методы и подходы
Методы молекулярного моделирования
Для моделирования координации соединений в активных центрах белков терапевтических мишеней использовался метод молекулярного докинга,
реализованный в программном комплексе Lead Finder1. Основой метода
молекулярного докинга является поиск минимума энергии в фазовом
пространстве системы белок-лиганд, проводимый с помощью генетического
алгоритма. Последний состоит в том, что над начальным множеством
состояний лиганда многократно проводятся операции кроссовера и мутаций с
последующим отбором лучших состояний для следующего этапа. Для
оптимизации работы алгоритма используется группировка состояний в
кластеры ограниченного размера, не позволяющая близким состояниям
заполнить собой всю популяцию.
Для расчета энергии взаимодействия в комплексах лигандтерапевтическая мишень использовалось полуэмпирическое силовое поле.
Вклад каждой из молекулярно-механических функций в общую энергию
масштабировался с помощью трех наборов эмпирических коэффициентов,
подобранных таким образом, чтобы а) максимально точно воспроизводить
экспериментально измеренную энергию взаимодействия в системе химическое
соединение-терапевтическая мишень; б) ранжировать различные положения
связывания лиганда, таким образом находя наиболее вероятное, и в) правильно
ранжировать активные и неактивные молекулы в экспериментах по
виртуальному скринингу. Использование по сути трех различных скоринговых
функций в сочетании с модифицированным генетическим алгоритмом
позволяет обеспечить высокую точность расчетов.
При расчете свободной энергии взаимодействия в системе белок-лиганд
используются следующие энергетические компоненты:
 Ван-дер-Ваальсова энергия, рассчитываемая с помощью потенциала
Леннарда-Джонса в форме 6-12.
 Энергия взаимодействия с металлами, рассчитываемая в виде потенциала
Леннарда-Джонса в форме 10-12.
 Энергия электростатического взаимодействия, рассчитываемая с помощью
экранированного
кулоновского
потенциала
с
диэлектрической
проницаемостью, зависящей от расстояния и микроокружения.
1
J. Chem. Inf. Model. – 2008. – 48. – 12. – P. 2371-85.
5
 Электростатическая составляющая энергии десольватации лиганда при
связывании с белком, рассчитываемая с использованием адаптированной
модели Борна.
 Энергия образования водородных связей при взаимодействии лиганда с
терапевтической мишенью, рассчитываемая как произведение потенциала
Леннарда-Джонса в форме 10-12 и квадратов косинусов угла донор-протонакцептор и угла между векторами акцептор-протон и акцептор-электронная
пара. Дополнительно учитывается количество водородных связей белка с
водой, экранированных при связывании лиганда.
 Энергия неспецифической гидрофобной сольватации рассчитывается с
помощью потенциала, зависящего от объема, занимаемого лигандом в
активном центре белка. Для описания более специфических контактов
используются площади полярных и неполярных контактов лиганда с белком.
 Потери внутренней энергии лиганда при связывании с белком
рассчитываются в виде разности энергий нековалентного взаимодействия
атомов внутри лиганда в растворе и в связанном состоянии.
 Торсионная энергия лиганда оценивается с помощью модифицированного
потенциала Рикерта-Беллманса.
 Энтропийные потери лиганда при связывании с белком учитываются
линейной функцией, зависящей от числа вращательных степеней свободы
лиганда.
Для повышения надежности результатов поиска активных ингибиторов,
проводимого методом виртуального скрининга, использовался метод
структурной фильтрации, разработанный в нашей лаборатории. Основная идея
данного метода состоит в консервативности наборов направленных
взаимодействий в комплексах терапевтическая мишень-ингибитор. Можно
утверждать, что один из таких наборов взаимодействий должен также
реализовываться в комплексах белка с потенциальными ингибиторами. На
основании этого утверждения возможно проводить отбор соединений, для
которых наиболее высока вероятность проявления активности, по образованию
ими определенных водородных связей с белком. Геометрическими критериями
наличия водородной связи между белком и лигандом является расстояние менее
3,5 Å между донором и акцептором водородной связи, и угол донор-водородакцептор, больший 150o.
В ходе выполнения данной работы был разработан ряд программ на
языке Perl, автоматизирующих подготовку задач и управление расчетами,
анализ результатов и их представление в удобном для дальнейшей обработки
формате, а также многие другие процессы.
6
Исследование биологической активности
Экспериментальное определение ингибиторной способности соединений
на панели из 20 протеинкиназ человека, включающей в себя киназы EphA2 и
ACK1, было любезно проведено Татьяной Ракитиной (Институт
биоорганической химии РАН). Для измерений использовались человеческие
белки, экспрессированные в клеточной линии SF9. Ферментативная активность
определялась по интенсивности флуоресценции с использованием набора для
определения концентрации АТФ Kinase-Glo Plus (Promega, США). Измерения
проводились при концентрации АТФ, равной 1 мкM, в качестве ингибитора
сравнения использовался стауроспорин.
Экспериментальное определение ингибиторной способности соединений
по отношению к протеинкиназе CDK2 проводилось Caliper Discovery Alliances
and Services (США). Для измерений использовался человеческий фермент,
субстратами являлись меченый флуоресцеином пептид (1,5 мкM) и АТФ
(35 мкM). Процент ферментативной активности определялся по интенсивности
сигнала
флуоресценции
фосфорилированного
пептида
после
электрофоретического разделения реакционной смеси. В качестве ингибитора
сравнения использовался стауроспорин (IC50 6,7 нМ).
2. Результаты и обсуждение
Виртуальное профилирование ингибиторов протеинкиназ
Одной из задач настоящей работы являлось исследование применимости
метода молекулярного докинга к моделированию структур и свободных энергий
образования комплексов киназ с их ингибиторами для предсказания профилей
активности лекарств и лекарственных кандидатов, действующих на
протеинкиназы, и спектров восприимчивости протеинкиназ, представляющих
собой важные терапевтические мишени, к различным ингибиторам. В качестве
исходных данных для моделирования были использованы экспериментально
определенные профили активности 42 соединений, часть из которых является
зарегистрированными лекарственными препаратами, остальные же находятся
на различных этапах клинических испытаний. Моделирование проводилось с
использованием 196 экспериментально определенных трехмерных структур
86 протеинкиназ человека, и представляло собой расчет геометрии комплекса
белка с предполагаемым ингибитором.
Анализ доступных трехмерных структур комплексов ингибиторпротеинкиназа показал, что ингибиторы протеинкиназ могут быть условно
разделены на два типа в соответствии с занимаемым сайтом связывания
(рисунок 1). Координация лигандов первого типа происходит в области
шарнирного фрагмента киназного домена, что характерно для связывания
7
Рисунок 1. Положения координации, характерные для лигандов первого (А, PDB ID 2ojg) и
второго (Б, PDB ID 1kv2) типов.
нативного субстрата всех киназ - АТФ. В координации лигандов второго типа
помимо шарнирного фрагмента принимает участие область связывания
пептидных субстратов, называемая DFG-петлей.
Набор моделей протеинкиназ, моделирование координации с которыми
проводилось в рамках настоящей работы, также можно условно разделить на
четыре группы в зависимости от доступности для взаимодействия с лигандом и
относительного объема каждого из двух центров связывания (рисунок 2).
Наиболее распространенной является конформация с открытым центром
связывания АТФ и закрытым DFG-сайтом (АТФо-DFGз); для 76% протеинкиназ
имеется как минимум одна модель с такой конформацией. Второй по
распространенности является конформация АТФз-DFGз, в которой DFG-сайт
также недоступен, а центр связывания АТФ имеет небольшой объем. Модели, в
которых DFG-сайт доступен для связывания лиганда, немногочисленны – их
суммарное количество составляет 15% от полного числа подготовленных
моделей.
Анализ результатов моделирования проводился в два этапа. На первом
этапе предсказанные трехмерные структуры комплексов были подвергнуты
экспертной оценке с целью выявления пар киназа-ингибитор, для которых
рассчитанная геометрия координации соответствует комплексу протеинкиназы
с активным ингибиторам. В общем случае характерной особенностью
подобных комплексов является образование лигандом одной или более
водородных связей с шарнирным фрагментом протеинкиназы, причем со
стороны лиганда в образовании этих водородных связей участвуют атомы,
входящие или расположенные на расстоянии одной или двух связей от
ароматического или гетероароматического кольца. Кроме того, в случае
киназных ингибиторов второго типа между белком и ингибитором образуются
8
Рисунок
2.
Конформации
активного центра протеинкиназ.
Красными
и
синими
окружностями выделены области,
соответствующие АТФ- и DFGсайтам, соответственно. Белым
показаны неполярные остатки
белка, зеленым – незаряженные
полярные остатки, синим и
красным – положительно и
отрицательно
заряженные
остатки, соответственно.
А – АТФо-DFGз (PDB ID 1m17)
Б – АТФз-DFGз (PDB ID 2i0y)
В – АТФо-DFGо (PDB ID 2b2w,
сечение)
Г – АТФз-DFGо (PDB ID 2hiw,
сечение).
дополнительные водородные связи и/или гидрофобные контакты в области
DFG-петли. На втором этапе результаты моделирования сравнивались с
экспериментальными данными и классифицировались в соответствии со
схемой 1.
Статистические параметры, характеризующие среднюю точность
моделирования координации набора из 86 киназ с 42 ингибиторами,
рассчитывались путем суммирования количеств истинно положительных,
истинно отрицательных, ложноположительных и ложноотрицательных
результатов моделирования по всем киназам (таблица 1). Из представленных
данных следует, что общая точность моделирования структурной
совместимости киназ с различными ингибиторами составляет 77% и
характеризуется достаточно низким разбросом (SD = 11%). Таким образом,
полная вероятность правильного предсказания активности ингибитора по
отношению к одной из киназ лежит в диапазоне от 66% до 88%, что показывает
применимость метода молекулярного докинга для моделирования профилей
активности ингибиторов протеинкиназ и характеризует точность метода как
достаточно высокую.
Моделирование
Эксперимент
+
-
+
-
Истинно-положит.
Ложно-положит.
ИП
ЛП
Ложно-отр.
Истинно-отр.
ЛО
ИО
Чувствительность
ИП/(ИП+ЛО)
Специфичность
ИО/(ЛП+ИО)
PPV
ИП/(ИП+ЛП)
NPV
ИО/(ИО+ЛО)
Точность
(ИП+ИО)/(П+О)
9
Схема 1.
Классификация
результатов
моделирования
профилей активности
киназных ингибиторов
Средние значения специфичности и NPV - параметров, характеризующих
надежность отрицательного предсказания, полученные в результате
моделирования, составляют 84% и 85%, соответственно. В то же время, средние
значения параметров, характеризующих надежность положительных
предсказаний - чувствительности и PPV, заметно ниже, и находятся на уровне
50%. Таким образом, отрицательные предсказания имеют бóльшую
достоверность по сравнению с положительными. Основной причиной этого
является недостаточное количество трехмерных структур киназ, совместимых с
координацией некоторых ингибиторов. Это подтверждается тем, что
чувствительность моделирования активности небольших по размерам
ингибиторов 1 типа более чем в 2 раза превосходит аналогичный параметр для
ингибиторов 2 типа.
Таблица
1.
Параметры,
характеризующие
точность
моделирования
спектра
восприимчивости набора из 86 протеинкиназ к ингибиторам методом молекулярного
докинга, и формулы для их расчета.
Все киназы/
Ингибиторы Ингибиторы
Формула
Параметр
все ингибиторы
1 типа
2 типа
Чувствительность
0,52
0,67
0,28
PPV
0,50
0,52
0,44
Специфичность
0,84
0,79
0,90
NPV
0,85
0,88
0,82
Точность
0,77
0,76
0,77
∑кин ИП
∑кин ИП ∑кин ЛО
∑кин ИП
∑кин ИП ∑кин ЛП
∑кин ИО
∑кин ИО ∑кин ЛП
∑кин ИО
∑кин ИО ∑кин ЛО
∑кин ИП ∑кин ИО
∑кин П ∑кин О
Исследование подходов к повышению точности виртуального
скрининга
Виртуальный скрининг библиотек химических соединений с помощью
молекулярного докинга широко используется для поиска соединений,
способных координироваться с белками-терапевтическими мишенями и
ингибировать их активность. Критерием, по которому оценивается успешность
виртуального скрининга, в общем виде является обогащение известными
активными молекулами большого набора предположительно неактивных
лигандов. За обогащение принимается отношение концентрации активных
лигандов в порции библиотеки с наивысшими оценками к их концентрации в
исходной библиотеке. Таким образом, эффективность виртуального скрининга
оценивается с точки зрения его способности обогащать небольшой набор
молекул действительно активными лигандами исходя из намного большей
библиотеки соединений.
Для
исследования
точности
метода
виртуального
скрининга,
10
реализованного в программном комплексе Lead Finder, был использован
неоднократно описанный в литературе набор из 40 белков, для каждого из
которых имеются наборы активных и неактивных низкомолекулярных
лигандов. Кроме индивидуальных для каждой мишени наборов неактивных
лигандов, также использовался общий набор неактивных молекул, полученный
объединением индивидуальных наборов.
Кроме стандартной методологии виртуального скрининга, в рамках
которой оценка точности происходит по результатам ранжирования активных и
неактивных молекул в соответствии с предсказанной энергией взаимодействия
с терапевтической мишенью, в настоящей работе была также исследована
методология повышения точности моделирования, использующая структурную
фильтрацию положений координации лигандов, предсказанных методом
молекулярного докинга. Ранее в наших работах было показано2, что
дополнительный учет консервативных направленных взаимодействий позволяет
существенно повысить эффективность виртуального скрининга, уменьшая
долю ложноположительных предсказаний.
Результаты исследования точности виртуального скрининга, проведенного
с использованием как индивидуальных библиотек неактивных молекул, так и
общего для всех мишеней набора неактивных молекул, содержащего свыше
90 тысяч соединений, представлены в таблице 2. Из представленных данных
следует, что применение структурной фильтрации для обработки результатов
виртуального скрининга с использованием индивидуальных наборов
неактивных соединений приводит к увеличению параметра раннего обогащения
RE1 в среднем в полтора раза. При переходе к более позднему обогащению,
определяемому параметром RE5, наблюдаемая эффективность фильтрации
падает, выражаясь в незначительном повышении данного параметра. Такой
эффект является следствием того, что активные молекулы, выведенные
фильтрацией в начало списка, составляют очень небольшую его долю. По той
же причине наблюдается стабильность средних площадей под кривыми
обогащения (ROC AUC), являющихся интегральным параметром. Аналогично,
в случае виртуального скрининга с использованием общего набора неактивных
молекул применение структурной фильтрации приводит к увеличению
параметра раннего обогащения RE0.1 в среднем в полтора раза, и параметра
RE0.5 в среднем в 1,6 раза. Среднее значение площади под кривой обогащения
(ROC AUC) изменяется незначительно.
Таким образом, использование структурной фильтрации докинговых
решений для обработки виртуального скрининга позволяет повысить начальное
2
J. Mol. Model. – 2010. – 16. – P. 1223-30
11
обогащение библиотеки соединений активными молекулами в среднем в
1,5 раза. Кроме того, из приведенной таблицы следует, что начальное
обогащение библиотеки активными соединениями повышается с ростом
размера и химического разнообразия соединений. Это означает, что при
переходе от модельных экспериментов к поиску новых биологически активных
соединений методом виртуального скрининга больших библиотек коммерчески
доступных соединений ожидается высокая эффективность.
Таблица 2. Влияние структурной фильтрации на усредненные параметры точности
виртуального скрининга
Индивидуальные наборы неактивных соединений
Без фильтрации
С фильтрацией
Класс белков
ROC
ROC
RE1
RE5
RE1
RE5
AUC
AUC
15.7
7.5
0.80
20.1
7.7
0.80
Ядерные рецепторы
7.3
3.9
0.61
8.1
4.1
0.63
Киназы
6.3
6.0
0.83
9.5
7.6
0.80
Сериновые протеазы
9.8
5.7
0.61
13.9
5.3
0.61
Металлоферменты
10.5
13.9
0.94
47.8
18.2
0.97
Фолатные ферменты
8.3
5.7
0.67
12.7
5.2
0.68
Прочие ферменты
10.1
6.1
0.70
15.3
6.4
0.71
Все белки
Общий набор неактивных соединений
Без фильтрации
С фильтрацией
Класс белков
ROC
ROC
RE0.1 RE0.5
RE0.1 RE0.5
AUC
AUC
52.0
19.3
0.83
61.5
30.5
0.80
Ядерные рецепторы
30.0
20.3
0.67
42.6
31.3
0.69
Киназы
30.5
33.9
0.94
76.3
73.9
0.92
Сериновые протеазы
0.0
5.3
0.61
32.4
17.9
0.69
Металлоферменты
492.0
50.1
0.95
642.4
185.4
0.99
Фолатные ферменты
25.0
25.3
0.66
63.4
34.0
0.73
Прочие ферменты
60.4
25.3
0.73
90.1
41.5
0.76
Все белки
Факторы, влияющие на эффективность структурной фильтрации
Структурная фильтрация результатов моделирования комплексов белоклиганд, основанная на консервативности взаимодействий, имеющих место в
известных комплексах белков с низкомолекулярными соединениями, позволяет
повысить точность виртуального скрининга за счет снижения количества
ошибок первого рода, то есть ложноположительных предсказаний. Поскольку в
данной работе была использована фильтрация по водородным связям,
необходимо дополнительно обсудить влияние количества консервативных
водородных связей и их взаимного расположения на эффективность
структурной фильтрации.
Количество и взаимное расположение сайтов образования консервативных
12
водородных связей оказывают существенное влияние на прирост начального
обогащения, получаемый при использовании структурной фильтрации.
В общем случае результативность структурной фильтрации тем выше, чем
больше консервативных водородных связей образуется между лигандом и
белком, и чем дальше друг от друга расположены сайты их образования.
Очевидно, что наличие в белке только одного сайта образования
консервативной водородной связи может привести к тому, что эта водородная
связь будет образована произвольной молекулой, донор или акцептор
водородной связи у которой будет размещен правильным образом. В случае же,
когда сайтов образования водородных связей несколько, и они разнесены в
пространстве на небольшое (порядка нескольких ангстрем) расстояние,
вероятность того, что неактивный лиганд будет участвовать в нужных
взаимодействиях, существенно снижается.
Кроме того, в ряде белков при координации лигандов реализуются так
называемые коррелированные, или согласованные, водородные связи. Данный
тип взаимодействия реализуется при образовании двух водородных связей
между парами различных атомов белка и лиганда, расположенных так, что в
области взаимодействия образуется цикл. В частности, такой тип
взаимодействий наблюдается при связывании лигандов с поли-(АДФ-рибозо)полимеразой и фосфодиэстеразой 5 (рисунок 3). На предсказываемую
свободную энергию образования комплекса белок-лиганд образование
согласованных водородных связей влияет слабо, однако применение
структурной фильтрации в этом случае позволяет получать высокие
обогащения виртуальных библиотек активными ингибиторами за счет того, что
вероятность случайного образования неактивным лигандом данного вида
взаимодействий очень низка.
А
Б
Рисунок 3. Согласованные водородные связи в активном центре поли-(АДФ-рибозо)полимеразы (А) и фосфодиэстеразы 5 (Б)
13
Поиск новых фрагментных ингибиторов EphA2 и ACK1
Метод молекулярного докинга продемонстрировал многообещающие
результаты в задаче моделирования структур и свободных энергий комплексов
протеинкиназ с ингибиторами. Следующим разумным шагом представляется
применение данного метода для поиска новых молекул, способных
координироваться в активном центре и ингибировать ферментативную
активность протеинкиназ.
Поиск новых фрагментных ингибиторов киназ EphA2 и ACK1 проводился
в библиотеке KINASet компании Chembridge, содержащей более 12000
низкомолекулярных веществ, отобранных методом 3D QSAR по похожести на
АТФ – нативный субстрат всех протеинкиназ. Первый этап поиска заключался в
расчете положений связывания и соответствующих им значений энергетической
функции для каждого соединения из библиотеки KINASet с использованием
всех полноатомных моделей трехмерной структуры, подготовленных для
протеинкиназ EphA2 и ACK1. На следующем этапе среди рассчитанных для
каждого соединения положений связывания отбирались докинговые решения,
удовлетворяющие критериям структурной фильтрации. На завершающем этапе
поиска проводилась визуальная экспертная оценка предсказанных положений
связывания.
В ходе визуального анализа рассчитанных положений связывания в случае
обеих киназ было обнаружено 6 соединений, способных координироваться в
области шарнирного фрагмента, отличающихся от типичных ингибиторов
протеинкиназ. Последние, как правило, содержат фармакофорный фрагмент,
состоящий из ароматической аминогруппы – донора водородной связи, и
соседнего с ней ароматического атома азота или же карбонильного кислорода –
акцепторов водородной связи. Данный фрагмент способен координироваться с
шарнирным фрагментом киназы, образуя при этом две водородные связи.
В отличие от подобного типичного фрагмента, обнаруженные соединения
являлись производными 2-гидроксифенола (таблица 3).
Таблица 3. Фрагментные ингибиторы протеинкиназ EphA2 и ACK1, обнаруженные в ходе
виртуального скрининга.
NH2
N
1
HO
2
HO
HO
N
HO
HO
H 3C
OH
O
O
4
3
S
HO
N
N
CH3
5
HO
S
6
HO
N
N
H
HO
HO
14
O
CH3
HO
HO
Рисунок 4. Координация нативного лиганда (А) и соединения 1 (Б) в активном центре
протеинкиназы EphA2 (PDB ID 1mqb).
Положения координации данных соединений, предсказанные в ходе
виртуального скрининга, показали, что 2-гидроксифенольный фрагмент
предположительно также способен координироваться в шарнирном фрагменте
протеинкиназ с образованием вышеописанных водородных связей (рисунок 4).
Для получения дополнительных свидетельств в пользу предсказанного способа
координации был проведен поиск аналогичных паттернов связывания киназ с
их ингибиторами в базе данных рентгеновских структур Protein Data Bank.
Анализ результатов поиска позволил обнаружить трехмерную структуру
комплекса фосфатидилинозитол-3 киназы (PI3K) с флавоноидом мирицитином,
в которой 2,5-дигидроксифенольный фрагмент флавоноида координируется с
шарнирным фрагментом киназы образом, подобным предсказанному для
ингибиторов, найденных в ходе виртуального скрининга (рисунок 5).
Рисунок 5. (A) Предсказанное
для соединения 1 положение
связывания в активном центре
протеинкиназы EphA2.
2-гидроксифенольный
фрагмент образует водородные
связи с остатками E693 и M695
шарнирного
фрагмента
(нумерация
остатков
соответствует PDB ID 1mqb).
(Б) Связывание мирицитина в
активном центре PI3-киназы
(PDB ID 1e90, атомы водорода
лиганда не показаны).
15
В дополнение к протеинкиназам EphA2 и ACK1, было проведено
моделирование координации найденных соединений с рядом других
протеинкиназ человека, а именно с ABL1, CSK, EGFR, FGFR1, FGFR2, KDR,
KIT, Lyn, PYK и Syk. Предсказанные положения координации в ряде случаев
практически не отличались от найденных для киназ EphA2 и ACK1, таким
образом свидетельствуя о том, что найденные фрагментные ингибиторы могут
быть активны по отношению к широкому спектру других протеинкиназ
человека. Кроме того, поиск в базах данных Chemical Abstracts Service и
PubChem Bioassay показал, что для обнаруженных соединений на данный
момент не описана противокиназная активность. Таким образом, следующим
логическим шагом была экспериментальная проверка активности данных
соединений.
Биологическая активность найденных соединений
Экспериментальная проверка активности предсказанных фрагментных
ингибиторов на панели из 20 протеинкиназ человека показала, что данные
соединения в концентрации 10 мкМ снижают ферментативную активность
протеинкиназ EphA2 и ACK1. Исключение составляют пары соединение 6 EphA2 и соединение 2 - ACK1, в которых ингибирование ферментативной
активности не было зарегистрировано. В случае протеинкиназы EphA2 для
соединений 1-5 также были экспериментально определены кривые доза-эффект,
исходя из которых были получены значения IC50 – концентрации ингибитора,
снижающей активность фермента вдвое. Результаты экспериментального
измерения активности соединений 1-6 представлены в таблице 4.
EphA2
ACK1
Соединение
IC50,
мкM
Ki выч,
мкM
Ki, мкM
Ki выч,
мкM
1
2.2±0.3
8.4
50
21.8
2
0.6±0.2
5.1
-
-
3
1.2±0.2
1.9
72
42.0
4
1.0±0.3
0.3
15
4.0
5
1.0±0.2
1.4
53
6.8
6
-
-
41
5.2
16
Таблица 4. Результаты
экспериментального измерения
активности новых ингибиторов
протеинкиназ EphA2 и ACK1.
Концентрация соединений в
экспериментах с ACK1
составляла 10 мкМ.
Расчетные константы
ингибирования были получены
исходя из свободной энергии
связывания, рассчитанной
программным комплексом
Lead Finder.
Таким образом, было показано, что найденные соединения значительно
подавляют ферментативную активность протеинкиназы EphA2, при этом
экспериментально определенные для них значения IC50 колеблются от 0.6 до
2.2 мкМ и хорошо согласуются с предсказанными значениями свободной
энергии образования комплексов. По отношению к протеинкиназе ACK1
активность новых ингибиторов оказалась ниже – 10 мкМ этих соединений
подавляют от 10 до 30% каталитической активности, что также согласуется с
результатами моделирования.
Результаты измерения активности по отношению к остальным 18
протеинкиназам человека, приведенные в таблице 5, свидетельствуют о
достаточно широком профиле активности новых ингибиторов, предположение о
котором также было сделано на основании результатов моделирования.
Таблица 5. Результаты измерения активности соединений 1-6 в концентрации 10 мкМ на
панели из 18 протеинкиназ человека.
Соединение
Syk
CSK
IGF1R
EGFR
InsR
Lyn
FGFR1
FGFR2
Alk
Abl
BLK
CSFR
CTK
PDGFRa
PYK
KIT
KDR
YES
6
48
4
60
35
68
80
76
28
77
60
30
31
84
0
0
12
0
1
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
4
12
3
11
21
10
20
20
14
12
19
19
7
28
0
0
4
0
9
90
4
57
48
80
91
85
28
10
0
0
39
18
0
0
13
10
2
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
4
16
4
13
12
16
15
17
15
9
0
0
15
7
0
0
4
2
13
81
64
44
35
65
58
64
36
64
58
34
24
103
0
0
29
14
3
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
5
13
11
12
9
29
30
24
11
24
28
14
12
13
0
0
17
6
8
39
26
48
4
55
62
67
22
68
74
34
63
104
63
0
93
46
4
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
1
5
3
7
1
5
12
18
6
10
13
16
33
3
27
0
14
4
3
14
2
27
7
39
54
54
7
64
0
14
30
77
24
0
0
0
5
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
1
14
5
13
10
19
14
11
9
15
0
14
20
36
25
0
0
0
5
32
3
41
19
23
62
47
26
72
51
25
31
58
9
32
91
68
6
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
±
3
5
3
4
4
12
11
4
12
14
7
3
14
29
8
33
5
16
Из приведенных данных следует, что найденные фрагментные ингибиторы
наиболее активны по отношению к таким протеинкиназам, как EGFR, FGFR1,
FGFR2, Abl и PDGFRa. Результаты, полученные методом молекулярного
докинга, свидетельствуют о том, что координация новых ингибиторов с этими
киназами происходит таким же образом, как и с протеинкиназами EphA2 и
ACK1. Таким образом, 2-гидроксифенольный фрагмент, присутствующий во
всех обнаруженных соединениях, представляет собой новый общий
фармакофор, пригодный для разработки новых ингибиторов протеинкиназ,
целенаправленно действующих на несколько мишеней, например на EphA2 и
EGFR.
17
Разработка и валидирование фрагментного подхода к поиску
ингибиторов in silico
Результаты, описанные в предыдущем разделе, показывают
применимость метода молекулярного докинга к поиску фрагментных
ингибиторов. Однако, для целенаправленного поиска фрагментов, способных к
координации с заданной терапевтической мишенью и пригодных к дальнейшей
оптимизации,
представляется
целесообразной
разработка
более
специализированного подхода.
Для расчёта свободной энергии связывания и, соответственно,
константы ингибирования, необходимо правильно определить геометрию
координации исследуемого соединения. Поэтому в первую очередь необходимо
проверить, насколько корректно метод молекулярного докинга позволяет
предсказывать геометрию связывания фрагментов. По результатам анализа базы
данных лекарств, для которых известна трёхмерная структура комплекса с
белком-мишенью, было отобрано 39 соединений. Из них 34 полных
лекарственных молекулы докируются корректно (предсказанное положение
связывания совпадает с данными РСА, RMSD < 1,5 Å). Причина некорректного
молекулярного докинга оставшихся 5 соединений, судя по всему, состоит в их
большом размере и, как следствие, большом количестве степеней свободы.
Лекарства, докинг которых прошёл корректно, разбили на фрагменты и
докировали в белок-мишень. Для каждого фрагмента определили корректность
докирования, а также долю занимаемого соединением сайта связывания
(визуально). Затем эти данные были проанализированы следующим образом:
для каждого возможного значения характеристик связывания определялось
общее количество соединений, удовлетворяющих этому значению, а среди них число корректно и некорректно докированных фрагментов (таблица 6).
Таблица 6. Факторы, влияющие на корректность фрагментного докинга. Приведено общее
количество фрагментов, удовлетворяющее условию («Всего»), количество корректно (+) и
некорректно (-) докированных фрагментов, а также процент корректно докированных
фрагментов.
Фактор
Значение
+
Всего
+, %
HB
0
2
13
15
13
1
7
4
11
64
>1
35
7
42
83
Me
41
23
64
64
+
3
1
4
75
V, %
15
1
6
7
14
25
19
11
30
63
50
22
7
29
75
75
2
0
2
100
44
24
68
65
18
Таким образом, образование более чем одной водородной связи между
фрагментом и белком-мишенью существенно повышает надёжность
молекулярного докинга фрагментов, поскольку образование водородной связи с
одной стороны энергетически весьма выгодно, а с другой - наличие нескольких
водородных связей существенно ограничивает спектр возможных положений
соединения в пространстве. Надёжность фрагментного докинга также
повышается при взаимодействии лиганда с ионом металла: координация
металла весьма выгодна энергетически, и в органическом соединении обычно
присутствует сравнительно небольшое количество групп, способных
участвовать в таком взаимодействии, и таким образом количество возможных
поз резко сокращается. Наконец, чем большую долю сайта связывания занимает
фрагмент, тем выше вероятность корректного предсказания геометрии
координации, так как при увеличении доли занимаемого фрагментом сайта
связывания уменьшается количество возможных геометрий связывания, а,
следовательно, повышается надёжность докинга.
Экспериментально определённые энергии связывания фрагментных
ингибиторов согласуются со значениями, предсказанными на основании
молекулярного моделирования (рисунок 6). Среднеквадратичное отклонение
составило 1,35 ккал/моль, что соответствует отличию констант связывания
примерно на один порядок. Такая ошибка является вполне приемлемой для
молекулярного моделирования, особенно если учесть, что цель виртуального
фрагментного скрининга состоит не в том, чтобы точно рассчитать свободную
энергию связывания, а в том, чтобы отобрать соединения, активные в разумной
концентрации, и лишь затем провести оптимизацию их связывания.
9,00
<1 ккал/моль
<2ккал/моль
dGexp, ккал/моль
8,00
7,00
6,00
5,00
4,00
3,00
0,00
0,50
1,00
1,50
2,00
2,50
|ΔdG|, ккал/моль
3,00
3,50
4,00
Рисунок 6. Точность предсказания свободной энергии связывания фрагментов. Показана
экспериментальная энергия связывания фрагмента (dGexp) и абсолютное значение ошибки её
предсказания (|ΔdG|).
19
Поиск новых биологически активных соединений методом
виртуального фрагментного скрининга
На основании изложенного в предыдущих разделах можно заключить, что
молекулярный докинг позволяет адекватно моделировать структуру и
свободную энергию взаимодействия фрагментов с мишенью, особенно в тех
случаях, когда они участвуют в направленных взаимодействиях с белком, или
же занимают значительную часть активного центра. Однако простое
применение виртуального скрининга фрагментной библиотеки недостаточно
эффективно при направленном поиске новых фрагментных ингибиторов, так
как при этом даже после структурной фильтрации остаётся несколько сотен
соединений,
экспериментальная
проверка
активности
которых
нецелесообразна. После нескольких попыток воспроизвести in silico поиск
известных фрагментных ингибиторов была предложена общая методика для
фрагментного скрининга in silico, позволяющая сократить количество
фрагментных соединений для экспериментальных измерений, и состоящая из
следующих этапов:

поиск трёхмерной структуры белка-мишени в комплексе с ингибитором

подготовка полноатомной трёхмерной модели белка-мишени и выявление
консервативных взаимодействий в комплексах мишень-ингибитор
(т.е. критериев структурной фильтрации)

виртуальный скрининг фрагментной библиотеки и структурная
фильтрация результатов

ранжирование соединений, удовлетворяющих критериям структурной
фильтрации по удельной энергии взаимодействия с мишенью

кластеризация лучших соединений по структурным мотивам,
взаимодействующим с белком
Мишенью для поиска новых фрагментных ингибиторов была выбрана
протеинкиназа CDK2, участвующая в регуляции клеточного деления. Выбор
данной мишени был обусловлен рядом факторов, таких как подтвержденная
вовлеченность в патологические процессы, наличие большого числа
экспериментально разрешенных трехмерных структур и ингибиторов,
действующих на мишень, а также доступность in vitro моделей для проведения
экспериментальных измерений.
Поиск новых фрагментных ингибиторов CDK2 проводился с
использованием библиотеки фрагментных соединений, полученной путем
отбора молекул, удовлетворяющих усеченному «правилу пяти» Липинского, из
библиотек компаний Enamine и Vitas-M Laboratory. В результате виртуального
скрининга библиотеки, содержавшей 31869 молекул, для протеинкиназы CDK2
20
было найдено 1438 лигандов, удовлетворяющих критериям структурной
фильтрации. При кластеризации лучших соединений по скаффолду,
взаимодействующему с белком, для протеинкиназы CDK2 было получено
13 кластеров (рисунок 7).
Для определения достоверности полученных результатов был проведён
поиск выявленных структурных мотивов (ядер кластеров) среди известных
нефрагментных ингибиторов, поскольку число известных ингибиторов CDK2
достаточно велико, и они принадлежат к разным классам органических
веществ. Кроме того, для данного белка удалось обнаружить также некоторые
данные по имеющимся фрагментным ингибиторам. Проведенный поиск
показал, что 10 из 13 структурных мотивов встречается в реальных ингибиторах
CDK2. Таким образом, из 13 обнаруженных ядер фрагментов 3 являются
новыми.
O
O
H
N
Ar
25
A
NH
NH H
N
N
H
O
7
6
NH
R
O
N
H
N
16
O
8
H
O
N
N
H
Any
N
7
6
H
O
NH
A
17
Any
R
NH H
N
H
N
O
NH
O
NH
H
O
6
O
N
Any
N
N
H
1
1
N
N
H
O
1
H
N
O
NH H
1
Рисунок 7. Найденные кластеры фрагментов для протеинкиназы CDK2. Под формулами
фрагментов указана их встречаемость среди 100 лучших по удельной энергии
взаимодействия с белком соединений.
A=С(H)n, N(H), O; Any – одинарная или двойная связь.
21
На следующем этапе работы на основе анализа положений координации и
предсказанной энергии связывания было решено отобрать из каждого кластера
по 1-2 наиболее хорошо связывающихся соединения и проводить дальнейшие
эксперименты именно с ними.
Среди ингибиторов CDK2 было отобрано 15 соединений, однако доступно
для измерений оказалось лишь 4 соединения. Определенное для них понижение
каталитической активности фермента составило 21-58% в концентрации 0,5 мМ
(рисунок 8А). Этих данных недостаточно для расчёта точного значения
константы ингибирования, однако они показывают активность трёх
ингибиторов в субмиллимолярной, а одного - в миллимолярной концентрации,
что является приемлемым результатом для фрагментных ингибиторов.
Таким образом, эффективность методики виртуального фрагментного
скрининга была подтверждена как встречаемостью найденных фрагментов в
ингибиторов,
так
и
экспериментально
структурах
существующих
обнаруженной активностью найденных с её помощью 4 фрагментных
ингибиторов протеинкиназы CDK2.
Б
А
H
N
N
NH2
O
N
N
F
MW 171
MW 178
52% @ 0.5 мМ
38% @ 0.5 мМ
O
O
NH
N
Cl
MW 180,6
58% @ 0.5 мМ
O
N
H
MW 161
21% @ 0.5 мМ
Рисунок 8. Результаты экспериментального определения активности ингибиторов
протеинкиназы CDK2 (А) и предсказанное положение координации для одного из них (Б).
Приведены молярные массы соединений и процент ингибирования фермента при заданной
концентрации вещества.
22
Основные результаты и выводы
1. Моделирование термодинамических и структурных параметров
координации набора 86 терапевтически значимых ферментов киназ и их
42 ингибиторов с помощью метода молекулярного докинга дало общую
точность 77% в отношении предсказания пар фермент-ингибитор.
2. Недостаточность экспериментальных данных о структурах активных
центров киназ и их подвижности обусловливает бóльшую достоверность
отрицательных предсказаний (85%) по сравнению с положительными
(52%) для моделирования координации пар фермент-ингибитор методом
докинга.
3. Применение метода структурной фильтрации позволяет снизить
начальный процент ложноположительных предсказаний координации пар
белок-лиганд в 1,5 раза, как было показано на наборе 40 структурно и
функционально различных белков.
4. Обнаружена
способность
производных
2-гидроксифенола
координироваться в активном центре тирозинкиназ EphA2 и ACK1 и
ингибировать их ферментативную активность в микромолярном
диапазоне концентраций. Экспериментально установлена ингибирующая
активность найденных соединений в ряду 20 тирозинкиназ человека.
5. Наибольшая точность моделирования структуры комплексов белков с
фрагментными органическими соединениями методом докинга
составляет 83% и достигается для соединений, участвующих в
направленных взаимодействиях (водородные связи, координация с
металлом и т.д.) и образующих комплементарный гидрофобный контакт с
белком. Точность расчета свободной энергии образования комплексов
фрагментных соединений с белками, исследованная на наборе 30
комплексов, составляет 1,35 ккал/моль.
6. Применение структурной фильтрации и кластеризации позволило
повысить точность методов докинга для моделирования координации и
свободной энергии образования комплексов фрагментных соединений с
белками, и найти 4 новых ингибитора протеинкиназы CDK2 с
константами ингибирования, лежащими в микромолярном диапазоне
концентраций.
23
Список публикаций
1.
Stroylov, V.S. Novel fragment-like inhibitors of EphA2 obtained by
experimental screening and modeling / V.S. Stroylov, T.V. Rakitina,
F.N. Novikov, O.V. Stroganov, G.G. Chilov, A.V. Lipkin // Mendeleev
Commun. — 2010. — 20. — P. 263-265.
2.
Novikov, F.N. Improving performance of docking-based virtual screening by
structural filtration / F.N. Novikov,V.S. Stroylov, O.V. Stroganov, G.G. Chilov
// J. Mol. Model. — 2010. — 16. — 7. —P. 1223-30.
3.
Stroganov, O.V. Lead finder: an approach to improve accuracy of proteinligand docking, binding energy estimation, and virtual screening /
O.V. Stroganov, F.N. Novikov, V.S. Stroylov, V. Kulkov, G.G. Chilov //
J. Chem. Inf. Model. — 2008. — 48. — P. 2371-85.
4.
Novikov, F.N. Developing novel approaches to improve binding energy
estimation and virtual screening: a PARP case study / F.N. Novikov,
V.S. Stroylov, O.V. Stroganov, V. Kulkov, G.G. Chilov // J. Mol. Model.
— 2009. — 15. —11. — P. 1337-47.
5.
Stroganov, O.V. Lead Finder – software for drug discovery applications /
O.V. Stroganov, F.N. Novikov, V.S. Stroylov, G.G. Chilov // Сборник тезисов
докладов VII Московского международного конгресса
"БИОТЕХНОЛОГИЯ: состояние и перспективы развития".— 2009.
— Москва, Россия. — Том 1. — С. 236.
6.
Стройлов, В.С. Lead Finder — программный продукт для поиска новых
лекарственных препаратов / В.С. Стройлов, О.В. Строганов,
Ф.Н. Новиков, Г.Г. Чилов // Сборник тезисов IV Российского симпозиума
"Белки и пептиды". — 2009. — Казань, Россия. — С. 393.
7.
Зейфман, А.А. Фрагментный подход к поиску лекарств in silico /
А.А. Зейфман, В.С. Стройлов // Тезисы докладов IV молодежной
конференции ИОХ РАН. — 2010. — Москва, Россия.
8.
Stroylov, V. Lead Finder in the CSAR scoring challenge / Victor Stroylov,
Ghermes Chilov, Oleg Stroganov, Fedor Novikov, Val Kulkov // Тезисы
докладов международной конференции «ACS Fall 2010». — 2010.
— Бостон, США. — COMP 145.
9.
Chilov, G. Key directions of mastering docking and scoring approaches /
Ghermes Chilov, Oleg Stroganov, Fedor Novikov,Victor Stroylov, Val Kulkov
// Тезисы докладов международной конференции «ACS Fall 2010».
— 2010. — Бостон, США. — COMP 24
24
Download