КОМПЬЮТЕРНОЕ ПРОГНОЗИРОВАНИЕ СПЕКТРОВ БИОЛОГИЧЕСКОЙ АКТИВНОСТИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ

advertisement
КОМПЬЮТЕРНОЕ
ПРОГНОЗИРОВАНИЕ СПЕКТРОВ
БИОЛОГИЧЕСКОЙ АКТИВНОСТИ
ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ
Д.А. Филимонов
Институт биомедицинской химии
им. В.Н. Ореховича РАМН, Москва
Методы биоинформатики
Фундаментальная
теория
Универсальный
закон
природы
Ab initio принципы
Molecular
Modelling
Machine
Learning
Обучение на примерах
Единичная оценка
Сходство
Пример лекарственной субстанции
http://www.drugs.com/plavix.html
Brand Names : Plavix
Generic Name: Clopidogrel
Plavix (clopidogrel) keeps the platelets in your
blood from coagulating (clotting) to prevent
unwanted blood clots that can occur with certain
heart or blood vessel conditions.
http://en.wikipedia.org/wiki/Clopidogrel
Clopidogrel is an oral, thienopyridine class antiplatelet
agent used to inhibit blood clots in coronary artery
disease, peripheral vascular disease, and cerebrovascular
disease. It is marketed by Bristol-Myers Squibb and SanofiAventis under the trade name Plavix. The drug works by
irreversibly inhibiting a receptor called P2Y12, an
adenosine diphosphate ADP chemoreceptor. Adverse
effects include hemorrhage, severe neutropenia, and
thrombotic thrombocytopenic purpura (TTP).
Клопидогрел (Clopidogrelum) — лекарственный
препарат, снижающий склонность тромбоцитов к
агрегации.
Обучающая выборка PASS
Число соединенй в выборке
250000
4000
200000
3000
150000
2000
100000
1000
50000
0
0
1995
1995
1998
1998
2001
2001
2003
2003
2005
2005
2007
2007
2009
2009
2010
2010
Число прогнозируемых
активностей
5000
300000
Спектр биологической активности:
Весь комплекс
üфармакологических эффектов
üбиохимических механизмов действия
üэффектов специфической токсичности и побочного действия
üэффектов взаимодействия с системой метаболизма
üэффектов влияния на генную экспрессию
üэффектов влияния на белки-транспортеры
которые вещество способно вызывать при некоторых условиях
взаимодействия с биологическими объектами,
без учета особенностей конкретных экспериментов.
Активности представлены качественно.
Принцип «презумпции невиновности»:
вещество не обладает теми видами биологической активности,
которые не указаны в его спектре.
Представление структуры молекулы
Взаиморасположение
в пространстве
атомов
Поэтому
структурная формула
однозначно
определяет
свободной молекулы
в основном
состоянии в вакууме –
свойства
молекулы.
необходимая и достаточная характеристика ее структуры.
Представление структуры молекулы
Дескрипторы многоуровневых атомных окрестностей (MNA)
основаны на идее описания отдельных атомов молекулы
с учетом их окружения.
Дескрипторы
многоуровневых атомных окрестностей – MNA
O
O
C
N
S
Cl
MNA/0:
-С
Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75.
Filimonov D.A., Poroikov V.V. (2008) In: Chemoinformatics Approaches to Virtual Screening.
Eds. Alexandre Varnek and Alexander Tropsha. Cambridge (UK): RSC Publishing, 182-216.
Дескрипторы
многоуровневых атомных окрестностей – MNA
O
C
C
C
O
N
S
Cl
MNA/1:
-С(CN-H-C)
Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75.
Filimonov D.A., Poroikov V.V. (2008) In: Chemoinformatics Approaches to Virtual Screening.
Eds. Alexandre Varnek and Alexander Tropsha. Cambridge (UK): RSC Publishing, 182-216.
Дескрипторы
многоуровневых атомных окрестностей – MNA
O
C
C
C
MNA/2:
C
C
Cl
O
N
C
C
S
-С(C(CC-С)N(CC-С)-H(-С)-C(-С-O-O))
Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75.
Filimonov D.A., Poroikov V.V. (2008) In: Chemoinformatics Approaches to Virtual Screening.
Eds. Alexandre Varnek and Alexander Tropsha. Cambridge (UK): RSC Publishing, 182-216.
Дескрипторы
многоуровневых атомных окрестностей – MNA
CH3
O
C
C
C
C
C
C
C
Cl
O
N
C
C
C
C
S
MNA/3: -С(C(C(СС-H)C(CC-Cl)-С(CN-H-C))
N(C(CN-H-H)C(CN-H-H)-С(CN-H-C))
-H(-С(CN-H-C))
-C(-С(CN-H-C)-O(-C)-O(-C-C)))
Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75.
Filimonov D.A., Poroikov V.V. (2008) In: Chemoinformatics Approaches to Virtual Screening.
Eds. Alexandre Varnek and Alexander Tropsha. Cambridge (UK): RSC Publishing, 182-216.
Дескрипторы
многоуровневых атомных окрестностей – MNA
O
HC
CHHHO
CHHCC
CHHCN
CHCC
CHCCN
CHCS
CCCC
CCCS
CCCCl
CCOO
NCCC
OC
OCC
SCC
ClC
O
C
Cl
N
S
Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75.
C(C(CCC)C(CC-H-H)S(CC))
C(C(CCC)C(CS-H)-H(C))
C(C(CCC)N(CC-C)-H(C)-H(C))
C(C(CCS)C(CC-H)C(CN-H-H))
C(C(CCS)C(CN-H-H)-H(C)-H(C))
C(C(CC-H-H)N(CC-C)-H(C)-H(C))
C(C(CC-H)C(CC-H)-H(C))
C(C(CC-H)C(CC-C)-H(C))
C(C(CC-H)C(CC-C)-Cl(C))
C(C(CC-H)C(CC-Cl)-H(C))
C(C(CC-H)C(CC-Cl)-C(CN-H-C))
C(C(CC-H)S(CC)-H(C))
N(C(CN-H-H)C(CN-H-H)-C(CN-H-C))
S(C(CCS)C(CS-H))
-H(C(CC-H))
-H(C(CC-H-H))
-H(C(CN-H-H))
-H(C(CS-H))
-H(-C(CN-H-C))
-H(-C(-H-H-H-O))
-C(C(CC-C)N(CC-C)-H(-C)-C(-C-O-O))
-C(-H(-C)-H(-C)-H(-C)-O(-C-C))
-C(-C(CN-H-C)-O(-C)-O(-C-C))
-O(-C(-H-H-H-O)-C(-C-O-O))
-O(-C(-C-O-O))
-Cl(C(CC-Cl))
Filimonov D.A., Poroikov V.V. (2008) In: Chemoinformatics Approaches to Virtual Screening.
Eds. Alexandre Varnek and Alexander Tropsha. Cambridge (UK): RSC Publishing, 182-216.
Дескрипторы
многоуровневых атомных окрестностей – MNA
9000
8000
Количество структур
7000
6000
5000
4000
3000
2000
1000
0
0
20
40
60
80
100
120
Количество MNA дескрипторов
140
160
180
Пример органического соединения в PASS
O
Структурные дескрипторы
O
N
Cl
S
Спектр активности
Acute neurologic disorders treatment
Antianginal
Antiarthritic
Anticoagulant
Antipsoriatic
Antithrombotic
Atherosclerosis treatment
CYP2C19 inhibitor
CYP2C9 inhibitor
CYP3A4 substrate
Hyperthermic
Neuroprotector
Platelet aggregation inhibitor
Purinergic P2T antagonist
Purinergic P2Y12 antagonist
HC
CHHHO
CHHCC
CHHCN
CHCC
CHCCN
CHCS
CCCC
CCCS
CCCCl
CCOO
NCCC
OC
OCC
SCC
ClC
C(C(CCC)C(CC-H-H)S(CC))
C(C(CCC)C(CS-H)-H(C))
C(C(CCC)N(CC-C)-H(C)-H(C))
C(C(CCS)C(CC-H)C(CN-H-H))
C(C(CCS)C(CN-H-H)-H(C)-H(C))
C(C(CC-H-H)N(CC-C)-H(C)-H(C))
C(C(CC-H)C(CC-H)-H(C))
C(C(CC-H)C(CC-C)-H(C))
C(C(CC-H)C(CC-C)-Cl(C))
C(C(CC-H)C(CC-Cl)-H(C))
C(C(CC-H)C(CC-Cl)-C(CN-H-C))
C(C(CC-H)S(CC)-H(C))
N(C(CN-H-H)C(CN-H-H)-C(CN-H-C))
S(C(CCS)C(CS-H))
-H(C(CC-H))
-H(C(CC-H-H))
-H(C(CN-H-H))
-H(C(CS-H))
-H(-C(CN-H-C))
-H(-C(-H-H-H-O))
-C(C(CC-C)N(CC-C)-H(-C)-C(-C-O-O))
-C(-H(-C)-H(-C)-H(-C)-O(-C-C))
-C(-C(CN-H-C)-O(-C)-O(-C-C))
-O(-C(-H-H-H-O)-C(-C-O-O))
-O(-C(-C-O-O))
-Cl(C(CC-Cl))
Термины биологической активности в PASS
501
3295
57
199
29
49
фармакологический эффект
биохимических механизмов действия
эффектов специфической токсичности
и побочного действия
терминов метаболизма
эффектов влияния на генную экспрессию
эффектов влияния на белки-транспортеры
Алгоритм прогноза спектра биологической
активности органических соединений PASS
По структуре молекулы
в виде множества из m дескрипторов {D1, …, Dm}
для каждой активности Ak
подсчитываются значения Bk:
Bk = (Sk – S0k)/(1 – Sk*S0k)
Sk = Sin[åi ArcSin(2P(Ak|Di) – 1)/m]
S0k = 2P(Ak) – 1
P(Ak)
P(Ak|Di)
- априорная вероятность
найти вещество с активностью Ak
- условная вероятность активности Ak
у молекулы, имеющей дескриптор Di
Алгоритм прогноза спектра биологической
активности органических соединений PASS
Частотные оценки вероятностей P(Ak) и P(Ak|Di):
P(Ak) = Nk /N,
P(Ak|Di) = Nik /Ni
N - общее количество веществ в выборке;
Ni - количество веществ, содержащих дескриптор Di
в описании структуры;
Nk - количество веществ, содержащих активность Ak
в спектре активности;
Nik - количество веществ, содержащих и дескриптор Di
в описании структуры, и активность Ak в спектре
активности.
Филимонов Д.А., Поройков В.В. (2006) РХЖ, L, (2), 66-75.
Результат прогноза PASS
Спектр активности
Acute neurologic disorders treatment
Antianginal
Antiarthritic
Anticoagulant
Antipsoriatic
Antithrombotic
Atherosclerosis treatment
CYP2C19 inhibitor
CYP2C9 inhibitor
CYP3A4 substrate
Hyperthermic
Neuroprotector
Platelet aggregation inhibitor
Purinergic P2T antagonist
Purinergic P2Y12 antagonist
Задача классификации
Неактивные
TP
Calculated value
FP
Активные
Порог
TN
FN
Observed value
Критерий точности классификации
Anthony Nicholls. What do we know and when do we know it?
J. Comput. Aided. Mol. Des. 2008
Задача классификации в PASS
1.0
0.9
0.8
0.7
Pa
0.6
Pi
0.5
0.4
0.3
0.2
0.1
0.0
-1
-0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
Pa(B) и Pi(B) – функции B-статистики, вычисляемые по
обучающей выборке с исключением по одному.
Фармакологический эффект «Противоопухолевое».
Критерий точности прогноза PASS
1
Вероятнсть распознавания
0.9
0.8
0.7
0.6
Чувствителность
0.5
Специфичность
0.4
Точность
0.3
0.2
0.1
0
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
Вероятность ошибки 2-го рода
Фармакологический эффект «Противоопухолевое».
Инвариантная точность прогноза 0.87.
Задача классификации в PASS
1.0
0.9
0.8
0.7
Pa
0.6
Pi
0.5
0.4
0.3
0.2
0.1
0.0
-1
-0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
Pa(B) и Pi(B) – функции B-статистики, вычисляемые по
обучающей выборке с исключением по одному.
Биохимический механизм действия
«Carbonic anhydrase inhibitor».
Критерий точности прогноза PASS
1
Вероятнсть распознавания
0.9
0.8
0.7
0.6
Чувствителность
0.5
Специфичность
0.4
Точность
0.3
0.2
0.1
0
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
Вероятность ошибки 2-го рода
Биохимический механизм действия
«Carbonic anhydrase inhibitor».
Инвариантная точность прогноза 0.9986.
Валидация точности прогноза PASS
Валидация точности прогноза PASS
IAP для тестовой выборки, %
100
95
100
90
80
85
60
80
40
75
20
70
65
60
0
10
20
30
40
50
60
70
80
90
100 110 120
124 активности отобранных из MDDR соединений
Влияние
Влияниенеполноты
неполнотыданных
данныхоб
о структурах
активности
Результат прогноза PASS
Пример применения прогноза PASS
Пример применения прогноза PASS
Из 573 виртуальных соединений по прогнозу PASS
было отобрано 9 потенциальных ингибиторов
циклооксигеназы и липоксигеназы одновременно
В эксперименте:
8 проявили противовоспалительную активность
по 7 – ингибиторы одного из ферментов
6 – ингибиторы обоих ферментов
Использование прогнозов PASS Inet
Navarrete-Vazquez G., Hidalgo-Figueroa S., Torres-Piedra M., et al. (2010). Synthesis, vasorelaxant
activity and antihypertensive effect of benzo[d]imidazole derivatives. Bioorganic & Medicinal Chemistry, 18
(11): 3985–3991.
Mustafayeva K., Di Giorgio C., Elias R., et al. (2010). DNA-Damaging, mutagenic, and clastogenic
activities of gentiopicroside isolated from Cephalaria kotschyi roots. Journal of Natural Products, 73 (2): 99–
103.
Raja A.K., Vimalanathan A.B., Raj S.V., et al. (2010). Indispensable chemical genomic approaches in novel
systemic targeted drug discovery. Biology and Medicine, 2 (3): 26-37.
Torres-Piedra M., Ortiz-Andrade R., Villalobos-Molina R., et al. (2010). A comparative study of flavonoid
analogues on streptozotocinenicotinamide induced diabetic rats: Quercetin as a potential antidiabetic agent
acting via 11b–Hydroxysteroid dehydrogenase type 1 inhibition. European Journal of Medicinal Chemistry,
45: 2606-2612.
Benchabane Y., Di Giorgio C., Boyer G., et al. (2009). Photo-inducible cytotoxic and clastogenic activities
of 3,6-di-substituted acridines obtained by acylation of proflavine. European Journal of Medicinal Chemistry,
44: 2459–2467.
Hernandez-Nunez E., Tlahuext H., Moo-Puc R., et al. (2009). Synthesis and in vitro trichomonicidal,
giardicidal and amebicidal activity of N-acetamide(sulfonamide)-2-methyl-4-nitro-1H-imidazoles. European
Journal of Medicinal Chemistry, 44 (7), 2975-2984.
Babaev E.V. (2009). Combinatorial chemistry at the university: ten years experience of research, educational
and organizational projects. Russsian Chemical Journal, 53 (5), 140-152.
Ghadimi S., Ebrahimi-Valmoozi A.A. (2009). Lipophilicity, electronic, steric and topological effects of some
phosphoramidates on acethylcholinesterase inhibitory property. J. Iran. Chem. Soc., 6 (4): 838-848.
Gregirchak N.M., Kosyanchuk Ya.S. (2009). Studies of biological activity of newly synthesized compounds.
Proceedings of the National University of Food Technologies, No.28, 27-30.
Благодарности
ИБМХ РАМН, Москва, Россия
Александр Дмитриев
Дмитрий Дружиловский
Алексей Захаров
Олег Гомазков
Алексей Лагунин
Ольга Коборова
Алла Степанчикова
Ольга Фильц
Анастасия Рудик
Сергей Иванов
Борис Соболев
Татьяна Брюшинина
Владимир Поройков
Татьяна Глориозова
ВИНИТИ РАН, Россия
Валентина Блинова
Lab. Med. Chem., NCI, NIH, Frederik, M.D., U.S.
Marc Nicklaus
Marcus Sitzmann
Igor Filippov
Aristotelian University of Thessaloniki, Greece
Athina Geronikaki
Norwegian UniVersity of Science and Technology, Trondheim
Sergey Zotchev
Download