Ультраметрика в биофизике

advertisement
Институт химической
физики им. Н.Н. Семенова,
РАН
49-я Школа ПИЯФ
по Физике Конденсированного Состояния
16-21 марта 2015, Санкт-Петербург,
Зеленогорск
Ультраметрика в биофизике
Владик Аветисов
Институт химической физики им. Н. Н. Семенова РАН
метрика и ультраметрика
метрика
ультраметрика
1. d ( x, y )  0, d ( x, y )  0 ( x  y )
1. d ( x, y )  0, d ( x, y )  0 ( x  y )
2. d ( x , y )  d ( y , x )
2. d ( x , y )  d ( y , x )
3. d ( x , y )  d ( x , z )  d ( z , y )
неравенство треугольника
3. d ( x, y )  max d ( x, z ), d ( z , y )
сильное неравенство треугольника:
всякий треугольник либо равнобедренный (с
меньшим основанием), либо равносторонний
геометрия ультраметрического пространства
Следствия сильного неравенства
треугольника d ( x, y )  max d ( x, z ), d ( z , y )
образом ультраметрического пространства
является дерево: расстояние между двумя точками
определяется положением ближайшего "общего предка" .
• всякая точка шара является его
центром;
• радиус шара равен диаметру шара;
• всякие два ультраметрических шара
либо не имеют общих точек, либо
меньший шар целиком содержится в
большем;
• всякий шар можно полностью покрыть
конечным числом шаров меньшего
радиуса.
• ультраметрическое расстояние
принимает дискретные значения.
•
•
•
граница дерева – ультраметрическое пространство
само дерево - граф ультраметрических расстояний
каждое поддерево - ультраметрический шар
ультраметрика и аксиома измерения
ультраметрическое пространство неархимедово.
аксиома Архимеда ("аксиома измерения")
B
A
A
C
d n{ AC}  d AB
А
С
B
d n{ AC}  d AB
в ультраметрическом пространстве нельзя
малыми шагами пройти большое расстояние...
…, т.е. нельзя понимать движение как
последовательность малых смещений
метрика, числовая норма и числовые поля
метрика (расстояние d)
d AB  0; d AB  0, A  B
d AB  d BA
d AC  d AB  d BC
норма числа (|x|)
  x   0;   x   0, x  0
  xy     x    y 
  x  y    x    y
архимедовы пространства и вещественные числа
вещественная норма рационального числа:
B
A
••
A
•
C
•
•
• •
| x | max  x, x 
неравенство треугольника:
| x  y || x |  | y |
аксиома Архимеда
d n ( AC )  d AB
архимедовость
| 2x |  | x |
вещественные числа:
x   a x m , 0  a x   m  1

сходимость по вещественной норме
ультраметрические пространства и р-адические числа
d AC  max d AB , d BC 
р-адическая норма рационального числа:
x  p
n
, | x | p  p 
m
р-простое число
| x  y | p  max | x | p , | y | p 
сильное неравенство треугольника
р-адические числа:
x   a x  p  , 0  p x   p  1

A
C
B
неархимедовость:
d n ( AC )  d AC
сходимость по р-адической норме
неархимедовость
пример:
| nx | p  | x | p
| 0,125 |2  8,
| 0,125 |2 | 32 |2
| 32 |2  0, 03125
два способа описания природы
теорема Островского:
любая норма числа эквивалентна либо вещественной
норме, либо р-адической норме.
архимедовы пространства
неархимедовы пространства
существует только 2 типа моделей реальности – "архимедовы"
модели и "неархимедовы" модели.
когда удобно использовать "деревья"?
• Многомасштабность
• Дискретность
• Самоподобие
многомасштабность + дискретность
иерархия
примеры из биофизики: - реконструкция нелокальных характеристик
сложной системы по локальным наблюдаемым
ферментативный катализ и все то, что
топология генома: макромолекула ДНК
относится к "молекулярным машинам" и их
дизайну".
длиной около 2 метров плотно упакована в ядре
клетки микронного размера. При этом фрагмент
ДНК любого масштаба остается доступным для
быстрого считывания генетической
информации.
Основная проблема: как по кинетическим
данным реконструировать характер
флуктуационно-динамической подвижности
белковой молекулы
Основная проблема: как по матрице контактов
реконструировать укладку полимерной цепи ДНК
в чем заключается проблема описания динамики белка
Состояние белковой молекулы можно определить
задав пространственное положение всех
«элементарных единиц» макромолекулы. Если
имеется N «элементарных единиц», каждая их
которых имеет m степеней свободы, то состояние
макромолекулы можно описывать точкой
(Евклидова) пространства размерности M=Nm,
RM.
При атомном представлении размерность
пространства состояний белковой молекулы
составляет несколько тысяч.
проблема описания динамики белка
protein energy
(r)
Далее, следовало бы определить энергию
(r) в каждом состоянии (например, из
межатомных взаимодействий) и построить
энергетический ландшафт белковой
молекулы (r).
protein conformations, rRM
проблема описания динамики белка
Типичные масштабы для белковых молекул:
• число атомов ~ 103
• размерность пространства состояний ~ 103
• число локальных минимумов >> 10100
protein energy
(r)
(этого никто явно не считал, но все так думают)
protein conformations, rRM
Построить такие энергетические ландшафты,
невозможно даже на самых мощных компьютерах.
Энергетические ландшафты можно
реконструировать только для существенно
меньших молекулярных структур.
potential energy U(x)
potential energy U(x)
представление сложных энергетических ландшафтов древообразными графами
conformational space
local minima
конечные вершины графа представляют локальные минимумы
энергетического ландшафта, а остальные вершины графа
представляют «точки перевала» для путей переходов из одних
состояний в другие.
энергетический ландшафт тетрапептида (4-Ala)
Ландшафты сложных систем
слишком нерегулярны, чтобы быть
описанными на языке
традиционной (евклидовой)
геометрии. Язык древообразных
графов и "бассейнов минимумов"
здесь более удобен.
S.V.Krivov, S. F.Chekmarev, M., Karplus. J. Struc. Chem. 42(6), 877 (2001).
энергетический ландшафт гексапептида (6-Ala)
Часто (хотя и не всегда) структура
"бассейнов" наводит на мысль об иерархии и
самоподобии.
Энергетические ландшафт полипептида (-hairpin, 16 аминокислотных остатков, Gly-GluTrp-Thr-Tyr-Asp-Asp-Ala-Thr-Lys-Thr-Phe-Thr-Val-Thr-Gl)
Энергетический ландшафт
достаточно больших
молекулярных структур
содержит множество
разномасштабных элементов от
индивидуальных локальных
минимумов до разнообразных
"притягивающих бассейнов".
S.V.Krivov, M. Karplus. Proc. Nat. Acad. Sci. USA. 101(41) 14766 (2004)
многомасштабное приближение
basin-to-basin-kinetics и ультраметрика
В макромолекулярных системах
индивидуальные состояния обычно
сгруппированы в "бассейны", и наиболее
интересная кинетика включает переходы
бассейна в бассейн.
Если равновесие внутри бассейна
достигается существенно быстрее
характерного времени выхода из бассейна,
то поведение системы, в главном, будет
определяться переходами между бассейна
(basin-to-basin kinetics).
В приближении basin-to-basin kinetics,
константы переходов зависят от масштабов
бассейнов и разделяющих барьеров.
1
2
3
В приближении basin-to-basin-kinetics характерные времена
переходов между индивидуальными состояниями
подчиняются сильному неравенству треугольника, т.е. это
приближение делает пространство состояний
ультраметрическим.
basin-to-basin kinetics как ультраметрический случайный процесс
w
3
Пространство состояний
представляет граница дерева.
Само дерево представляет
(ультраметрические) расстояния
между состояниями.
Оно же представляет бассейны
состояний и иерархию их
вложений.
Узлы ветвлений можно
понимать как "точки
перевала" на барьерах,
разделяющих состояния.
w
w
2
1
w3
w2
w1
w1>w2>w3… константы
скоростей
переходов
ультраметрическая диффузия
df i (t )
  w(i | j ) f j (t )   w( j | i) f i (t )
dt
j i
j i
р-адическое уравнение ультраметрической диффузии
df ( x, t )
  w(| x  y | p ) f ( y, t )  f ( x, t )d p y
dt
B Q p
матрица переходов имеет характерный блочноиерархический вид матрицы Паризи
континуальный предел
w(i | j )  w(| x  y | p )  w( p  )  w .
параметризация констант переходов рациональными
числами и введение их зависимости от ультраметрического
расстояния.
i  1 p
1
N
a p
i
i 1
N
i
 p ai p i  x
i 1
Для регулярного дерева бассейнов
матрицы переходов становится просто
функций ультраметрического
расстояния. Она и задает
энергетический ландшафт системы
приложения: флуктуационно-динамическая подвижность белка от 300 K до 4 K
описывается одним и тем же р-адическим уравнением.
кинетика связывания
СО миоглобином
спектральная
диффузия в белках
Эксперимент обнаружил необычную
флуктуационно динамическую подвижность
белковых молекул.
Теория показала, что подвижность белковых
молекул подобна ультраметрической
диффузии и остается такой от 300 К до 4 К !
В. А. Аветисов и др. Труды Математического ин-та им. В. А. Стеклова, 2014, 285, 3.
ультраметрические модели позволяют по-новому взглянуть на белки
белковых молекулы – это структуры, энергетические
ландшафты которых обладают свойством
иерархического самоподобия.
этим белковая глобула отличаются от обычной полимерной глобулы.
Может ли полимерная цепь, уложенная
иерархическим образом в глобуляроподобную структуру, быть "молекулярной
машиной".
Моделирование показывает, что да, так
вполне может быть.
еще один пример: складчатые глобулы и упаковка генома
genome-wide chromosome conformation capture method
обычная глобула
складчатая
(фрактальная)
глобула
В "среднем", геном имеет структуру
фрактальной глобулы.
усредненная вероятность контакта P(s)
падает с расстоянием вдоль цепи как P(s) ~s-1
E. Lieberman-Aiden, et al., Science, 2009, 326, 289.
Yu. Grosberg, S. K. Nechaev and E. I. Shakhnovich, J.
Phys. (France), 1988, 49, 2095.
складчатая глобула
Yu. Grosberg, S. K. Nechaev and E. I. Shakhnovich, J. Phys. (France), 1988, 49, 2095.
иерархия складок в складчатой глобуле
=1
=2
ультраметрическое описание
складчатой конформации:
=3
O
A
=3
g*
=2
0
01
00
A
(a)
складки в складках
000
001
010
=1
011
100
•
"состояние" звена задается набором
складок (путь на дереве);
•
пространство состояний звена
становится ультраметрическим
(граница дерева)
•
складчатая конформация описывается
траекторий ультраметрического
случайного блуждания (блуждание на
границе дерева)
1
10
101
11
A
110
(b)
дерево складок
111
df ( x, t )
  w(| x  y | p ) f ( y, t )  f ( x, t )d p y
dt
B Q p
Ультраметрическая упаковка генома
L. I. Nazarov et al. Soft Matter. DOI: 10.1039/c4sm02519a
складчатость структуры
Pijcrump ~ V 1 ( (i, j )) ~ p  ( i , j )
вероятность контакта обратно
пропорциональна объему складки
wij  e
 Eij
Pijcrump  ()
гетерополимерность
  1 (A - A, B - B)
Eij  
  u (A - B)
гомоконтакт энергетически предпочтителен
вероятность контакта, усредненная
 E
N 1
e ij Pijcrump (m)
W (m)
по всем укладкам случайной
Pij 
  Eij crump
последовательности на дереве
Z
e Pij (m)  1  Pijcrump (m)
m 0
складок



похоже, что ультраметрика присуща не только белкам, но и ДНК.
реальные матрицы контактов
модельные матрицы контактов
L. I. Nazarov et al. Soft Matter. DOI: 10.1039/c4sm02519a
заключительное замечание
Ультраметрика столь же естественна, как и обычная метрика.
Она сильно все упрощает когда есть многомасштабность,
дискретность и самоподобие. Не удивительно, что природа
этим пользуется. Особенно там, где функциональность
сопряжена с структурной сложностью.
Надо еще иметь в виду, что наблюдаемые всегда
вещественные, а ультраметрическое описание нет. Поэтому в
ультраметрических моделях наблюдаемую нужно определять
явно . В сложных системах наибольший интерес представляет
описание нелокального поведения, но наблюдаемая чаще всего
остается локальной. В таких случаях, эксперимент может
отражать статистикеу редких событий, генерируемых
нелокальным поведением системы. Например, статистику
первых возвращений ультраметрического случайного
блуждания.
спасибо
за
внимание
Download