Введение в кристаллографию макромолекул Лекция 3

advertisement
Введение в кристаллографию
макромолекул
Лекция 3
Владимир Юрьевич ЛУНИН
Институт Математических Проблем Биологии РАН
Пущино
http://www.impb.ru/lmc
Вычисление коэффициентов ряда
Фурье
Любая функция на отрезке [0,1] может быть разложена,
при этом единственным образом, в ряд Фурье.

  x   A0  2 Ah cos 2  hx   Bh sin 2 h x 
h 1
1
Ah    x cos2 hx dx
0
1
Bh    x sin 2 hx dx
0
Ah cos 2  hx   Bh sin 2 h x   Fh cos2 hx    h 
Ah  Fh cos 
Fh  Ah2  Bh2
B
tg  h  h
Ah
Bh  Fh sin 
hmax
 x   F0  2 Fh cos2  hx    h 
h 1
Fh , h -
модуль и фаза коэффициентов
Фурье, отвечающих частоте h
Ряды Фурье для функций нескольких переменных
 x, y, z 
0  x, y, z  1
 x, y, z   A000  2Ahkl cos 2  hx  ky  lz   Bhkl sin 2 h x  ky  lz 
hkl
 x, y, z   F000  2 Fhkl cos2  hx  ky  lz    hkl 
hkl
Ahkl     x, y , z  cos2 hx  ky  lz dxdydz
V
Bhkl     x, y , z sin 2 hx  ky  lz dxdydz
V
Fhkl  A  B
2
hkl
2
hkl
tg  hkl
Bhkl

Ahkl
r  xa  yb  zc
Рентгеновский эксперимент с
монокристаллом позволяет
измерить интенсивность
волн, рассеянных в
направлениях,
определяемых условиями
 σ  σ0 
 σ  σ0 
, a   h, 
, b  k,

 

 

 σ  σ0 
,c  l
h,k,l - целые

 

Вклады в амплитуду и
фазу рассеянной
волны, зависят от
Bhkl
распределения
2
2
tg  hkl 
Fhkl  Ahkl  Bhkl
электронной плотности
Ahkl
в элементарной ячейке
Ahkl     x, y , z  cos2 hx  ky  lz dxdydz
и могут быть
V
рассчитаны по
Bhkl     x, y , z sin 2 hx  ky  lz dxdydz
формулам
V
1. Рентгеновский дифракционный эксперимент с
эксперимент
с
монокристаллом
позволяет
измерить модули коэффициентов в разложении
функции распределения электронной плотности в
ряд Фурье.
 x, y, z   F000  2 Fhkl cos2  hx  ky  lz    hkl 
hkl
2. Знание значений модулей и фаз дает
возможность
рассчитать
"синтез
Фурье
электронной плотности"
~ x, y , z   F  2
F cos2  hx  ky  lz    
S
000

 
hkl S
hkl
hkl
3. Наличие модели структуры дает возможность
рассчитать гипотетические значения модулей и
фаз и сравнить модули с экспериментальными
значениями
Подходы к решению фазовой проблемы
SIR - Single Isomorphous Replacement
Однократное изоморфное замещение;
MIR - Multiple Isomorthous Replacement
Множественное изоморфное замещение;
AD -
Anomalous Dispersion
Аномальное рассеяние;
MAD - Multiwavelength Anomalous Diffraction
Многоволновое аномальное рассеяние;
MR - Molecular Replacement
Молекулярное замещение;
Direct Methods (ab initio methods)
"Прямые" методы.
Подходы к решению фазовой проблемы
SIR - Single Isomorphous Replacement
Однократное изоморфное замещение;
изоморфное производное
"нативный" белок
{FPH}
{FP}
{P}
• метод позволяет решать фазовую проблему;
• наличие каналов в кристаллах белка позволяет
получать производные;
• изоморфизм имеет место лишь приближенно;
• проблема определения мест присоединения
тяжелых меток;
• проблема создания тяжелых меток для больших
макромолекулярных комплексов
• фазы определяются неоднозначно; необходимо
несколько производных.
MIR - Multiple Isomorthous Replacement
Множественное изоморфное замещение;
AD -
Anomalous Dispersion
Аномальное рассеяние
Из кинематической теории рассеяния следует, что
F  s  F s
(закон Фриделя). При наличии аномально рассеивающих
атомов (а.р.а.) закон нарушается. Измерения F(-s) и F(s)
становятся независимыми. Их сравнение позволяет
решать фазовую проблему.
• метод позволяет решать фазовую проблему;
• в белках встречаются а.р.а.; можно
использовать производные с тяжелыми
атомами;
• проблема определения мест нахождения
аномально рассеивающих атомов;
• фазы определяются неоднозначно;
MAD - Multiwavelength Anomalous Diffraction
Многоволновое аномальное рассеяние;
В основе подхода лежит изменение интенсивности
аномального рассеяния при изменении длины волны.
• один из активно
используемых методов
решения фазовой
проблемы;
• возможность использования
селен-метиониновых
производных;
• проблема определения мест
нахождения аномально
рассеивающих атомов;
• не всегда получается.
Sd
Methionin
N
Ca
O
Se
Синтез Фурье электронной плотности для
белка альдоз-редуктазы. Разрешение 0.9Å.
Фазы определены методом MAD.
MR - Molecular Replacement
Молекулярное замещение;
Комбинированные синтезы Фурье
модель
структурные факторы
r1, r2 ,..., rM ,...rN
full
Fhklfull ,  hkl
r1, r2 ,..., rM
part
Fhklpart ,  hkl
Синтез Фурье
full
Fhklfull ,  hkl
part
Fhklpart ,  hkl
part
Fhklfull ,  hkl
r1, r2 ,..., rM
rM ,...rN
+
+
?
+
?
Комбинированные синтезы Фурье
модель
структурные факторы
r1, r2 ,..., rM ,...rN
full
Fhklfull ,  hkl
r1, r2 ,..., rM
part
Fhklpart ,  hkl
Синтез Фурье
full
Fhklfull ,  hkl
part
Fhklpart ,  hkl
part
Fhklfull ,  hkl
r1, r2 ,..., rM
+
+
+
rM ,...rN
+
1/2
Комбинированные синтезы Фурье
модель
структурные факторы
r1, r2 ,..., rM ,...rN
full
Fhklfull ,  hkl
r1, r2 ,..., rM
part
Fhklpart ,  hkl
u1,...uL
Синтез Фурье
full
Fhklfull ,  hkl
part
Fhklpart ,  hkl
part
Fhklfull ,  hkl
r1, r2 ,..., rM
+
+
+
rM ,...rN
u1,...uL
+
-
+
1/2
1/2
MR - Molecular Replacement
Молекулярное замещение;
План действий:
А. Найти в банке белок с известными координатами
(пробную модель), чья структура ожидается быть
похожей на структуру исследуемого белка.
Б. Разместить пробную модель в элементарной ячейке
так, чтобы получить максимальное соответствие этой
модели исследуемой структуре.
В. Рассчитать по оптимально размещенной пробной
модели значения фаз структурных факторов.
MR - Molecular Replacement
Молекулярное замещение;
?
пробная модель
В общем случае положение твердого тела определяется
шестью параметрами (a, b, g, tx, ty, tz).
углы вращения
вектор трансляции
MR - Molecular Replacement
Молекулярное замещение;
Оптимальное размещение пробной модели
Для каждого допустимого набора параметров
(a, b, g, tx, ty, tz) можно рассчитать соответствующие
calc
a , b ,g , tx , t y , tz 
значения модулей структурных факторов Fhkl
Хотим иметь наилучшее совпадение с экспериментально
obs
определенными модулями Fhkl
 F a , b , g , t , t , t   F 
calc
hkl
x
y
z
obs 2
hkl
 min
hkl
Задачу можно разделить на два этапа: поиск углов
вращения ("функция вращения") и поиск трансляции
("функция трансляции").
MR - Molecular Replacement
Молекулярное замещение;
С нахождением оптимальной ориентации и положения
пробной модели работа не кончается!
Надо откорректировать модель.
MR - Molecular Replacement
Молекулярное замещение;
• один из наиболее используемых методов решения
фазовой проблемы;
• чем больше белков исследовано, тем шире
возможности метода;
• необходимо наличие гомологичной пробной
модели;
• результат зависит от обоснованности гипотезы о
гомологии между пробной моделью и исследуемой
структурой.
MR - Molecular Replacement
Молекулярное замещение;
Где взять гомологичную пробную модель?
•
•
•
•
среди структур, определенных РСА;
среди структур определенных ЯМР;
электронная микроскопия;
теоретическое предсказание модели.
"Прямые" методы
Основаны на информации общего типа:
• атомность;
• неотрицательность функции распределения
электронной плотности;
• разделенность атомов в пространстве;
• связность областей высокой электронной
плотности;
• гистограммы синтезов Фурье.
Низкомолекулярные структуры рутинное использование;
Небольшие белки, высокое разрешение ряд успешных попыток;
Большие комплексы, среднее разрешение в процессе разработки, отдельные
успешные попытки.
Модель структуры
ATOM
30
N
SER
2
13.117
9.840
39.210 1.000 12.49
c
Z
b
X Y
абсолютные координаты
(X,Y,Z)
Ортогональная система координат,
единица измерения Å.
CRYST1
SCALE1
SCALE2
SCALE3
a
b
относительные координаты
(x,y,z):
r=xa + yb +zc
49.430
66.790
47.400 90.00
0.020231 0.000000 0.000848
0.000000 0.014972 0.000000
0.000000 0.000000 0.021116
S
a
g
92.40 90.00
0.000000
0.000000
0.000000
U
xfrac = S11X + S12Y + S13Z + U1
yfrac = S21X + S22Y + S23Z + U2
zfrac = S31X + S32Y + S33Z + U3
Температурный фактор
(temperature factor / Atomic Displacement Parameter /
ADP)
 (e/Å3)
30
25
20
B=0
15
10
5
r (Å)
0
-3
 4
 r    C j 
j 1
 Bj
5
3
-2
 4 2 r 2 
 2

 exp  



B
j



-1
0
1
2
3
Радиальное распределение электронной плотности
в атоме углерода при разных значениях
температурного фактора B.
 (e/Å3)
30
25
20
B=0
15
10
5
r (Å)
0
-3
3
-2
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
 j



5
-1
0
1
2
3
Радиальное распределение электронной плотности
в атоме углерода при разных значениях
температурного фактора B.
 (e/Å3)
30
25
20
B=0
B=2
15
10
5
r (Å)
0
-3
3
-2
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
 j



5
-1
0
1
2
3
Радиальное распределение электронной плотности
в атоме углерода при разных значениях
температурного фактора B.
 (e/Å3)
30
25
20
B=0
B=2
B=5
15
10
5
r (Å)
0
-3
3
-2
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
 j



5
-1
0
1
2
3
Радиальное распределение электронной плотности
в атоме углерода при разных значениях
температурного фактора B.
 (e/Å3)
30
25
20
B=0
B=2
B=5
B=10
15
10
5
r (Å)
0
-3
3
-2
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
 j



5
-1
0
1
2
3
Радиальное распределение электронной плотности
в атоме углерода при разных значениях
температурного фактора B.
 (e/Å3)
30
25
20
B=0
B=2
B=5
B=10
B=20
15
10
5
r (Å)
0
-3
3
-2
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
 j



5
-1
0
1
2
3
Радиальное распределение электронной плотности
в атоме углерода при разных значениях
температурного фактора B.
 (e/Å3)
30
25
B=0
B=2
B=5
B=10
B=20
B=50
20
15
10
5
r (Å)
0
-3
3
-2
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
 j



5
-1
0
1
2
3
Радиальное распределение электронной плотности
в атоме углерода при разных значениях
температурного фактора B.
 (e/Å3)
5
B=0
B=2
B=5
B=10
B=20
B=50
B=100
r (Å)
0
-3
3
-2
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
 j



5
-1
0
1
2
3
Радиальное распределение электронной плотности
в атоме углерода при разных значениях
температурного фактора B.
B  8 2 u 2
u - смещение атома
 (e/Å3)
5
B=0
B=2
B=5
B=10
B=20
B=50
B=100
r (Å)
0
-3
3
-2
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
 j



5
-1
0
1
2
3
Радиальное распределение электронной плотности
в атоме углерода при разных значениях
температурного фактора B.
B  8 2 u 2
u - смещение атома
B
u
2
0.16
5
0.25
10
0.36
20
0.50
50
0.80
100
1.13
B=0
B=2
B=5
B=10
B=20
B=50
B=100
2
r (Å)
0
-3
3
-2
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
 j



5
 (e/Å3)
5
-1
0
1
2
3
Радиальное распределение электронной плотности
в атоме углерода при разных значениях
температурного фактора B.
B  8 2 u 2
u - смещение атома
B
u
2
0.16
5
0.25
10
0.36
20
0.50
50
0.80
100
1.13
B=0
B=2
B=5
B=10
B=20
B=50
B=100
2
r (Å)
0
-3
3
-2
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
 j



5
 (e/Å3)
5
-1
0
1
2
3
Изотропный температурный фактор
3
 4 2 r 2 
 4  2

 exp  
 r    C j 

 Bj  B 
B

B
j 1
j




5

s2 
f s   f s exp  B 
4

ATOM
30
N
SER
2
13.117
9.840
39.210 1.000 12.49
Анизотропный температурный фактор
ATOM
ANISOU
30
30
N
N
SER
SER
2
2
13.117
9.840 39.210 1.000 12.49
1510
2105
1130
447
-393 -1019
Коэффициент заполнения / заселенность / occupancy
Идеальный кристалл - содержимое всех элементарных
ячеек идентично.
Коэффициент заполнения / заселенность / occupancy
"Реальный" кристалл - молекула "воды" присутствует
только в 73% элементарных ячеек.
Коэффициент заполнения / заселенность / occupancy
Для данных координат атома коэффициент заполнения
показывает какой процент элементарных ячеек
кристалла содержат атом в указанной позиции.
ATOM
6626
O
HOH
4951
21.882
X
15.425
Y
26.797 0.500
Z

s2 
f j s   T j f j s exp  B j 
4

T
8.74
B
Коэффициент заполнения / заселенность / occupancy
Альтернативные конформации
ATOM 5490 N ATRP 295
ATOM 5514 N BTRP 295
29.848 2.643 16.199 0.499 7.13
30.271 2.787 16.200 0.501 6.52
Уточнение параметров модели
x , y , z , B , T 
j
j
j
j
j
- параметры модели
calc
x j , y j , z j , B j , Tj  - рассчитанные по модели модули
Fhkl
структурных факторов
calc
Fhkl
- экспериментально определенные модули
структурных факторов
Хотим иметь
RX ray   F
calc
hkl

obs 2
hkl
F
 min
hkl
Получили задачу на минимизацию (нелинейный "метод
наименьших квадратов" / least squares / LSQ).
Стандартный фактор достоверности / R-factor
R
calc
obs
F

F
 hkl hkl
hkl
F
obs
hkl
100%
hkl
Типичная задача:
endonuclease Sm
Число неводородных атомов
Число независимых параметров
Число независимых ограничений (1.1Ǻ set)
3 694
36 940
108 000
Проблемы:
• много локальных максимумов; возможно только
локальное уточнение; радиус сходимости ~ 0.7Å;
• модель "рассыпается".
Стереохимические ограничения
1
j
5
1.46Å
1.24Å
1.37Å
2
x , y , z , B , T 
3
1.02Å
1.52Å
4
j
j
j
- параметры модели
j
d ijcalc - расстояние между i-ым и j-ым
атомами в модели
dijexact - идеальное расстояние между
i-ым и j-ым атомами в модели
Хотим иметь
d
calc
12
 1.46  d
2
calc
23
 1.37  d
2
calc
34
 1.52  d
2
calc
35
 1.24  min
2
Стереохимические ограничения
1
j
5
1.46Å
3
1.02Å
j
j
j
- параметры модели
j
d ijcalc - расстояние между i-ым и j-ым
атомами в модели
1.24Å
1.37Å
2
x , y , z , B , T 
1.52Å
dijexact - идеальное расстояние между
i-ым и j-ым атомами в модели
4
Хотим иметь
d
calc
12
 1.46  d
2
calc
23
 1.37  d
2
Rdist   d
ij
calc
ij
calc
34
d
 1.52  d
2

exact 2
ij
 min
calc
35
 1.24  min
2
RX ray   F
calc
hkl

obs 2
hkl
F
 min
hkl
Rdist   d
calc
ij
d

exact 2
ij
 min
ij
Составной критерий
R  wX ray RX ray  wdistRdist
 wX ray
 F
calc
hkl
hkl

obs 2
hkl
F
 wdist
 d
ij
А как выбрать веса wX-ray, wdist ?
calc
ij
d

exact 2
ij
 min
Стереохимические ограничения
x , y , z , B , T 
j
5
1
j
j
j
- параметры модели
calc
- угол между i,j,k -ыми атомами
aijk
122. 123.5
2
j
в модели
3 120.5
exact
- идеальный угол между i,j,k aijk
ыми атомами в модели
4
Хотим иметь
a
calc
123
 122.  a
2
calc
235
 123.5  a
2
calc
534
 120.5  min
calc
exact
  min
Rangle   aijk
 aijk
2
ijk
R  wX ray RX  ray  wdistRdist  wangleRangle
2
Двугранные углы
Плоские группы
Хиральность
R-free
рабочие
уточнение модели
все рефлексы
только контроль
контрольные
R-free
Вода, водороды.
Обычное уточнение
Частичная модель
r 
M
j j 1
"Потерянные" атомы
uk kNM 1
calc, part
obs
r jtrue  Fhklcalc,lost utrue


Fhklfull,true  Fhkl

F
k
hkl
Fcalc, part
Fcalc,lost
F obs
Подгонка Fcalc,part к Fobs может сдвигать
координаты атомов с их правильных значений.
raw (partial)
model {rj}
Fhobs
Максимизация
правдоподобия
Fhpart({rj})
randomly
added
‘solvent’
atoms {uk}
Likelihood-based
refinement
Fhsol({uj})
Fhcalc({rj}+{uk})=
|F hpart({rj})+Fhsol({uk})|
calculated
magnitudes
for ‘mixed’
(real and
imaginary
atoms)
model
L({rj})=
Probability {Fhcalc({rj}+{uk})=Fhobs for all h}
maximum
T.Terwilliger
Pyrobaculum aerophilum
A pilot project in structural genomics
A test case to find the bottlenecks: summary of results from all
laboratories in the project
Step
Number of genes
Cloned
Expressed in E. coli
Purified
Crystallized
X-ray structures
NMR structures
274
168
43
24
10
1
?
Next: how to increase the success rate?
X-ray structure analysis
Intensities Is of
diffracted beams
crystal
registration
X-ray source
X-ray
experiment
h
0
0
0
0
0
0
k l
0 6
0 8
0 20
1 6
1 7
1 8
F
46.09
212.95
98.75
188.33
14.88
226.02
σ
2.74
5.00
3.15
5.06
8.00
7.9
Kinematic theory
of diffraction
X-ray structure analysis
The solving of
the structure
h
0
0
0
0
0
0
k l
0 6
0 8
0 20
1 6
1 7
1 8
F
46.09
212.95
98.75
188.33
14.88
226.02
σ
2.74
5.00
3.15
5.06
8.00
7.9
Wk={r: S(r) > k}
The phase problem
refined model
preliminary model
Protein
Data
ATOM
ATOM
Bank
ATOM
ATOM
ATOM
ATOM
6
7
8
9
10
11
CA
C
O
CB
OG1
CG2
MET
MET
MET
THR
THR
THR
A
A
A
A
A
A
1
1
1
2
2
2
0
0
0
0
0
0
X
Y
1.530
1.452
1.808
-0.430
-1.549
-0.265
3.431
4.960
5.574
7.045
7.435
7.733
Z
T
5.646
5.500
4.503
7.578
6.701
8.906
1.00
1.00
1.00
1.00
1.00
1.00
B
9.39
7.10
10.54
23.54
27.09
21.71
1. Дж.Гласкер, К.Трублад. Анализ кристаллической структуры. "Мир", Москва,
1974
2. М.А.Порай-Кошиц. Основы структурного анализа химических соединений.
Москва, "Высшая школа", 1989
3. Т.Бландел, Л.Джонсон. Кристаллография белка. "Мир", Москва, 1979
4. Ч.Кантор, П.Шиммел. Биофизическая химия, том 2. Москва, "Мир", 1984
5. International Tables for Crystallography, vol. F. Crystallography of biological
macromolecules. by Kluwer Academic Publishers, Dordrecht/Boston/London, 2001
X-RAY CRYSTALLOGRAPHY
From : “Nobel Prizes for X-Ray science”. Published by the Advanced Photon Source at Argonne National Laboratory on
the occasion of the Centennial Meeting of the American Physical Society. «A Century of Physics», March 20-26, 1999
Download