Составление паттерна по множественному

advertisement
http://kr.expasy.org/prosite/
*
20
*
SODF_ECOLI 1 : IAASFGSFADFKAQFTDAAIKNFGSGWTWL : 30
SODF_PHOLE 1 : IEKAFGSFAEFKAKFTDSAINNFGSSWTWL : 30
SODF_COXBU 1 : IDKTFGSLEKFKALFTDSANNHFGSGWAWL : 30
SODF_PLEBO 1 : IDAAFGSLDKFKEEFSNAAATQFGSGWAWL : 30
SODF_LEGPH 1 : INKSFGSFAAFKEQFSQTAATTFGSGWAWL : 30
SODF_BABBO 1 : IEEKFGSFSAFKTDFSNLLAGHFGSGWGWL : 30
SODF_PSEAE 1 : INAAFGSFDKFKEEFTKTSVGTFGSGWGWL : 30
SODF_PSEPU 1 : INAAFGSFDKFKEEFTKTSVGTFGSGWGWL : 30
SODF_BORPE 1 : IKAKWGSVDAFKEAFNKSAAGNFGSGWTWL : 30
SODF_CAMJE 1 : LEKEFGSLENFKAEFIKGATGVFGSGWFWL : 30
i
fGS
FK F
FGSgW WL
[IL]-X-[AKE]-X-[FW]-G-S-[FLV]-[AEDS]-X-F-K-[AET]-X-F-[TSNI]-[DNQK]-X[ALS]-X-[KNTG]-X-F-G-S-[GS]-W-[TAGF]-W-L
Мотив, удовлетворяющий паттерну, был найден в 14 последовательностях (в том числе были
найдены все последовательности из моего выравнивания). Все найденные белки являлись
ортологами моего белка, только из разных организмов.
Затем был проделан эксперимент: все квадратные скобки, содержащие 4 остатка, были заменены
на X (произвольный остаток). В результате были найдены все те же последовательности (Feзависимых супероксид дисмутаз), а также ещё 9 Mn-зависимых супероксид дисмутаз. Это говорит о
том, что:
1) Выборка ортологов в приведенном выше выравнивании достаточно хорошая (она была бы
плохой, если при замене какой-либо из скобок на X обнаружились бы новые белки,
удовлетворяющие паттерну): при заметном ослаблении условий нашлись те же 14
последовательностей, что и прежде
2) Данный участок встречается не у всех последовательностей Fe-завмсимых супероксид
дисмутаз, но зато он есть у некоторых Mn-зависимых. Поэтому:
Всё-таки непонятно, почему найденные в самом начале 14 последовательностей по данному
участку более походят на белки из другого семейства, чем из своего собственного
Это свидетельствует о родстве данных 2 групп белков. Конечно, неодходимы дальнейшие
исследования, но, возможно, этот участок присутствовал у общего предка, затем в каждом из
семейств изменился, оставшись неизменным у данных 23 белков
Возможно, данный паттерн является лишь результатом конвергентного сходства (напр.,
связывает одно и то же вещество) и достаточно далёк от паттерна предковой последовательности
Затем был произведен ряд поисков с всё более мягкими паттернам и наконец по паттерну
F-G-S-X-W-X(1,10)-W-L
Но это увеличило кол-во найденных белков только до 96, причём среди найденных белков были
RPOA (Replicase polyprotein 1ab) и другие белки, далекие от SODF.
Известные сайты и мотивы в белке SODF_ECOLI
Идентификато Идентификато
р документа
р документа
PROSITE
с описанием
(AC)
мотива
Название мотива
Подпись Mn/Feзависимых
супероксид
дисмутаз
Тип
подписи
(паттерн,
профиль)
паттерн
Паттерн
(регулярное
выражение)
D-x-[WF]-E-H[STA]-[FY](2)
PS00088
PDOC00083
PS00017
PDOC00017
АТФ/ГТФсвязывающий
сайт мотив A (Pобразная петля)
PS00006
PDOC00006
PS00008
PDOC00006
PS00001
PDOC00001
Сайт
паттерн [ST]-x(2)-[DE]
фосфорилирован
ия Казеин киназы
II
Сайт
паттерн GN{EDRKHPFYW}
миристоилировани
-x(2)-[STAGCN]я
{P}
Сайт Nпаттерн N-{P}-[ST]-{P}
гликозилировани
я
Сайт
паттерн [ST]-x-[RK]
фосфорилирован
ия протеин
киназы C
PS00005
PDOC00005
паттерн [AG]-x(4)-G-K[ST]
Насколько подпись
специфична?
Сколько
мотивов
нашлось в
белке?
Специфична
1
Неспецифична
1
Неспецифична
3
Неспецифична
5
Неспецифична
1
Неспецифична
1
Download