С. Гарушянц

advertisement
Московский Государственный Университет им. М.В. Ломоносова
Факультет Биоинженерии и Биоинформатики
Компьютерный анализ регулона, отвечающего за биосинтез
триптофана, в геномах архей
Курсовая работа студентки 2-го курса
Гарушянц С.
Тьюторы: Равчеев Д.А., Герасимова А.В.
Супервайзер: д.б.н. проф. Гельфанд М.С.
Москва, 2004
Введение
Археи представляют собой третью ветвь органического мира, отличную от эукариот и
эубактерий. Расхождение архей и эукариот произошло, по всей видимости, уже после
отделения эубактерий. Такие представления о возникновении данной группы связаны с тем, что
по общему строению клетки, центральному метаболизму и строению транспортных систем они
ближе к прокариотам, тогда как транскрипция и трансляция построены по эукариотическому
типу. Так, строение РНК-полимеразы скорее напоминает эукариотическое, и, кроме того, для
архебактерий показан процессинг мРНК, ранее известный только для эукариотических
организмов. Некоторые особенности есть и в строении рибосом: по составу входящих в них
рРНК и белков, они имеют типично бактериальное строение, но по форме скорее напоминают
эукариотические (Bell and Jackson, 1998). Несмотря на то, что археи представляют собой
уникальный источник биологического разнообразия, данная группа является намного менее
изученной, чем бактерии и эукариоты. Это связано как с недавним ее открытием, так и с
различными трудностями, возникающими при экспериментальном изучении архебактерий. К
настоящему времени подробно изучены лишь механизмы метаногенеза, тогда как общий
метаболизм практически не исследован.
Исследования
архей
биоинформатическими
методами
также
ограничены
лишь
несколькими работами, например, предсказанием гена для шикимат-киназы, фермента,
задействованного в синтезе ароматических соединений (Daugherty et al., 2001). В другой работе
(Gelfand et al., 2000) был проведен анализ некоторых регуляторных систем архей методами
сравнительной геномики. Так, была изучена регуляция теплового шока, фиксации азота и
синтеза триптофана, пуриновых нуклеотидов. В связи с ростом числа полных геномных
последовательностей, было решено провести дальнейшее исследование синтеза триптофана в
различных архебактериях.
Регуляция синтеза триптофана ранее была подробно изучена у гамма-протеобактерий и в
грам-положительных бактериях (Panina et al., 2001; Panina et al.,2003).
В случае гамма-протеобактерий была показана регуляция данного метаболического пути на
нескольких уровнях. Регуляторная система включает два регулятора транскрипции, TyrR и
TrpR, аттенюационные механизмы и аллостерическую регуляцию по принципу обратной связи.
У грам-положительных бактерий наряду с регуляцией
транскрипции присутствует также
регуляция по типу аттенюации: за счет РНК-связывающего белка TRAP, а также за счет
специфической последовательности в лидерной области мРНК, так называемого Т-бокса.
1
Описанные статьи представляют интерес, поскольку путь синтеза триптофана (Рис. 1)
практически не отличается у бактерий и архей, и в нем участвуют гомологичные белки.
Как уже говорилось, предпринимались попытки изучения регуляции синтеза триптофана и в
архебактериях. Так, в геноме Methanobacter thermautotrophicus в регуляторных областях генов
синтеза триптофана были обнаружены довольно консервативные потенциальные сигналы
(Gelfand et al., 2000). Сигнал в данном случае представляет собой тандемный повтор, единицей
которого является палиндром длиной 6 нуклеотидов с консенсусом TGTACA. Расстояние
между палиндромными последовательностями в пределах одного сайта составляет от 3 до 5
нуклеотидов.
Сайты такого вида были найдены перед всеми оперонами, кодирующими синтез
триптофана из общего предшественника всех ароматических аминокислот – хоризмата (Рис.1).
К таковым относятся опероны MTH1476 и MTH1655-61. Сайты были обнаружены также в
регуляторных областях генов, ответственных за синтез общего предшественника всех
ароматических аминокислот – хоризмата, и взаимопревращения хоризмата и префената (см.
Табл.1).
Префенат
представляет
собой
аминокислот – тирозина и триптофана.
предшественник
двух
других
ароматических
Таким образом, данная регуляторная система
контролирует не только синтез триптофана, но и соотношение всех
трех ароматических
аминокислот.
Потенциальный сайт был также обнаружен перед геном MTH1654, образующим дивергон
с опероном MTH1655-61. Анализ аминокислотной последовательности продукта этого гена, а
также его ортологов из геномов Archaeoglobus fulgidus и Pyrococcus horikoshii показал, что
данный белок является фактором транскрипции. Расположение данного гена в одном локусе с
генами синтеза триптофана и присутствие перед ним регуляторного сайта говорит о том, что,
скорее всего, именно этот белок и является регулятором синтеза триптофана.
2
Рис. 1. Путь синтеза триптофана у архей. Около стрелок указаны тривиальные названия генов.
OH
OH
O
P
HO
OH
O
O
O
CH2
CH3
O
AroC
OH
PheA
CH2
O
O
TyrA
O
H3C
OH
OH
CH2
Õî ðèçì àò
H3C
CH2
TrpE, TrpG
HO
5-äåãèäðî ø èêèì î âàÿ êèñëî òà
(3-äåãèäðî ø èêèì àò)
O
NH2
Àí òðàí èëî âàÿ êèñëî òà
TrpD
OH
HO
O
HO
P
NH
O
O
O
OH
OH
Àì èí î ãëèêî çèä
O
TrpF
OH
OH
O
NH
O
O
P
OH
O
OH
-
1-(2-êàðáî êñèô åí èëàì èí î )-1'-äèî êñè-D-ðèáóëî çî -5'-ô î ñô àò
H
N
TrpC
O
OH
O
P
OH
-
O
OH
Èí äî ë-3-ãëèöåðî ô î ñô àò
TrpB-1; TrpB-2; TrpA
N
H
Èí äî ë
TrpB-1; TrpB-2; TrpA
O
OH
NH2
NH
L-òðèï òî ô àí
3
OH
Ï ðåô åí àò
Табл. 1. Названия генов и функции белков, входящих в регулон синтеза триптофана у
Methanobacter thermautotrophicus
Функция
Название
Тривиальное
соответствующего гена
название гена
Предполагаемый репрессор синтеза триптофана
MTH1654
Хоризмат синтаза
MTH748
aroC
Хоризмат мутаза, субъединица А
MTH804
pheA
Триптофан синтаза, субъединица бета гомолог
MTH1476
trpB-1
Хоризмат мутаза, субъединица А
MTH1640
tyrA
Антанилат синтаза компонент I
MTH1655
trpE
Антанилат синтаза, компонент II
MTH1656
trpG
Индол-3-глицерол фосфат синтаза
MTH1657
trpC
5’-фосфорибозил антанилат изомераза
MTH1658
trpF
Триптофан синтаза, бета субъединица
MTH1659
trpB-2
Триптофан синтаза, альфа субъединица
MTH1660
trpA
Антанилат фосфорибозилтрансфераза
MTH1661
trpD
Цели и задачи
Как уже упоминалось ранее, целью данной работы было изучение регуляции синтеза
триптофана в различных группах архебактерий. Данная задача интересна с точки зрения
молекулярной эволюции, поскольку имеется возможность проследить изменения, как в составе
метаболического пути, так и в строении регуляторных систем.
Для этого нами были поставлены следующие задачи: поиск ортологов регуляторного
белка, поиск ортологов белков-ферментов метаболического пути, выявление неортологичных
замен, поиск новых регуляторных сигналов, изучение структуры регулона.
4
Материалы и методы
Нами было исследовано 12 геномов архей, принадлежащих к различным группам:
Methanobacter thermautotrophicus delta H (Smith et al., 1997), Methanosarcina acetivorans C2A
(Galagan et al., 2002), Methanosarcina mazei (Deppenmeier et al., 2002), Pyrococcus abyssi GE5
(Cohen et al., 2003), Pyrococcus furiosus DSM 3638 (Maeder et al., 2002), Pyrococcus horikoshii
OT3 (Kawarabayasi et al., 1998),
Archaeoglobus fulgidus DSM 4304 (Klenk et al., 1997),
Halobacterium salinarum NRC-1 (Ng et al., 2000), Thermoplasma acidophilum DSM 1728 (Ruepp et
al., 2000) и Thermoplasma volcanium GSS1 (Kawashima et al., 2000), а также неполные геномы
Methanosarcina barkeri str. fusaro, Methanococcoides burtonii DSM 6242 и Ferroplasma
acidarmanus. Все последовательности геномов были взяты из базы данных GenBank
(http://www.ncbi.nlm.nih.gov/)
Для поиска интересующих нас регуляторных сайтов использовался метод «проверки
соответствия» (“consistency check”). Суть данного метода заключается в том, что исследуется
сохранение сайта перед ортологичными генами в родственных геномах. Если сайт сохраняется,
то данные гены с большой вероятностью находятся под регуляцией. Если же сайт не
сохраняется,
то,
скорее
всего,
данный
сигнал
является
ложным
(так
называемое
«перепредсказание»). Благодаря данному методу можно предсказывать регуляцию, даже имея
недостаточно специфичное распознающее правило (Mironov et al., 2000).
Для поиска потенциальных сайтов в геномных последовательностях нами использовался
метод позиционных весовых матриц (Gelfand et al., 2000).
В этом методе, на основании набора известных сайтов, используя множественное
выравнивание, рассчитывается вес каждого нуклеотида в каждой позиции по формуле:
W(b,k)= log[N(b,k)+0,5]-0,25 i log[N(i,k)+0,5],
где: i - все нуклеотиды, N(b,k) – число появлений нуклеотида b в позиции k.
Вес сайта представляет в данном случае сумму весов всех его позиций.
У данного метода есть несколько преимуществ. Во-первых, учитывается разная
значимость различных позиций сайта, что является следствием специфичности ДНК-белковых
взаимодействий. Во-вторых, учитывается возможность замен одного нуклеотида на другой в
определенной позиции и вероятность таких замен.
Для поиска ортологичных генов и потенциальных регуляторных сайтов в геномных
последовательностях был использован пакет программ GenomeExplorer (Миронов и др., 2000).
5
Для построения матриц для поиска сайтов использовалась программа SignalX (Миронов и
др., 2000).
Для построения множественных выравниваний и филогенетических деревьев была
использована программа ClustalX (Thomson et al., 1997).
Для визуализации деревьев использовалась
программа GeneMaster (Миронов А. А.,
неопубликованное).
Для поиска гомологов известных белков в других геномах была использована программа
BLAST (Altschul et al., 1997) (http://www.ncbi.nlm.nih.gov/BLAST/).
Для построения диаграмм лого регуляторного сайта использовалась программа WebLogo
(Crooks, 2004).
Для поиска в белковых последовательностях мотивов «спираль-поворот-спираль» (helixturn-helix, HTH) использовалась программа “Helix-Turn-Helix Motif Prediction” (Dodd and Egan,
1990).
Результаты и обсуждение
Поиск ортологов белка-регулятора в геномах архей
В качестве первого этапа поиска ортологов был произведен поиск гомологов белкарегулятора из M. thermoautotrophicus в белковой базе данных при помощи программы BLAST.
После этого уже среди геномов архей, имеющих гомолога, был проведен поиск ортологов
данного регулятора, в результате был выбран ряд геномов (см. материалы и методы). Поиск
ортологов белка-регулятора является необходимым условием изучения регуляции, поскольку
при его отсутствии невозможно предположить, что искомые сайты в исследуемых геномах
будут похожи на уже известные сайты в геноме M. thermoautotrophicus. Отсутствие ортолога
белка-регулятора говорит о том, что-либо используется другой механизм регуляции, либо
отсутствует данный метаболический путь. Отдельного внимания заслуживает ситуация с
геномом M.barkeri. В настоящее время нам доступна лишь неполная последовательность генома
этого организма, в которой не удалось найти ортолога белка-регулятора. Однако в белковой
базе данных с помощью программы BLAST был найден гомолог регулятора из Methanobacter
thermoautotrophicus. Поиск гомологов в геноме M. thermoautotrophicus показал, что лучшим
гомологом для найденного белка из M. barkeri является именно регулятор MTH1654. Таким
образом, эти два белка являются ортологами. Кроме того, нами были найдены ортологи
MTH1654 в геномах двух других организмов из рода Methanosarcina: M. acetivorans и M. mazei.
6
На основании этого мы исследовали регуляцию синтеза триптофана также и в геноме M.
barkeri.
Выравнивание аминокислотных последовательностей белков-регуляторов показано на
рисунке 2. Ранее были высказаны предположения о том, что данный белок содержат HTHдомен (Gelfand, 2000). Их картирование при помощи программы поиска HTH-доменов (Dodd
and Egan, 1990) показало, что таковые имеются во всех белках. Несмотря на то, что данные
участки выравниваются между собой, степень их сходства крайне низка, в результате чего
возможны изменения в структуре регуляторного сигнал. Выравнивание показало также, что у
белков-регуляторов из M. burtonii, P. furiosus, M. thermoautotrophicus и
H. salinarum
неправильно определены старты генов (Рис. 2).
На основе множественного выравнивания было построено филогенетическое дерево
белков-регуляторов (Рис.3). Как видно из рисунка 3, степень сходства регуляторов низка, а,
следовательно, и сигнал во всех изучаемых видах мог измениться в ходе эволюции. Поэтому
для поиска сигнала разумно выделить на дереве группы, в которых регуляторы имеют
достаточно высокий уровень сходства. Можно рассчитывать, что внутри таких групп сигнал
скорее всего будет сохраняться. Поиск сигнала производился отдельно внутри каждой группы.
Были выделены следующие группы:
-
группа, соответствующая роду Pyrococcus;
-
группа, включающая в себя рода Methanosarcina и Methanococcoides;
-
группа, объединяющая рода Thermoplasma и Ferroplasma.
Рис. 2. Выравнивание аминокислотных последовательностей белков-регуляторов с
картированными на нем HTH-доменами (показаны белыми буквами на черным фоне).
Обозначения: PAB - Pyrococcus abyssi, PH - Pyrococcus horikoshii, PF - Pyrococcus furiosus, MA Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC
- Ferroplasma acidarmanus, TA - Thermoplasma acidophilum, TVN - Thermoplasma volcanium,
MTH - Methanobacter thermoautotrophicus.
PAB
PH
PF
MTH
MA
MM
MBA
MCB
Hsp
TA
TVN
FAC
AF
-------------------------------------MWGRIEHYFDEYPVRKLIAKTLL
-------------------------------------MWGRIEHYFDEYPVRKLIAKTLL
----------------------------MLNFVGGRLMWGKIEHYFDEYPVRKLIAKTLL
-----------------------------MYINVVKCMWKQIKHRFEGYPSRMYVARKII
-------------------------------------MWQTLLSKFEKYPAQAKVLKLLF
-------------------------------------MWQTLLKKFEKYPAQAKVLKLLF
-------------------------------------MWQTLLKKFEKYPAQAKVLKLLF
MSNYICMFLCFNGSFIKLILYGYKPLYPYNFRPKVIIMWSTVLNKFEKHPAQQKVIKLLF
------------------------------------------MQKFEGSPGQQAVIRLLL
-------------------------------------MWSYIYDKFSRSPSQLRIVKKMF
-------------------------------------MWSYIYDKFSRSPSQLKIVKKMI
-------------------------------------MWDYINKVFDNYPAEKKVVQKML
-------------------------------------MWKKVAEKFEKYPSQIAVAREFL
7
Рис. 2. Продолжение
PAB
PH
PF
MTH
MA
MM
MBA
MCB
Hsp
TA
TVN
FAC
AF
RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELREIYMNLE
RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELRDIYMNLE
RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELRDIYMNLE
DLGFRIDR----NGKIYCDDVEISDVALARAVGVDRRTVRATANTILEDEKLRGIFENMM
ERGFQVNE----EGKVTSGSIEIAHTQLAKEVGVDRRVVDATTKTIISDELLSTIFKNVH
ERGFQVNE----EGKVTSGSIEIAHTQLAKEVGVDRRVVDATTKTIISDELLSTIFKNVH
ERGFQVNE----EGKVTSGSIEIAHTQLAKEAGVDRRVVDATTKTIISDELLSRIFRNVH
ERGFQVNG----DGKVTSGSIEIPHTQLAKEAGVDRRVVDATTETILSDELLKNIFQNVT
ERGFSVND----GGRVVSGGIEIPYTQVAQEAGVDRRVVDSTTEAILDDGELTRIFQNIS
SIGIRVTKLYD-EPVLMCGDIEIRPNTLAKATGTDRRSVMSVIERIINDETLYPVFSQLE
STGIKVTKSFDNEPVLMCGDIEIRPNTLAKAAETDRRSVISVINRIANDDKLYPFFSQLE
KIGISVKILYD-EPKLFCESIEIKPNSIARAFHVDRRVIVNMIQKIINDPELFDFFSNLE
RLGISVR-----NGKAYCGDIELVPTKIAEAIGVDRKVVLAAIQNIESDEELSKVFSALK
*: :
. :*:
:*.
.**: :
* .
* .: :
PAB
PH
PF
MTH
MA
MM
MBA
MCB
Hsp
TA
TVN
FAC
AF
PT-VHMKYVGKHVGYGVIEIEPEPRA-IGILAKVAQKIADRGINIVQAIAEDPELYPEAT
PT-VHMKYVGRHVGYGVIEIEPEPRA-IGILARVAQKIADRGINIVQAIAEDPELYPEAT
PT-VHMKYVGKHVGYGVIEIEPEPRA-IGILAKIAQKIAEREINIVQVVAEDPELYPEAI
PAGALLRDAAGELDFGVVEIEADARN-PGILAAAARLIADKGISIRQAHAGDPELDETPR
SI-PFLRDVAPALGLGVIIIIPEDAAHIGILAEVAGLISKHNVSIRQAVSDDPYLTDNPR
SI-PFLRDVAPSLGLGVIIIIPEDAAHVGILAEVAGLISKHNVSIRQAVSDDPYLTDNPM
SI-PFLRDVAPSLGLGVIIIIPEDAADVGILAEVASLISGSKVSIRQAVSDDPYLTDNPR
SI-PFLRDVAPALGLGVIIITPDDAANVGILFSVSQVISNHNISIRQAVSDDPYFNSKAM
QI-PSLMDLAPVLDLHVVTVAVQDADEPGIVAAVTGLLADHGIPIRQTISEDPEFTDEPR
PV-ANLWKVSSKLGYGVIEILPESASKPGIIAGVSSIIAKRGISIRQVIVDDPELVEDPK
PV-ANLWKASVKMGLGVIEIIPESANKPGIIAGISSIIAKHNISIRQVIVDDPEIVEDPK
PM-SNFENSGSKMGFGVIEIIPTDASMPGIIAGVMNVLAESGISVRQFIADDPDLVDNPR
PV-ANIAEVARILGFGVLEVYAEST-KVGIVAGVASALANAGISIRYILAEDPELSVESK
:
. :. *: :
**:
::
: :
** :
.
PAB
PH
PF
MTH
MA
MM
MBA
MCB
Hsp
TA
TVN
FAC
AF
LTIITEKPIPGDLINELSKLEGVKRISIY
LTIITEKPIPGDLINELSKLEGVKRISIY
LTIITEKPIPGDLINELSKLEGVKRISIY
LTIITETPIPGGLLKDFLKIDGVKRVSIY
LTIITDHKVPGDLVDDILNLPSVKGVSIY
LTIITDNKVPGDLVDEILKLPSVKGVSIY
LTIITDKKVPGELVDKILELPSVKGVSIY
LTIITDSKVPGDIVNEILQLPGVKGVSIY
LYVVTDEELPGAVFTALAEMSAVRSVELS
AVVVTEQKVPPDIIPELKSVEGVRAITIL
AVVVTDQKVPAELIPELRSVDGVKGITIL
AIIVTTNTITGDVLNGIKKARGVKAVMLLTVVTETKIPGAVVEEILRVEGVEKVLIS
::*
:. :. :
.*. : :
8
Рис. 3. Филогенетическое дерево для белков, ортологичных MTH1654 из M. thermautotrophicum.
Обозначения: MTH - Methanobacter thermoautotrophicus, PAB - Pyrococcus abyssi, PH Pyrococcus horikoshii, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA Thermoplasma acidophilum, TVN - Thermoplasma volcanium.
PH PF
PAB
8
0.2
0.2
7
FAC
TA
0.10
TVN
0.18
MTH
0.28
0.2
8
AF
0.11
0.29
0.
1
3
Hsp
MCB
MA
MBA MM
Поиск потенциальных членов триптофанового регулона в геномах архей
После того, как были выбраны геномы, содержащие ортолога белка-регулятора, в них
был произведен поиск генов, участвующих в синтезе триптофана. С этой целью был проведен
поиск ортологов для всех генов, входящих в триптофановый регулон в M. thermautotrophicus
(Таблица 2). Особенно стоит отметить то, что, несмотря на наличие регулятора у P. horikoshii,
метаболический путь у данного вида почти полностью отсутствует, что было показано ранее
(Xie et al., 2003).
Для некоторых генов в ряде геномов не удалось найти ортологов. При этом в составе
оперонов, содержащих гены синтеза триптофана, были найдены гены с неизвестной функцией.
Для продуктов этих генов был произведен поиск гомологов при помощи программы BLASTP.
9
Ряд неортологичных замен наблюдается для 5’-фосфорибозил антанилат изомеразы (trpF)
у таких организмов, как Pyrococcus abyssi и P.furiosus, Thermoplasma acidophilum и
Archaeglobus fulgidus. Для белков из Pyrococcus abyssi и P.furiosus уровень сходства с
ферментом TrpF из Lactobacillus casei, для которого данная функция была определена
экспериментально, составляет 30% и 32% соответственно (Natori, 1990). Для этих же видов был
показан высокий уровень сходства с TrpF из археи Thermococcus
kodakaraensis (уровень
сходства 60% и 58% соответственно) и белками из бактерий Clostridium acetobutylicum с
меньшим сходством (32%) для P. abyssi, и Listeria innocua для P.furiosus с уровнем сходства
35%. Для TrpF из Thermoplasma acidophilum было обнаружено сходство с белком из
Thermoplasma volcanium (48%) , белком из бактерии Lactobacillus casei, но с меньшим
сходством (35%). Для белка из A. fulgidus уровень сходства с соответствующим белком из
бактерии Lactobacillus casei составляет 31%, так же найдено сходство с белками из ряда архей,
например, уровень сходства с белком из Thermococcus kodakaraensis составляет 50%.
Для всех найденных TrpF из архей и TrpF из бактерии Lactobacillus casei было
построено филогенетическое дерево (Рис. 4). Как видно из рис. 4, все белки TrpF, несмотря на
низкий уровень сходства, принадлежат к одному семейству. Ветвь, соответствующая
бактериальному белку, выходит из одного общего корня со всеми белками из архей, в
результате чего исключается предположение о горизонтальном переносе от бактерий к археям.
Таким образом, наиболее вероятным представляется следующее предположение: все белки
TrpF архей представляют собой гомологи, далеко разошедшиеся в ходе эволюции. Однако, изза низкого уровня сходства, используемый алгоритм поиска ортологов не позволяет нам
идентифицировать все TrpF, как ортологичные.
Помимо этого наблюдается неортологичные замены альфа-субъединицы триптофан
синтазы (TrpA) у рода Thermoplasma. Так для T. acidophilum было найдено сходство с TrpA
10
Тривиальное
название гена
MTH
MCB
MM
MBA
MA
AF
MTH1654
068_0059
MM2375
MA1396
AF1020
aroC
MTH748
068_0108
MM1712
RMMA0840
8
aroC
AF0670
pheA
MTH804
trpB-1
MTH1476
068_0036
MM0337
-
tyrA
MTH1640
046_0008
MM1275
trpE
MTH1655
048_0022
MM2818
trpG
MTH1656
trpC
MTH1657
trpF
MTH1658
trpB-2
MTH1659
062_0019
MM2822
trpA
MTH1660
062_0020
MM2821
trpD
MTH1661
048_0025
MM2820
-
062_0018
-
-
MM2817
MM2823
MM2819
Hsp
VNG2296
C
-
aroC
VNG1244
C
trpB
AF1240
-
RMMA0739
7
MA4595
AF0227
-
trpE
AF1603
trpE1
RMMA0798
5
RMMA0871
0
RMMA0870
1
RMMA0870
0
RMMA0798
4
trpG
AF1602
trpG1
trpC
AF1604
trpC
trpF
AF1601* trpF
-
-
-
AF1600
AF1599
trpA
trpB
trpA
trpD
AF1604
trpD1
FAC
TA
166_009
5
Ta1106
157_004
0
Ta0824
158_003
6
Ta0669
158_003
1
158_003
0
158_002
9
158_003
2
-
TVN
PF
TVN0456
PAB
PAB243
5
TVN0729
aroC
PF1700
TVN0931
-
trpB-2
-
PF1572
PF1592
-
Ta0806
TVN1024
trpE
PF1709
Ta0807
TVN1023
PF1708
Ta0808
TVN1022
trpG
PAB204
3
trpF*
PF1707*
Ta0805* TVN1025
trpB-1
158_003
5
Ta0803* TVN1027* trpA
158_003
4
Ta0804 TVN1026 trpD
PF1711
PF1706
PF1705
PF1710
Табл. 2. Ортологи всех генов, входящих в триптофановый регулон в Methanobacter thermautotrophicus. Обозначения: PAB Pyrococcus abyssi, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina
barkeri, MCB - Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma
acidarmanus, Ta - Thermoplasma acidophilum, TVN - Thermoplasma volcanium, MTH - Methanobacter thermoautotrophicus.
Условные обозначения: “-“ ортологов не найдено; “*” - установлена неортологичная замена.
11
Sulfolobus tokodaii (27%), с бактериальной триптофан синтазой из Chlamydophila caviae (29%) и
даже с соответствующим белком из красной водоросли Porphyra purpurea (22%). Для T.
volcanium было найдено сходство с trpA архей (Sulfolobus solfataricus – 27%) и бактерий
Chlamydophila caviae (27%).
Для всех белков TrpA также было построено филогенетическое дерево (Рис. 5). В случае
с TrpA ситуация оказалась схожей с наблюдавшейся для белков TrpF. Однако, в
непосредственной близости от ветви, содержащей белки из T. acidophilum, T. volcanium и F.
acidarmanus, располагается ветвь, соответствующая Trp из кренархеот рода Sulfolobus.
Поэтому в данном случае мы не можем исключать возможность горизонтального переноса от
кренархеот к эуархеотам.
Рис. 4. Филогенетическое дерево белков TrpF из архей и бактерий. Обозначения: PAB Pyrococcus abyssi, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM Methanosarcina mazei, MBA - Methanosarcina barkeri, AF - Archaeoglobus fulgidus, Hsp Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA - Thermoplasma acidophilum,
TV - Thermoplasma volcanium, MTH - Methanobacter thermoautotrophicus. Бактерии: LC Lactobacillus casei.
TrpF_LC
TrpF_MM
0 .1 1
TrpF_MBA
TrpF_MA
0.
10
0.33
0.
0 .1
9
30
TrpF_Hsp
0.30
TrpF_TV
0 .2 4
0.
13
0.28
TrpF_TA
0 .2 5
TrpF_AF
0.
16
0 .4 0
0
3
.3
0.16
TrpF_FAC
TrpF_PAB
TrpF_PF
TrpF_MTH
12
Рис. 5. Филогенетическое дерево белков TrpA из архей, бактерий и эукариот. Обозначения:
Археи: PAB - Pyrococcus abyssi, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM
- Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA
- Thermoplasma acidophilum, TV - Thermoplasma volcanium, MTH - Methanobacter
thermoautotrophicus, STO – Sulfolobus tokodaii, SS – Sulfolobus sulfotarius. Бактерии: CCA –
Chlamydophila caviae. Эукариоты: PP – Porphyra purpurea.
TrpA_TV
TrpA_TA
TrpA_FAC
TrpA_CCA
3
8
0.11
0 .1
34
0.19
0.
0 .1
TrpA_SS
0 .2 2
0.24
0 .3
TrpA_STO
5
TrpA_PP
0 .3
4
0.32
TrpA_MBA
0.12
0.
17
TrpA_MA
TrpA_MM
0.
0.31
22
0 .1
3
3
0 .3 1
0 .1
TrpA_PF
TrpA_MCB
TrpA_PAB
TrpA_MTH
13
TrpA_Hsp
Доменные перестройки
Для синтеза триптофана из хоризмата необходимо 7 ферментативных активностей,
названных TrpEGDFCAB, и каждая из них осуществляется за счет своего отдельного белкового
домена. Для ряда бактерий и архей было показано, что для белков, участвующих в синтезе
триптофана, характерны доменные пересторойки (Xie, 2003). Так, например, у
бактерий
Corynebacterium glutamicum происходит слияние trpC и trpF в единый ген, у Coxiella burtenii слияние trpF и trpB. Достаточно частым является слияние trpG и trpD, например, такая
перестройка происходит у бактерий Thermotoga maritima и Campylobacter jejuni. Для части
цианобактерий, таких как Anabaena sp., Nostoc puncliforme, было показано слияние trpE и trpG
(рис. 6).
Рис. 6. Доменные перестройки для ферментов синтеза триптофана у некоторых видов бактерий
и архей. Данные о доменных перестройках у A. fulgidus получены в этой работе; остальные
примеры взяты из Xie et al. (2003)
Corynebacterium glutamicum
N
N
TrpC
TrpE
TrpF
C
C
N
TrpB
C
N
TrpG
C
N
TrpD
C
N
TrpD
C
Coxiella burtenii
N
TrpF
N
TrpG
TrpB
C
N
C
TrpE
C
N
TrpC
C
Thermotoga maritime, Campylobacter jejuni
N
TrpG
N
TrpE
TrpD
C N
C
TrpC
C
N
TrpB
Anabaena sp., Nostoc puncliforme
N
TrpE
TrpG
C
14
C
N
TrpF
C
Рис. 6 Продолжение
N
TrpC
C
N
TrpB
C
N
C
N
TrpF
C
N
TrpD
C
Archaeglobus fulgidus
N
TrpC
N
TrpF
TrpD
C
N
C
TrpB
TrpG
C
N
TrpE
C
Рис. 7. а) Выравнивание TrpCD A. fulgidus (AF1604) и TrpC M. thermoautotrophicus (MTH1657);
б) Выравнивание TrpCD A. fulgidus (AF1604) и TrpD M. thermoautotrophicus (MTH1661).
a)
Met|MTH1657
AF|AF1604
MLRDIIRSKKLEVKELMKKTPLSILRDDITVMDEPVSFPAAVGGGKVSLICEYKRASPSM
----------------------------MMDFGFVDSLKGASKRGKNAVIAEVKVRSPIH
: :.
*: .*
** ::*.* * **
Met|MTH1657
AF|AF1604
GRISE-RGLEEMMEVYQDLADAVSIVTDGKYFKGSLDLLSGATDYG-KPLLMKDFLVDEY
GDLLRGRRIEDILRAYEKAGAAAISYITAEQFSGNFETLKKIVGLTDLPVLRKDFIRGRK
* : . * :*:::..*:. . *.
.: *.*.:: *. ..
*:* ***: ..
Met|MTH1657
AF|AF1604
KIYQARASGASSVLLITGVFPDLEAG-IQKCRELSMEPLVECHTSLDIFRALEAGAEIIG
EVERTAEVEAAALLLIARHLKERTAEMVDFCFEHGIEPLVEVHHAEDLVYAENARAVLI:: ::
*:::***: : : * :: * * .:***** * : *:. * :* * :*
Met|MTH1657
AF|AF1604
VNNRDLETFEVDLERTHALAPLVP-DELILVSESGVRGPEDAEILAGYGADALLIGTAPM
-NNRDIDRMERDGGSIDVTAKIAEKIRAFKVSGSGIGSVEDLLFVLQY-VDAALIGTAFM
****:: :* *
.. * :.
. : ** **: . ** :: * .** ***** *
Met|MTH1657
AF|AF1604
SAQNPRELLEEIVDAVSQCRDRRRRYTGDEFFEQFA-----------------------MAENTEEFVQTVCGGEKMIEDVLRGLDFDKAYELAKTLPELDEIKIAAVLAALEAKGYGA
*:*..*::: : .. . .* *
*: :*
Met|MTH1657
AF|AF1604
-----------------------------------------------------------EVIAGFAKGVAEKSKIEIGKVMDTCGTGGDKTSSINVSTAVAIALSTVHPVAKHGNRAVS
Met|MTH1657
AF|AF1604
-----------------------------------------------------------SKSGSADVLEALGVRIEMDEERARKMIAETNFAFLFAPLYHKSFARVAAVRRNLGIRTIF
Met|MTH1657
AF|AF1604
-----------------------------------------------------------NVTGPLTNPARPEVQIVGVASEILLVEVAKAMSLLGRRAVVVYGSGMDEVNPNSSTDIAV
Met|MTH1657
AF|AF1604
-----------------------------------------------------------VNGGVERLKLEPEDFGIERCRVLPCSSSGESAERIRAVFSGKGLKEDRRLIAINFATALF
Met|MTH1657
AF|AF1604
------------------------------------ALGYEDLKENVEIFEEKVQSGELARKLEEIACKSTSM
15
Рис. 7б. Продолжение
AF|AF1604
Met|MTH1661
MMDFGFVDSLKGASKRGKNAVIAEVKVRSPIHGDLLRGRRIEDILRAYEKAGAAAISYIT
------------------------------------------------------------
AF|AF1604
Met|MTH1661
AEQFSGNFETLKKIVGLTDLPVLRKDFIRGRKEVERTAEVEAAALLLIARHLKERTAEMV
------------------------------------------------------------
AF|AF1604
Met|MTH1661
DFCFEHGIEPLVEVHHAEDLVYAENARAVLINNRDIDRMERDGGSIDVTAKIAEKIRAFK
------------------------------------------------------------
AF|AF1604
Met|MTH1661
VSGSGIGSVEDLLFVLQYVDAALIGTAFMMAENTEEFVQTVCGGEKMIEDVLRGLDFDKA
----------------------------------MKFRRMIS---EIMD--FRNLSEDEA
:* : :.
:::: :*.*. *:*
AF|AF1604
Met|MTH1661
YELAKTLP--ELDEIKIAAVLAALEAKGYGAEVIAGFAKGVAEKS-KIEIG---KVMDTC
YSLMEMIMAGELDDIKIAAILTALAMKGETVDEITGFARAMRDRSPRVRVSGSHEVVDSC
*.* : :
***:*****:*:** ** .: *:***:.: ::* ::.:.
:*:*:*
AF|AF1604
Met|MTH1661
GTGGDKTSSINVSTAVAIALSTVHP-VAKHGNRAVSSKSGSADVLEALGVRIEMDEERAR
GTGGDSFRSYNISTAAAMIAAAAGVRVAKHGNRAVTGSCGGADILEAAGVNIELDAAAAA
*****. * *:***.*: ::.
*********:...*.**:*** **.**:*
*
AF|AF1604
Met|MTH1661
KMIAETNFAFLFAPLYHKSFARVAAVRRNLGIRTIFNVTGPLTNPARPEVQIVGVASEIL
RSLSDVGISFMFAPLFHRATARVAAVRRSLGFKTVFNILGPLTSPAAAGIQLLGVFDPQL
: :::..::*:****:*:: ********.**::*:**: ****.** . :*::** . *
AF|AF1604
Met|MTH1661
LVEVAKAMSLLG-RRAVVVYG------SGMDEVNPNSSTDIAVVNGGVERLK-LEPEDFG
VGPVAEVLRNLGTRCAMVVHGFDANLNPALDEISTVGPTLVAFLEDDEIRIDRLMPPDFG
: **:.: ** * *:**:*
..:**:.. ..* :*.::.. *:. * * ***
AF|AF1604
Met|MTH1661
IER---CRVLPCSSSGESAERIRAVFSGKG---LKEDRRLIAINFATALFALG--YEDLK
VEVGELEHLRAGSTTAENLELFMDVLRGREDTPEQKSRLDIALANAGALIYLAGLADTLP
:*
:: . *::.*. * : *: *:
::.* **: * **: *.
: *
AF|AF1604
Met|MTH1661
ENVEIFEEKVQSGELARKLEEIACKSTSM-EGTETAKRTVKSGAALELLEEFVSYTRNLQS
*..* :..*:**
. ***:.. : .:
В данной работе нами было показано слияние trpC и trpD для археи A. fulgidus. Так во
всех остальных исследуемых организмах были обнаружены два отдельных гена trpC и trpD, а у
A. fulgidus был обнаружен один ген, включающих обе последовательности. Схематическое
изображение расположения доменов в данном ферменте представлено на рисунке 6. На рис. 7
приведены выравнивания белка TrpCD из A. fulgidus с белками TrpC и TrpD из M.
thermoautotrophicus.
16
Изменения в оперонной структуре
Помимо неортологичных замен и доменных перестроек, нами были обнаружены также
изменения в оперонной структуре. Обычно
гены, отвечающие за синтез триптофана из
хоризмата, расположены в одном опероне. В некоторых случаях, например у Halobacterium sp.
NRC-1, происходит распад этого оперона на два или более, например, у Halobacterium sp. NRC1. Помимо этого у M. acetivorans и M. mazei сохраняется один оперон, включающий в себя
гены синтеза триптофана, но последовательность генов в нем отличается от наблюдающейся у
M.thermoautotrophicus. Полная оперонная структура генов синтеза триптофана всех
исследовавшихся видов архей приведена на рисунке 8.
Рис. 8. Полная оперонная структура исследованных видов архей. Символом (*) обозначены
неортологичные замены. Оранжевыми квадратами обозначено наличие сайта в данной
регуляторной области.
Methanobacter thermoautotrophicus delta H
reg
trpE trpG
trpC
trpF
trpB-2
trpA
aroC
tyrA
pheA
Methanosarcina mazei
trpC
trpB
trpA
trpD
Methanosarcina acetivorans
trpC
trpB
trpA
trpD
trpF
trpE
trpG
trpF
trpE
trpG
trpF*
trpB-1
trpA
Pyrococcus abyssi
trpC
trpD
trpE
trpG
trpB-2
17
trpD
Рис. 8. Продолжение
Pyrococcus furiosus
trpC
trpD
trpE
trpG
trpF*
trpB
trpB-1
Thermoplasma acidophilum
trpA* trpD
trpF*
trpE
trpG
trpC
trpG
trpC
trpB
T.volcanium
trpA* trpD
trpF
trpE
trpB
H. salinarum
trpC
trpB
trpA
trpD1
trpF
trpE1
trpG1
trpG
trpF*
A.fulgidus
trpC,D trpE
trpB-2 trpA
trpB-1
F.acidarmanus
trpB
trpF
trpA
trpE
trpD
trpG
trpC
18
trpA
Рис.8. Продолжение
Methanococcoides burtonii
trpB1
trpE
trpD
trpC
trpB
trpA
Поиск потенциальных сайтов связывания белка-регулятора
Используя матрицу, полученную на основании сайтов в геноме M. thermoautotrophicus,
нам удалось обнаружить сигналы только в группе, содержащей организмы из рода
Methanosarcina и Methanococcoides burtonii, причем сигнал не был обнаружен для M. barkeri. В
геномах M. acetivorans и M. mazei потенциальные сайты связывания были найдены перед trpопероном. С помощью выравнивания регуляторных областей перед данными оперонами, было
показано, что сайты расположены в консервативной области, тогда как остальная часть
данного межгенного участка является неконсервативной (Рис. 9). Помимо trp-оперона в
геномах этих двух видов архей имеется второй ген trpB, перед которым не было обнаружено
потенциальных сайтов. У Methanococcoides burtonii сайты были найдены перед всеми генами,
отвечающими за синтез триптофана из хоризмата, кроме trpE. Все найденные сайты приведены
в таблице 3.
19
Рис. 9. Выравнивание регуляторных областей перед trp-опероном у M. mazei и M. acetivorans.
Найденный сигнал на выравнивании отмечен зеленым цветом. Инициаторные кодоны выделены
курсивом и подчеркнуты. Обозначения: MA - M. acetivorans, MMZ - M. mazei.
MA|trpC
MMZ|MM2823
-----------------------------------------------------------AATTGGTCAGGCATTGTTATACGGGTCCATTTTTTACCCCTTTATTTCTACTGGAAAAAT
MA|trpC
MMZ|MM2823
---------------------------------------AATGTATGAACAAAATAAATT
TTAATACAGATTTTTTGTAATTTCAATTTTTGCCTTTAAAATTCATCAAACACCTGAAGA
*** ** ** * * **
MA|trpC
MMZ|MM2823
TGTTTAATTCGGTTATTCTCATCCTACTGAA-GTTCATTTT-GTCTGTAGCCTTTTTAAC
TCAAAAGAAGTGTTTCCCATACTTGAGGGAATGTTCATCAGAGTCTATCAGTTTTT---C
*
*
***
* *
* *** ******
**** *
****
*
MA|trpC
MMZ|MM2823
TCGGTTCCTGCAATCTTAAAGAATTTATGTGATGTTTTTGTGTGCTGGCTTTTTCTTC-TCAAACTGCATGGCACGACAGCGTTTCTGTGTAGAAATGAACTGTCAGCGATTTCTTCAG
**
* ** *** **** *
*
**
** *******
MA|trpC
MMZ|MM2823
--CGAATTTTATTTACAGGTATAAATATAAATAAAACTATTATTATT--TAATCCTCAAA
CCTGTACCCCGGCAGAACTGATAAATTTACTCAAAATCCGCAGAACTCTTAATCCGTCAC
* *
*
****** **
****
* * * ******
*
MA|trpC
MMZ|MM2823
ATTTTATAA---AATCAGCAACAGTTTATCCTCATCCAAAAGCTTTTTATAGCAAGTATG
TTCTAAGTGGTTACTTTTTAAACTCCTGTCATCATCCGAAATCTTTTTATATCAAGTACA
* * *
* *
**
* ** ****** *** ********* ******
MA|trpC
MMZ|MM2823
GTATTAGACATTGTTGTACACAAATATACACCAGTGATGATTA---------GCATTAGACATTGTTGTACACAACTATACGTCAGTGATTCATAATGCACGATT
* ********************* ***** *******
**
Табл. 3. Предполагамые сайты, найденные в регуляторных областях.
Организм
M. thermoautotrophicus
M. thermoautotrophicus
M. thermoautotrophicus
M. thermoautotrophicus
M. thermoautotrophicus
M. thermoautotrophicus
M.mazei
M.acetivorans
Methanococcoides burtonii
Methanococcoides burtonii
Methanococcoides burtonii
Methanococcoides burtonii
Оперон
regulator
aroC
pheA
trpB-1
tyrA
trpEGCFB-2AD
trpCGEFB
trpСGEFB
trpD
trpCBA
trpB-1
trpB-1
Положение
-8
-86
-71
-103
-135
-86
-48
-38
-7
-39
-91
-41
20
Вес
7.50
5.65
6.62
8.47
5.65
7.51
8.98
8.97
9,95
9,31
5,68
7,07
Сайт
TGTAtA-4-TGTACA
gGTACA-5-cGTAtA
TGgACA-5-gGTACA
TGTACA-4-TGTACA
TGgACc-5-TGTtCA
TGTACA-4-TaTACA
aGTACA-4-TagACA-4-TGTACA
TagACA-4-TGTACA-4-TaTACA
TaTACA-4-TGTACA-4-TGTACA
TGTACA-4-TaTACt-4-TGTACA
TGTAat-4-TGTACA
TcTACA-4-aGTACt-4-TGTgCA
Построение филогенетического дерева для белков ТrpB
Присутствие в некоторых геномах двух генов для бета-субъединицы триптофан синтазы
(ТrpB) наводит на мысль о дупликации данного гена в ходе эволюции. Оба гена trpB (trpB1 и
trpB2) есть только в некоторых из изучаемых геномах: M. thermautotrophicus, P. abyssi, P.
furiosus, M. mazei, M. barkeri, M. burtonii, A. fulgidus. В остальных случаях встречается только
один из генов trpB. С целью прояснить филогенетические соотношения между ферментами
ТrpB, найденными в каждом из геномов, было построено филогенетическое дерево для всех
найденных белков ТrpB (Рис. 10). На дереве отчетливо можно выделить две группы ферментов,
соответствующих TrpB1 и TrpB2. Как становится понятным из анализа дерева, дупликация
скорее всего произошла еще до расхождения исследуемых организмов по группам, и является,
таким образом, достаточно древней. В дальнейшем, по всей видимости, в ходе эволюции
различных групп происходила утрата одного из trpB генов. Кроме того, нами была показана
ошибка в аннотации генома P. abyssi. Ген, проаннотированный у P. abyssi как trpB2, на самом
деле относится к группе trpB1.
Бактериальные гомологи были найдены только для TrpB2 (см. Рис. 10). Таким образом,
TrpB1 представляет собой белок, характерный для архей, тогда как скорее всего появился в
результате горизонтального переноса от бактерий. Следовательно, TrpB1 и TrpB2 являются
ксенологами (Koonin et al., 2001).
Поиск регуляторных сигналов в группе, соответствующей роду Pyrococcus, и группе,
отвечающей родам Ferroplasma и Thermoplasma
Поиск регуляторных сигналов у рода Pyrococcus
Используя имеющуюся у нас матрицу, не удалось обнаружить потенциальных сайтов
перед генами синтеза триптофана в геномах P. abyssi и P. furiosus. Поэтому для поиска сайтов
нами был применен метод генетического футпринтинга. В основе этого метода лежит поиск
консервативных последовательностей перед ортологичными генами из родственных геномов с
помощью выравнивания. (Florea et al., 2003; McCue et al., 2001)
21
Рис. 10. Филогенетическое дерево белков ТrpB. Обозначения: Археи: PAB - Pyrococcus abyssi,
PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA - Thermoplasma acidophilum,
TV - Thermoplasma volcanium, MTH - Methanobacter thermoautotrophicus. Бактерии: THM Thermotoga maritima, CLA - Clostridium acetobutylicum, AQ - Aquifex aeolicus, CV - Caulobacter
vibrioides.
TrpB1_MCB
TrpB1_MTH
TrpB1_MM
TrpB1_AF
2
0 .1
0.14
TrpB1_PF
0 .2
5
0.25
0 .2 7
TrpB2_AF
3
0 .1
0.12
TRB1_AQ
TRPB_CLA
22
15
14
TRB1_THM
TrpB2_MTH
0.
0.
0 .1 8
TrpB_Hsp
TrpB1_PAB
TrpB2_PF
6
0.16
0 .2 0
TrpB2_MM
TrpB_MA
0 .1
4
TrpB2_MCB
0 .2
TrpB_FAC
0.
13
18
0 .1 8
0.
TrpB_TV
TrpB_TA
TrpB2_PAB
TrpB_MBA
TRPB_CV
Парное выравнивание регуляторных областей перед оперонами, содержащими только гены
синтеза триптофана, у P. abyssi и P. furiosus показало, что эти регуляторные области не имеют
ярко выраженных консервативных участков, поэтому явным образом не удается выделить
регуляторные сайты.
Поиск регуляторного сигнала по консенсусу, известному для аналогичного сигнала перед
генами M. thermoautotrophicus, не дал никаких результатов. В большинстве случаев в
регуляторных областях удавалось найти лишь один короткий палиндром длины 6, вероятность
встретить который случайно очень велика, поэтому нельзя предполагать, что это искомый
регуляторный сигнал.
Так как белки-регуляторы ортологичны, разумно предположить, что структура сигнала в
геномах представителей рода Pyrococcus будет частично сохранена. Можно предположить, что
в данном случае сохранится общий план строения сигналов, но возможны некоторые
изменения в консенсусе палиндромных сайтов; также возможно и изменение расстояния между
палиндромными боксами. При помощи программы SignalX был осуществлен поиск коротких
палиндромов в регуляторных областях. Были найдены только единичные палиндромы с
низким весом. Таким образом, у архебактерий рода Pyrococcus либо сильно изменилась
структура регуляторного сайта, либо регуляция синтеза триптофана имеет совершенно другой
механизм.
Поиск регуляторных сигналов в группе, отвечающей родам Ferroplasma и Thermoplasma.
Поиск в данном случае осуществлялся такими же методами, как и для рода Pyrococcus.
Поиск сигналов вместе у родов Ferroplasma и Thermoplasma не дал результатов, так как,
видимо, представители этих родов все-таки достаточно далеко разошлись в ходе эволюции.
При поиске внутри рода Thermoplasma, также не удалось выявить консервативный
регуляторный сигнал. Выравнивание регуляторных областей не дало никакого результата, так
как регуляторные области оказались малоконсервативны.
Поскольку все белки-регуляторы являются ортологами, мы предположили, что структура
сигнала должна сохраняться в ходе эволюции. Поэтому был предпринят поиск повторов,
состоящих из палиндромных боксов. Такой поиск был осуществлен с помощью программы
SignalX. Однако, обнаруживать устойчивый сигнал не удалось.
Подобная ситуация могла быть вызвана различными причинами. Во-первых, в результате
расхождения белков-регуляторов в процессе эволюции могла измениться сама структура сайта.
Во-вторых, не исключено, что могла измениться функция белка-регулятора, и регуляция
синтеза триптофана в данной группе архей осуществляется иным образом.
23
Выводы
1. Исследована регуляция синтеза триптофана
методами сравнительной геномики.
Обнаружены новые потенциальные регуляторные сайты у архей M. burtonii, M. acetivorans и
M. mazei.
2. В ряде исследуемых геномов были обнаружены неортологичные замены для генов trpF и
trpA.
3. Было показано, что появление дополнительного гена trpB в ряде геномов архей произошло
не за счет дупликации данного гена, а за счет горизонтального переноса из бактерий.
4. Для археи A. fulgidus были показаны доменные перестройки в белках, задействованных в
синтезе триптофана.
24
Список литературы
Миронов А.А., Винокурова Н.П., Гельфанд М.С. (2000) Програмное обеспечение анализа
бактериальных геномов. Молекулярная биология, 34, 253-262
Altschul S.F., Madden T.L., Schaffer A.A., Zhang J., Zhang Z., Miller W., Lipman D.J. (1997)
Gapped BLAST and PSI-BLAST: a new generation of protein database search programs.
Nucleic Acids Research, Vol. 25, No.17, 3389-3402
Bell S.D. and Jackson S.P. (1998) Transcription in Archaea. In “Mechanisms of transcription”,
Cold Spring Harbor Laboratory Press.
Cohen G.N., Barbe V., Flament D., Galperin M.L., Heilig R., Lecompte O., Poch O., Prieur D., Querellou
J., Ripp R., Thierry J.C., Van der Oost J., Weissenbach J., Zivanovic Y., and Forerre P. (2003) An
integrated analysis of the genome of the hyperthermophilic archaeon Pyrococcus abyssi. Mol
Microbiol. 47 (6), 1495-1512.
Crooks G.E., Hon G., Chandonia J.-M., and Brenner S.E. (2004) WebLogo: A Seguence Logo
Generator. Cold Spring Harbor Laboratory Press.
Daniels C.J., Mao J.-I., Rice P., Noelling J., Reeve J.N. (1997) Complete genome sequence of
Methanobacterium thermoautotrophicum deltaH: functional analysis and comparative genomics.
J. Bacteriol. 179,7135-7155.
Daugherty M, Vonstein V, Overbeek R, Osterman A. (2001) Archaeal shikimate kinase, a new
member of the GHMP-kinase family. J Bacteriol. 183(1), 292-300.
Deppenmeier U., Johann A., Hartsch T., Merkl R., Schmitz R.A., Martinez-Arias R., Henne A.,
Wiezer A., Baumer S., Jacobi C., Bruggemann H., Lienard T., Christmann A., Bomeke M., Steckel S.,
Bhattacharyya A., Lykidis A., Overbeek R., Klenk H.P., Gunsalus R.P., Fritz H.J. and Gottschalk G.
(2002) The genome of Methanosarcina mazei: evidence for lateral gene transfer between
Bacteria and Archaea. J. Mol. Microbiol. Biotechnol. 4 (4), 453-461.
Dodd I.B., Egan J. B. (1990) Improved detection of helix-turn-helix DNA-binding motifs in
protein seguences. Nucleic Acids Research, Vol. 18, No. 17, 5019-5026
Galagan J.E., Nusbaum С., Roy A., Endrizzi M.G., Macdonald P., FitzHugh W., Calvo S., Engels R.,
Smirnov S., Atnoor D., Brown A., Alien N., Naylor J., Stange-Thomann N., DeAreHuno K., Johnson
R., Linton L., McEwan P., McKernan K., Talamas J., Tirrell A., Ye W., Zimmer A., Barber R.D.,
Cann L, Graham D.E., Grahame D.A., Guss A.M., Hedderich R., Ingram-Smith C., Kuettner H.C.,
Krzycki J.A., Leigh J.A., Li W., Liu J., Mukhopadhyay В., Reeve J.N., Smith K., Springer T.A.,
Umayam L.A., White O., White R.H., Conway dc Macario E., Ferry J.G., Jarrell K.F., Jing H.,
Macario A.J., Paulsen I., Pritchett M., Sowers K.R., Swanson R.V., Zinder S.H., Lander E., Metcalf
W.W., and Birren B. (2002) The genome of M. acetivorans reveals extensive metabolic and
physiological diversity. Genome Res. 12 (4), 532-542.
Gelfand M.S., Koonin E.V., Mironov A.A. (2000) Prediction of transcription regulatory sites in
Archaea by a comparative genomic approach. Nucleic Acids Research, 28, 695-705.
25
Florea L., McClelland М., Riemer С., Schwartz S. and Miller W. (2003) EnteriX 2003: visualization
tools for genome alignments of Enterobacteriaceae. Nucleic Acids Research, 31, 13, 3527–3532
Kawarabayasi Y., Sawada M., Horikawa H., Haikawa Y., Hino Y., Yamamoto S., Sekine M., Baba S.,
Kosugi H., Hosoyama A., Nagai Y., Sakai M., Ogura K., Otsuka R., Nakazawa H., Takamiya M.,
Ohfuku Y., Funahashi Т., Tanaka Т., Kudoh Y., Yamazaki J., Kushida N., Oguchi A., Aoki K., and
Kikuchi H. (1998) Complete sequence and gene organization of the genome of a hyperthermophilic archaebacterium, Pyrococcus horikoshii OT3. DNA Res. 5 (2), 55-76.
Kawashima Т., Amano N., Koike H., Makino S., Higuchi S., Kawashima-Ohya Y., Watanabe K.,
Yamazaki M., Kanehori K., Kawamoto Т., Nunoshiba Т., Yamamoto Y., Aramaki H., Makino K., and
Suzuki M. (2000) Archaeal adaptation to higher temperatures revealed by genomic sequence of
Thermoplasma volcanium. Proc Natl Acad Sci USA. 97 (26), 14257-14262.
Klenk H.P, Clayton R.A., Tomb J.F., White O., Nelson K.E., Ketchum K.A., Dodson R.J., Gwinn M.,
Hickey E.K., Peterson J.D., Richardson D.L., Kerlavage A.R., Graham D.E., Kyrpides N.C.,
Fleischmann R.D., Quackenbush J., Lee N.H., Sutton G.G., Gill S., Kirkness K.F., Dougherty B.A.,
McKenney K., Adams M.D., Loftus В., and Venter J.C. (1997) The complete genome sequence of
the hyperthermophilic, sulphate-reducing archaeon Archaeoglobus fulgidus. Nature. 390 (6658),
364-370.
Koonin E.V., Makarova K.S., Aravind L. (2001) Horizontal gene transfer in prokaryotes:
quantification and classification. Annu Rev Microbiol. 55,709-42.
Maeder D.L., Weiss R.B., Dunn D.M., Cherry J.L., Gonzalez J.M., DiRuggiero J., and Robb F.T.
(1999) Divergence of the hyperthermophilic archaea Pyrococcus furiosus and P. horikoshii
inferred from complete genomic sequences. Genetics. 152 (4), 1299-1305.
McCue L.A., Thompson W., Carmack C.S., Ryan M.P., Liu J.U., Derbyshire V. and Laurence C.E.
(2001) Phylogenetic footprinting of transcription factor binding sites in proteobacterial
genomes. Nucleic Acids Research, 29, 3, 774-782.
Natori Y., Kano Y. and Imamoto F. (1990) Nucleotide sequences and genomic constitution of five
tryptophan genes of Lactobacillus casei. J Biochem (Tokyo). 107 (2), 248-255.
Ng W.V., Kennedy S.P., Mahairas G.G., Berquist В., Pan M., Shukla H.D., Lasky S.R., Baliga M.S.,
Thorsson V., Sbrogna J., Swartzell S., Weir D., Hall J., Dahl T.A., Welti R., Goo Y.A., Leithauser В.,
Keller K., Cruz R., Danson M., Hough D.W., Maddocks D.G., Jablonski P.E., Krebs M.P., Angevine
C.M., Dale H., Isenbarger T.A., Peck R.F., Pohlschroder M., Spudich J.L., Jung K.W., Alam M.,
Freitas Т., Hou S., Daniels C.J., Dennis P.P., Omer A.D., Ebhardt H., Lowe T.M., Liang P., Riley M.,
Hood L., and DasSarma S. (2000) Genome sequence of Halobacterium species NRC-1. Proc Natl
AcadSci USA. 97 (12176-12181)
Panina E.M., Vitreschak A.G., Mironov A.A., and Gelfand M.S. (2001) Regulation of Aromatic
Amino Acid Byosynthesis in Gamma-Proteobacteria.J.Mol. Microbiol. Biotechnol,3(4), 529-543.
Panina E.M., Vitreschak A.G., Mironov A.A., and Gelfand M.S. (2003) Regulation of biosynthesis
and transport of aromatic amino acids in low-GC Gram-positive bacteria FEMS Microbiology
Letters, 222, 211-220
26
Ruepp A., Graml W., Santos-Martinez M.L., Koretke K.K., Volker C., Mewes H.W., Frishman D.,
Stocker S., Lupas A.N., and Baumeister W. (2000) The genome sequence of the thermoacidophilic
scavenger Thermoplasma acidophilum. Nature. 407 (6803), 508 513
Smith D.R., Doucette-Stamm L.A., Deloughery C., Lee H.-M., Dubois J., Aldredge T., Bashirzadeh
R., Blakely D., Cook R., Gilbert K., Harrison D., Hoang L., Keagle P., Lumm W., Pothier B., Qiu D.,
Spadafora R., Vicare R., Wang Y., Wierzbowski J., Gibson R., Jiwani N., Caruso A., Bush D., Safer
H., Patwell D., Prabhakar S., McDougall S., Shimer G., Goyal A., Pietrovski S., Church G.M.,
Thomson J.D., Gibson T.J., Plewniak F., Jeanmouglin F., Higgins D. G. (1997) The Clustal_X
windows interface: flexible strategies for multiple sequence alignment aided by quality analysis
tools. Nucleic Acids Research, Vol. 25, No. 24, 4876-4882.
Wolfe R.S. (2002) The Archaea: A Personal Overview of the Formative Years. In “The
Prokariotes. An Evolving Electronic Resource for the Microbiological Community”
(http://141.150.157.117:8080/prokPUB)
Xie G., Keyhani N.O., Bonner C.A., and Jensen R.A. (2003) Ancient origin of trypthophan operon
and the dynamics of evolutionary change. Microbiology and Molecular Biology Reviews, 303-342
27
Download