Филогенетическое дерево и его реконструкция

advertisement
Филогенетическое дерево и его реконструкция.
1. Изображение дерева
На основе имеющейся скобочной формулы
(((А:35,В:35):5,(С:35,D:35):15):50,(Е:40,F:40):60);
посредством программы было построено изображение дерева.
2. Описание дерева как разбиения множества листьев.
Предложенное в задании дерево (см. рис.) имеет 9 ветвей, шесть из которых являются
внешними, а три внутренними. Внешними ветвями называются те «линии», которые
отходят от какого-либо листа, т.е. попросту соединяют его с другими элементами дерева.
А внутренние ветви образуют более сложную организацию листьев, формируют так
называемые кластеры (множества листьев, расположенные с одного или другого конца
этой ветви).
На рисунке все три внутренние ветви выделены разными цветами. Например, красная
ветвь делит множество всех листьев на кластеры A,B и C,D,E,F (все остальные), а синяя –
на E,F и A,B,C,D.
Таким образом, топологию дерева можно представить в виде таблицы, где столбцы есть
ничто иное, как листья, а строки – это ветви. Причем в нем можно оставить лишь те
строки, которые соответствуют внутренним ветвям, поскольку внешние ветви –
информации не несут.
ABCDEF
..****
**..**
****..
3. Получение искуственных мутантных последовательностей.
Мы можем создать искусственные последовательности, которые будут соответствовать
листьям и узлам дерева, считая, что в корне находится последовательность гена белка
alf_ecoli.
Длина последовательности этого гена составляет 1080bp.
Поскольку в качестве расстояний между элементами даны количества мутаций на 100
оснований, то для перехода к абсолютным значениям мутаций (имеются в виду
исключительно замены) нужно воспользоваться следующей формулой:
X=(1080N)/100,
где X – абсолютное значение числа мутаций, N – расстояние, приведенное в
скобочной формуле, 1080 – длина последовательности гена.
Воспользовавшись данной формулой, мы можем пересчитать все расстояния.
Далее для получения «мутантов» обратимся к программе msbar пакета EMBOSS.
Запущенный скрипт имел следующий вид:
msbar alf_ecoli_gene.fasta junc_EF.fasta -point 4 -count 648 -auto
msbar junc_EF.fasta E.fasta -point 4 -count 432 -auto
msbar junc_EF.fasta F.fasta -point 4 -count 432 -auto
msbar alf_ecoli_gene.fasta junc_ABCD.fasta -point 4 -count 540 -auto
msbar junc_ABCD.fasta junc_AB.fasta -point 4 -count 54 -auto
msbar junc_ABCD.fasta junc_CD.fasta -point 4 -count 162 -auto
msbar junc_AB.fasta A.fasta -point 4 -count 378 -auto
msbar junc_AB.fasta B.fasta -point 4 -count 378 -auto
msbar junc_CD.fasta C.fasta -point 4 -count 378 -auto
msbar junc_CD.fasta D.fasta -point 4 -count 378 -auto
4. Реконструкция дерева алгоритмами UPGMA, Neighbor-joining и
максимального правдоподобия. Сравнение деревьев.
Полученные последовательности были записаны в один файл. При этом «мутанты» были
вручную переименованы.
Алгоритм максимального правдоподобия (неукорененное дерево).
fdnaml mutants.fasta -ttratio 1 -auto
Полученное изображение:
+--------F
+------------------------------4
+--1
+---------E
| |
| +-------B
|
|
+------D
3----2
|
+-------C
|
+-------A
Предварительно посчитаем попарные расстояния между последовательностями
программой fdnadist:
fdnadist mutants.fasta -ttratio 1 -auto
Полученный файл в формате *.fdnalist используется далее.
Алгоритм Neighbor-joining (неукорененное).
fneighbor mutants.fdnadist -auto
+-------C
+---2
!
+-------D
!
! +-------B
3-4
! !
+----------E
! +--------------------------------1
!
+--------F
!
+--------A
Реконструкция алгоритмом UPGMA (укорененное дерево!)
fneighbor mutants.fdnadist -treetype u -outfile mutants_upgma -auto
+----------------A
+---2
!
+----------------B
+-------------------------------4
!
!
+--------------C
!
+-----1
--5
+--------------D
!
!
+------------------E
+---------------------------------3
+------------------F
ABCDEF
. . ****
** . . **
**** . .
. * . . **
Исходное
дерево модели
+
+
+
-
Максимальное
правдоподобие
+
+
+
Neighborjoining
+
+
+
UPGMA
+
+
+
-
Единственный метод, построивший верное дерево в данной ситуации, - это метод,
основанный на алгоритме UPGMA.
5. Бутстреп-анализ множественного выравнивания и построение
консенсусного дерева.
Последовательно использовались следующие команды:
fseqboot mutants.fasta -auto [создается 100 бутстреп-реплик выравнивания]
fdnaml mutants.fseqboot -ttratio 1 -auto [полученные 100 выравниваний подаются на
вход программе fdnaml. В выходном файле (.treefile) получаем 100 скобочных формул,
соответствующих реконструкциям, сделанным по каждому из выравниваний]
fconsense mutants.treefile
Косенсусное дерево выглядит следующим образом:
+------F
+100.0-|
|
+------E
+-99.0-|
|
|
+------A
+------|
+-58.0-|
|
|
+------B
|
|
|
+--------------------D
|
+---------------------------C
Топология полученного консенсусного дерева описывается следующим образом:
..**..
..****
....**
100.00
99.00
58.00
Топология реального дерева (см. пункт 1):
ABCDEF
..****
**..**
****..
Эти цифры справа (бустреп-значения) показывают, в скольки деревьях из ста
«случайных» встретилась эта ветвь, таким образом характеризуя статистическую
надежность, биологическую достоверность соответствующих ветвей.
Несмотря на невысокое значение у одной из ветвей, она есть и в реальном дереве.
Т.е. топология реального и консенсусного деревьев полностью совпадает.
6. Создание изображения дерева программой fdrawtree.
Использовалась команда:
fdrawtree mutanty.treefile
Download