Эволюционная история внутригеномных

advertisement
Эволюционная история внутригеномных рекомбинационных событий в
геномах бактерий родов E. coli / Shigella spp. / Salmonella spp.
Бочкарева О.О.
ИППИ РАН
olga.bochkaryova@
gmail.com
сравнение
очень
близких
геномов
и
восстанавливать историю их эволюционных
отношений.
Традиционные
методы
реконструкции эволюции основываются на
сравнении белковых последовательностей в
предположении, что все участки генома
наследуются вертикально.
Однако в ходе микроэволюции участки
хромосом бактерий
могут обмениваться
различными способами: любой участок может
быть скопирован или перемещен в другую
позицию, ген, полученный вертикально от
предка, может быть заменен на горизонтально
перенесенный от другого организма.
История таких перестроек интересна как с
точки зрения эволюционной микробиологии, так
и практически, поскольку такие перестройки
могут изменять свойства штаммов.
Аннотация
В работе была исследована группа бактерий
Escherichia coli / Shigella / Salmonella,
содержащая 47 полностью отсеквенированных и
аннотированных геномов.
На основе данных об ортологических рядах
был проанализирован порядок генов и выделены
синтенные блоки (участки с совпадающим
порядком генов). С помощью алгоритма MGRA
были
построены
эволюционные
деревья,
реконструирован порядок генов у предков во всех
его узлах и перестройки блоков на всех ветвях.
Сравнение частот перестроек на деревьях
E.coli и Shigella spp. показало, что поток
внутригеномных рекомбинаций не равномерен по
времени.
Для неуниверсальных ортологических рядов
были проанализированы две характеристики:
консервативность локализации в геномах и
топология
филогенетического
дерева.
Консервативность порядка универсальных генов
в геномах E. coli и Salmonella spp. позволила
отфильтровать
случаи,
когда
причиной
изменения относительного расположения генов
ряда в геномах являлись геномные перестройки,
затронувшие соседние универсальные гены.
Таким образом, на основе сопоставления
локализации генов и филогенетических деревьев
ортологических рядов были выделены гены,
которые независимо несколько раз были
перенесены горизонтально.
3. Материалы и методы
В работе были использованы ортологические
ряды для 25 штаммов E.coli, 6 штаммов Shigella и
16 штаммов Salmonella. Из рассмотрения были
удалены гены, в аннотации которых были
указания на фаги, транспозоны, IS-элементы,
либо же если ни одному из ортологов не была
приписана GO-функция. Далее ортологические
ряды
были дополнены с использованием
BLASTN (http://blast.ncbi.nlm.nih.gov/).
Для построения синтенных блоков был
использован
алгоритм
Duplications
and
Rearrangements
In
Multiple
Mammals
(DRIMM)-Synteny [1].
Для реконструкции геномных перестроек был
использован алгоритм MGRA (Multiple Genome
Rearrangements and Ancestors)[2].
1. Введение
Для понимания механизмов эволюции, таких
как
механизмы
отбора
геномных
последовательностей, необходимо проводить
231
Для неуниверсальных ортологических рядов,
гены которых найдены в более чем двух штаммах
E. coli и двух штаммах Salmonella spp., были
проанализированы
две
характеристики:
консервативность локализации в геномах и
топология
филогенетического
дерева.
Филогенетическое дерево ряда определялось как
согласованное, если удавалось найти такое
расположение корня, при котором на дереве
образовались две монофилетические группы
Salmonella spp. и Escherichia coli.
Относительная позиция генов ряда в геномах
определялась следующим образом. Каждый
геном представлялся в виде зацикленной
последовательности генов и для каждого
неуниверсального гена координаты определялись
как номера ортологических рядов ближайших
универсальных генов в прямом и обратном
направлении обхода списка. В случае, если гены
ряда во всех штаммах имели одинаковых
универсальных соседей, позиция генов ряда
считалась консервативной. Ряды, изменение
локализации которых было вызвано геномной
перестройкой,
затронувшей
соседние
универсальные гены, также характеризовались
как имеющие консервативную позицию. На
основе
информации
об
относительном
расположении генов ряды, имеющие паралоги,
были
разделены,
что
учитывалось
при
построении их филогенетических деревьев.
В штаммах внутри каждой группы было
получено менее 25 синтенных блоков, что
говорит о консервативности порядка генов в ходе
микроэволюции E.coli и Salmonella spp.
Эволюционные деревья Salmonella spp. (рис.1)
и E.coli (рис.2), построенные по перестройкам
синтенных блоков, показывают, что почти в
половине штаммов E. coli и трети штаммах
Salmonella spp. найдено полное совпадение
порядка универсальных генов.
4. Результаты и обсуждение
В штаммах Shigella удалось выделить более
150 синтенных блоков, эволюционное дерево
представлено на рис.3.
Рис.2
После
разделения
паралогов
по
относительному расположению в геномах в
штаммах
E.coli
было
найдено
2182
универсальных ортологических ряда, в 16
штаммах Salmonella spp. - 2463.
Рис.3
Таким образом, несмотря на то, что штаммы
Shigella spp. возникли в процессе эволюции от E.
coli, частота перестроек на ветках отличается в
десятки раз.
Топология полученных деревьев совпадает с
деревьями, построенными по аминокислотным
последовательностям,
однако
существенно
различаются относительные длины веток. Это
показывает,
что
поток
внутригеномных
рекомбинаций не равномерен по времени.
Рис. 1
232
Анализ
относительного
расположения
неуниверсальных генов показал, что из более чем
3000 рассмотренных ортологических рядов
только 40 не имеют консервативной позиции.
Эти ряды можно разделить на 3 группы:
1. присутствующие
в
большинстве
штаммов Salmonella spp. и менее чем
половине штаммов E.coli.
2. присутствующие
в
большинстве
штаммов Salmonella spp. и менее чем в
половине штаммов E.coli.
3. присутствующие менее чем в половине
штаммов Salmonella spp. и менее чем в
половине штаммов E.coli.
Ортологические ряды, представленные в
большинстве штаммов E.coli и Salmonella spp,
сохраняют свое расположение во всех геномах.
По-видимому, гены, не имеющие постоянной
локализации, независимо несколько раз были
перенесены горизонтально и еще не успели
распространиться.
При анализе филогенетических деревьев
ортологических рядов была выявлена строгая
корреляция
между
их
топологией
и
расположением генов в геномах: штаммы, у
которых ген локализован одинаково, образуют
поддеревья.
5. Благодарности
Работа выполнена совместно с Маратом
Казановым и Евгением Гордиенко.
Список используемой литературы
[1]
Pham SK, Pevzner P. P. DRIMM-Synteny:
decomposing genomes into evolutionary conserved
segments Bioinformatics, 2010, 26(20), 2509-2516
[2] Alekseyev MA, Pevzner P. P. Breakpoint graphs and
ancestral genome reconstructions. Genome Res., 2009,
19(5), 943-957
233
Download