Текст диссертации - Институт биоорганической химии

advertisement
Федеральное агентство научных организаций (ФАНО России)
Федеральное государственное бюджетное учреждение науки
ИНСТИТУТ БИООРГАНИЧЕСКОЙ ХИМИИ
им. академиков М.М. Шемякина и Ю.А. Овчинникова
Российской академии наук
( ИБХ РАН )
На правах рукописи
Баскаев Константин Константинович
Разработка нового метода крупномасштабного поиска гипометилированных
регуляторных участков в геномах эукариот
03.01.03 – Молекулярная биология
Диссертация на соискание ученой степени кандидата
биологических наук
Научный руководитель
доктор биологических наук
Буздин Антон Александрович
Москва – 2015
2
3
1. Оглавление
1. ОГЛАВЛЕНИЕ ................................................................................................................................... 3
2. ВВЕДЕНИЕ ......................................................................................................................................... 5
2.1. Актуальность темы ................................................................................................................ 7
2.2. Цель и задачи исследования ................................................................................................. 8
2.3. Научная новизна и практическая значимость ..................................................................... 8
2.4. Научные публикации по итогам диссертационной работы ............................................... 9
2.4.1. Статьи по теме диссертации ......................................................................................... 9
2.4.2. Тезисы научных конференций по теме диссертации ................................................. 9
3. ОБЗОР ЛИТЕРАТУРЫ. «МОДИФИЦИРОВАННЫЕ ОСНОВАНИЯ В ДНК» ........................ 11
3.1. Модифицированные основания в ДНК бактерий и их вирусов ...................................... 12
3.1.1. Модифицированные основания в ДНК бактерий. .................................................... 12
3.1.2. Модифицированные основания в ДНК бактериофагов ........................................... 18
3.2. Модифицированные основания в геноме эукариот ......................................................... 20
3.2.1. Метилированные основания в геноме высших эукариот ......................................... 20
3.2.2. Импринтинг и инактивация Х-хромосомы................................................................ 25
3.2.3. Гипермодифицированные основания в геноме млекопитающих ........................... 28
3.2.4. Простейшие: модифицированные и гипермодифицированные основания ........... 33
3.2.5. Наличие метиладенина в геноме эукариот ................................................................ 35
3.3. Заключение ........................................................................................................................... 39
4. ПРАКТИЧЕСКАЯ ЧАСТЬ. «РАЗРАБОТКА НОВОГО МЕТОДА КРУПНОМАСШТАБНОГО
ПОИСКА ГИПОМЕТИЛИРОВАННЫХ РЕГУЛЯТОРНЫХ УЧАСТКОВ В ГЕНОМАХ
ЭУКАРИОТ» ........................................................................................................................................ 40
4.1. Материалы и методы ........................................................................................................... 40
4.1.1. Оборудование ............................................................................................................... 40
4.1.2. Расходные материалы .................................................................................................. 40
4.1.3. Выделение и очистка ДНК .......................................................................................... 40
4.1.4. Олигонуклеотидные праймеры и суппрессионные адапторы ................................. 41
4
4.1.5. Молекулярное клонирование, скрининг библиотек ................................................. 41
4.1.6. Бактериальные штаммы. Трансформация и культивирование ................................ 41
4.1.7. Эндонуклеазы рестрикции, рестрикция и лигирование ........................................... 42
4.1.8. Полимеразная цепная реакция .................................................................................... 43
4.1.9. Дуплекс-специфическая нуклеаза (ДСН) .................................................................. 43
4.1.10. Бисульфитная конверсия ........................................................................................... 44
4.1.11. Электрофорез в агарозном геле ................................................................................ 44
4.1.12. Секвенирование.......................................................................................................... 44
4.2. Теоретические основы метода ............................................................................................ 45
4.3. Выбор мобильных элементов ............................................................................................. 47
4.4. Получение пилотных клонотек .......................................................................................... 47
4.5. Применение nMETR для поиска гипометилированных последовательностей в
геномной ДНК рака мочевого пузыря ...................................................................................... 52
4.6. Крупномасштабное секвенирование nMETR-библиотек ................................................ 54
4.7. Бисульфитное секвенирование ........................................................................................... 56
4.8. Заключение ........................................................................................................................... 59
4.9. Экспериментальный анализ специфичной для человека открытой рамки считывания
c11orf72 ........................................................................................................................................ 59
5. ВЫВОДЫ .......................................................................................................................................... 67
6. СПИСОК СОКРАЩЕНИЙ .............................................................................................................. 68
7. СПИСОК ЛИТЕРАТУРЫ................................................................................................................ 69
8. БЛАГОДАРНОСТИ ......................................................................................................................... 82
ПРИЛОЖЕНИЕ 1. ИСПОЛЬЗОВАННЫЕ ОЛИГОНУКЛЕОТИДЫ .............................................. 83
A. Олигонуклеотидные праймеры и супрессионные адаптеры для nMETR ........................ 83
Б. Олигонуклеотидные праймеры для ДНК, подвергавшейся бисульфитной конверсии ... 84
ПРИЛОЖЕНИЕ 2. ПОСЛЕДОВАТЕЛЬНОСТИ МОБИЛЬНЫХ ЭЛЕМЕНТОВ И САЙТЫ
ОТЖИГА ОЛИГОНУКЛЕОТИДНЫХ ПРАЙМЕРОВ, ИСПОЛЬЗОВАННЫХ В РАБОТЕ ........ 85
5
2. Введение
В начале 21 в. частной компанией «Celera Genomics» под руководством Крейга Вентера
и Национальным Центром Исследований Человеческого Генома в Национальной Организации
Здравоохранения США (NIH), возглавляемого Френсисом Коллинзом был завершен
масштабный и амбициозный проект «Геном человека» (Human Genome Project, HGP). Датой
окончания проекта, стоившего 3 миллиарда долларов и продолжавшегося 12 лет можно назвать
дату публикации итоговых заявлений в авторитетных изданиях Cell и Nature [1; 2].
Нуклеотидная последовательность человеческого генома опубликована для публичного доступа
и плодами этой кропотливой работы может воспользоваться все научное сообщество.
Успешное внедрение технологий секвенирования нового поколения (Next-generation sequencing,
NGS) и постоянное снижение стоимости определения нуклеотидных последовательностей
позволило полностью секвенировать множество геномов [3]. Существуют базы данных,
содержащие полные или частичные последовательности геномов приматов, птиц, рыб, грибов и
эубактерий, секвенированы геномы различных архей. Свободный доступ и последующая
публикация геномной последовательности человека является важной вехой в изучении жизни в
ее генетическом разнообразии [1]. Следует ометить, что знание того, что представляет из себя
геном конкретного организма не дает ответа на вопрос каким образом наследственная
информация реализуется в процессе его жизнедеятельности. В настоящее время внимание
научного сообщества сместилось с поиска и определения новых генов на их экспрессию и
функционирование [4].
Важная роль в определении того, как реализуется генетическая информация
принадлежит эпигенетике, которая рассматривает модификации, затрагивающие
функциональную активность генов, не меняя при этом нуклеотидной последовательности ДНК
и устойчиво наследующиеся в ряду клеточных поколений [5]. Эпигенетические модификации
делятся на два типа – метилирование ДНК и модификация гистонов [6]. Функциональное
состояние гена, хромосомы или даже целого генома будет определяться распределением
модифицированных оснований и гистонов по геномной ДНК. Существует тесная связь между
этими двумя модификациями [7].
Метилирование ДНК влияет на функционирование многих клеточных систем,
участвует в регуляции репликации, транскрипции, рекомбинации и репарации. Каталитическая
модификация оснований как в РНК, так и в ДНК происходит во всех главных надцарствах
живого, включая некоторые виды вирусов [8].
6
Некоторые их этих модификаций, такие как метилирование, тиоуридинилирование и
псевдоуридинилирование оснований в рРНК и тРНК присутствуют практически во всех живых
формах и необходимы для выживания. Как правило, модификация оснований в ДНК менее
разнообразна и имеет меньшую частоту, чем другие модификации нуклеиновых кислот
(модификации РНК). Меньшее разнообразие и относительно небольшая представленность
модификаций ДНК, возможно, является следствием ограничений, возникающих из-за
двуцепочечной структуры ДНК и защиты генетического материала от потенциального
мутагенного воздействия таких модификаций. Тем не менее, модификации ДНК предоставляют
дополнительный «информационный слой» (эпигенетическую информацию) к информации,
которую можно закодировать четырьмя буквами генетического кода. Как результат, у
относительно небольшого набора модификаций ДНК появились в процессе эволюции и
распространились среди всех отделов живого важные биологические функции [9].
Модифицированное основание
5-метилцитозин, 5mC
Организм
Высшие эукариоты
Бактериофаги
Динофлагелляты
Доля в ДНК, %
5-30
0,2-0,5
2-17
Грибы
Бактерии
Фаги Escherichia coli T2, T4, T0
1-5
0,3-2
100
β-D-глюкозилгидроксиметилурацил, 5hmU
Trypanosoma brucei
0,4
N6-метиладенин
Tetrahymena
Динофлагелляты
Бактерии
0,8-2,5
10
0,3-3
Фаги (T2, T4)
0,5-2
5-гидроксиметилцитозин,
5-ROH2CCyt (R1=Н, R2=αGlc,
R3=βGlc, R4=βGlc-αGlc)
α-путрестцинилтимин, α-Put
Фаг Pseudomonas acidovorans φW14
50
N6-кабрамоиметиладенин
Фаг E. coli Mu
15
Таблица 1. Различные природные химические модификации оснований в ДНК и их
представленность (По данным [8]).
7
2.1. Актуальность темы
Эпигенетика — быстро развивающаяся область молекулярной биологии, пытающаяся
ответить на вопрос «Как работает геном?». Тогда как каждая содержащая ядро клетка
человеческого организма, за исключением лимфоцитов, несет один и тот же набор генов,
разные гены в разных клетках экспрессируются в разное время, что и является одной из причин
разнообразия клеток и тканей человеческого организма. Помимо критической роли в
нормальном развитии живых организмов, эпигенетические изменения сопровождают (или
являются причиной) таких патологических процессов как онкогенез и старение.
Метилирование геномной ДНК является важной частью эпигенетических процессов.
До настоящего времени главным методом изучения статуса метилирования генома
позвоночных животных является секвенирование ДНК, подвергнувшейся реакции
бисульфитной конверсии. В случае полногеномных исследований за бисульфитной конверсией
может следовать использование техник секвенирования следующего поколения (англ. Next
Generation Sequencing, NGS) или анализ реакционных смесей на микрочипах. Помимо этого,
для получения метилированных последовательностей из смеси фрагментов геномной ДНК
может быть использована аффинная хроматография. Однако, для анализа большого объема
получающихся данных требуются методы контроля, позволяющие исключить
ложноположительные и ложноотрицательные результаты.
Идеальный контроль должен соответствовать следующим критериям:
- содержать достаточный объем данных для полногеномного исследования
- покрывать большое количество разнообразных локусов на разных хромосомах и в
разных областях каждой хромосомы
- быть достаточно дешевым, хорошо воспроизводимым и не требовать длительного
времени на каждый эксперимент.
Помимо этого, важно не просто получить нужную информацию, но и оценить её
достоверность. Таким образом, актуальным представляется создание такого «контрольного
метода». В работе показано, что метод имеет и самостоятельную практическую ценность, в том
числе за счет таких преимуществ, как удобство, простота и небольшая длительность
выполнения эксперимента.
8
2.2. Цель и задачи исследования
Цель данной работы - разработка нового метода крупномасштабного поиска
гипометилированных регуляторных участков в геномах эукариот nMETR (англ. non-Methylated
Tag Recovery). При разработке метода основной упор делался на универсальность и наибольшее
разнообразие покрываемых локусов человеческого генома.
В рамках поставленной цели предполагалось решить следующие задачи:
-
получить с помощью nMETR пилотные клонотеки на основе геномной ДНК
человека
-
получить с помощью nMETR ампликоны, содержащие последовательности
гипометилированных локусов генома
-
осуществить биоинформатический анализ полученных последовательностей, а
картировать местоположение обнаруженных гипометилированные
последовательности в человеческом геноме
Помимо указанных задач, прямо следующих из цели исследования, в работу включена
глава, посвященная экспериментальному анализу открытой рамки считывания с11orf72. Эта
задача возникла в процессе анализа результатов одного из пилотных экспериментов и
дополнительно иллюстрирует потенциал nMETR как источника новой информации.
2.3. Научная новизна и практическая значимость
Метод, разработанный в рамках данной работы является оригинальным, дешевым и
быстрым спсобом поиска гипометилированных последовательностей в геномной ДНК любого
эукариотического организма с CG-метилированием и мобильными элементами в геноме. Метод
прост и универсален, он может служить для быстрого обнаружения эпигенетических маркеров
одновременно для большого количества тканей и образцов, имеет большой потенциал
использования для определения различий в метилировании геномов клеток в норме и при
различных патологиях или использоваться в качестве контрольного.
В ходе выполнения работы получены 6589 нуклеотидных последовательности несущие
информацию о 1113 локусах человеческого генома, из которых 711 (64%) из них находились в
окрестности CpG-островков (200 п. о. ) . Данные результаты получены с помощью
специализированной программы “PostParser”, написанной в нашей лаборатории.
9
В процессе разработки nMETR автором было показано, что предсказанная ранее
открытая рамка считывания белка c11orf72 специфична для генома человека и отсутствует в
ДНК других высших приматов. Выявление и структурно-функциональный анализ подобных
«новых» последовательностей генома человека представляется актуальной задачей. Также,
впервые проведен системный анализ транскрипционной активности c11orf72 в различных
тканях человека.
2.4. Научные публикации по итогам диссертационной работы
Научные результаты, полученные в ходе подготовки работы изложены в 4-х статьях в
рецензируемых научных журналах и должены на 2-х конференциях.
2.4.1. Статьи по теме диссертации
1). Baskaev K. nMETR: technique for facile recovery of hypomethylation genomic tags. / K.
Baskaev, A. Garazha, N. Gaifullin, M. V. Suntsova, A. A. Zabolotneva, A. A. Buzdin // Gene – 2012.
– Т. 498 – № 1 – 75–80с.
2). Баскаев К. К. Эволюционно недавние группы генетических мобильных элементов в
геноме человека / К. К. Баскаев, А. А. Буздин // Вавиловский журнал генетики и селекции –
2011. – Т. 15 – № 2 – 313–322с.
3). Баскаев К. К. Эволюционно недавние вставки мобильных элементов и их вклад в
структуру генома человека / К. К. Баскаев, А. А. Буздин // Журнал Общей Биологии – 2012. – Т.
73 – № 1 – 3–20с.
4). Баскаев К. К. Экспериментальный анализ специфичной для человека открытой
рамки считывания c11orf72 / К. К. Баскаев, Р. В. Холоденко, Г. В. Малахова, Н. М. Гайфуллин,
Е. В. Корзенева, М. В. Сунцова, А. А. Буздин // Биоорганическая Химия – 2013. – Т. 39 – № 2 –
151–158с.
2.4.2. Тезисы научных конференций по теме диссертации
1). Баскаев К. К. , Буздин А. А. Новый метод широкомасштабного поиска
гипометилированных последовательностей генома // Международная научная конференция по
10
биоорганической химии, биотехнологии и бионанотехнологии, посвященную 75-летию со дня
рождения академика Ю. А. Овчинникова. Москва, 2009.
2). Баскаев К. К. , Буздин А. А. Новый метод широкомасштабного поиска
гипометилированных последовательностей генома // Фундаментальная наука для
биотехнологии и медицины. Москва, 2010.
11
3. Обзор литературы. «Модифицированные основания в
ДНК»
В настоящем обзоре литературы рассматриваются природные химические
модификации нуклеиновых кислот и их функциональная роль, с акцентом на новую
информацию о модифицированных основаниях в геномной ДНК эукариот.
В ДНК различных организмов, как про-, так и эукариот, были обнаружены
модифицированные и сверхмодифицированные основания, называемые минорными. Впервые
присутствие модифицированного основания (5-метилцитозина) в бактериальном геноме было
выявлено в 1925 году [10]. Позже, в конце 40-х – начале 50-х годов XX века, также было
показано наличие 5-метилцитозина в геномной ДНК эукариотического организма [11].
Модификации, приводящие к образованию минорных оснований происходят энзиматически, то
есть являются естественными для ДНК организма, в отличие от воздействия различных
алкилирующих и гликозилирующих агентов. Заместители модифицированных оснований могут
быть простыми, как например метильные или гидроксильные группы, а могут быть более
крупными, как сахара [8].
Рисунок 1. 1) 5-метилцитозин, 2) N4-метилцитозин и 3) N6-метиладенин
Три вида оснований встречаются в живой природе наиболее часто: 5-метилцитозин,
N6-метиладенин и N4-метилцитозин (Рис. 1), которые образуются путем пострепликативной
модификации ДНК ферментами ДНК-метилтрансферазами [12; 13], другие модифицированные
основания могут включаться в ДНК как пострепликативно, так и корепликативно.
12
3.1. Модифицированные основания в ДНК бактерий и их
вирусов
Бактериальные эпигенетические системы, главным образом основаны на ДНКбелковом взаимодействии и обычно составлены из ДНК-метилазы и белка или белков, с сайтом
связывания, перекрывающимся с таргетной последовательностью метилазы и блокирующими
метилирование. Метилирование же данной последовательности, в свою очередь, может
препятствовать связыванию белка с ДНК. Таким образом, последовательность ДНК, с которой
связывается белок может находиться в одном из двух возможных состояниях: метилированном
или неметилированном [14].
Тогда как наиболее распространенным модифицированным основанием в ДНК высших
эукариот является 5-метилцитозин (5mC), в генетическом материале прокариот обнаруживается
как 5mC, так и другие метилированные основания: N-4-метилцитозин (4mC) и N-6-метиладенин
(N6A). Ниже будут рассмотрены функции минорных оснований прокариот, дан краткий обзор
минорных оснований в ДНК бактериофагов.
3.1.1. Модифицированные основания в ДНК бактерий.
В геноме Escherichia coli содержатся два метилированных основания: 5mC и N6A,
составляя, соответственно, 1 и 2% от общего числа C и A. В ДНК прокариот
модифицированные основания, как 5mC, так и N6A зачастую являются частью системы
рестрикции-модификации, защищающей ДНК клетки-хозяина от ферментов, называемых
эндонуклеазами рестрикции. Феномен рестрикции и модификации впервые был открыт в
начале 1950-х. Было обнаружено, что некоторые штаммы бактерий ингибировали ("restrict",
[15]) размножение вирусов, предварительно выращенных на других штаммах. Эффект был
вызван эндонуклеазами, специфичными к определенной последовательности ДНК с
образованием нескольких дискретных фрагментов ДНК после гидролиза [16]. К настоящему
моменту известно, что эндонуклеазы рестрикции широко распространены среди прокариот [17],
кроме того, эти ферменты нашли чрезвычайно широкое применение в генной инженерии и
ДНК-диагностике[18].
Системы рестрикции-модификации совмещают активности эндодезоксирибонуклеазы
(ENase) и ДНК-метилтрансферазы (MTase). Ферменты взаимодействуют со специфичными
последовательностями ДНК, обычно насчитывающими от четырех до восьми нуклеотидов. Эти
13
последовательности могут быть непрерывными или прерываться, симметричными или
асимметричными, уникальными или вырожденными. Обычно ферменты РМ-систем узнают
двуцепочечную ДНК. Модификации, катализируемые метилтрансферазами, представляют
собой присоединение метильных групп к одному нуклеотиду каждой цепи в узнаваемой
последовательности [19]. Метилтрансферазы, метилирующие цитозин в положение C5
называются эндоциклическими, в отличие от метилтрансфераз экзоциклических,
метилирующих аденин и цитозин в положениях N6 и N4 соответственно [20]. В качестве
донора метильных групп и необходимого кофактора служит S-аденозил-метионин.
Первоначально системы рестрикции/модификации относили к одному из трёх
классических типов – I, II или III. В первом и третьем типе метилазная и эндонуклеазная
активность совмещена в одной полипептидной цепи, а во втором – метилаза и эндонуклеаза –
это два разных полипептида. Эндонуклеазы III типа расщепляют ДНК на удалении от сайта
метилирования, а эндонуклеазы типов I и II, наоборот, расщепляют ее в окрестности сайта
метилирования. Затем, в 2000 году основы номенклатуры РМ-систем были пересмотрены, и
был выделен IV тип систем РМ, эндонуклеазы которого расщепляют модифицированные
(метилированные, гидроксиметилированные и глюкозил-гидроксиметилированные основания)
[17].
Любая чужеродная ДНК, попадающая в бактериальную клетку потенциально опасна и
полностью расщепляется, если только не защищена (см. раздел «Модифицированные основания
в ДНК бактериофагов») или не происходит из бактериальной клетки, имеющей аналогичную
РМ-систему. Потому активность эндонуклеаз рестрикции выше, чем соответствующих им
метилаз. Однако, расщепление неметилированной ДНК – это потенциально смертельное для
бактериальной клетки событие, потому в целях его предотвращения используются различные
системы регуляции, так или иначе «задерживающие» появление в цитоплазме эндонуклеазной
активности. Подробное рассмотрение данных механизмов выходит за рамки данного обзора,
более детальное их описание можно найти в работе [14].
Метилирование бактериальной ДНК не исчерпывается только метилазами систем
рестрикции-модификации. Так, помимо метилтрансфераз, участвующих в системе рестрикциимодификации существуют и т. н. «одиночные» или «орфанные» («orphan») метилтрансферазы,
по всей видимости, ведущие своё происхождение от ферментов систем рестрикциимодификации (РМ), но не имеют «парного» фермента-эндонуклеазы. Эти ферменты
называются Dam, Dcm и CcrM, метилирование которых может происходить как в контексте, так
и вне контекста РМ. Dam и Dcm метилируют, соответственно, аденин в последовательностях
5’-GATC-3’ и второго цитозина в последовательностях 5′-CCWGG-3′, где W – A или T, а CcrM
5’-GANTC-3’, где N – любой нуклеотид [14]. Следует упомянуть, что Dam-метилирование
14
встречаются преимущественно у гамма-протеобактерий и у некоторых археобактерий, тогда
как CcrM распространена среди альфа-протеобактерий [21; 22].
Dam-метилаза E. coli участвует во множестве клеточных процессов – от мистмэтч
репарации до экспрессии генов и контроля сегрегации бактериальных хромосом. Аналоги Dam
обнаружены в Salmonella spp. [23], Haemophilus influenza [24] и других грамотрицательных
бактериях. Dam-метилаза весьма процессивна, так, в клетках кишечной палочки находится
всего по нескольку молекул этого фермента, тогда как в геномной ДНК обнаруживается
примерно 19000 последовательностей GATC последовательностей [25].
Метилирование аденина напрямую влияет на связывание определенных белков с ДНК.
Так, рестриктаза DpnI расщепляет последовательность 5’-GATC-3’ только в том случае, если
аденин в составе данного тетрануклеотида метилирован, но не расщепляет неметилированные
последовательности, тогда как MboI связывается и расщепляет ту же последовательность
только тогда, когда аденин в ее составе неметилирован [26]. Предполагается, что отсутствие
водородной связи между метилированным аденином и тимином позволяет различать
метилированные и неметилированные последовательности (метилированные
последовательности более лабильны, кроме того, метильная группа оказывается в большой
бороздке ДНК и создавать стерические затруднения для связывания белков) как это, например,
показано для рестриктазы EcoRV, которая расщепляет неметилированную последовательность
5′-GATATC-3′, но не расщепляет эту же последовательность с двумя метилированными
аденинами [27]. Другим примером подобного специфичного связывания является компонент
системы мистмэтч-репарации MutH, расщепляющий неметилированную дочернюю цепь в
гемиметилированной последовательности GATC и сама Dam-метилаза, которая с равной
эффективностью связывает как неметилированную, так и гемиметилированную цепь, но быстро
диссоциирует, если таргетная последовательность полностью метилирована [26].
Обычно последовательность 5’-GATC-3’ метилирована в обеих цепях, а
гемиметелированное состояние возникает только в реплицируемой ДНК и существует от
половины до трех минут при выращивании кишечной палочки при 30°C. Таким образом, только
что синтезированная цепь может узнаваться белками системы репарации, так как аденины в ее
составе не являются метилированными. Если же дочерняя цепь метилирована, то она уже не
является субстратом белков системы репарации и ошибки в ее составе не исправляются. Таким
образом, метилирование аденина в составе последовательности 5’-GATC-3’достаточно для
пострепликативной мистмэтч-репарации. Гемиметилированный дуплекс расщепляется
компонентом системы репарации MutH, при этом разрывается связь в неметилированной ДНК
между гуанином и аденином, после чего образуется одноцепочечная брешь, могущая достигать
размера 1 т. п. о. Затем полимераза заполняет разрыв и дуплекс ДНК восстанавливается [28]. В
15
отсутствии Dam фермент MutH не может отличить материнскую цепь от дочерней и с равной
вероятностью расщепляет одну из двух цепей, что может приводить к закреплению мистмэтчей
в качестве мутаций при внесении изменений в материнскую цепь [29].
Экспрессия некоторых генов кишечной палочки, а также инсерции ее вирусов и
траспозонов зависят от метилирования аденина в составе сайтов Dam-метилазы. Например,
штаммы, мутантные по dam гену показывают увеличение частоты инсерций TnlD в 10-20 раз, а
ISlO в 100 раз, а частоту делеций и других геномных перестроек, связанных с TnlO, в 200 раз
или больше. Помимо этого, гемиметилированные GATC-сайты используются транспозонами
для контроля количества инсерций последовательностей IS3, IS10, IS50 и IS903 и
бактериальных траспозонов Tn5, Tn10 и Tn 903 [30-32]. Примером может служить регуляция
транспозиции IS10: в первом случае GATC-сайт расположен внутри -10 модуля промотора гена
транспозазы. Полное метилирование этого сайта затрудняет связывание РНК-полимеразы с
промотором и уменьшает транскрипцию tpn. Второй аналогичный сайт находится около
внутреннего конца IS10 и его полное метилирование полностью блокирует связывание
транспозазы. Следует заметить, что IS10, метилированный по значащей цепи в примерно 330
раз более активен, чем метилированный по незначащей и примерно в 1000 раз более активен,
чем полностью метилированный IS10-элемент. Данный механизм оставляет мобильным
элементам бактерий только небольшой на транспозицию между репликацией и полным
метилированием геномной ДНК [33].
Многие промоторы, содержащие сайты метилирования Dam в области -10 или -35,
показывают различия в экспрессии в штаммах, мутантных по гену dam. Так, уровень 3галактозидазы, при экспрессии фьюжна генов glnS-lacZ в три раза выше в мутантах dam- в
сравнении с диким типом. Напротив, экспрессия гена dnaA уменьшается в штаммах,
содержащих мутацию dam [34].
Несмотря на почти полное метилирование Dam своих сайтов-мишеней, существуют и
важные исключения: (i) в точке начала репликации E. coli oriC, (ii) в промоторе гена dnaA, (iii)
возможно, дополнительные сайты, с которыми связывается белок SeqA, имеющий сродство к
кластерам двух или более гемиметилированных GATC, расположенных на расстоянии одногодвух витков спирали ДНК [35]. OriC содержит кластер из 13 сайтов Dam-метилазы, которые
после присоединения SeqA блокируются им и остаются в гемиметилированном состоянии,
кроме того SeqA предотвращает связывание с точкой начала репликации белка DnaA
(контролирует инициацию репликации). Существуют предположения, что тетрамеры SeqA,
связывающиеся с другими GATC-сайтами может служить в качестве организатора своего рода
хромосомных доменов [36]. Механизм сегрегации реплицированных бактериальных хромосом
включает присоединение последовательности начала репликации к клеточной оболочке и
16
последующему росту мембраны между сайтами присоединения. Используя измерения in vitro
было показано, что гемиметилированный oriC, содержащий 11 сайтов метилирования GATC,
связывается с мембраной E. Coil, однако ни полностью метилированные, ни полностью
деметилированные сайты начала репликации с мембраной не связываются [37]. Таким образом
гемиметилированная последовательность oriC функционирует аналогично центромере, а Damметилирование регулирует событие, происходящее один раз за клеточное поколение.
Некоторые неметилированные GATC-сайты стабильно передаются по наследству в
различных клеточных поколениях. Данный феномен был обозначен как «паттерны
метилирования» и впервые был обнаружен у патогенных штаммов кишечной палочки,
вызывающих пиелонефрит в опероне, кодирующем белки Pap-пиля (pyelonephritis-associated
pilus или pap). Соответствующий сайт, проксимальный по отношению к промотору pap
метилирован в случае фенотипа E. Coil, связанного с уропатогенностью (uropathogenic
Escherichia coli, UPEC), и неметилирован, если бактерия патогенности не проявляет [38].
Неметилированные GATC-сайты зачастую находятся в составе регуляторных
последовательностей, связывающих, к примеру, cAMP-CAP (белок-активатор катаболизма в
комплексе с циклическим AMP) и других регуляторных факторов, и, таким образом,
стимулироваться факторами внешней среды. Так, GATC-сайт, расположенный в регуляторной
области оперона car, контролирующей синтез карбамоилфосфатсинтетазы, защищен от Damметилирования. Данный оперон отвечает за анаболизм аргинина и пиримидина, и, как
оказалось, метилирование указанного сайта связано с недостатком пиримидина. Кроме того,
обнаружено, что факторы CarP и IHF действительно связываются с регуляторной областью
carAB и защищают соответствующий GATC-сайт от метилирвания. Другим примером является
последовательность GATC, находящаяся в позиции -102 по отношению к точке начала
транскрипции гена flhD оперона flh (данный оперон отвечает за синтез бактериального
жгутика). Белковым фактором, защищающим указанный GATC от метилирования является
CAP [39; 40].
Орфанная метилаза CcrM изначально была обнаружена в Caulobacter crescentus и
играет важную роль в регуляции клеточного цикла этой бактерии [41]. CcrM обладает высокой
специфичностью по отношению к гемиметилированной ДНК и обладает высокой
процессивностью [42].Caulobacter crescentus является бактерией с двумя разными видами
клеток: в результате ассиметричного деления образуются «членистые» («stalked») и «роящиеся»
(«swarmer») клетки, которые не способны делиться. Для прохождение клеточного деления
«роящиеся» клетки дифференцируются в «членистые», при этом важным условием репликации
бактериальной хромосомы и деления является полное метилирование сайтов 5’-GANTC-3’
вблизи точки начала репликации Caulobacter (Cori) [43].
17
Значение Dcm-метилирования (несмотря на то, что оно было открыто в начале 70-х
годов прошлого века [44]) остается не до конца проясненным. Как уже было упомянуто выше,
Dcm присоединяет метильную группу ко второму цитозину последовательности 5′-CCWGG-3′,
метилирование различных участков геномной ДНК E. coli является консервативным.
Высокоэффективная жидкостная хроматография, совмещенная с масс-спектрометрией
показала, что в геномной ДНК 162 штаммов кишечной палочки метилировано от 0,86 до 1,3%
всего цитозина. Предполагается, что метилирование цитозина в кишечной палочки может
влиять на транскрипцию [45]. Данная точка зрения подтверждается и другими известными
фактами. Так, ген lexA, имеющий жизненно важное значение для кишечной палочки и
принимающий участие в ответе на повреждение ДНК, содержит в составе своего промотора
сайт узнавания Dcm, однако же изменение уровня экспрессии гена lexA при изменении
количества Dcm-метилазы в клетке не показано [46]. Это и подобные наблюдения были
проверены путем анализа 1864 промоторов в полностью секвенированном геноме штамма E.
coli K-12 MG1655, во многих случаях они оказались ассоциированы с последовательностью 5′CCWGG-3′. При этом почти 200 промоторов несли в своем составе один сайт узнавания Dcm,
семнадцать – две таких последовательности, а два – три последовательности, причём
распределение сайтов узнавания отличалось от случайного. Промоторы, в которых находились
последовательности, чаще всего относились к генам, ответственным за клеточный транспорт и
метаболизм аминокислот, трансляцию и транскрипцию. Помимо этого, авторами было
показано, что в стационарной фазе транскрипция генов рибосомальных субъединиц rplC и rpsJ
снижается в присутствии Dcm, а в их составе наличествуют сразу три последовательности,
являющиеся сайтами метилирования указанной метилазы. Со ссылкой на неопубликованные
данные, авторы [45] заявляют об усилении транскрипции данных генов в присутствии
ингибитора метилирования 5-азацитидина. Таким образом, можно считать, что Dcmметилирование цитозина служит для «тонкой настройки» синтеза белка в стационарной фазе
роста.
Наличие гена dcm не является жизненно необходимым: штаммы E. coli с
делетированным, иным образом поврежденным или полностью удаленным dcm,
жизнеспособны, как, например, штамм E. coli B, который используется для изучения некоторых
нечетных фагов [47]. Некоторые сайты узнавания Dcm-метилазы остаются неметилированными
даже в dcm+ штаммах кишечной палочки, что может быть связанно с особенностями топологии
ДНК в этих областях. 5’-метилцитозин имеет тенденцию спонтанно дезаминироваться до
тимина. Потому положение гена dcm, в составе оперона с геном vsr, продукт которого
необходим для репарации T-G мистмэтчей, уравновешивает мутагенный потенциал 5mC. Ген
vsr лежит ниже гена dcm и имеет с ним общие 7 кодонов. Есть основания полагать, что Dcm
18
необходим для удаления таких мистмэтчей, но в литературе пока не предложено механизмов их
взаимодействия (название гена vsr и соответствующего продукта Vcr является аббревиатурой,
расшифровывающейся как «мистмэтч-репарация коротких фрагментов» или «very short patch
repair»). Последовательности, которые метилирует Dcm, являются «горячими точками
мутагенеза» [48]. Показано, что потеря плазмиды с геном метилтрансферазы и
соответствующей ей рестриктазы EcoRII чаще происходит в штаммах dcm+, чем в dcm- [49].
Кроме 5mC в генетическом материале прокариот обнаруживается N4-метилцитозин
(m4C). В отличие от 5mC, 4mC не подвергается спонтанному дезаминированию, что может
объяснять его преимущественное присутствие в геноме термофильных бактерий [12]. N4метилцитозин обнаружен только у прокариот [9], где, как и 5-метилцитозин, является
компонентом системы рестрикции-модификации [50; 51].
3.1.2. Модифицированные основания в ДНК бактериофагов
Рассматривая модифицированные основания, включенные в ДНК вириусов, следует
отметить тот факт, что первое сверхмодифицированное основание ДНК, 5гидроксиметилцитозин (hmC), было обнаружено в ДНК бактериофага [52].
На протяжении длительного времени считалось, что бактерии и их бактериофаги
коэволюционировали, осуществляя своего рода «гонку вооружений» [53]. Примером такой
коэволюции может служить противостояние фагов и защитных механизмов клетки-хозяина.
«Исключение» фагов (phage exclusion) может происходить различными путями, в том числе с
помощью механизма рестрикции-модификации, позволяющем деградировать фаговую ДНК и
не требующим смерти бактериальной клекти [17]. Чтобы избежать воздействия системы
рестрикции-модификации Т-четные фаги Myoviridae защищают свою ДНК с помощью
различных модификаций. Генетический материал данных фагов может содержит
метилированный аденин, а цитозин полностью замещается на гидроксиметилцитозин (hmC),
который, в свою очередь, может подвергаться дальнейшей модификации с образованием
глюкозилированного гидроксиметилцитозина (glc-hmC) [54]. Тем не менее, в штамме E. coli
CT596 были обнаружены гены gmrS и gmrD, продукты которых GmrS (36 kDa) и GmrD (27
KDa), образуют комплекс GMR, являющийся эндонуклеазой IV типа, специфично
расщепляющую ДНК различных фагов (T4, T2, T6), содержащую глюкозилированный
гидроксиметилцитозин. Показано, что GMR деградирует как α–glu-HMC T4, так и β–glu-HMC,
содержащиеся в ДНК фага T4 с образованием фрагментов около 4 т. п. о. При этом деградации
генетического материала, содержащего немодифицированный цитозин или
19
негликозилированный гидроксиметилцитозин не наблюдается. Активность данного фермента
стимулируется кальцием и требует трифосфонуклеотидов, предпочтительно UTP и подавляется
фаговым белком IPI (Internal Protein I), образующим своего рода очередную линию защиты
против системы рестрикции клетки-хозяина [55].
Другая модификация ДНК, защищающая генетический материал фагов против нуклеаз
хозяина – карбомоилметиладенин, продукт действия фермента, кодированного геном mom фага
Mu из E. coli. Фермент конвертирует остатки A в консенсусной последовательности
C/GAG/CNPy в карбамоилметиладенин [56]. Такая модификация предотвращает деградацию
фаговой ДНК многими эндонуклеазами рестрикции и мутанты Mu, дефектные по гену mom
проявляют эффективность в образовании бляшек в 104 - 105 ниже, чем фаги дикого типа [57].
Некоторые модифицированные основания несут дополнительные гексозные заместители, как
это было показано для Т-четных фагов E. coli и в фаге Bacillus subtilis SP15 [58; 59].
В фагах B. subtilis Hi, 4e, 2C, SPO1, SP82G, 425, и SP8, тимин полностью замещен на
гидроксиметилуридин [60]. Эта модификация производится из предшественника dUMP, в свою
очередь производящимся из dCMP ферментом dCMP дезаминазой, а dUMP конвертируется в
гидроксиметилуридинмонофосфат фаговым ферментом dUMP-гидроксиметилазой, с
последующим фосфорилированием дезоксинуклеотиддифосфаткиназами хозяина.
Образовавшийся таким образом гидроксиметилуридинтрифосфат (НОМеUTP) включается в
ДНК как субстрат ДНК-полимеразы. Эта корепликативная модификация в ДНК фагов B. Subtilis
может защищать ДНК фага от нуклеаз хозяина, например от BsuR, причем, в некоторых
случаях, даже если они связываются со своими специфичными сайтами [61].
Гидроксиметилуридин и его гликозилированная форма, glc-HOMeC могут быть
сигналами транскрипции средних и/или поздних генов фага. Ранние гены транскрибируются
немодифицированной РНК-полимеразой хозяина, ферментом, на который не влияют
модифицированные основания в ДНК. Таким образом, эти модификации могут служить
регуляторами транскрипции определенных генов в поздней фазе инфекционного цикла.
Присутствие 5hmU и его гликозилированной формы не является строго необходимым [62].
Пиримидин α-путресцинилтимин (α-putT) замещает 50% остатков T в фаге Pseudomonas
acidovorans W14 [63] и включается в ДНК корепликационно. Присутствие α-putT облегчает
упаковку ДНК в головку фага [64].
Некоторые бактериофаги (T4, Mx8) и вирусы архей (φCh1 and SNDV) [65-67] кодируют
Dam-метилазу, а фаг H2 иммунен к системе рестрикции-модификации BamHI клетки-хозяина,
так как кодирует метилтрансферазу с такой же специфичностью. Некоторые фаги (например,
φ3T, pII и SPR) кодируют необычные метилтрансферазы [68-70].
20
3.2. Модифицированные основания в геноме эукариот
Наиболее распространенной модификацией оснований в геноме высших
эукариотических организмов является модификация цитозина, 5mC. Данная модификация
является одной из наиболее изученных и была обнаружена во всех четырех царствах эукариот.
Так, у позвоночных цитозин метилируется главным образом в составе CpGдинуклеотидов, у растений в последовательностях CpG, CpHpG и CpHpH, где H – любое
основание, кроме гуанина, у грибов метилированный цитозин главным образом обнаружен в
составе CpG-динуклеотидов. У низших эукариот в составе генома обнаружены
гипермодифицированные основания, кроме того, в ДНК прокариот и растений обнаружен 6mA.
Ниже будут более подробно рассмотрены упомянутые модификации оснований в геномах
эукариот.
3.2.1. Метилированные основания в геноме высших эукариот
Степень метилирования и распространение метилированных оснований по геному
среди животных сильно варьируют. Так, у модельного организма нематоды Caenorhabditis
elegans в составе ДНК 5mC не детектируется, кроме того, червь не несет в своём геноме
аналогов каких-либо метилтрасфераз. Другой модельный организм, плодовая мушка Drosophila
melanogaster, имеет в своём составе ген-аналог метилтрансферазы и её ДНК содержит 5mC, но
его содержание относительно невелико, а происходит оно в контексте CpT, а не CpG, как у
большинства животных [71; 72]. Большинство изученных геномов беспозвоночных умеренно
метилированы в контексте CpG-динуклеотидов, с большими областями метилированной ДНК,
разделенной такими же большими областями неметилированной [73]. У позвоночных
животных 5mC в составе динуклеотидов CpG широко и относительно равномерно
распространены по геномной ДНК [74; 75].
У млекопитающих метилирование ДНК происходит почти исключительно по CG
динуклеотидам (принято обозначение CpG, где C – это цитозин связанный фосфодиэфирной
связью p с гуанином G), большинство динуклеотидов CpG в геномной ДНК метилированы [76;
77]. CNG, CC(a/t)GG, CA и CT быть метилированы, правда данное событие происходит с очень
низкой частотой [78-80]. Так, CNG и CNN метилрование показно для ранних стадий в
мышином эмбрионе [81] и эмбриональных стволовых (ES) клетках и почти прекращается в
соматических клетках [82]. CpG – метилирование у эукариот участвует в большом количестве
21
клеточных функций, включая тканеспецифическую экспрессию генов, клеточную
дифференциацию, геномный импринтинг, инактивацию Х хромосомы, регуляцию структуры
хроматина и такие патологии, как канцерогенез и старение [77]. Метилирование динуклеотидов
CpG необходимо для нормального развития организма [92,93], и необходимо для выживания
дифференцированной клетки [94]. CG-динуклеотиды сконцентрированы в геноме в составе так
называемых CpG-островков, которые характеризуются повышенным содержанием цитозина и
гуанина и повышенной частотой динуклеотидов CpG [77; 83]. Данные образования составляют
примерно 0,7% человеческого генома (по длине), но содержат 7% всех CG динуклеотидов [84].
CpG-островками называются последовательности длиной не менее 200 п. о. (часто больше 500
п. о. ), в которых содержание C и G составляет более половины всех нуклеотидов, а отношение
наблюдаемой частоты CpG-динуклеотидов к ожидаемой равно хотя бы 0,6 [85]. Такое
определение было сделано в 1989 году, т. е. еще до наступления постгеномной эры, и может
включать в себя не только СpG-богатые 5’-регионы генов, но и некоторые межгенные участки
(например, Alu-элементы), поэтому в работе [86] на основе анализа полного сиквенса хромосом
21 и 22 было предложено другое определение, исключающее такие последовательности.
Авторы называют CpG-островками последовательности более 500 п. о. длиной в которых
содержание гуанина и цитозина составляет по крайней мере 55%, а отношение ожидаемой
частоты динуклеотидов CpG к наблюдаемой 0,65. Cледует отметить, что лучшим способом
идентификации CpG-островка является экспериментальный, а не биоинформатический.
Показано, что примерно 60% промоторов человеческих генов находятся в тесной
близости с CpG-островками и, хотя большая часть CpG в их составе неметилирована, для
некоторых CpG-островков показано тканеспецифическое метилирование, например, в процессе
развития организма [77]. Следует отметить, что транскрипция некоторых генов, в промоторах
которых нет CpG-островков, коррелирует со статусом метилирования областей, прилежащих к
промторной. В качестве примеров можно привести гены Oct-4 и Nanog, которые имеют в
составе своих промоторов метилированные области, но не имеют CpG-островка и ген
интерлейкина-3, тканеспецифическая транскрипция которого связана с деметилированием
соответствующих последовательностей (в его промоторе нет CpG-островка) [87-89].
Большинство CpG-островков в геноме являются неметилированными на всех стадиях во всех
тканях, из этого следует тот факт, что ген может «молчать» даже если его CpG-островок
неметилирован, как это показано, например, для тканеспецифичных человеческих генов αглобина и α-2(1)-коллагена [90]. Предполагается, что связывание каких-либо регуляторных
белков с CpG-островком может защищать его от метилирования de novo, путем стерического
исключения соответствующих метилаз. Существуют белки, связывающие неметилированные
CpG и, таким образом, наиболее подходящие на эту роль [91-93].
22
В соматических клетках человека метилировано около 1% всего цитозина, т. е. 60-70%
всех CpG в геноме [94]. Хотя уровень метилирования генома сперматозоида и яйцеклетки
сравним с таковым в соматических клетках организма, но его паттерны отличаются от таковых
в соматических клетках [95]. В раннем развитии млекопитающих отцовский геном активно
деметилируется. Данный процесс происходит сразу после протамин-гистонного обмена в
мужском пронуклеусе (Рис. 2). Деметилирование отцовского генома обнаружено у различных
млекопитающих: человека, домашней свиньи, коровы, лабораторной крысы и мыши [96].
Согласно данным по флуоресцентной иммуноперципитации хроматина, деметилирование
происходит в масштабах всего отцовского генома, однако более детальные исследования ДНК,
подвергающейся бисульфитной конверсии показывают, что отдельные участки геномной ДНК
защищены от деметилирования. Так, области, контролирующие импринтинг,
интрацистернальные подобные ретровирусам мобильные элементы, центромерные и
теломерные сателлитные ДНК остаются метилированными все время, что может быть важно
для поддержания стабильности хромосом и подавления транскрпиции импринтированных
генов [97]. Деметилирование на этом этапе, согласно последним данным, осуществляется за
счет конверсии метилциозина в гидроксиметилцитозин белками семейства Tet в мужском
пронуклеосе с последующим «пассивным» истощением общего содержания
гидроксиметилированного цитозина в процессе репликации ДНК (подробно обсуждается в
разделе «Гипермодифицированные основания в геноме млекопитающих» [98]. Тогда как
«отцовская» ДНК быстро теряет метильные метки и сохраняет низкий уровень метилирования,
изначально высокий уровень метилирования материнского генома снижается постепенно, по
пассивному механизму, следующему из полуконсервативного способа репликации ДНК (Рис.
2). Показано, что «материнскую» часть генома в целом (как и некоторые импринтированные
гены в частности) защищает от метилирования белок PGC7/Stella, сохраняя его даже после
слияния пронуклеусов [99].
Процесс деметилирования в масштабах всего генома обнаружен в эмбриональных
половых клетках, которые под воздействием сигналов из висцеральной эндодермы и
экстраэмбриональной эктодермы начинают движение к зачатку гонады из задней эктодермы
зародыша. Если в начале своего движения (E8.5) в их геноме возможны эпигенетические
«метки» (по аналогии с другими клетками эпибласта), то к концу своего движения данные
метки полностью «стираются» (показано для эмбриона мыши) [100].
23
Рисунок 2. Независимое от репликации метилирование ДНК мужского пронуклеуса на
стадии фертилизации и снижение уровня метилцитозина в «женском» пронуклеусе по
пассивному механизму. Обозначен момент метилирования установления новых областей
метилирования de novo. Транскрипция гена Tet3 обозначена красной линией [101].
Кроме этого, активное деметилирование, не связанное с репликацией ДНК происходит
в ответ на определенные сигналы в определенных локусах. Так, процесс активного
деметилирования и последующей экспрессии ранее репрессированных локусов показан для
гена интерлейкина-2 в активированных Т-лимфоцитах и для промотора гена BDNF в ответ на
деполяризацию мембраны KCl в нейронах головного мозга [88; 102].
Уровень метилирования начинает быстро расти на стадии бластоцисты (Рис. 2),
различные метилированные области появляются уже во внутренней клеточной массе (inner cell
mass, ICM) и трофэктодерме, в пределе достигая уровня, который можно обнаружить у
взрослых. В фазе дробления общий уровень метилирования падает на 30% в сравнении с
соматическими клетками, после чего происходит т. н метилирование генома de novo,
восстанавливающее степень метилирования ДНК ко времени имплантации. Такое же, но менее
значительное падение уровня метилирования происходит у Xenopus laevis, а у Danio rerio
(популярный модельный организм, рыба семейства карповых, в англоязычной литературе
известна как zebrafish) подобного снижения не происходит вообще [103]. Данные различия
могут отражать особенности роли метилирования цитозина в различных видах позвоночных.
Метилирование de novo происходит и в соматических клетках взрослого организма. У
значительной части CpG-островков уровень метилирования возрастает в процессе старения или
24
при различных геномных аномалиях, таких, как рак, подобный же процесс наблюдается и в
иммортализированных клеточных линиях [104-106]. Некоторые из CpG-островков становятся
метилированными в процессе развития организма и, если данное явление наблюдается, то
соответствующий ген не экспрессируется. Метилированные в процессе развития CpG-островки
включены в такие процессы, как геномный импринтинг и инактивация X-хромосомы. В
клетках-предшественниках сперматозоидов метилирование de novo происходит примерно на
14-20й день после оплодотворения, а в предшественниках яйцеклеток на 5й день после родов
[95].
В дополнение к координированным изменениям в течении нормального развития, ДНК
метилом подвергается определенным изменениям при патологии, например, раке. Изменения
включают в себя потерю метилирования в масштабах всего генома и ненормальное
метилирование некоторых локусов. Промоторы генов-супрессоров опухолеобразования
подвергаются метилированию, которое обычно приводит к их «умолканию» [107].
В норме статус метилирования ДНК сохраняется с помощью поддерживающего
метилирования. Согласно общепринятой точке зрения, данный процесс осуществляется
специальным ферментом, «поддерживающей» метилазой Dnmt1, которая имеет большее
сродство к тем неметилированным динуклеотидам CpG дочерней цепи, напротив которых
находятся метилированные динуклеотиды в родительской цепи, таким образом однажды
установленный «шаблон» метилированной ДНК сохраняется в последующих клеточных
поколениях. Соответственно, распространенная точка зрения состоит в том, что клетка
экспрессирует вначале de novo метилазы Dnmt3a и Dnmt3b, а затем поддерживает
получающийся рисунок метилирования [108]. Тем не менее, эксперименты с искусственно
синтезированной ДНК показали низкую точность такого процесса: после многих клеточных
поколений паттерны метилирования введенной в клетки плазмиды сохранялись, но для каждого
отдельного CpG динуклеотида вероятность сохранить свой статус метилирования после одного
деления клетки составляла 5% [109]. Данные подтверждены для индивидуального гена, Fmr1 и
это означает, что у клеток одного клона в культуре паттерны метилирования не совпадают, что
свидетельствует о наличии дополнительного механизма, поддерживающего цитозин
метилированным [110].
Метилированное основание цитозина может содействовать или препятствовать
присоединению регуляторных белков. В первом случае метильная метка может быть
«прочитана» семейством белков, связывающих метилированные CpG и являющихся
медиаторами репрессии транскрипции через взаимодействие с деацетилазами гистонов [77].
Метилирование может вытеснять ДНК-связывающие белки с их сайтов связывания [111].
Существуют два механизма подавления транскрпции генов путем метилирования их
25
промоторов. Первый предполагает прямое влияние метильной группы цитозина, находящейся в
большой бороздке ДНК, на связывание определнных белков. Примером такого нарушения
взаимодействия между ДНК и регуляторным белком может служить взаимодействие белка
CTCF с границами транскрибируемого домена гена H19. Данный белок предотвращает
активацию гена его энхансером, но, в случае метилирования сайта связывания CTCF, энхансер
может активировать H19, так как CTCF не может связаться со своим сайтом [112; 113]. Второй
предполагает специфичное связывание определенных белков с метилированными
последовательностями. В настоящий момент обнаружено семейство белков, связываюие
последовательности, имеющие в своём составе метилированные CpG: MBD1, MBD2, MBD3,
MeCP2 (являющиеся метил-зависимыми репрессорами транскрипции) и Kaiso, для которого
показно взаимодействие с последовательностью 5′-m5CGm5CG-3’ in vitro, и способность
блокировать транскрипцию в искусственных генетических системах [114; 115].
Метилирование ДНК приводит к ограничению экспрессии генов мобильных элементов
и блокирует их траспозицию. Последовательности мобильных элементов, относящихся к
классам LINE и SINE в геноме человека сильно метилированы и транскрипция с их промоторов
подавлена [80; 116]. Эмбриональные стволовые клетки мыши в норме подавляют транспозицию
элементов IAP, но в случае отсутствия в клетках Dnmt1 таковая значительно возрастает [117].
Наиболее распространенные в человеческом геноме мобильные элементы Alu (относятся к
SINE), насчитывающие несколько сотен тысяч копий, из которых менее 1% способна к
транспозиции, причём многие элементы содержат в своём составе функциональные промоторы.
Данные промоторы, как правило, метилированы и хотя транскрипция с этих промоторов может
происходить вследствие различных стрессов и без деметилирования, искусственное
деметилирование усиливает транскрпипцию с этих промоторов [116; 118].
3.2.2. Импринтинг и инактивация Х-хромосомы
В диплоидных организмах каждая из соматических клеток получает по две копии
каждого гена. Обычно оба полученных аллеля транскрибируются одновременно, но некоторые
гены (от 1 до 2%) являются импринтированными, т. е. экспрессируется только один аллель.
Импринтированные гены, в отличие от не импринтированных, экспрессируются в зависимости
от источника аллеля (получен от матери или отца). Способность гена к транскрипции
программируется эпигенетически, с помощью некодирующих РНК, посттрансляционных
модификаций гистонов или метилирования. Так, были обнаружены дифференциально
метилированные регионы (differentially methylated regions, DMRs), статус метилирования
26
которых различается в аллелях, полученных от отца и матери. Подобные участки обнаружены
как у одиночных генов, подверженных импринтингу, так и у находящихся в составе кластеров,
транскрипцией которых управляют специальные области области, контролирующие
импринтинг (imprinting control regions, ICR). DMR метилируются в стволовых клетках по
механизму de novo и либо поддерживаются в процессе всего индивидуального развития
организма (первичные DMR), либо устанавливаются на определенном этапе развития
впоследствии импринтированной экспрессии генов (вторичные DMR) [119]. Многие первичные
DMR являются и ICR, что подтверждается экспериментами по делетированию этих участков:
при потере DMR меняется состояние импринтированности аллелей [120]. В данном случае
«метильная метка» служит как удобный регулятор, управляющий транскрипцией: она является
наследуемой и специфичной и может быть удалена в процессе созревания половых клеток, что
логично для отражения пола индивидуума с помощью импринтинга в момент разненсения
каждого аллеля в отдельный компартмент (половую клетку) [121]. Однажды установленное в
стволовой клетке импринтированное состояние аллеля должно поддерживаться в исходном
состоянии после оплодотворения, когда геном подвергается эпигенетическому
репрограммированию, включающему в себя деметилирование (Рис. 3). Метилированные
области, отвечающие за импринтинг должны сохраняться в процессе превращение
метилцитозина в гидроксиметилцитозин и могут поддерживаться небольшими количествами
метилазы Dnmt1, присутствующими в эмбрионе перед стадией имплантации [122].
Рисунок 3. Репрограммирование областей метилирования в течении эмбрионального
развития и после рождения. Указаны временные рамки «стирания» метилирования в половых
стволовых клетках [121].
Метилирование цитозина является важным элементом механизма подавления
транскрипции импринтированных генов. Первая – это т. н. «инсуляторная» модель
импринтинга, в качестве примера которой можно привести уже упомянутый ген H19 и Igf2,
находящихся в импринтированном локусе H19/Igf2. Ген H19 экспрессируется в случае
27
наследования от матери, а ген Igf2 экспрессируется в случае наследования от отца. Оба
активируются энхансером и их реципрокный импринтинг находится под контролем инсулятора,
находящегося между этих двух генов и несущего сайт связывания белка CTCF. В аллеле,
полученном от матери, CTCF связывается со своим сайтом внутри ICR и предотвращает
взаимодействие Igf2 с энхансером, находящимся на стороне гена H19. В «отцовском» аллеле
для предотвращения транскрипции H19 требуется метилирование его промотора, а
метилирование ICR предотвращает связывание CTCF и позволяет энхансеру активировать ген
Igf2 (Рис. 4a).
Другой механизм импринтига связан с использованием длинных некодирующих РНК,
которые транскрибируются с генов, дифференциально метилированые промоторы которых
находятся в составе ICR. В случае, если промотор неметилирован, то происходит транскрипция
и РНК репрессирует транскрипцию цис-связанных генов. В случае же метилированного ICR (а,
значит, и промотора) транскрипция регулятора не происходит и экспрессию генов ничего не
нарушает. В качестве примера можно привести ген Igf2r, у которого экспрессируется только
материнская копия. «Отцовская» копия данного гена репрессируется некодирующей РНК Airn.
Данная РНК репрессирует отцовскую копию Igf2r повсеметсно, а близлижащие гены Slc22a2 и
Slc22a3 в плаценте (Рис. 4b) [123].
У млекопитающих метилирование цитозина играет важную роль в инактивации второй
X-хромосомы у самок. Инактивация Х-хромосомы – процесс, позволяющий уравновесить
транскрипцию сцепленных с Х-хромосомой генов в обоих полах. Одна из Х-хромосом
избирается не отвечающей на инактивационные сигналы, а затем происходит инактивация
оставшейся Х-хромосомы, начинающаяся в центре инактивации Xic (X inactivation center) [124;
125]. Изучение процесса инактивации у мышей показало, что инактивация запускается
некодирующей РНК гена Xist и регулируется некоторыми другими некодирующими РНК.
Продукт транскрипции Xist покрывает хромосому, с которой он транскрибируется и привлекает
различные факторы, способствующие переходу Х-хромосомы в молчащее состояние [126; 127].
Неактивная Х-хромосома обладает свойствами конститутивного гетерохроматина:
поддерживается в конденсированном состоянии в интерфазе [128], поздней репликацией ДНК
[129], сниженным количеством ацетилированных гистонов [130] и повышенным уровнем
метилирования, в частности, CpG-островков генов, но в активной X-хромосоме
соответствующие CpG-островки метилированы слабо [131; 132].
28
Рисунок 4. Два пути регуляции импринтинга, оба зависят от метилирования
регуляторных участков, статус метилирования «материнских» последовательностей показан
сверху, статус метилирования мужских - снизу, закрашенные кружки обозначают
метилированные последовательности, не закрашенные – деметилированные. a. «Инсуляторная»
модель импринтинга на примере локуса H19/Igf2, метилирование промотора Igf2, обозначено
закрашенными ромбами, ICR обозначен зеленым прямоугольником, а DMR в его составе –
красными линиями, энхансер обозначен двумя закрашенными овалами, его влияние на
соотвествующие локусы обозначено стрелками b. Механизм импринтинга, использующий
некодирующие РНК на примере Igf2r. ICR обозначен зеленым прямоугольником, регуляторное
воздействие некодирующей РНК Airn обозначено внизу в виде стрелок с горизонтальной
линией на концах [121].
Несмотря на то, что случайная инактивация Х-хромосомы происходит у мутантных
мышей с делетированным геном Dnmt1, в дальнейшем развитии эмбриона неактивная Xхромосома активируется. Таким образом, метилирование цитозина у млекопитающих
вовлечено в поддержание неактивного состояния инактивированной X-хромосомы[144]. В
процессе инактивации X-хромосомы 5’-область гена Xist в активной хромосоме и его CpGостровок в неактивной хромосоме метилируется по механизму de novo, кроме этого как в
активной, так и в неактивной хромосоме транскрипция Xist подавлена вследствие тотального
метитилирования соответсвующих областей [133; 134].
3.2.3. Гипермодифицированные основания в геноме млекопитающих
Несмотря на то, что долгое время в геномной ДНК млекопитающих не было
обнаружено других модифицированных оснований, кроме 5-метилцитозина, последние
29
исследования показали возможность дальнейшего окисления 5mC до 5-гидроксиметилцитозина
(5hmC), 5-карбоксилцитозина (5caC) и 5-формилцитозина (5fC) [135].
Так, 5-гидроксиметилцитозин недавно (2009 г. ) обнаружен в геномной ДНК
эмбриональных стволовых клеток мыши, а его уровень уменьшается с истощением пула мРНК
гена Tet1 при РНК-интерференции [136]. hmC присутствует в ДНК клеток головного мозга
мыши, в частности в клетках Пуркинье и гранулярных клетках, составляя 0,6 и 0,2% от всех
нуклеотидов, соответственно, но не присутствует в раковых клеточных линиях происходящих
из человека и мыши [137].
Положение 5hmC в геномной ДНК фронтального отдела человеческого мозга,
картированное на последовательность генома, показало, что содержание 5hmC больше в
промоторных областях генов, чем в межгенном пространстве. Можно отметить, что
повышенное или среднее содержание гидроксиметилцитозина не связано с «умолканием» гена.
Так, наличие большого количества 5mC в ДНК мозга в промоторах генов, специфичных для
яичек связано с блокировкой транскрипции, а в последовательностях этих генов 5hmC не
обнаруживается [138].
В человеческом и мышином геноме обнаружены гомологи белков трипаносомы JBP1 и
JBP2, окисляющих метильную группу тимина в пятом положении. Один из гомологов, белок
Tet1, является 2-оксиглутаро- и Fe(II)-зависимым и катализирует конверсию 5mC в hmC в
клеточных культурах и in vitro [139]. Интересен тот факт, что ген семейства Tet, TET1, как
следует из его названия (Ten-eleven translocation) ранее рассматривался в контексте геномных
перестроек при острой миелоидной лейкемии и носил название LCX (leukemia-associated protein
with a CXXC domain) [140].
В настоящий момент найдены еще 2 белка из этого семейства со сходной активностью,
кроме этого данные белки могут не только окислять 5mC до 5hmC, но и катализировать
последовательные реакции превращения 5hmC в 5fC и далее в 5caC [135]. Предположение о
том, что данные реакции могут использоваться для активного деметилирования ДНК было
сделано на основе аналогии с конверсией урацила в тимин у растений. Показана конверсия
5hmC до формил- и карбамоилцитозина in vitro и доказали его присутствие в ДНК с помощью
двумерной тонкослойной хроматографии и масс-спектрометрии, показали наличие этих
гипермодифицированных оснований в эмбриональных стволовых клетках мыши в количестве
1.3×103 5hmC, 20 5fC и 3 5caC на каждый миллион цитозинов в геномной ДНК [141].
Как уже говорилось выше, помимо ферментативной конверсии 5mC в hmC, белки
семейства Tet конвертируют 5mC в 5caC и 5fC, однако биологическое значение данных
гипермодификаций цитозина (помимо деметилирования геномной ДНК) остается неясным: так,
показано, что изменение содержания 5hmC, 5caC и 5fC в геномной ДНК эмбриона мыши не
30
оказывает влияния на подвижность целого набора различных мобильных элементов, таких как
LINE-1 (семейство LINE), Alu/B1 (семейство SINE), ERV1 (ретротранспозон LTR, класс I), IAP
(ретротранспозон LTR, класс II), ERVL (LTR ретротранспозон класс III) и ORR1 (LTR
ретротранспозон, семейство MaLR) [101; 142].
Отмечается, что метилсвязывающие белки, например, MeCP2 (methyl-CpG-binding
protein 2) не узнает гидроксиметилированные последовательности, что может приводить к
транскрпиции ранее «молчащего» гена. Показано in vitro, что определенные домены белка
Uhrf1, являющегося ключевым фактором поддержки метилированного состояния ДНК, узнают
и связывают не только гемиметилированные, но и полностью и гемигидроксиметилированные
последовательности, таким образом гидроксиметилцитозин может прямо влиять на ремоделинг
хроматина путем прямого привлечения специфических ДНК-связывающих белков [143; 144].
Производные окисления метилцитозина (5hmC, 5fC и 5caC), могут служить
субстратами для деаминаз и гликозилаз (Рис. 4). Так, показано, что тимин-ДНК-гликозилаза
TDG может быстро удалять как формилцитозин, так и карбамоилцитозин в контексте CpGсайтов, а скорость удаления формилцитозина из пары G-5fC происходит даже быстрее, чем из
пары G-T, возможно вследствие ослабления N-гликозидной связи между основанием и сахаром,
кроме этого TDG игнорирует гидроксиметилцитозин [145]. Высокая активность гликозилаз
может объяснять низкое содержание 5fC и 5caC в геномной ДНК [141]. Предположение об
участии TDG в процессе активного деметилирования подтверждаются тем, что мутантные
эмбрионы мыши, несущие делеции данного гена являются летальными и проявляют аномально
высокий уровень метилирования в целом наборе промоторов генов [146; 147]. Таким образом,
данные предположения позволяют построить модель механизма активного деметилирования
ДНК, начинающегося с окисления 5mC до 5hmC и последующим использованием механизмов
репарации BER (base excision repair) для восстановления последовательности ДНК. Важно
отметить, что несмотря на увеличение количества 5caC при делеции TDG его суммарное
содержание остается ниже, чем содержание 5fC. Поскольку показана высокая эффективность
Tet2 в превращении 5fC в 5caC, можно предположить наличие каких-либо еще белков,
участвующих в процессинге 5caC [148].
Предложена и другая модель активного деметилирования, предполагающая
дезаминирование 5hmC комплексом AID/APOBEC (activation-induced deaminase/apolipoprotein B
mRNA-editing enzyme complex) с образованием 5-гидроксиметилурацила (5hmU) и
последующим его удалением гликозилазами и исправлением получившегося апуринапиримидинового сайта с помощью BER. Предположения о существовании такого механизма
подтверждаются способностью гликозилаз, таких как TDG и SMUG1, к удалению
гидроксиметилурацила из пар 5hmU-G, их низкая активность в отношении 5hmC и прямое
31
взаимодействие TDG и AID, показанное в исследованиях на человеческой клеточной линии
HEK293, (Рис. 5) [147]. В последних исследования показано, что AID может действовать в паре
с Tet1 при деметилировании двуцепочечной ДНК. Котрансфекция клеток HEK293 плазмидами,
несущими различные деаминазы AID/APOBEC-комплекса с линеаризованной ДНК,
содержащей 5mC или 5hmC приводила к специфичному деметилированию ДНК, содержащей
5hmC, но активности в отношении дуплекса, содержащего 5mC активность не наблюдалась.
Следует отметить, что 5hmU, являющегося предполагаемым интермедиатом в данном
гипотетическом механизме, не обнаруживается в геномной ДНК млекопитающих, что может
означать либо низкую активность этого пути деметилирования, либо чрезвычайно короткий
срок жизни интермедиата [149; 150].
Оба этих механизма могут приводить к нестабильности генома, так как требуют
участия системы репарации, кроме того, для такого процесса, как репарация мистмэтчей в
масштабе всего генома может быть недостаточно временного окна после фертилизации или при
миграции половых стволовых клеток.
Рисунок 5. Возможные механизмы деметилирования ДНК с помощью белков
семейства Tet. 5mC образуется в ДНК под действием ДНК метилтрансфераз (Dnmt), затем
может гидроксилироваться белками Tet с образованием 5hmC, который далее окисляется до 5fC
и 5caC, 5hmC может дезаминироваться с образованием 5hmU деаминазами AID/APOBECC.
5hmU, 5fC и 5caC удаляются из геномной ДНК гликозилазами (например, TDG). Прямая
конверсия 5caC в цитозин осуществляется гипотетической декарбоксилазой [101].
Еще одной моделью деметилирования, лишенной вышеозначенных недостатков,
является превращение 5hmC в C дегидроксиметилазной активностью de novo метилаз Dnmt3a и
Dnmt3b. Дегидроксиметилазная активность этих ферментов была показана in vitro, при этом
поддерижвающия метилаза Dnmt1 таковой активности не проявляла [151]. Исследование было
произведено на клеточной линии 293T, которую трансформировали плазмидами, несущими
соответствующие гены. При экспрессии трансфецированного гена Tet1 цитозин в составе ДНК-
32
субстрата конвертировался в гидроксиметилцитозин на 75%, а при экспрессии гена Dnmt3a 53%
гидроксиметилцитозина, содержащегося в субстрате, превращались в цитозин. Данная реакция
не требовала ни 2-оксиглутарата, ни Fe(II).
Помимо активного деметилирования образованный из 5mC гидроксиметилцитозин
может «разбавляться» в процессе репликации, так как не узнается поддерживающей метилазой
Dnmt1. C помощью флуоресцентной иммунопреципитации показно уменьшение количества
5mC в мужском пронуклеусе и коррелирующее с ним возрастание количества 5hmC. В
процессе дальнейшего деления (проверено для эмбрионов на стадии двух, четырех и восьми
клеток) суммарная длина последовательностей, содержащих гидроксиметилцитозин
согласуется с гипотезой о том, что гидроксиметильная «метка» не поддерживается после
репликации, как это было показано для 5mC, а «разбавлялась» путем репликации до вплоть до
стадии имплантации [142]. Повышение содержания гидроксиметилцитозина в ДНК мужского
пронуклеуса совпадает по времени с уменьшением количества метилцитозина, а кроме этого
анализ экспрессии показывает, что ген Tet3 экспрессируется на высоком уровне в ооцитах и
зиготе на стадии одной клетки, но снижается уже на стадии двух клеток (Рис. 2). Инактивация
Tet3 препятствует деметилированию отцовского генома [152; 153]. Помимо этого, показано
увеличение концентрации Tet3 в мужском пронуклеусе на стадии зиготы. Несмотря на
вышепреведенные данные делеция Tet3 не является летальной, но приее наличии как в ооцитах,
так и в половых стволовых клетках приводит к нарушениям в развитии эмбриона, возможно
вследствие неправильной активации или репрессии генов, важных для эмбрионального
развития [154].
Одновременно с быстрым снижением уровня экспрессии гена Tet3 начиная со стадии
двух клеток, растет уровень транскрипции гена Tet1 [153]. К моменту образования бластоцисты
Tet1 и Tet2 начинают экспрессируются в ICM и эмбриональных стволовых клетках мыши, где
Tet3 не экспрессируется. В процессе дифференцировки, наоборот, снижается экспрессия Tet1 и
Tet2, а у Tet3 возрастает. Нокдаун Tet1 в стволовых клетках мыши приводит к уменьшению
содержания гидроксиметилцитозина на 50% и увеличивает метилирование промоторной
области гена Nanog, ключевого фактора поддержания плюрипотентности и снижает уровень его
транскрипции, следствием чего становится замедление пролиферации эмбриональных
стволовых клеток. Было показано, что в стволовых клетках мыши в промоторных областях
генов факторов плюрипотентности (таких, как Nanog, Tcl1 и Esrrb) повышено содержание
5hmC. Кроме этого, дефицит Tet1, вызыванный кнокдауном его гена приводит к повышению
вероятности спонтанной дифференцировки в клетки трофэктодермы и мезодермы [155; 156]. В
эмбриональных стволовых клетках мышей с нокаутированным геном Tet1 наблюдается
снижение содержания 5hmC на 35%, нарушена регуляция более, чем 200 различных генов.
33
Несмотря на это фенотип эмбриональных стволовых клеток таких мышей остается
нормальным, они продуцируют все необходимые факторы плюрипотентности. Несмотря на то,
что такие мутанты не являются летальными, 75% мышей с нокаутированным Tet1 рождаются со
сниженной массой тела, что означает задержки в эмбриональном развитии, а при скрещивании
гомозиготных мутантов численность потомства снижена, что может означать частичную
летальность данной мутации или нарушения при образовании эмбриональных половых клеток
[157].
Изменение количества 5hmC в ДНК мозга может иметь важное биологическое
значение. Так, при измерениях количества 5hmC в ДНК из мозжечка мыши показано
увеличение в 4 раза (с 0,1% до 0,4% всех нуклеотидов) начиная с седьмого дня после рождения
до зрелого возраста. Показано увеличение количества гидроксиметилцитозина в 5,5 тыс. генов в
процессе взросления, причем среди этих генов обнаруживаются связанные с
нейродегенеративными возрастными заболеваниями, ангиогенезом, а также гены,
ответственные за ответ на гипоксию [158]. Таким образом, образование
гидроксиметилцитозина и, возможно, связанные с ним процессы активного деметилирования,
могут играть существенную роль в процессах постнатального развития мозга, возрастных
нейродегенеративных изменениях и пластичности мозговой активности, связанной с
транскрипцией.
3.2.4. Простейшие: модифицированные и гипермодифицированные
основания
У простейших роль метилирования цитозина может быть отлична от таковой для
многоклеточных организмов. Так, у ресничного простейшего Oxytricha trifallax 5mC выполняет
роль метки, позволяющей отличить ДНК, подлежащую удалению. Каждая клетка простейшего
содержит два ядра: транскрипционно активный макронуклеус и транскрипционно неактивный
микронуклеус, участвующий в половом процессе. Макронуклеус содержит около 5%
последовательностей ДНК микронуклеуса. При образовании макронуклеуса повторяющиеся
последовательности, такие как транспозоны и сателлитная ДНК удаляются, а гены
подвергаются реаранжировке. В макронуклеусе содержатся около 20000 хромосом размером
немного больше 2 т. п. о, почти каждая из которых содержит один индивидуальный ген [159;
160]. Эти микрохромосомы образуются из относительно коротких фрагментов, называемых в
англоязычной литературе MDS (Macronuclear Destined Segments), сшиваемых в порядке,
который может отличаться от такового в составе микронуклеуса. Так, гены O. Trifallax часто
34
прерываются внутренними элиминируемыми последовательностями (Internal Eliminated
Sequences, IESs), которые удаляются в процессе такой реаранжировки [161]. Таким образом при
образовании нового макронуклеуса требуется удалить всю ДНК старого и 95%
последовательностей ДНК микронуклеуса [162]. 5mC обнаруживался только в деградирующем
макронуклеусе клеток O. Trifallax после конъюгации с помощью антител с флуоресцентной
меткой. В микронуклеусе, равно как и в клетках, находящихся на вегетативной стадии
жизненого цикла, присутвие 5mC обнаруживалось на низком уровне. Деградация ДНК в
макронуклеусе происходит одновременно с возрастанием уровня метилирования. Наряду с
метилцитозином в ДНК деградирующего макронуклеуса содержался и 5гидроксиметилцитозин, детектируемый с помощью иммунофлуоресцентных методов. Данные
иммунофлуоресцентного анализа были подтверждены с помощю масс-спетрометрии,
совмещенной с UPLC (ultra high performance liquid chromatography). Как по данным
иммунофлуоресценции, так и по данным масс-спектрометрии обнаруживается динамика
содержания 5mC и 5hmC в ДНК O.Trifallax после конъюгации. Уровень метилированного
цитозина резко возрастал через 36 часов после конъюгации и непрерывно снижался с 40 до 60
часов, до полной деградации «старого» макронуклеуса. Одновременно уровень
гидроксиметилцитозина непрерывно возрастал с 36 часов после конъюгации до 64 часов. С
помощью иммунопреципитации, совмещенной с секвенированием, был обнаружен богатый
пиримидинами мотив, подвергающийся специфическому метилированию и названый авторами
«СС-мотив». При исследовании ДНК микронуклеуса было найдено, что 5hmC содержится в
наиболее распространенном 170 п. о. повторе, полностью элиминируемом при образовании
макронуклеуса, аналогично некоторым другим распространенным стателлитным повторам.
Возрастание уровня 5mC было показано для неправильно сшитых продуктов реаранжировки
ДНК микронуклеуса, которые затем удаляются, но механизм этого удаления остаётся неясен
[163]. Таким образом, у O. Trifallax метилирование и гидроксиметилирование цитозина
является меткой, с помощью которой помечаются три класса подлежащей уничтожению ДНК:
повторяющися последовательности микронуклеуса при образовании макронуклеуса, ДНК
родительского макронуклеуса перед деградацией и ошибочно сшитые продукты реаранжировки
ДНК микронуклеуса при образовании макронуклеуса.
Помимо обычных для всех эукариот метилцитозина и гидроксиметилцитозина, роль
которых изучалось авторами вышеуказанной работы, в ДНК прокариот найдены и
гипермодифицированные основания. Например, β-D-глюкозилгидроксиметилурацил
(«основание J», base J), образующееся из тимина, встречается в протистах, включая паразитов
Trypanosoma и Leishmania [130]. Как и 5mC, основание J участвует в подавлении
транскрипционной активности генов: оно присутствует в неактивных копиях генов,
35
кодирующих вариабельных поверхностный гликопротеин (the variable surface glycoprotein,
VSG), отвечающий за антигенную вариабельность паразита, но отсутствует в единственной
активной копии [131]. Биосинез J требует белков JBP1 и JBP2, 2-оксиглутаро- и Fe(II)зависимые белки, являющиеся катализаторами первой стадии его биосинтеза [136]. Аналоги
данных белков, как уже указывалось выше, найдены у млекопитающих.
5hmU – общее минорное ДНК основание для динофлагеллят, в которых оно замещает
от 12 до 68% T, в зависимости от вида [164].
3.2.5. Наличие метиладенина в геноме эукариот
Предположение, что 6mA отсутствует в ДНК животных появилось вследствие
экспериментов, поставленных больше 30 лет назад, имевших низкую разрешающую
способность и показывающих, что 5mC является единственным метилированным основанием в
геномной ДНК [176–178] Подобное предпочтение 5mC перед 6mA в контроле важнейших
биологических процессов довольно неожиданно, если принять во внимание значение 6mA в
жизнедеятельности бактерий и тенденцию спонтанного дезаминирования 5mC в тимин [114].
Возможным объяснением может являться тот факт, что большая часть 5mC в ДНК
млекопитающих находится в транспозонах, что является частью механизма защиты геномной
ДНК от мобильных элементов вследствие подавляющего воздействия на экспрессию генов и
накопление мутаций из-за вышеупомянутого спонтанного дезаминирования 5mC [95; 165].
Следовательно, большое количество транспозонов (>45%) в геномной ДНК человека и
относительно большое количество 5mC может маскировать небольшие количества 6mA. Таким
образом, возможность участия 6mA в процессах развития, программируемой клеточной гибели
и старения, патологической пролиферации, дегенерации и инфекционных заболеваниях пока
еще недостаточно изучена.
Тем не менее, некоторые высшие эукариоты, в том числе грибы, водоросли и высшие
растения, несут 6mA в составе своей ДНК. На данный момент обнаружено, что 6mA
присутствует в ДНК многих эукариотических организмов, например, в водорослях; вирусах
водорослей; грибах; и простейших, включая Tetrahymena, Crithidia, Paramecium, Oxytricha,
Trypanosoma cruzi, Stylonychia, кроме этого в ДНК многих водорослей было найдено
гипермодифицированное основание N6-диметиладенин [19; 166-175].
ДНК макронуклеуса Tetrahymena метилирована по аденину и транскрипционно
активна. N6-метиладенин составляет примерно 0. 8% всего аденина в ДНК макронуклеуса,
36
тогда как ДНК микронуклеуса деметилирована и неактивна, то есть метилирование аденина
оказывает позитивный регуляторный эффект на активность генов в Tetrahymena [176].
Эта ДНК несет 6mA преимущественно в последовательностях 5'-NAT-3' [177], и только
3% всего N6-метиладенина находится в GATC [178; 179]. У миксомицета Physarum flavicomum
в ходе инцистирования ДНК становится чувствительной к эндонуклеазе рестрикции DpnI, что
может быть объяснено метилированием аденина в последовательностях GATC на этой стадии
жизненного цикла [180]. У высших растений 6mA был найден в различных органах и
амилопластах, обнаружен в тяжелой цепи митохондриальной ДНК саженцев пшеницы и в
митохондриальной ДНК многих изученных высших растений, включая различные мхи,
папоротники и покрытосеменные [181; 182]. Сравнение продуктов рестрикции MboI
(эндонуклеазы, чувствительной к Dam-метилированию) и Sau3A (не чувствительной к нему)
показало наличие метилирования аденинов в гене зеина в кукурузе [183]. Ген
метилтрансферазы цитозина DRM2 у арабидопсиса метилирован по аденину в некоторых
сайтах GATC, а из саженцев пшеницы была изолирована N6-аденинметилаза [184; 185]. Само
возможное наличие метилирования аденина в геномной ДНК эукариот и, соответственно,
значение этого гипотетического процесса пока еще остаются неясными. Существуют данные,
что характер транскрипции многих генов, морфология и ход развития растений, изменяются
при их трансформации генетическими конструктами, содержащими и экспрессирующими ген
прокариотической ДНК-аденинметилтрансферазы. Так, экспрессия гена бактериальной Dam
метилазы в трансгенном табаке приводит к метилированию аденина в последовательностях
GATC (степень метилирования аденина в геноме прямо пропорциональна уровню экспрессии
внесенного гена dam и при сверэкспрессии этого гена все последовательности GATC
оказываются метилированы) и последующим морфологическим нарушениям в листьях и
соцветиях. Сверхэкспрессия dam в растениях коррелирует с различными фенотипическими
нарушениями, включая нарушения пигментации листьев, апикального доминирования и
структуры цветков [186]. Dam-зависимое метилирование промоторных регионов генов
алкогольдегидрогеназы, убиквитина и актина, содержащихся в генетических конструктах,
сильно увеличивает их траскрипцию в различных тканях табака и пшеницы [187].
Метилирование аденина в динуклеотидах AG в последовательности AGATCCAA в промоторе
гена NtMyb2, кодирующего регуляторный белок ретротранспозона табака Tto1, бактериальной
метилазой Dam повышает связываение AGP1, который взаимодействует с динуклеотидами AG
в клетках табака. Метилирование аденина увеличивает транскрипцию с промоторов генов
CaMV 35S, Adh1 и убиквитина в кукурузе, а некоторые ядерные белки из эмбрионов пшеницы
предпочтительно связываются с ДНК, содержащей метилированные аденины, больше чем с
содержащей метилированные цитозины. Считается, что специфические чувствительные к
37
присутствию 6mA ДНК-связывающие белки отвечают за увеличение транскрипции,
наблюдаемой в ячмене в присутствии 6mA в активных промоторах. Таким образом,
метилирование аденина в ДНК может регулировать транскрипцию генов, по крайней мере в
растениях, что предполагает регулярный характер и физиологическое значение такого
метилирования [188].
Возможным механизмом такой регуляции экспрессии генов и клеточной
дифференцировки в растениях может быть внедрение цитокининов (N6-производных аденина)
[204]. Показано, что цитокинины (6-бензиламинопурины) действительно включены в ДНК в
Tetrahymena pyriformis [189]. Когда цитокинин замещает аденин в сайте метилирования, этот
сайт не метилирован, вследствие того, что акцепторная аминогруппа уже несет заместитель
(бензил, изофенил и т. д. ), как результат этого ДНК становится неметилирована по адениновым
остатком, что может влиять на репликацию и экспрессию генов. Можно предположить, что
соответствующие гормон-рецепторные комплексы конкурируют с ДНК-метилтрансферазами за
сайты связывания на ДНК, что является хорошо известным явлением модулирования
метилрованиия ДНК фитогормонами [190], представляющем собой механизм прямого влияния
гормонов на геном. Возможно, метилирование аденина приводит к супрессии метилирования
ДНК в ответ на воздействие 6-бензиламинопурина в пластидах платана в процессе синтеза
фотосинтетических белков [191].
Существуют данные об участии метилирования аденина в деградации чуждой ДНК в
клетке. В сравнении с метилированием цитозина, метилирование аденина ведет к значительно
более быстрой деградации такой ДНК [192]. Таким образом, можно предположить наличие
системы узнавания ДНК, белки которой похожи на эндонуклеазы рестрикции бактерий, которая
выборочно гидролизует и уничтожает ДНК, метилирование которой по аденину отличается от
метилирования ДНК хозяина. Специфическая эндонуклеаза с уникальными свойствами была
изолирована из саженцев пшеницы. Этот фермент зависит от SAM и присутствия катионов
кальция и магния, он специфично различает и гидролизует метилированные и
деметилированные ДНК [193].
ДНК животных различаются по чувствительности к гидролизу с бактериальными
эндонуклеазами рестрикции, которые блокируются метилированием аденина TaqI, MboI и
Sau3AI, что позволяет предположить присутствие 6mA в определенных генах (таких как MyoD1 мыши или гены стероидных 5-α-редуктаз второго типа у крысы, причем, в случае крысиного
гена рестрикционная картина коррелирует с его экспрессией [194; 195]. Это открытие позволяет
предпологать присутствие аденин-метилтрансфераз в клетках животных. Относительно
большое распространение 5mC в ДНК млекопитающих привлекает внимание к роли m5C в
биологических процессах в ущерб исследованиям 6mA. В этой связи следует отметить, что
38
общее содержание 6mA (<0. 001%) может быть биологически значимо, особенно, если он
присутствует в специфических регуляторных элементах генов. Следовательно, принимая во
внимание огромный размер человеческого генома (3,3 × 109 bp) и число генов (~30×103),
присутствие нескольких сотен 6mA может оказывать значительное влияние на биологические
процессы, такие как клеточная дифференцировка или морфогенез [196].
Любопытным фактом является способность экзогенного N6-метилдеоксиаденозина
(MedAdo) индуцировать клеточную дифференцировку и синтез олигодендроглиального
маркера 2’3’-циклонуклеотид-3’-фосфорилазы в клетках глиомы C6.9. Индуцированная N6метилдеоксиаденозином дифференциация наблюдалась в феохромоцитомных или
тератокарциномных клеточных культурах [197]. Более того, показан эффект искусственного
метилирования аденина на дифференциацию клеток и экспрессию генов как у животных, так и
растений, что может означать вовлечённость метиладенина в эпигенетическую регуляцию
клеточных процессов и у млекопитающих [196]. Кроме того, показано наличие 6mA в ДНК
насекомых, в частности, у комара [198].
Некоторые исследования показывают возможность воздействия 6mA на экспрессию
генов в клетках млекопитающих. Так, искусственное присутствие 6mA может влиять на
связывание ядерных белков [199], уменьшать активность аденовирусного промотора E1A [200],
или приводить к образованию регуляторного элемента, отвечающего на воздействие
стероидных гормонов [201].
Таким образом, в эукариотических клетках возможно присутствие еще одной системы
метилирования ДНК, присоединяющей метильную группу к аденину. Пока непонятно, как
данные системы взаимодействуют между собой или насколько они независимы.
Метилирование аденина может влиять на метилирование цитозина и наоборот. Известно, что
что степень метилирования гена цитозин-ДНК-метилтрансферазы DRM2 в трансгенной A.
thaliana значительно уменьшается антисенс-конструктами, направленными к гену Met1
цитозин-ДНК-метилтрансферазы [184].
39
3.3. Заключение
Несмотря на значительные успехи в изучении причин и следствий метилирования и
других модификаций в ДНК многие аспекты функционирования этой части эпигенетического
аппарата остаются неясными. Так, открытие процесса конверсии метилцитозина в
гидроксиметилцитозин белками семейства Tet принесло не только предположения о
гипотетическом механизме деметилирования, но и поставило новые вопросы. Например,
различия в содержании 5hmC в ДНК клеток трофэктодермы, ICM и различных
предшественников клеток крови у плацентарных млекопитающих намекает на участие данной
модификации в регуляции развития иммунной системы [155]. Таким образом,
модифицированные и гипермодифицированные основания представляют собой чрезвычайно
разнообразное, сложное и интересное поле для дальнейших исследований, затрагивающих
практически все отделы живой природы, а значение их для фундаментальных и прикладных
дисциплин, в частности, эволюционной биологии, биотехнологии биомедицины трудно
переоценить.
40
4. Практическая часть. «Разработка нового метода
крупномасштабного поиска гипометилированных
регуляторных участков в геномах эукариот»
4.1. Материалы и методы
4.1.1. Оборудование
В работе было использовано следующее оборудование:
- амплификатор Терцик (ДНК-технология, Россия);
- термостат Гном (ДНК-технология, Россия);
- источник питания Эльф (ДНК-технология, Россия);
- микроцентрифуга Mini Spin (максимальная скорость 13400 об/мин, Eppendorf,
Германия);
- гомогенизатор роторный лабораторный;
- охладитель SC 2D (Biocom, Россия);
- автоматические пипетки (Labnet, США);
- ламинарный шкаф (Lamsystems, Россия);
- электронные весы (Ohaus, Германия);
- прибор для документирования гелей (Viber Lourmat, Франция);
- камеры для электрофоретического разделения (BioRad SubCall GT (США-Франция).
4.1.2. Расходные материалы
Использовались следующие расходные материалы: пластиковые наконечники и
пластиковые пробирки для ПЦР объёмом 0. 5 мл (Treff Lab, Швейцария), пластиковые
микроцентрифужные пробирки на 1. 5 мл (Eppendorf, Германия), пленка Parfilm (American
National Can, США), одноразовые чашки Петри (Завод Медицинских Полимеров, Россия), 25
см2 флаконы для культивирования клеток (Corning Inc. ).
4.1.3. Выделение и очистка ДНК
41
Геномная ДНК из образцов тканей выделялась с помощью кита Wizard® SV Minipreps
DNA Purification Systems (Promega, США).
При очистке фрагментов ДНК после электрофоретического разделения и после
прохождения ПЦР использовался кит Wizard® SV Gel and PCR Clean-Up System (Promega,
США).
При очистке в геле продуктов ПЦР, используемых для получения пилотных
клонотекили при подготовке образца для крупномасштабного секвенирования (см.
Секвенирование) на одну дорожку наносили около 3000 нг ДНК.
Для выделения плазмидной ДНК использовался кит фирмы Цитокин, Россия.
4.1.4. Олигонуклеотидные праймеры и суппрессионные адапторы
Использованные в работе олигонуклеотиды, включая суппрессионный адаптор
Na21St19 и его подложку StII, (последовательности представлены в Приложении 1) были
синтезированы фирмой «Евроген», Москва, Россия.
Суппрессионный адаптор Na21St19 отжигался вместе с подложкой StII по следующей
схеме: вначале смешивали эквимолярные количества адаптора и подложки в буфере TrisMgSO4 pH 7. 4, Fulka, полученную смесь ставили в термоциклер и запускали программу отжига.
Программа отжига состояла из нагрева до 65°С в течении 5 минут, а затем температура
опускалась с 65°С до 22°С (с шагом в 1°С по две минуты на шаг). Полученную смесь
отожженного на подложке адаптора смешивали с 1мкг геномной ДНК в эквимолярном
соотношении и лигировали высокоактивной T4 ДНК-лигазой (см. Лигирование).
4.1.5. Молекулярное клонирование, скрининг библиотек
Клонирование продуктов ПЦР осуществлялось в вектор pGemT (Promega, США),
проверка трансформантов на наличие вставок осуществлялось методом ПЦР с помощью
стандартных праймеров M13 прямого и обратного (приобретены в фирме «Евроген», Россия),
см. Полимеразная цепная реакция.
4.1.6. Бактериальные штаммы. Трансформация и культивирование
42
В работе использовались химически компетентные клетки XL-Blue, полученные
кальций-хлоровым методом. Трансформация производилась методом теплового шока (вначале
оттаивание при 0°С, затем добавление ДНК и инкубация на льду при 0°С 20 минут, затем
тепловой шок при 42°С 1. 5 минуты, инкубация на льду (0°С) 5 минут. Перед помещением в
селективную среду клетки 1 час инкубировали при 37°С в среде LB.
Для дальнейшего культивирования использовался LB среда с добавлением 100 мкг/мл
ампициллина или 1. 5% LB-агар.
4.1.7. Эндонуклеазы рестрикции, рестрикция и лигирование
Метилчувствительные рестриктазы. Метилчувствительные рестриктазы BspFNI и
BspACI, расщепляющие гипометилированные последовательности CG^CG и С^СGC
соответственно, были приобретены в фирме «Сибэнзим», Новосибирск, Россия.
Постановка рестрикции. Рестрикция геномной ДНК, выделенной по стандартному
протоколу китом Wizard® SV Minipreps DNA Purification Systems, осуществлялась в
оптимальных буферных растворах, указанных производителем (фирма «Сибэнзим»). Для
рестриктазы BspFNI использовался «буфер Y» (33 mM Tris-ацетат (pH 7. 9 при 25°C); 10 mM
магний-ацетат; 66 mM калий-ацетат; 1 mM ДТТ), а для рестриктазы BspACI – «буфер O» (50
mM Tris-HCl (pH 7. 6 при 25°C); 10 mM MgCl2; 100 mM NaCl; 1 mM ДТТ). Реакцию
производили в течение 16 часов при 37°C в 50 мкл, количество ДНК – 1 мкг, с пятикратной
нагрузкой по активности фермента (за единицу активности принимается количество фермента,
необходимое для гидролиза 1 мкг ДНК фага λ за 1 час при 37°С в 50 мкл реакционной смеси).
Лигирование. Для постановки лигазной реакции использовалась высокоактивная T4
ДНК-лигаза («Сибэнзим», Новосибирск, Россия). Лигирование осуществлялось в
соответствующем буфере от производителя (SE-буфер для T4-ДНК-лигазы, 50 mM Tris-HCl (pH
7. 8 при 25°C); 10 mM MgCl2; 10 mM ДТТ; 1 mM ATP. ) во всех случаях в течение 16 часов при
14°C, в каждой реакции участвовало около 1000 ед. фермента (за одну единицу активности Т4
ДНК-лигазы принимали количество фермента, необходимое для 50% сшивки HindIIIфрагментов ДНК фага лямбда за 30 мин при 16°С в 20 мкл реакционной смеси при
концентрации ДНК 300 мкг/мл).
При получении библиотек ДНК в реакции участвовало 300 нг вектора pGEM-T и около
600 нг очищеных продуктов ПЦР, такое же соотношение вектора и вставки было использовано
при клонировании рекомбинантных последовательностей в вектор после бисульфитной
конверсии (очистка ДНК описана в разделе Выделение и очистка ДНК).
43
4.1.8. Полимеразная цепная реакция
Полимеразная цепная реакция осуществлялась в амплификаторе Терцик, для каждой
ПЦР исходное количество ДНК составляло 30 нг.
Лигазная смесь, полученная методом nMETR амплифицировалась, температура
плавления 95◦С (время плавления вначале 1 цикл 5 минут, затем по 20 секунд каждый цикл)
отжига 65◦С (время элонгации 20 секунд), температура элонгации 72◦С (время элонгации
минута тридцать секунд). Первая реакция – 15 циклов, а затем для определения оптимального
количества циклов для амплификации целевых продуктов при “Nested” ПЦР, была поставлена
расцикловка от 10 до 25 циклов с шагом в 5 циклов. Для определения нецелевых продуктов
амплификации была осуществлена “Nested” ПЦР полученной смеси с праймерами только к
последовательности адаптора и только к последовательности повтора.
Скрининг полученных пилотных клонотек следующим образом: температура
плавления 95◦С (время плавления: вначале 1 цикл 10 минут, затем по 25 секунд каждый цикл),
температура отжига 60◦С (время элонгации 20 секунд), температура элонгации 72◦С (время
элонгации одна минута сорок секунд), всего 20 циклов.
При получении рекомбинантной вставки из обработанной бисульфитом ДНК
использовались следующие условия: температура плавления 95◦С (время плавления: вначале 1
минута, затем по 20 секунд каждый цикл), использованная температура отжига зависела от
того, какая пара праймеров используется (список праймеров и их температур отжига
представлен в Приложении 1, время элонгации 20 секунд), температура элонгации 72◦С (время
элонгации минута сорок секунд), 15 циклов для внешних праймеров, затем разбавление в 10 раз
и “Nested” ПЦР 25 циклов.
Для реакций использовался 10x буфер для проведения ПЦР и 50x раствор
дезоксинуклеотидтрифосфатов и препарат Taq-полимеразы («Евроген», Россия), количество
праймеров в реакционной смеси составляло 0,4µМ. ПЦР смеси, полученной из продуктов
реакции рестрикции после лигирования адапторов и при получении рекомбинантных вставок
обработанной бисульфитом ДНК осуществлялись в объеме 25 мкл. Реакции, производящиеся
для скрининга пилотных клонотек – в объеме 12,5 мкл.
4.1.9. Дуплекс-специфическая нуклеаза (ДСН)
Дуплекс-специфическая нуклеаза приобретена у фирмы «Евроген», Москва, Россия.
Для реакции использовались реагенты производителя, в каждой реакционной смеси
44
содержалось 300 нг ДНК (объем смеси 10 мкл, 2 ед. активности фермента на каждую реакцию),
перед каждой реакцией осуществлялось нагревание 10х Мастер-буфера (5 мкл на реакцию, 500
mM Tris-HCl (pH 8. 0); 50 mM MgCl2; 10 mM ДТТ) до 68°С, реакция проводилась при той же
температуре в течение 10 минут, а затем добавлялся 2х Стоп-раствор (5mM ЭДТА, 80 мл) и
осуществлялось инкубирование смеси в течение 5 минут при 68°С с последующей
инактивацией в течение 2 минут при 98°С.
4.1.10. Бисульфитная конверсия
Биульфитная конверсия геномной ДНК производилась с помощью кита EpiTect
Bisulfite Kit (Promega, США), перед дальнейшим использованием производилась амплификация
полученной конвертированной ДНК с помощью набора EpiTect Whole Bisulfitome (Promega,
США).
4.1.11. Электрофорез в агарозном геле
Разделение продуктов ПЦР, проверка целостности плазмид, несущих рекомбинантную
вставку и очистка фрагментов ДНК для клонирования осуществлялась в 1. 5% агарозном геле,
приготовленном на 0. 5x TBE буфере с добавлением бромистого этидия. Перед нанесением
образцы смешивались с 1 мкл краски, содержащей 0. 25% бромфенола, 0. 25% ксиленицанола и
30% глицерина. Электрофорез производили при силе тока в 40 А в 0. 5x TBE буфере. Данные
электрофоретического исследования фиксировались при помощи цифровой камеры с УФ
трансиллюминатором, длина волны УФ - 280 нм.
4.1.12. Секвенирование
Секверинование отдельных клонов из полученных пилотных клонотек заказывалось в
фирме «Евроген», Россия.
Крупномасштабное секвенирование ДНК осуществлялось в центре "Биоинженерия"
Российской Академии Наук, Москва, Россия на приборе GS FLX, Roche. Количество
секвенированной ДНК составляло 1500 нг в 20 мкл.
45
4.2. Теоретические основы метода
Многие эндонуклеазы рестрикции расщепляют геномную ДНК в зависимости от
статуса метилирования их специфического сайта связывания. Некоторые из них, называемые
метилзависимыми, расщепляют только метилированные последовательности, а другие,
называемые метилчувствительными, только неметилированные [202]. Эндонуклеазы, узнающие
неметилированные сайты могут быть использованы для «зондирования» деметилированных
геномных областей, а последующее лигирование супрессионных адаптеров делает возможной
ПЦР-амплификацию деметилированных локусов [203]. Метилчувствительные рестриктазы,
используемые для эпигенетических исследований, как правило, выбираются так, чтобы их сайт
узнавания содержал один или несколько CG-динуклеотидов, содержание которых больше в
регуляторных последовательностях, таких как CpG-островки [204]. Таким образом,
расщепление геномной ДНК рестриктазой, сайт узнавания которой содержит более одного CGдинуклеотида с большой вероятностью будет происходить именно по регуляторным
последовательностям.
Различные повторяющие последовательности составляют наибольшую фракцию
человеческого генома [205], некоторые из них, такие как теломерные или центромерные
повторы занимают строго определенные позиции в хромосоме, а другие, такие как мобильные
элементы (transposable elements, TE), составляющие >40% человеческого генома [1]|,
распределяются случайным образом по всей последовательности хромосомы. Различные
семейства TE представлены в геноме различным числом копий, от десятков до миллионов на
одного члена семейства. Так, в человеческом геноме содержится >106 копий
ретротротранспозона Alu, ассоциированных с CG-богатыми регионами генома , а их
расположение относительно различных генов достаточно случайно , т. е. на каждые 3 т. п. о.
гаплоидного генома приходится примерно одна копия данного мобильного элемента [205-207].
Ретротранспозоны LINE-1 как полноразмерные активные, так и делетированные с 5’ –
конца, составляют около 17% человеческого генома (около полумиллиона копий) и именно на
LINE-1, а среди всех L1 на семейство Ta1d приходится большая часть случаев транспозиции
[208; 209].
Большая группы ДНК-копий ретроэлементов человеческого генома, а именно
эндогенные ретровирусы и часть ретротранспозонов, составляющих примерно 8% человеческой
ДНК, содержат длинные концевые повторы (LTR, Long Terminal Repeats). Данные структуры
являются сложными по своему составу, находятся на обоих концах ДНК-копии мобильного
элемента и несут множество регуляторных последовательностей. Кроме этого, вследствие
46
гомологичной рекомбинации множество LTR присутствуют в геноме в виде одиночных копий
[210].
Указанные выше мобильные элементы могут использоваться как своего рода «зонды»,
относительно равномерно покрывающие человеческий геном и, вместе с
метилчувствительными рестриктазами, ограничивающие количество анализируемых
последовательностей.
На основании вышеуказанных соображений, была разработана принципиальная схема
метода, названного nMETR или non-MEthylated Tag Recovery. Геномная ДНК обрабатывается
метилчувствительной рестриктазой, затем к полученному рестрикту лигируются
супрессионные адапторы. Полученная лигазная смесь амплифицируется с праймерами к
последовательности адаптора и геномного повтора (см. Рис. 6).
Рисунок 6. Принципиальная схема метода nMETR. Геномная ДНК обозначена серой
линией, геномный повтор – оранжевым прямоугольником, супрессионные адапторы –
зелеными прямоугольниками, стрелками показаны олигонуклеотидные праймеры. Геномная
ДНК обрабатывается метилчувствительной рестриктазой (1), к полученному рестрикту (2)
лигируются супрессионные адапторы (3) и полученная смесь амплифицируется с праймерами к
последовательностям адаптора и геномного повтора (4).
47
В разработанном варианте метода, целевые продукты представляют собой набор
последовательностей, находящихся между деметилированным сайтом узнавания эндонуклеазы
и геномным повтором.
4.3. Выбор мобильных элементов
Для подбора праймеров выбрали три консенсусных последовательности: из класса
SINE семейства Alu (около 106 копий [206]), из класса LINE семейства L1 (5x105 копий в
человеческом геноме [211]) и LTR из эндогенных ретровирусов HERV-K (около 2x103
последовательностей в составе семейства эндогенных ретровирусов HML-2 и одиночных LTR
[212]). С использованными в работе консенсусными последовательностями мобильных
элементов можно ознакомиться в Приложении 2.
4.4. Получение пилотных клонотек
На начальном этапе работы нами были получены пилотные клонотеки: на основе ДНК,
выделенной из тканей человеческого мозга. Геномная ДНК расщеплялась рестриктазой BspFNI
(сайт рестрикции CG^CG). Степень расщепления геномной ДНК эндонуклеазой проверялась с
помощью электрофореза в 1% агарозном геле (см. Рис. 7).
Рисунок 7. Рестрикция геномной ДНК, выделенной из тканей мозга человека. M маркер молекулярных масс, 1 – геномная ДНК из тканей человеческого мозга, обработанная
48
рестриктазой BspFNI, 2 – геномная ДНК, выделенная из тканей человеческого мозга (на
дорожки 1 и 2 наносилось по 100 нг ДНК).
Смесь продуктов рестрикции очищалась фенолом и хлороформом, после чего
производилась лигазная реакция с очищенной смесью и адаптором Na21St19/StII
(последовательность супрессионных адаптеров см. в Приложении 1А), лигирование
осуществлялось по тупым концам. Полученная лигазная смесь амплифицировалась с
праймерами к различным мобильным элементам: длинным длинным концевым повторам (LTR)
эндогенных ретровирусов HERV-K, LINE-элементам семейства L1 или SINE-элементам
семейства Alu в паре с праймерами к последовательности супрессионного адаптера.
Амплификаты анализировались методом электрофореза в 1,5% агарозном геле (Рис. 8). Сайты
отжига праймеров на консенсусных последовательностях повторов можно найти в
Приложении 2.
Рисунок 8. Электрофореграмма продуктов ПЦР, полученных с помощью праймеров к
последовательности супрессионных адаптеров и различным геномным повторам. М – маркер
молекулярных масс, 1 – праймеры к повторам семейства L1, 2 – праймеры к повторам Alu, 3 –
праймеры к LTR HERV-K.
Полученные смеси продуктов амплификации клонировали, затем лигазной смесью
трансформировался штамм E. coli XL1-Blue. Трансформанты высевались на чашки Петри с
агаризованной средой LB, средняя плотность колоний после каждого такого рассева составляла
примерно 10-4. Клоны анализировались на наличие вставки с помощью стандартных праймеров
M13, после чего секвенировались. Секвенирование осуществлялось ЦКП «Геном» и фирмой
«Евроген», секвенирование осуществлялось с праймера M13for. Положение прочитанных
49
последовательностей в человеческом геноме определяли с помощью геномного браузера
Калифорнийского университета UCSC Genome Browser (http://genome.ucsc.edu).
Таким образом было проанализировано 200 клонов, полученных клонированием
продуктов амплификации с праймерами к супрессионным адапторам и последовательности
повтора Alu, из которых только 8 (4%) обладали ожидаемой последовательностью (наличие
остатка рестрикционного сайта BspFNI, и, одновременно, фрагмента мобильного элемента), 95
клонов, полученных аналогичным образом, с праймерами к длинным концевым повторам (LTR)
суперсемейства повторов HERV-K (3 клона с ожидаемой последовательностью вставки) и 100 с
праймерами к консенсусной последовательности семейства L1 (один клон с ожидаемой
последовательностью вставки). Поскольку частота встречаемости клонов, несущих вставку с
ожидаемой последовательностью, была выше у Alu-элементов, было принято решение
продолжать работу с праймерами к повтору Alu.
Анализ клонов, полученных путем амплификации с праймерами к повтору Alu показал,
что большинство нецелевых клонов представляли собой продукты амплификации
последовательностей, заключенных между двумя Alu-повторами, располагающимися в
ориентации «голова к хвосту» и имеющими размеры больше чем ~290 п. о. (Рис. 9.).
На первоначальном этапе работы данная проблема решалась с помощью электрофореза
на 1,5% агарозном геле и последующим выделением фрагментов ниже 250 п. о. (Рис. 9, дорожка
3, выделены рамкой). Это позволило увеличить пропорцию целевых последовательностей до
26% (52 клона из 200 секвенированных).
Рисунок 9 Продукты амплификации с праймерами к повтору Alu и последовательности
адаптора. 1, 2, 3 – 25, 20 и 15 раундов амплификации с праймерами к повтору Alu и
последовательности адаптора, фракция продуктов, выделенная из геля обведена пунктирной
50
рамкой, 4 – контрольная амплификация с праймерами только к супрессионному адаптору, 5 –
контрольная амплификация с праймерами только к последовательности Alu.
Для исключения потерь целевых последовательностей, имеющих тот же размер, что и
примесные Alu-Alu ПЦР-продукты схема амплификации была усовершенствована, что
позволило исключить разделение на геле и последующее выделение (Рис. 10). Вначале
производилась амплификация лигазной смеси с праймером к повтору Alu, Alu1for (см.
Приложение 1А), полученный амплификат обрабатывался дуплекс-специфичной нуклеазой
(ДСН), после чего производилась очистка продуктов реакции фенолом и хлороформом и
осуществлялась дальнейшая амплификация с праймерами Alu1for и Na21 (к адаптерной
последовательности). Затем процедура повторялась с использованием праймеров Alu2for – к
последовательности повтора и St19CG – к последовательности адаптера). Продукты
амплификации затем анализировались на 1,5% агарозном геле против контрольных продуктов,
к которым ДСН не добавляли.
51
Рисунок 10. (А) Схема, иллюстрирующая применение nMETR c праймерами к
повторам Alu. При наличии двух рядом стоящих повторов в одном рестрикционном фрагменте
с пришитыми адапторами (2, 3) возможна амплификация без участия праймеров к адапторной
52
последовательности с образованием побочных продуктов (4). (Б). Включение в nMETR стадии
амплификации с праймером только к последовательности повтора с последующей обработкой
ДСН, расщепляющей двуцепочечную ДНК позволяет накопить одноцепочечные продукты
амплификации, содержащие как последовательность адаптера, так и повтора.
Такая схема позволила сохранить выход целевых последовательностей на
приблизительно том же уровне, что и при очистке от побочных продуктов путем
электрофореза: из 30 случайно отбранных клонов, полученных с использованием ДСН, 9 (или
30%) содержали остаток сайта рестрикции на одном конце и фрагмент повтора на другом.
4.5. Применение nMETR для поиска гипометилированных
последовательностей в геномной ДНК рака мочевого пузыря
nMETR с использованием ДСН для уменьшения количества нежелательных продуктов
был использован для определения гипометилированных последовательностей в ДНК,
выделенной из опухоли мочевого пузыря. Вместо рестриктазы BspFNI использовалась
метилчувствительная эндонуклеаза рестрикции BspACI, расщепляющей неметилированный
непалиндромный тетрануклеотид C^CGC. Поскольку BspACI оставляет липкие концы,
полученная смесь обрабатывалась фрагментом Клёнова 20 минут, затем к полученным
продуктам лигировались супрессионные адапторы Na21St19/StII по тупым концам. Для
дальнейшей работы были использованы продукты амплификации, получающиеся на 20 цикле
(Рис. 11, дорожка 4).
53
Рисунок 11. Продукты, полученные методом nMETR из геномной ДНК опухоли
мочевого пузыря с обработкой ДСН. 1 – 5 – ПЦР-смеси, полученные nMETR с обработкой ДСН
с праймерами к последовательности супрессионного адаптора (St19-CG) и последовательности
геномного повтора Alu (Alu2for), 10, 15, 20, 25 и 30 раундов амплификации соответственно; 6 –
10 – контрольные ПЦР-смеси, полученные без обработки ДСН, 10, 15, 20, 25 и 30 раундов
амплификации соответственно.
Пилотная клонотека содержала 15 клонов. Как видно из Табл. 2. , 4 последовательности
содержали в себе геномный повтор Alu, 3 находились в окрестностях СpG – островка гена
ATP6V1C1, а одна – находилась в первом интроне гена NDUFV1.
Количество клонов,
Наличие
содержащих
CpG
последовательность
Локус
Окрестность локуса
8q22. 3
chr8:104032493-104034382, в первом
экзоне и интроне гена ATP6V1C1
+
3
11q13. 2
chr11:67375648-67375937, в первом
интроне гена NDUFV1
-
1
11q13. 1
chr11:65286522-65286614, в геномном
повторе Alu
-
4
Таблица 2. Результаты анализа клонотеки, полученнй методом nMETR с
использованием ДСН для ДНК, выделенной из раковых опухолей мочевого пузыря.
Для проверки статуса метилирования использовалось т. н. «бисульфитное
секвенирование», (Bisulfite Sequencing Assay, BSA), позволяющее напрямую устанавливать
статус метилирования известного геномного локуса.
Результаты проверки данных, полученных nMETR для локуса методом бисульфитного
секвенирования представлены на Рис. 12. Анализ последовательностей конвертированной ДНК
осуществлялся с помощью программы BiQAnalyser. Программа сравнивает последовательности
рекомбинантных вставок ДНК, конвертированной бисульфитом, и сравнивает их с исходной
последовательностью анализируемого локуса. На выходе строится схема, где каждая
горизонтальная линия – это последовательность рекомбинантной вставки, а кружки на ней –
отдельные CpG – динуклеотиды, заливка черным цветом соответствует метилированному CpG,
а отсутствие заливки – неметилированному.
При подготовке иллюстраций в целях наглядности и экономии места нарушен масштаб
схемы. Положение сайта рестрикции указывется с помощью рамки.
54
Рисунок 12. Результаты проверки данных, полученных с помощью nMETR методом
«бисульфитного секвенирования» для последовательностей из двух геномных локусов: в локусе
8q22. 3 проанализирована окрестность сайта рестрикции BspACI в в первом экзоне и интроне
гена ATP6V1C1, в локусе 11q13. 2 проанализирована окрестность сайта рестрикции BspACI в
первом интроне гена NDUFV1. Изображение получено с помощью программы “BiqAnalyser” (с
изменениями), каждая линия обозначает последовательность клона из библиотеки
конвертированных последовательностей, кружки – отдельные CpG, наличие метильной группы
у цитозина обозначается заливкой. Положение сайтов рестрикции BspACI (CCGC) указано с
помощью прямоугольной рамки, масштаб не сохранён.
При проверке статуса метилирования геномной ДНК для участка генома в локусе
11q13. 2 (Рис. 12) был замечен предсказанный ген c11orf72, находящийся в обратной
ориентации к NDUFV1 и имеющий с ним общий CpG-островок. Было принято решение
исследовать данную ОРС более подробно, заодно проверив статус метилирования CpGостровка гена NDUFV1.
4.6. Крупномасштабное секвенирование nMETR-библиотек
55
Используя вышеописанный протокол nMETR c использованием в качестве
метилчувстительной рестриктазы фермента BspFNI, а в качестве мобильного элемента
геномного повтора Alu с разделением амплификата на 1,5% агарозном геле и выделением
совокупности фрагментов ДНК длиной менее 250 п. о. был подготовлен образец для анализа на
геномном анализаторе GS FLX Roche (454). Для дальнейшего анализа нами использовались
фрагменты достаточного размера. (32990 (~48%) из 68729 исследованных
последовательностей).
Для анализа полученной информации сотрудником нашей лаборатории Андреем
Викторовичем Гаража была разработана специализированная программа, “PostParser” [213].
Программа отыскивала в прочитанном фрагменте остаток сайта рестрикции, адапторную
последовательность, последовательность повтора Alu, а затем картировала прочитанные
последовательности на человеческий геном, с использованием геномного браузера
Калифорнийского университета «The UCSC Genome Browser»). Среди картированных
последовательностей программой отбирались те, в которых присутствовал остаток сайта
рестрикции BspFNI (CGCG), после чего осуществлялся подсчет последовательностей,
приходящихся на каждый геномный локус, найденный с помощью метода nMETR (вблизи
определенного сайта рестрикции CGCG). Помимо этого, “PostParser” указывала расстояние от
каждого сайта рестрикции BspFNI до известных генов, мест считывания РНК или CpGостровков. С использованием “PostParser” из 32990 подходящих по размеру
последовательностей выделено 6589 (~20% и ~10% всех прочтений вообще), которые
содержали ~76 п. о. последовательности геномного повтора Alu, динуклеотид – остаток сайта
рестрикции и некоторую последовательность геномной ДНК между ними (от 20 п. о. , что
составляет минимальную длину запроса в геномном браузере Калифорнийского университета
«The UCSC Genome Browser»). Остальные продукты приходились на упомянутые выше
последовательности Alu-Alu, продукты неспецифичного расщепления рестриктазы и продукты
неправильного лигирования.
Данные 6589 последовательностей несли информацию о 1113 локусах человеческого
генома, из которых 711 (64%) из них находились в окрестности CpG-островков (200 п. о. ).
Детальное описание программы и база данных, полученная на данном этапе работы доступна в
сети Интернет (http://www. postparser.net, [213]). В краткой форме данные сведены в Табл. 3.
Последовательностей
Всего:
Целевых:
Уникальных:
Лежащих в CpG – островках или их
окрестностях (в пределах 200 п. о. ):
Количество, шт
68729
6589
1113
711
56
Таблица 3. Некоторые характеристики базы данных, полученной на основе
результатов крупномасштабного секвенирования на приборе Roche (454) GS FLX центра
«Биоинженерия» РАН.
4.7. Бисульфитное секвенирование
Различные локусы генома были представлены в выборке фрагментов, полученных с
помощью nMETR в различном количестве (см. Рис. 13). Поэтому было решено проверить
наличие корреляции между уровнем метилирования и количеством прочтений каждой
последовательность 454 секвенатором. Для оценки уровня метилирования использовался метод
«бисульфитного секвенирования» Нами были проанализированы 9 геномных локусов, из
которых:
- 3 локуса с высоким числом прочтений (25 или больше)
- 3 со средним числом прочтений (5– 8)
- 3 представлены в выборке одним прочтением
Рисунок 13. Распределение числа прочтений секвенатором продуктов nMETR среди
6589 последовательностей, найденных программой «PostParser» По вертикальной оси указано
количество локусов, прочитанных указанное число раз.
Геномные локусы, представленные в выборке большим или средним числом прочтений
оказались частично или полностью деметилированы, тогда как прочитанные только один раз
57
оказались метилированы почти целиком. Статусы метилирования сайта рестрикции (CGCG) и
прилегающих последовательностей, проанализированных с помощью бисульфитного
секвенирования, коррелируют (Рис. 14).
Рисунок 14. Результаты бисульфитного секвенирования 9 локусов, представленных
различным в обработанных программой “PostParser” данных различным числом повторов.
Изображение получено с помощью программы “BiqAnalyser” (с изменениями), каждая линия
обозначает последовательность клона из библиотеки конвертированных бисульфитом
58
последовательностей ДНК, кружки – отдельные CpG, наличие метильной группы у цитозина
обозначается заливкой. Красной рамкой обведены сайты рестрикции рестриктазы BspFNI
(CGCG), масштаб не сохранён. Справа обозначен локус, на который была картирована
найденная последовательность и количество прочтений.
Результаты бисульфитного секвенирования, таким образом, показывают пригодность
nMETR для поиска гипометилированных последовательностей генома.
59
4.8. Заключение
Разработанный метод nMETR способен быстро предоставить в распоряжение
исследователя набор гипометилированных последовательностей генома, которые могут как
выступать в качестве контроля в широкомасштабных исследованиях статуса метилирования
геномной ДНК, так и в качестве самостоятельного подхода для изучения эпигенетической
регуляции мобильных элементов. Помимо этого, nMETR является полезной техникой,
позволяющей получить набор гипометилированных последовательностей без определения
статуса метилирования для всей геномной ДНК. Метод может применяться для изучения
статуса метилирования ДНК любого эукариотического организма, содержащего в своей ДНК
геномные повторы и обладающего CG метилированием, наилучшие результаты могут
достигаться при выборе геномных повторов, наиболее широко распределенных по геномной
ДНК.
Возможно совмещение nMETR с любым современным подходом NGS. Единственным
ограничением в этом случае является необходимость секвенирования достаточно длинных
фрагментов, покрывающего повторяющиеся последовательности.
Разработанный протокол nMETR включает в себя стадию амплификации, которая
может влиять на распределение фрагментов ДНК в выборке вследствие эффекта «ПЦР-сдвига»
(англ. “PCR bias effect ”). В этом случае возможно снижение негативных эффектов с помощью
уменьшения числа раундов ПЦР или использования более процессивной полимеразы, так как
количество ДНК, необходимое для «глубокого» секвенирования снижается в ходе
усовершенствования приборов и методов NGS [214].
4.9. Экспериментальный анализ специфичной для человека
открытой рамки считывания c11orf72
Сопоставление первичной структуры ДНК человека с геномами шимпанзе и других
приматов позволило обнаружить множество особенностей, специфично маркирующих ДНК
человека [215]. Тем не менее, в настоящее время генетические основы, определяющие
фенотипические особенности человека, остаются не до конца понятными. Очевидно, важную
роль в этом сыграли такие генетические изменения, как делеции, дупликации, инверсии,
точечные замены, вставки мобильных генетических элементов [205; 216-218]. Помимо
изменения уже имевшихся генов, под действием мутаций может происходить образование
60
генов de novo из изначально некодирующих последовательностей ДНК [219; 220]. Ген c11orf72
(также известен как FLJ90834) был предсказан ранее на основании анализа транскриптома и
внесен в реестр генов человека. Мы показали, что предсказанная открытая рамка считывания
c11orf72 специфична для генома человека и отсутствует в ДНК других высших приматов. Мы
впервые провели системный анализ транскрипционной активности c11orf72 в различных тканях
человека (яичко, сердце, мозг, легкие, мочевой пузырь, рак яичка, рак мочевого пузыря).
61
Рисунок 15. (А) Схема окрестности гена c11orf72 и строения его второго
(кодирующего) экзона. Обозначены ген домашнего хозяйства NDUFV1, его CpG-островок,
представлена схема строения c11orf72. Обозначена структура второго экзона c11orf72
(вынесен), состоящего из фрагментов последовательностей трех генетических мобильных
элементов. 1 – места отжига праймеров для OT-ПЦР, 2 – места отжига праймеров к вероятной
62
5’-регуляторной области гена c11orf72 при «бисульфитном секвенировании», 3 - места отжига
праймеров к CpG-островку гена NDUFV1 при «бисульфитном секвенировании».
(Б) Результат выравнивания транслированной последовательности ОРС гена c11orf72
человека и ортологичных последовательностей шимпанзе и макака резуса. ч – транслированная
последовательность человека, ш – транслированная последовательность шимпанзе, р –
транслированная последовательность макака резуса. Ранние стоп-кодоны, прерывающие рамки
считывания у макака резуса и шимпанзе отмечены стрелкой.
Выравнивание транслированной открытой рамки считывания (ОРС) гена c11orf72 у
человека с ортологичными последовательностями шимпанзе и макака резуса показывает, что
человеческая ОРС содержит стоп кодон через 753 п. о. после точки начала трансляции , тогда
как в последовательности шимпанзе и макака резуса стоп-кодоны появляются существенно
раньше – после 32 кодона (Рис. 15Б). Таким образом, из трех исследованных видов приматов,
только человек содержит соответствующую этому локусу открытую рамку считывания.
Определение уровня транскрипции c11orf72 в различных нормальных и
подвергнувшихся злокачественному перерождению тканях человека (в семенниках, сердце,
тканях мозга, легких, мочевом пузыре, раке яичка и раке мочевого пузыря) проводили при
помощи ОТ-ПЦР (схему отжига праймеров см. на Рис. 15А). В качестве отрицательного
контроля использовали препараты мРНК соответствующих тканей без добавления фермента
обратной транскриптазы («RT-» - контроль). Положительным контролем служила ОТ-ПЦР с
праймерами к гену домашнего хозяйства человека ACTB1 (β-актин). Проведенное исследование
показало отсутствие транскрипции c11orf72 во всех исследованных тканях, на фоне высокой
транскрипционной активности гена ACTB1 (Рис. 16).
Рисунок 16. Результаты ОТ-ПЦР скрининга транскрипционной активности гена
c11orf72. ОТ-ПЦР проводили с образцами кДНК, полученной для образцов различных тканей
человека, с праймерами, специфичными для гена β-актина и для последовательности II экзона
c11orf72. Количество раундов ПЦР указано слева. Ткани, для которых были получены образцы
кДНК, указаны снизу. 1- электрофореграммы ПЦР-продуктов, полученных амплификацией
соотв. кДНК с праймерами к гену β–актина ACTB1. 2– электрофореграммы ПЦР-продуктов,
63
полученных амплификацией соотв. кДНК с праймерами ко II экзону c11orf72, RT- реакционная
смесь без добавления ревертазы, RT+ - с добавлением ревертазы.
Точка начала транскрипции одной из изоформ мРНК c11orf72 отстоит от точки начала
транскрипции гена домашнего хозяйства NDUFV1 всего на ~150 п. о. (гены разнонаправлены и
располагаются в ориентации «хвост к хвосту»). Между обоими генами расположен CpGостровок, который продолжается к началу гена NDUFV1 и включает его первый экзон (Рис.
15А). Перечисленные особенности позволяют предположить для обоих генов наличие общих
регуляторных последовательностей. При этом NDUFV1 относится к генам домашнего
хозяйства, кодирует один из компонентов митохондриальной электрон-транспортной цепи и
экспрессируется во всех тканях организма, а ген c11orf72, согласно нашим исследованиям, если
и транскрибируется, то лишь в ограниченном наборе тканей.
Такие существенные различия в активности этих двух генов, обладающих общими
регуляторными последовательностями, могут объясняться особенностями эпигенетической
регуляции их экспрессии.
Нами была произведена проверка статуса метилирования CpG-островка гена NDUFV1 и
области ДНК выше точки начала транскрипции c11orf72 для образцов тканей мозга и мочевого
пузыря человека. Полученные результаты свидетельствуют о высоком уровне метилирования
геномной ДНК для участка c11orf72 и о крайне низком уровне метилирования – для CpGостровка гена NDUFV1. Таким образом, отсутствие экспрессии c11orf72 в исследованных
человеческих тканях может быть опосредовано метилированием данного регуляторного
участка. (Рис. 17).
64
Рисунок 17. Результаты бисульфитного секвенирования участка в 5’-области перед
геном c11orf72 и CpG-островка гена NDUFV1C1 с использованием матриц геномной ДНК
тканей больших полушарий мозга и геномной ДНК ткани мочевого пузыря. Закрашенные круги
– метилированные CpG – динуклеотиды, белые круги – неметилированные CpG. Изображение
получено с помощью программы BiQAnalyser, масштаб не сохранен. Анализ проводился для
геномной ДНК из тканей мозга (данные объединены верхней скобкой) и мочевого пузыря
(данные объединены нижней скобкой)
В дальнейших экспериментах, мы исследовали внутриклеточную локализацию
белкового продукта с11orf72. Для этого на основе плазмидных векторов pTurboGFP-C и
pTurboGFP-N (Евроген, Россия) были получены конструкции, содержащие полноразмерную
открытую рамку считывания с11orf72, слитую на С- или на N-конце с геном флуоресцентного
белка TurboGFP в составе единой открытой рамки считывания белка, под транскрипционным
контролем промотора CMV.
Человеческие клетки линий NTera2/D1 (эмбриональный рак яичка) и HepG2 (рак
печени) трансфицировали полученными конструкциями, после чего при помощи метода
конфокальной микроскопии через 24, 48 или 72 часа определяли внутриклеточную
локализацию рекомбинантных белков. В качестве контроля использовались
нетрансфицированные клеточные культуры и клетки, трансфицированные «пустыми»
векторами pTurboGFP-C и pTurboGFP-N, содержащими только ген флуоресцентного белка, но
не несущими вставки с11orf72. В обеих клеточных линиях, химерные белки более-менее
равномерно окрашивали трансфицированные клетки для обеих использованных конструкций.
Это свидетельствует об отсутствии выраженной специфичности во внутриклеточной
локализации белкового продукта C11orf72.
Для проверки возможной цитотоксичности C11orf72, с использованием проточной
цитофлуориметрии мы сопоставили число апоптотических и некротических клеток в образцах
клеточной культуры NT2/D1, трансфицированных векторами, кодирующими химерные белки
C11orf72-TurboGFP, с количеством апоптотических и некротических клеток в образцах,
трансфицированных «пустыми» векторами pTurboGFP-C и pTurboGFP-N. Для идентификации
апоптотических клеток использовался метод окрашивания связанным с аннексином красителем
(Аннексин V связанный с FITC), некротические клетки определяли при помощи избирательного
окрашивания пропидиум иодидом. Культуры трансфектантов анализировались после 24, 48 и
72 часов после трансфекции.
Во всех случаях, доли апоптотических и некротических клеток в опыте и в контроле
были сопоставимы, так что полученные данные свидетельствуют в пользу отсутствия какоголибо выраженного цитотоксического эффекта у белкового продукта C11orf72. (Табл. 4).
65
Время после
трансфекции
24 часа
Трансфекция
TurboGFP-C
GFP+
GFP-
Эффективность
трансфекции
13,61±0,03
9,2±0,1
13,8
TurboGFPc11orf 72
12,82±0,04 14,33±0,03
14,5
TurboGFP-N
11,62±0,03 33,23±0,05
43,6
c11orf 72 TurboGFP-N
10,31±0,02 24±0,07
32
48 часов
TurboGFP-C
12,82±0,01 7,6±0,05
11,7
TurboGFPc11orf 72
23,75±0,03 13,2±0,06
6,7
TurboGFP-N
43,54±0,02 43,38±0,04
46
c11orf 72TurboGFP
61,6±0,09
53±0,03
40,7
72 часа
TurboGFP-C
7,32±0,05
3,1±0,03
11,4
TurboGFPc11orf 72
15,73±0,04 3±0,03
2,7
TurboGFP-N
52,36±0,03 10,8±0,07
45,9
c11orf 72 TurboGFP-N
59,97±0,04 18±0,09
33,2
Таблица 4. Анализ результатов трансфекции клеточной линии NT2/D1
рекомбинантными вариантами гена c11orf 72.
Полученные результаты свидетельствуют, что белковый продукт C11orf72 не обладает
каким-либо выраженным цитотоксическим или промитотическим эффектом, и чрезвычайно
высокий уровень транскрипционной супрессии этого локуса, по-видимому, не связан с какойлибо его опасностью для хозяйской клетки. Локализация белкового продукта C11orf72 внутри
клетки не проявляет каких-либо незаурядных особенностей распределения. Таким образом,
полученные в этой работе данные позволяют подвергнуть сомнению функциональную роль
c11orf72 в организме, да и существование гена c11orf72 как такового, вернее – статус локуса
c11orf72 как гена. Полученные данные свидетельствуют, что среди последовательностей, уже
каталогизированных как «гены» человека, могут встречаться и участки ДНК с сомнительной
функциональной значимостью.
Мы предполагаем, что экспрессия c11orf72 в ретинобластоме может быть связана с
сопутствующей раковому перерождению потерей каких-либо механизмов присутствующей в
норме транскрипционной супрессии этого локуса, что и выразилось в активации c11orf72.
Вместе с тем, само наличие открытой рамки считывания в составе c11orf72 и
экспрессия этого локуса в ограниченном наборе типов клеток является превосходным
доказательством гипотезы, согласно которой новые кодирующие белок последовательности
могут образовываться в ходе случайного мутагенеза исходно некодирующих фрагментов ДНК.
«Молчащие» такие вновь образованные последовательности, как в случае локуса c11orf72 и
66
ретинобластомы, могут аберрантно активироваться в поврежденных тканях. Дальнейшее
эволюционирование локусов, подобных c11orf72, может привести к появлению полноценных
новых функциональных генов.
67
5. Выводы
Разработан новый метод крупномасштабного поиска гипометилированных
регуляторных участков в геномах эукариот и получены пилотные клонотеки на основе
геномной ДНК, выделенной из человеческого мозга. Разработанный протокол успешно
масштабирован для анализа полученных смесей с помощью высокопроизводительного
секвенирования.
Продемонстрирована возможность бионформатического анализа данных, полученных с
помощью nMETR. Осуществлен анализ 68729 последовательностей, несущих информацию о
~1100 геномных локусах, из которых 64% располагались вблизи известных CpG-островков.
Показано, что последовательности, прочитанные один раз высокометилированы, а прочитанные
более пяти раз ‒ гипометилированы.
При проверке статуса метилирования геномной ДНК для участка генома в локусе
11q13. 2 был обнаружен ранее предсказанный ген c11orf72. Показано, что эта
последовательность является специфичной для генома человека, произведен системный анализ
её транскрипции и статус метилирования вероятной регуляторной области.
68
6. Список сокращений
4mC – N4-метилцитозин
5caC - 5-карбоксилцитозин
5fC - 5-формилцитозин
5hmC – 5-гидроксиметилцитозин
5hmU – 5-гидроксиметилурацил
5mC – 5 метилцитозин
6mA – N6-метиладенин
AID/APOBEC (activation-induced deaminase/apolipoprotein B mRNA-editing enzyme
complex) – активируемый деаминазный комплекс/ алипопротеин B -ферментативный комплекс
эдитинга мРНК
ENase – Endo Nuclease, эндонуклеаза
HGP – Human Genome Progect, проект «Геном Человека»
LCX - leukemia-associated protein with a CXXC domain
LINE – long interspersed nuclear element, длинный распределенный ядерный элемент
LTR – long terminal repeat, длинный концевой повтор
NGS – Next Generation Sequencing, секвенирование «следующего поколения»
NIH – National Institutes of Health, Национальный институт здоровья
nMETR - non-MEthylated Tag Recovery
ДСН - дуплекс-специфическая нуклеаза
ДТТ - дитиотреитол
ОРС – открытая рамка считывания
РМ – рестикция-модификация
69
7. Список литературы
1. Lander E. S., Linton L. M. M., Birren B., Nusbaum C., Zody M. C. C., Baldwin J., Devon
K., Dewar K., Doyle M., FitzHugh W., others, Funke R., Gage D., Harris K., Heaford A., Howland J.,
Kann L., Lehoczky J., LeVine R., McEwan P., McKernan K., Meldrim J., Mesirov J. P., Miranda C.,
Morris W., Naylor J., Raymond C., Rosetti M., Santos R., Sheridan A., Sougnez C., Stange-Thomann
N., Stojanovic N., Subramanian A., Wyman D., Rogers J., Sulston J., Ainscough R., Beck S., Bentley
D., Burton J., Clee C., Carter N., Coulson A., Deadman R., Deloukas P., Dunham A., Dunham I.,
Durbin R., French L., Grafham D., Gregory S., Hubbard T., Humphray S., Hunt A., Jones M., Lloyd
C., McMurray A., Matthews L., Mercer S., Milne S., Mullikin J. C., Mungall A., Plumb R., Ross M.,
Shownkeen R., Sims S., Waterston R. H., Wilson R. K., Hillier L. W., McPherson J. D., Marra M. A.,
Mardis E. R., Fulton L. A., Chinwalla A. T., Pepin K. H., Gish W. R., Chissoe S. L., Wendl M. C.,
Delehaunty K. D., Miner T. L., Delehaunty A., Kramer J. B., Cook L. L., Fulton R. S., Johnson D. L.,
Minx P. J., Clifton S. W., Hawkins T., Branscomb E., Predki P., Richardson P., Wenning S., Slezak T.,
Doggett N., Cheng J. F., Olsen A., Lucas S., Elkin C., Uberbacher E., Frazier M., Gibbs R. A., Muzny
D. M., Scherer S. E., Bouck J. B., Sodergren E. J., Worley K. C., Rives C. M., Gorrell J. H., Metzker
M. L., Naylor S. L., Kucherlapati R. S., Nelson D. L., Weinstock G. M., Sakaki Y., Fujiyama A.,
Hattori M., Yada T., Toyoda A., Itoh T., Kawagoe C., Watanabe H., Totoki Y., Taylor T.,
Weissenbach J., Heilig R., Saurin W., Artiguenave F., Brottier P., Bruls T., Pelletier E., Robert C.,
Wincker P., Smith D. R., Doucette-Stamm L., Rubenfield M., Weinstock K., Lee H. M., Dubois J.,
Rosenthal A., Platzer M., Nyakatura G., Taudien S., Rump A., Yang H., Yu J., Wang J., Huang G., Gu
J., Hood L., Rowen L., Madan A., Qin S., Davis R. W., Federspiel N. A., Abola A. P., Proctor M. J.,
Myers R. M., Schmutz J., Dickson M., Grimwood J., Cox D. R., Olson M. V., Kaul R., Shimizu N.,
Kawasaki K., Minoshima S., Evans G. A., Athanasiou M., Schultz R., Roe B. A., Chen F., Pan H.,
Ramser J., Lehrach H., Reinhardt R., McCombie W. R., de la Bastide M., Dedhia N., Blocker H.,
Hornischer K., Nordsiek G., Agarwala R., Aravind L., Bailey J. A., Bateman A., Batzoglou S., Birney
E., Bork P., Brown D. G., Burge C. B., Cerutti L., Chen H. C., Church D., Clamp M., Copley R. R.,
Doerks T., Eddy S. R., Eichler E. E., Furey T. S., Galagan J., Gilbert J. G., Harmon C., Hayashizaki
Y., Haussler D., Hermjakob H., Hokamp K., Jang W., Johnson L. S., Jones T. A., Kasif S., Kaspryzk
A., Kennedy S., Kent W. J., Kitts P., Koonin E. V., Korf I., Kulp D., Lancet D., Lowe T. M.,
McLysaght A., Mikkelsen T., Moran J. V., Mulder N., Pollara V. J., Ponting C. P., Schuler G., Schultz
J., Slater G., Smit A. F., Stupka E., Szustakowski J., Thierry-Mieg D., Thierry-Mieg J., Wagner L.,
Wallis J., Wheeler R., Williams A., Wolf Y. I., Wolfe K. H., Yang S. P., Yeh R. F., Collins F., Guyer
M. S., Peterson J., Felsenfeld A., Wetterstrand K. A., Patrinos A., Morgan M. J., de Jong P., Catanese
J. J., Osoegawa K., Shizuya H., Choi S., Chen Y. J. Initial sequencing and analysis of the human
genome // Nature. ‒ 2001. ‒ T. 409. ‒ C. 860-921.
2. Venter J. C., Adams M. D., Myers E. W., Li P. W., Mural R. J., Sutton G. G., Smith H. O.,
Yandell M., Evans C. A., Holt R. A., Gocayne J. D., Amanatides P., Ballew R. M., Huson D. H.,
Wortman J. R., Zhang Q., Kodira C. D., Zheng X. H., Chen L., Skupski M., Subramanian G., Thomas
P. D., Zhang J., Gabor Miklos G. L., Nelson C., Broder S., Clark A. G., Nadeau J., McKusick V. A.,
Zinder N., Levine A. J., Roberts R. J., Simon M., Slayman C., Hunkapiller M., Bolanos R., Delcher
A., Dew I., Fasulo D., Flanigan M., Florea L., Halpern A., Hannenhalli S., Kravitz S., Levy S.,
Mobarry C., Reinert K., Remington K., Abu-Threideh J., Beasley E., Biddick K., Bonazzi V., Brandon
R., Cargill M., Chandramouliswaran I., Charlab R., Chaturvedi K., Deng Z., Di Francesco V., Dunn P.,
Eilbeck K., Evangelista C., Gabrielian A. E., Gan W., Ge W., Gong F., Gu Z., Guan P., Heiman T. J.,
Higgins M. E., Ji R. R., Ke Z., Ketchum K. A., Lai Z., Lei Y., Li Z., Li J., Liang Y., Lin X., Lu F.,
Merkulov G. V., Milshina N., Moore H. M., Naik A. K., Narayan V. A., Neelam B., Nusskern D.,
Rusch D. B., Salzberg S., Shao W., Shue B., Sun J., Wang Z., Wang A., Wang X., Wang J., Wei M.,
Wides R., Xiao C., Yan C., Yao A., Ye J., Zhan M., Zhang W., Zhang H., Zhao Q., Zheng L., Zhong
F., Zhong W., Zhu S., Zhao S., Gilbert D., Baumhueter S., Spier G., Carter C., Cravchik A., Woodage
70
T., Ali F., An H., Awe A., Baldwin D., Baden H., Barnstead M., Barrow I., Beeson K., Busam D.,
Carver A., Center A., Cheng M. L., Curry L., Danaher S., Davenport L., Desilets R., Dietz S., Dodson
K., Doup L., Ferriera S., Garg N., Gluecksmann A., Hart B., Haynes J., Haynes C., Heiner C., Hladun
S., Hostin D., Houck J., Howland T., Ibegwam C., Johnson J., Kalush F., Kline L., Koduru S., Love
A., Mann F., May D., McCawley S., McIntosh T., McMullen I., Moy M., Moy L., Murphy B., Nelson
K., Pfannkoch C., Pratts E., Puri V., Qureshi H., Reardon M., Rodriguez R., Rogers Y. H., Romblad
D., Ruhfel B., Scott R., Sitter C., Smallwood M., Stewart E., Strong R., Suh E., Thomas R., Tint N. N.,
Tse S., Vech C., Wang G., Wetter J., Williams S., Williams M., Windsor S., Winn-Deen E., Wolfe K.,
Zaveri J., Zaveri K., Abril J. F., Guigo R., Campbell M. J., Sjolander K. V., Karlak B., Kejariwal A.,
Mi H., Lazareva B., Hatton T., Narechania A., Diemer K., Muruganujan A., Guo N., Sato S., Bafna V.,
Istrail S., Lippert R., Schwartz R., Walenz B., Yooseph S., Allen D., Basu A., Baxendale J., Blick L.,
Caminha M., Carnes-Stine J., Caulk P., Chiang Y. H., Coyne M., Dahlke C., Mays A., Dombroski M.,
Donnelly M., Ely D., Esparham S., Fosler C., Gire H., Glanowski S., Glasser K., Glodek A., Gorokhov
M., Graham K., Gropman B., Harris M., Heil J., Henderson S., Hoover J., Jennings D., Jordan C.,
Jordan J., Kasha J., Kagan L., Kraft C., Levitsky A., Lewis M., Liu X., Lopez J., Ma D., Majoros W.,
McDaniel J., Murphy S., Newman M., Nguyen T., Nguyen N., Nodell M., Pan S., Peck J., Peterson
M., Rowe W., Sanders R., Scott J., Simpson M., Smith T., Sprague A., Stockwell T., Turner R., Venter
E., Wang M., Wen M., Wu D., Wu M., Xia A., Zandieh A., Zhu X. The sequence of the human
genome // Science. ‒ 2001. ‒ T. 291. ‒ C. 1304-1351.
3. Schuster S. C. Next-generation sequencing transforms today's biology // Nature methods. ‒
2008. ‒ T. 5. ‒ C. 16-18.
4. Novik K. L., Nimmrich I., Genc B., Maier S., Piepenbrock C., Olek A., Beck S.
Epigenomics: genome-wide study of methylation phenomena // Current issues in molecular biology. ‒
2002. ‒ T. 4. ‒ C. 111-128.
5. Wu C., Morris J. R. Genes, genetics, and epigenetics: a correspondence // Science. ‒ 2001.
‒ T. 293. ‒ C. 1103-1105.
6. Bernstein B. E., Meissner A., Lander E. S. The mammalian epigenome // Cell. ‒ 2007. ‒ T.
128. ‒ C. 669-681.
7. Strahl B. D., Allis C. D. The language of covalent histone modifications // Nature. ‒ 2000.
‒ T. 403. ‒ C. 41-45.
8. Gommers-Ampt J. H., Borst P. Hypermodified bases in DNA // The FASEB journal :
official publication of the Federation of American Societies for Experimental Biology. ‒ 1995. ‒ T. 9.
‒ C. 1034-1042.
9. Iyer L. M., Abhiman S., Aravind L. Natural history of eukaryotic DNA methylation
systems // Progress in molecular biology and translational science. ‒ 2011. ‒ T. 101. ‒ C. 25-104.
10. Johnson T. B., Coghill R. D. Researches on Pyrimidines. C111. The Discovery of 5methyl-cytosine in Tuberculinic acid, the Nucleic Acid of the Tubercle Bacillus. // Journal of
American Chemical Society. ‒ 1925. ‒ T. 47. ‒ C. 2838-2844.
11. Hotchkiss R. D. The quantitative separation of purines, pyrimidines, and nucleosides by
paper chromatography // The Journal of biological chemistry. ‒ 1948. ‒ T. 175. ‒ C. 315-332.
12. Ehrlich M., Gama-Sosa M. A., Carreira L. H., Ljungdahl L. G., Kuo K. C., Gehrke C. W.
DNA methylation in thermophilic bacteria: N4-methylcytosine, 5-methylcytosine, and N6methyladenine // Nucleic acids research. ‒ 1985. ‒ T. 13. ‒ C. 1399-1412.
13. Doskocil J., Sormova Z. The Occurrence of 5-Methylcytosine in Bacterial
Deoxyribonucleic Acids // Biochimica et biophysica acta. ‒ 1965. ‒ T. 95. ‒ C. 513-515.
14. Casadesus J., Low D. Epigenetic gene regulation in the bacterial world // Microbiol Mol
Biol Rev. ‒ 2006. ‒ T. 70. ‒ C. 830-856.
15. Kelly Jr. T. J., Smith H. O. A restriction enzyme from Hemophilus influenzae. II //
Journal of molecular biology. ‒ 1970. ‒ T. 51. ‒ C. 393-409.
16. Smith H. O. Nucleotide sequence specificity of restriction endonucleases // Science. ‒
1979. ‒ T. 205. ‒ C. 455-462.
71
17. Roberts R. J. Restriction and modification enzymes and their recognition sequences //
Gene. ‒ 1978. ‒ T. 4. ‒ C. 183-194.
18. Nathans D., Smith H. O. Restriction endonucleases in the analysis and restructuring of
dna molecules // Annual review of biochemistry. ‒ 1975. ‒ T. 44. ‒ C. 273-293.
19. Пахомова М. В. N6-диметиламинопурин в ДНК некоторых видов водорослей //
Доклады Академии Наук СССР. ‒ 1974. ‒ T. 214. ‒ C. 1202-1205.
20. Bheemanaik S., Reddy Y. V., Rao D. N. Structure, function and mechanism of exocyclic
DNA methyltransferases // The Biochemical journal. ‒ 2006. ‒ T. 399. ‒ C. 177-190.
21. Lodwick D., Ross H. N., Harris J. E., Almond J. W., Grant W. D. dam methylation in the
archaebacteria // Journal of general microbiology. ‒ 1986. ‒ T. 132. ‒ C. 3055-3059.
22. Barbeyron T., Kean K., Forterre P. DNA adenine methylation of GATC sequences
appeared recently in the Escherichia coli lineage // Journal of bacteriology. ‒ 1984. ‒ T. 160. ‒ C. 586590.
23. Torreblanca J., Casadesus J. DNA adenine methylase mutants of Salmonella typhimurium
and a novel dam-regulated locus // Genetics. ‒ 1996. ‒ T. 144. ‒ C. 15-26.
24. Piekarowicz A., Bujnicki J. Cloning of the Dam methyltransferase gene from
Haemophilus influenzae bacteriophage HP1 // Acta Microbiol Pol. ‒ 1999. ‒ T. 48. ‒ C. 123-129.
25. Barras F., Marinus M. G. The great GATC: DNA methylation in E. coli // Trends in
genetics : TIG. ‒ 1989. ‒ T. 5. ‒ C. 139-143.
26. Youderian P., Vershon A., Bouvier S., Sauer R. T., Susskind M. M. Changing the DNAbinding specificity of a repressor // Cell. ‒ 1983. ‒ T. 35. ‒ C. 777-783.
27. Zahran M., Daidone I., Smith J. C., Imhof P. Mechanism of DNA recognition by the
restriction enzyme EcoRV // Journal of molecular biology. ‒ 2010. ‒ T. 401. ‒ C. 415-432.
28. Kunkel T. A., Erie D. A. DNA mismatch repair // Annual review of biochemistry. ‒ 2005.
‒ T. 74. ‒ C. 681-710.
29. Marinus M. G. Methylation of DNA // Escherichia coli and Salmonella: cellular and
molecular biology / Neidhardt F. C. и др. ‒ Washington DC: ASM, 1996. ‒ C. 782-791.
30. Dodson K. W., Berg D. E. Factors affecting transposition activity of IS50 and Tn5 ends //
Gene. ‒ 1989. ‒ T. 76. ‒ C. 207-213.
31. Reznikoff W. S. The Tn5 transposon // Annual review of microbiology. ‒ 1993. ‒ T. 47. ‒
C. 945-963.
32. Yin J. C., Krebs M. P., Reznikoff W. S. Effect of dam methylation on Tn5 transposition //
Journal of molecular biology. ‒ 1988. ‒ T. 199. ‒ C. 35-45.
33. Roberts D., Hoopes B. C., McClure W. R., Kleckner N. IS10 transposition is regulated by
DNA adenine methylation // Cell. ‒ 1985. ‒ T. 43. ‒ C. 117-130.
34. Plumbridge J., Soll D. The effect of dam methylation on the expression of glnS in E. coli
// Biochimie. ‒ 1987. ‒ T. 69. ‒ C. 539-541.
35. Correnti J., Munster V., Chan T., Woude M. Dam-dependent phase variation of Ag43 in
Escherichia coli is altered in a seqA mutant // Molecular microbiology. ‒ 2002. ‒ T. 44. ‒ C. 521-532.
36. Harel J., Daigle F., Forget C., Tessier M. C., Crost C., Martin C. Phase variation of
F165(1) (Prs-like) fimbriae from Escherichia coli causing septicaemia in animals // Can J Microbiol. ‒
2000. ‒ T. 46. ‒ C. 1101-1107.
37. Ogden G. B., Pratt M. J., Schaechter M. The replicative origin of the E. coli chromosome
binds to cell membranes only when hemimethylated // Cell. ‒ 1988. ‒ T. 54. ‒ C. 127-135.
38. Blyn L. B., Braaten B. A., Low D. A. Regulation of pap pilin phase variation by a
mechanism involving differential dam methylation states // The EMBO journal. ‒ 1990. ‒ T. 9. ‒ C.
4045-4054.
39. Charlier D., Gigot D., Huysveld N., Roovers M., Pierard A., Glansdorff N. Pyrimidine
regulation of the Escherichia coli and Salmonella typhimurium carAB operons: CarP and integration
host factor (IHF) modulate the methylation status of a GATC site present in the control region //
Journal of molecular biology. ‒ 1995. ‒ T. 250. ‒ C. 383-391.
72
40. Wang M. X., Church G. M. A whole genome approach to in vivo DNA-protein
interactions in E. coli // Nature. ‒ 1992. ‒ T. 360. ‒ C. 606-610.
41. Zweiger G., Marczynski G., Shapiro L. A Caulobacter DNA methyltransferase that
functions only in the predivisional cell // Journal of molecular biology. ‒ 1994. ‒ T. 235. ‒ C. 472-485.
42. Berdis A. J., Lee I., Coward J. K., Stephens C., Wright R., Shapiro L., Benkovic S. J. A
cell cycle-regulated adenine DNA methyltransferase from Caulobacter crescentus processively
methylates GANTC sites on hemimethylated DNA // Proceedings of the National Academy of
Sciences of the United States of America. ‒ 1998. ‒ T. 95. ‒ C. 2874-2879.
43. Marczynski G. T., Shapiro L. Control of chromosome replication in caulobacter
crescentus // Annual review of microbiology. ‒ 2002. ‒ T. 56. ‒ C. 625-656.
44. Marinus M. G., Morris N. R. Isolation of deoxyribonucleic acid methylase mutants of
Escherichia coli K-12 // Journal of bacteriology. ‒ 1973. ‒ T. 114. ‒ C. 1143-1150.
45. Militello K. T., Simon R. D., Qureshi M., Maines R., VanHorne M. L., Hennick S. M.,
Jayakar S. K., Pounder S. Conservation of Dcm-mediated cytosine DNA methylation in Escherichia
coli // FEMS Microbiol Lett. ‒ 2012. ‒ T. 328. ‒ C. 78-85.
46. Palmer B. R., Marinus M. G. The dam and dcm strains of Escherichia coli--a review //
Gene. ‒ 1994. ‒ T. 143. ‒ C. 1-12.
47. Daegelen P., Studier F. W., Lenski R. E., Cure S., Kim J. F. Tracing ancestors and
relatives of Escherichia coli B, and the derivation of B strains REL606 and BL21(DE3) // Journal of
molecular biology. ‒ 2009. ‒ T. 394. ‒ C. 634-643.
48. Lieb M., Bhagwat A. S. Very short patch repair: reducing the cost of cytosine methylation
// Molecular microbiology. ‒ 1996. ‒ T. 20. ‒ C. 467-473.
49. Takahashi N., Naito Y., Handa N., Kobayashi I. A DNA methyltransferase can protect the
genome from postdisturbance attack by a restriction-modification gene complex // Journal of
bacteriology. ‒ 2002. ‒ T. 184. ‒ C. 6100-6108.
50. Janulaitis A., Klimasauskas S., Petrusyte M., Butkus V. Cytosine modification in DNA by
BcnI methylase yields N4-methylcytosine // FEBS letters. ‒ 1983. ‒ T. 161. ‒ C. 131-134.
51. Adams G. M., Blumenthal R. M. The PvuII DNA (cytosine-N4)-methyltransferase
comprises two trypsin-defined domains, each of which binds a molecule of S-adenosyl-L-methionine //
Biochemistry. ‒ 1997. ‒ T. 36. ‒ C. 8284-8292.
52. Wyatt G. R., Cohen S. S. The bases of the nucleic acids of some bacterial and animal
viruses: the occurrence of 5-hydroxymethylcytosine // The Biochemical journal. ‒ 1953. ‒ T. 55. ‒ C.
774-782.
53. Rocha E. P., Danchin A., Viari A. Evolutionary role of restriction/modification systems as
revealed by comparative genome analysis // Genome Res. ‒ 2001. ‒ T. 11. ‒ C. 946-958.
54. Carlson K., Hattman S., Raleigh E. A. Restriction and Modification // Molcular Biology
of bacteriophage T4 / K. C. ‒ Washington, D. C.: Cold Spring Harbor Library Press, American Society
for Molecular Biology, D.C, 1994. ‒ C. 369-381.
55. Bair C. L., Black L. W. A type IV modification dependent restriction nuclease that targets
glucosylated hydroxymethyl cytosine modified DNAs // Journal of molecular biology. ‒ 2007. ‒ T.
366. ‒ C. 768-778.
56. Swinton D., Hattman S., Crain P. F., Cheng C. S., Smith D. L., McCloskey J. A.
Purification and characterization of the unusual deoxynucleoside, alpha-N-(9-beta-D-2'deoxyribofuranosylpurin-6-yl)glycinamide, specified by the phage Mu modification function //
Proceedings of the National Academy of Sciences of the United States of America. ‒ 1983. ‒ T. 80. ‒
C. 7400-7404.
57. Toussaint A. The DNA modification function of temperate phage Mu-1 // Virology. ‒
1976. ‒ T. 70. ‒ C. 17-27.
58. Ehrlich M., Ehrlich K. C. A novel, highly modified, bacteriophage DNA in which
thymine is partly replaced by a phosphoglucuronate moiety covalently bound to 5-(4',5'dihydroxypentyl)uracil // The Journal of biological chemistry. ‒ 1981. ‒ T. 256. ‒ C. 9966-9972.
73
59. Lehman I. R., Pratt E. A. On the structure of the glucosylated hydroxymethylcytosine
nucleotides of coliphages T2, T4, and T6 // The Journal of biological chemistry. ‒ 1960. ‒ T. 235. ‒ C.
3254-3259.
60. Hemphill H. E., Whiteley H. R. Bacteriophages of Bacillus subtilis // Bacteriological
reviews. ‒ 1975. ‒ T. 39. ‒ C. 257-315.
61. Huang L. H., Farnet C. M., Ehrlich K. C., Ehrlich M. Digestion of highly modified
bacteriophage DNA by restriction endonucleases // Nucleic acids research. ‒ 1982. ‒ T. 10. ‒ C. 15791591.
62. Revel H. R., Luria S. E. DNA-glucosylation in T-even phage: genetic determination and
role in phagehost interaction // Annual review of genetics. ‒ 1970. ‒ T. 4. ‒ C. 177-192.
63. Warren R. A. Modified bases in bacteriophage DNAs // Annual review of microbiology. ‒
1980. ‒ T. 34. ‒ C. 137-158.
64. Scraba D. G., Bradley R. D., Leyritz-Wills M., Warren R. A. Bacteriophage phi W-14: the
contribution of covalently bound putrescine to DNA packing in the phage head // Virology. ‒ 1983. ‒
T. 124. ‒ C. 152-160.
65. Arnold H. P., Ziese U., Zillig W. SNDV, a novel virus of the extremely thermophilic and
acidophilic archaeon Sulfolobus // Virology. ‒ 2000. ‒ T. 272. ‒ C. 409-416.
66. Baranyi U., Klein R., Lubitz W., Kruger D. H., Witte A. The archaeal halophilic virusencoded Dam-like methyltransferase M. phiCh1-I methylates adenine residues and complements dam
mutants in the low salt environment of Escherichia coli // Molecular microbiology. ‒ 2000. ‒ T. 35. ‒
C. 1168-1179.
67. Magrini V., Salmi D., Thomas D., Herbert S. K., Hartzell P. L., Youderian P. Temperate
Myxococcus xanthus phage Mx8 encodes a DNA adenine methylase, Mox // Journal of bacteriology. ‒
1997. ‒ T. 179. ‒ C. 4254-4263.
68. Balganesh T. S., Reiners L., Lauster R., Noyer-Weidner M., Wilke K., Trautner T. A.
Construction and use of chimeric SPR/phi 3T DNA methyltransferases in the definition of sequence
recognizing enzyme regions // The EMBO journal. ‒ 1987. ‒ T. 6. ‒ C. 3543-3549.
69. Behrens B., Noyer-Weidner M., Pawlek B., Lauster R., Balganesh T. S., Trautner T. A.
Organization of multispecific DNA methyltransferases encoded by temperate Bacillus subtilis phages
// The EMBO journal. ‒ 1987. ‒ T. 6. ‒ C. 1137-1142.
70. Wilke K., Rauhut E., Noyer-Weidner M., Lauster R., Pawlek B., Behrens B., Trautner T.
A. Sequential order of target-recognizing domains in multispecific DNA-methyltransferases // The
EMBO journal. ‒ 1988. ‒ T. 7. ‒ C. 2601-2609.
71. Gowher H., Leismann O., Jeltsch A. DNA of Drosophila melanogaster contains 5methylcytosine // The EMBO journal. ‒ 2000. ‒ T. 19. ‒ C. 6918-6923.
72. Hung M. S., Karthikeyan N., Huang B., Koo H. C., Kiger J., Shen C. J. Drosophila
proteins related to vertebrate DNA (5-cytosine) methyltransferases // Proceedings of the National
Academy of Sciences of the United States of America. ‒ 1999. ‒ T. 96. ‒ C. 11940-11945.
73. Tweedie S., Charlton J., Clark V., Bird A. Methylation of genomes and genes at the
invertebrate-vertebrate boundary // Molecular and cellular biology. ‒ 1997. ‒ T. 17. ‒ C. 1469-1475.
74. Eick D., Fritz H. J., Doerfler W. Quantitative determination of 5-methylcytosine in DNA
by reverse-phase high-performance liquid chromatography // Analytical biochemistry. ‒ 1983. ‒ T.
135. ‒ C. 165-171.
75. Santi D. V., Garrett C. E., Barr P. J. On the mechanism of inhibition of DNA-cytosine
methyltransferases by cytosine analogs // Cell. ‒ 1983. ‒ T. 33. ‒ C. 9-10.
76. Goll M. G., Bestor T. H. Eukaryotic cytosine methyltransferases // Annual review of
biochemistry. ‒ 2005. ‒ T. 74. ‒ C. 481-514.
77. Bird A. P. DNA methylation patterns and epigenetic memory // Genes & development. ‒
2002. ‒ T. 16. ‒ C. 6-21.
78. Clark S. J., Harrison J., Frommer M. CpNpG methylation in mammalian cells // Nature
genetics. ‒ 1995. ‒ T. 10. ‒ C. 20-27.
74
79. Lorincz M. C., Groudine M. C(m)C(a/t)GG methylation: a new epigenetic mark in
mammalian DNA? // Proceedings of the National Academy of Sciences of the United States of
America. ‒ 2001. ‒ T. 98. ‒ C. 10034-10036.
80. Woodcock D. M., Lawler C. B., Linsenmeyer M. E., Doherty J. P., Warren W. D.
Asymmetric methylation in the hypermethylated CpG promoter region of the human L1
retrotransposon // The Journal of biological chemistry. ‒ 1997. ‒ T. 272. ‒ C. 7810-7816.
81. Haines T. R., Rodenhiser D. I., Ainsworth P. J. Allele-specific non-CpG methylation of
the Nf1 gene during early mouse development // Developmental biology. ‒ 2001. ‒ T. 240. ‒ C. 585598.
82. Ramsahoye B. H., Biniszkiewicz D., Lyko F., Clark V., Bird A. P., Jaenisch R. Non-CpG
methylation is prevalent in embryonic stem cells and may be mediated by DNA methyltransferase 3a //
Proceedings of the National Academy of Sciences of the United States of America. ‒ 2000. ‒ T. 97. ‒
C. 5237-5242.
83. Li E., Bestor T. H., Jaenisch R. Targeted mutation of the DNA methyltransferase gene
results in embryonic lethality // Cell. ‒ 1992. ‒ T. 69. ‒ C. 915-926.
84. Jackson-Grusby L., Beard C., Possemato R., Tudor M., Fambrough D., Csankovszki G.,
Dausman J., Lee P., Wilson C., Lander E., Jaenisch R. Loss of genomic methylation causes p53dependent apoptosis and epigenetic deregulation // Nature genetics. ‒ 2001. ‒ T. 27. ‒ C. 31-39.
85. Gardiner-Garden M., Frommer M. CpG islands in vertebrate genomes // Journal of
molecular biology. ‒ 1987. ‒ T. 196. ‒ C. 261-282.
86. Takai D., Jones P. A. Comprehensive analysis of CpG islands in human chromosomes 21
and 22 // Proceedings of the National Academy of Sciences of the United States of America. ‒ 2002. ‒
T. 99. ‒ C. 3740-3745.
87. Blelloch R., Wang Z., Meissner A., Pollard S., Smith A., Jaenisch R. Reprogramming
efficiency following somatic cell nuclear transfer is influenced by the differentiation and methylation
state of the donor nucleus // Stem Cells. ‒ 2006. ‒ T. 24. ‒ C. 2007-2013.
88. Bruniquel D., Schwartz R. H. Selective, stable demethylation of the interleukin-2 gene
enhances transcription by an active process // Nat Immunol. ‒ 2003. ‒ T. 4. ‒ C. 235-240.
89. Hattori N., Nishino K., Ko Y. G., Ohgane J., Tanaka S., Shiota K. Epigenetic control of
mouse Oct-4 gene expression in embryonic stem cells and trophoblast stem cells // The Journal of
biological chemistry. ‒ 2004. ‒ T. 279. ‒ C. 17063-17069.
90. Bird A. P., Taggart M. H., Nicholls R. D., Higgs D. R. Non-methylated CpG-rich islands
at the human alpha-globin locus: implications for evolution of the alpha-globin pseudogene // The
EMBO journal. ‒ 1987. ‒ T. 6. ‒ C. 999-1004.
91. Bird A. P. CpG-rich islands and the function of DNA methylation // Nature. ‒ 1986. ‒ T.
321. ‒ C. 209-213.
92. McKeon C., Ohkubo H., Pastan I., de Crombrugghe B. Unusual methylation pattern of the
alpha 2 (l) collagen gene // Cell. ‒ 1982. ‒ T. 29. ‒ C. 203-210.
93. Voo K. S., Carlone D. L., Jacobsen B. M., Flodin A., Skalnik D. G. Cloning of a
mammalian transcriptional activator that binds unmethylated CpG motifs and shares a CXXC domain
with DNA methyltransferase, human trithorax, and methyl-CpG binding domain protein 1 // Molecular
and cellular biology. ‒ 2000. ‒ T. 20. ‒ C. 2108-2121.
94. Ehrlich M., Gama-Sosa M. A., Huang L. H., Midgett R. M., Kuo K. C., McCune R. A.,
Gehrke C. Amount and distribution of 5-methylcytosine in human DNA from different types of tissues
of cells // Nucleic acids research. ‒ 1982. ‒ T. 10. ‒ C. 2709-2721.
95. Bestor T. H. The DNA methyltransferases of mammals // Human molecular genetics. ‒
2000. ‒ T. 9. ‒ C. 2395-2402.
96. Mayer W., Niveleau A., Walter J., Fundele R., Haaf T. Demethylation of the zygotic
paternal genome // Nature. ‒ 2000. ‒ T. 403. ‒ C. 501-502.
97. Wu S. C., Zhang Y. Active DNA demethylation: many roads lead to Rome // Nature
reviews. Molecular cell biology. ‒ 2010. ‒ T. 11. ‒ C. 607-620.
75
98. Inoue A., Zhang Y. Replication-dependent loss of 5-hydroxymethylcytosine in mouse
preimplantation embryos // Science. ‒ 2011. ‒ T. 334. ‒ C. 194.
99. Nakamura T., Arai Y., Umehara H., Masuhara M., Kimura T., Taniguchi H., Sekimoto T.,
Ikawa M., Yoneda Y., Okabe M., Tanaka S., Shiota K., Nakano T. PGC7/Stella protects against DNA
demethylation in early embryogenesis // Nat Cell Biol. ‒ 2007. ‒ T. 9. ‒ C. 64-71.
100. Hajkova P., Erhardt S., Lane N., Haaf T., El-Maarri O., Reik W., Walter J., Surani M. A.
Epigenetic reprogramming in mouse primordial germ cells // Mech Dev. ‒ 2002. ‒ T. 117. ‒ C. 15-23.
101. Wu H., Zhang Y. Mechanisms and functions of Tet protein-mediated 5-methylcytosine
oxidation // Genes & development. ‒ 2011. ‒ T. 25. ‒ C. 2436-2452.
102. Martinowich K., Hattori D., Wu H., Fouse S., He F., Hu Y., Fan G., Sun Y. E. DNA
methylation-related chromatin remodeling in activity-dependent BDNF gene regulation // Science. ‒
2003. ‒ T. 302. ‒ C. 890-893.
103. Macleod D., Clark V. H., Bird A. Absence of genome-wide changes in DNA
methylation during development of the zebrafish // Nature genetics. ‒ 1999. ‒ T. 23. ‒ C. 139-140.
104. Baylin S. B., Herman J. G. DNA hypermethylation in tumorigenesis: epigenetics joins
genetics // Trends in genetics : TIG. ‒ 2000. ‒ T. 16. ‒ C. 168-174.
105. Issa J. P. CpG-island methylation in aging and cancer // Current topics in microbiology
and immunology. ‒ 2000. ‒ T. 249. ‒ C. 101-118.
106. Jones P. A., Wolkowicz M. J., Rideout 3rd W. M., Gonzales F. A., Marziasz C. M.,
Coetzee G. A., Tapscott S. J. De novo methylation of the MyoD1 CpG island during the establishment
of immortal cell lines // Proceedings of the National Academy of Sciences of the United States of
America. ‒ 1990. ‒ T. 87. ‒ C. 6117-6121.
107. Jones P. A., Baylin S. B. The fundamental role of epigenetic events in cancer // Nature
reviews. Genetics. ‒ 2002. ‒ T. 3. ‒ C. 415-428.
108. Pradhan S., Bacolla A., Wells R. D., Roberts R. J. Recombinant human DNA (cytosine5) methyltransferase. I. Expression, purification, and comparison of de novo and maintenance
methylation // The Journal of biological chemistry. ‒ 1999. ‒ T. 274. ‒ C. 33002-33010.
109. Sato T., Kano I., Fukuda M., Yoshida Y., Sasaki T. Angiocardiographic findings and
morphogenesis of criss-cross heart with situs solitus, concordant artrioventricular relationships and Ltransposition // Tohoku J Exp Med. ‒ 1976. ‒ T. 119. ‒ C. 377-384.
110. Stoger R., Kajimura T. M., Brown W. T., Laird C. D. Epigenetic variation illustrated by
DNA methylation patterns of the fragile-X gene FMR1 // Human molecular genetics. ‒ 1997. ‒ T. 6. ‒
C. 1791-1801.
111. Hark A. T., Schoenherr C. J., Katz D. J., Ingram R. S., Levorse J. M., Tilghman S. M.
CTCF mediates methylation-sensitive enhancer-blocking activity at the H19/Igf2 locus // Nature. ‒
2000. ‒ T. 405. ‒ C. 486-489.
112. Bell A. C., West A. G., Felsenfeld G. The protein CTCF is required for the enhancer
blocking activity of vertebrate insulators // Cell. ‒ 1999. ‒ T. 98. ‒ C. 387-396.
113. Holmgren C., Kanduri C., Dell G., Ward A., Mukhopadhya R., Kanduri M., Lobanenkov
V., Ohlsson R. CpG methylation regulates the Igf2/H19 insulator // Curr Biol. ‒ 2001. ‒ T. 11. ‒ C.
1128-1130.
114. Hendrich B., Bird A. Identification and characterization of a family of mammalian
methyl-CpG binding proteins // Molecular and cellular biology. ‒ 1998. ‒ T. 18. ‒ C. 6538-6547.
115. Prokhortchouk A., Hendrich B., Jorgensen H., Ruzov A., Wilm M., Georgiev G., Bird
A., Prokhortchouk E. The p120 catenin partner Kaiso is a DNA methylation-dependent transcriptional
repressor // Genes & development. ‒ 2001. ‒ T. 15. ‒ C. 1613-1618.
116. Liu W. M., Chu W. M., Choudary P. V., Schmid C. W. Cell stress and translational
inhibitors transiently increase the abundance of mammalian SINE transcripts // Nucleic acids research.
‒ 1995. ‒ T. 23. ‒ C. 1758-1765.
117. Walsh C. P., Chaillet J. R., Bestor T. H. Transcription of IAP endogenous retroviruses is
constrained by cytosine methylation // Nature genetics. ‒ 1998. ‒ T. 20. ‒ C. 116-117.
76
118. Chu W. M., Ballard R., Carpick B. W., Williams B. R., Schmid C. W. Potential Alu
function: regulation of the activity of double-stranded RNA-activated kinase PKR // Molecular and
cellular biology. ‒ 1998. ‒ T. 18. ‒ C. 58-68.
119. Barlow D. P. Genomic imprinting: a mammalian epigenetic discovery model // Annual
review of genetics. ‒ 2011. ‒ T. 45. ‒ C. 379-403.
120. Bartolomei M. S. Genomic imprinting: employing and avoiding epigenetic processes //
Genes & development. ‒ 2009. ‒ T. 23. ‒ C. 2124-2133.
121. Abramowitz L. K., Bartolomei M. S. Genomic imprinting: recognition and marking of
imprinted loci // Curr Opin Genet Dev. ‒ 2012. ‒ T. 22. ‒ C. 72-78.
122. Cirio M. C., Martel J., Mann M., Toppings M., Bartolomei M., Trasler J., Chaillet J. R.
DNA methyltransferase 1o functions during preimplantation development to preclude a profound level
of epigenetic variation // Developmental biology. ‒ 2008. ‒ T. 324. ‒ C. 139-150.
123. Nagano T., Mitchell J. A., Sanz L. A., Pauler F. M., Ferguson-Smith A. C., Feil R.,
Fraser P. The Air noncoding RNA epigenetically silences transcription by targeting G9a to chromatin
// Science. ‒ 2008. ‒ T. 322. ‒ C. 1717-1720.
124. Lyon M. F. Gene action in the X-chromosome of the mouse (Mus musculus L.) //
Nature. ‒ 1961. ‒ T. 190. ‒ C. 372-373.
125. Rastan S. Non-random X-chromosome inactivation in mouse X-autosome translocation
embryos--location of the inactivation centre // J Embryol Exp Morphol. ‒ 1983. ‒ T. 78. ‒ C. 1-22.
126. Ng K., Pullirsch D., Leeb M., Wutz A. Xist and the order of silencing // EMBO Rep. ‒
2007. ‒ T. 8. ‒ C. 34-39.
127. Panning B., Dausman J., Jaenisch R. X chromosome inactivation is mediated by Xist
RNA stabilization // Cell. ‒ 1997. ‒ T. 90. ‒ C. 907-916.
128. Barr M. L., Carr D. H. Correlations between sex chromatin and sex chromosomes // Acta
Cytol. ‒ 1962. ‒ T. 6. ‒ C. 34-45.
129. Takagi N. Differentiation of X chromosomes in early female mouse embryos // Exp Cell
Res. ‒ 1974. ‒ T. 86. ‒ C. 127-135.
130. Jeppesen P., Turner B. M. The inactive X chromosome in female mammals is
distinguished by a lack of histone H4 acetylation, a cytogenetic marker for gene expression // Cell. ‒
1993. ‒ T. 74. ‒ C. 281-289.
131. Lock L. F., Melton D. W., Caskey C. T., Martin G. R. Methylation of the mouse hprt
gene differs on the active and inactive X chromosomes // Molecular and cellular biology. ‒ 1986. ‒ T.
6. ‒ C. 914-924.
132. Lock L. F., Takagi N., Martin G. R. Methylation of the Hprt gene on the inactive X
occurs after chromosome inactivation // Cell. ‒ 1987. ‒ T. 48. ‒ C. 39-46.
133. Barr H., Hermann A., Berger J., Tsai H. H., Adie K., Prokhortchouk A., Hendrich B.,
Bird A. Mbd2 contributes to DNA methylation-directed repression of the Xist gene // Molecular and
cellular biology. ‒ 2007. ‒ T. 27. ‒ C. 3750-3757.
134. Okano M., Bell D. W., Haber D. A., Li E. DNA methyltransferases Dnmt3a and Dnmt3b
are essential for de novo methylation and mammalian development // Cell. ‒ 1999. ‒ T. 99. ‒ C. 247257.
135. Ito S., Shen L., Dai Q., Wu S. C., Collins L. B., Swenberg J. A., He C., Zhang Y. Tet
proteins can convert 5-methylcytosine to 5-formylcytosine and 5-carboxylcytosine // Science. ‒ 2011.
‒ T. 333. ‒ C. 1300-1303.
136. Tahiliani M., Koh K. P., Shen Y., Pastor W. A., Bandukwala H., Brudno Y., Agarwal S.,
Iyer L. M., Liu D. R., Aravind L., Rao A. Conversion of 5-methylcytosine to 5-hydroxymethylcytosine
in mammalian DNA by MLL partner TET1 // Science. ‒ 2009. ‒ T. 324. ‒ C. 930-935.
137. Kriaucionis S., Heintz N. The nuclear DNA base 5-hydroxymethylcytosine is present in
Purkinje neurons and the brain // Science. ‒ 2009. ‒ T. 324. ‒ C. 929-930.
138. Jin S. G., Wu X., Li A. X., Pfeifer G. P. Genomic mapping of 5-hydroxymethylcytosine
in the human brain // Nucleic acids research. ‒ 2011. ‒ T. 39. ‒ C. 5015-5024.
77
139. Iyer L. M., Tahiliani M., Rao A., Aravind L. Prediction of novel families of enzymes
involved in oxidative and other complex modifications of bases in nucleic acids // Cell Cycle. ‒ 2009.
‒ T. 8. ‒ C. 1698-1710.
140. Ono R., Taki T., Taketani T., Taniwaki M., Kobayashi H., Hayashi Y. LCX, leukemiaassociated protein with a CXXC domain, is fused to MLL in acute myeloid leukemia with trilineage
dysplasia having t(10;11)(q22;q23) // Cancer Res. ‒ 2002. ‒ T. 62. ‒ C. 4075-4080.
141. Smiley J. A., Kundracik M., Landfried D. A., Barnes Sr. V. R., Axhemi A. A. Genes of
the thymidine salvage pathway: thymine-7-hydroxylase from a Rhodotorula glutinis cDNA library and
iso-orotate decarboxylase from Neurospora crassa // Biochimica et biophysica acta. ‒ 2005. ‒ T. 1723.
‒ C. 256-264.
142. Inoue A., Matoba S., Zhang Y. Transcriptional activation of transposable elements in
mouse zygotes is independent of Tet3-mediated 5-methylcytosine oxidation // Cell Res. ‒ 2012. ‒ T.
22. ‒ C. 1640-1649.
143. Frauer C., Hoffmann T., Bultmann S., Casa V., Cardoso M. C., Antes I., Leonhardt H.
Recognition of 5-hydroxymethylcytosine by the Uhrf1 SRA domain // PLoS One. ‒ 2011. ‒ T. 6. ‒ C.
e21306.
144. Jin S. G., Kadam S., Pfeifer G. P. Examination of the specificity of DNA methylation
profiling techniques towards 5-methylcytosine and 5-hydroxymethylcytosine // Nucleic acids research.
‒ 2010. ‒ T. 38. ‒ C. e125.
145. Maiti A., Drohat A. C. Thymine DNA glycosylase can rapidly excise 5-formylcytosine
and 5-carboxylcytosine: potential implications for active demethylation of CpG sites // The Journal of
biological chemistry. ‒ 2011. ‒ T. 286. ‒ C. 35334-35338.
146. Cortazar D., Kunz C., Selfridge J., Lettieri T., Saito Y., MacDougall E., Wirz A.,
Schuermann D., Jacobs A. L., Siegrist F., Steinacher R., Jiricny J., Bird A., Schar P. Embryonic lethal
phenotype reveals a function of TDG in maintaining epigenetic stability // Nature. ‒ 2011. ‒ T. 470. ‒
C. 419-423.
147. Cortellino S., Xu J., Sannai M., Moore R., Caretti E., Cigliano A., Le Coz M., Devarajan
K., Wessels A., Soprano D., Abramowitz L. K., Bartolomei M. S., Rambow F., Bassi M. R., Bruno T.,
Fanciulli M., Renner C., Klein-Szanto A. J., Matsumoto Y., Kobi D., Davidson I., Alberti C., Larue L.,
Bellacosa A. Thymine DNA glycosylase is essential for active DNA demethylation by linked
deamination-base excision repair // Cell. ‒ 2011. ‒ T. 146. ‒ C. 67-79.
148. He Y. F., Li B. Z., Li Z., Liu P., Wang Y., Tang Q., Ding J., Jia Y., Chen Z., Li L., Sun
Y., Li X., Dai Q., Song C. X., Zhang K., He C., Xu G. L. Tet-mediated formation of 5carboxylcytosine and its excision by TDG in mammalian DNA // Science. ‒ 2011. ‒ T. 333. ‒ C. 13031307.
149. Globisch D., Munzel M., Muller M., Michalakis S., Wagner M., Koch S., Bruckl T., Biel
M., Carell T. Tissue distribution of 5-hydroxymethylcytosine and search for active demethylation
intermediates // PLoS One. ‒ 2010. ‒ T. 5. ‒ C. e15367.
150. Guo J. U., Su Y., Zhong C., Ming G. L., Song H. Hydroxylation of 5-methylcytosine by
TET1 promotes active DNA demethylation in the adult brain // Cell. ‒ 2011. ‒ T. 145. ‒ C. 423-434.
151. Chen C. C., Wang K. Y., Shen C. K. The mammalian de novo DNA methyltransferases
DNMT3A and DNMT3B are also DNA 5-hydroxymethylcytosine dehydroxymethylases // The Journal
of biological chemistry. ‒ 2012. ‒ T. 287. ‒ C. 33116-33121.
152. Iqbal K., Jin S. G., Pfeifer G. P., Szabo P. E. Reprogramming of the paternal genome
upon fertilization involves genome-wide oxidation of 5-methylcytosine // Proceedings of the National
Academy of Sciences of the United States of America. ‒ 2011. ‒ T. 108. ‒ C. 3642-3647.
153. Wossidlo M., Nakamura T., Lepikhov K., Marques C. J., Zakhartchenko V., Boiani M.,
Arand J., Nakano T., Reik W., Walter J. 5-Hydroxymethylcytosine in the mammalian zygote is linked
with epigenetic reprogramming // Nat Commun. ‒ 2011. ‒ T. 2. ‒ C. 241.
154. Gu T. P., Guo F., Yang H., Wu H. P., Xu G. F., Liu W., Xie Z. G., Shi L., He X., Jin S.
G., Iqbal K., Shi Y. G., Deng Z., Szabo P. E., Pfeifer G. P., Li J., Xu G. L. The role of Tet3 DNA
dioxygenase in epigenetic reprogramming by oocytes // Nature. ‒ 2011. ‒ T. 477. ‒ C. 606-610.
78
155. Ito S., D'Alessio A. C., Taranova O. V., Hong K., Sowers L. C., Zhang Y. Role of Tet
proteins in 5mC to 5hmC conversion, ES-cell self-renewal and inner cell mass specification // Nature.
‒ 2010. ‒ T. 466. ‒ C. 1129-1133.
156. Wu H., Zhang Y. Tet1 and 5-hydroxymethylation: a genome-wide view in mouse
embryonic stem cells // Cell Cycle. ‒ 2011. ‒ T. 10. ‒ C. 2428-2436.
157. Dawlaty M. M., Ganz K., Powell B. E., Hu Y. C., Markoulaki S., Cheng A. W., Gao Q.,
Kim J., Choi S. W., Page D. C., Jaenisch R. Tet1 is dispensable for maintaining pluripotency and its
loss is compatible with embryonic and postnatal development // Cell Stem Cell. ‒ 2011. ‒ T. 9. ‒ C.
166-175.
158. Song C. X., Szulwach K. E., Fu Y., Dai Q., Yi C., Li X., Li Y., Chen C. H., Zhang W.,
Jian X., Wang J., Zhang L., Looney T. J., Zhang B., Godley L. A., Hicks L. M., Lahn B. T., Jin P., He
C. Selective chemical labeling reveals the genome-wide distribution of 5-hydroxymethylcytosine //
Nat Biotechnol. ‒ 2011. ‒ T. 29. ‒ C. 68-72.
159. Lauth M. R., Spear B. B., Heumann J., Prescott D. M. DNA of ciliated protozoa: DNA
sequence diminution during macronuclear development of Oxytricha // Cell. ‒ 1976. ‒ T. 7. ‒ C. 6774.
160. Williams K., Doak T. G., Herrick G. Developmental precise excision of Oxytricha
trifallax telomere-bearing elements and formation of circles closed by a copy of the flanking target
duplication // The EMBO journal. ‒ 1993. ‒ T. 12. ‒ C. 4593-4601.
161. Prescott D. M. The DNA of ciliated protozoa // Microbiological reviews. ‒ 1994. ‒ T.
58. ‒ C. 233-267.
162. Dawson D., Buckley B., Cartinhour S., Myers R., Herrick G. Elimination of germ-line
tandemly repeated sequences from the somatic genome of the ciliate Oxytricha fallax // Chromosoma.
‒ 1984. ‒ T. 90. ‒ C. 289-294.
163. Bracht J. R., Perlman D. H., Landweber L. F. Cytosine methylation and
hydroxymethylation mark DNA for elimination in Oxytricha trifallax // Genome Biol. ‒ 2012. ‒ T. 13.
‒ C. R99.
164. Rae P. M. Hydroxymethyluracil in eukaryote DNA: a natural feature of the pyrrophyta
(dinoflagellates) // Science. ‒ 1976. ‒ T. 194. ‒ C. 1062-1064.
165. Yoder J. A., Walsh C. P., Bestor T. H. Cytosine methylation and the ecology of
intragenomic parasites // Trends in genetics : TIG. ‒ 1997. ‒ T. 13. ‒ C. 335-340.
166. Зайцева Г. Н., Колесников А. А., Яценко И. А., Кирнос М. Д., Ванюшин Б. Ф. О
первичной структуре ДНК кинетопласта Critbidia oncopelti // Доклады Академии Наук СССР. ‒
1974. ‒ T. 219. ‒ C. 243-245.
167. Ammermann D., Steinbruck G., Baur R., Wohlert H. Methylated bases in the DNA of
the ciliate Stylonychia mytilus // European journal of cell biology. ‒ 1981. ‒ T. 24. ‒ C. 154-156.
168. Cummings D. J., Tait A., Goddard J. M. Methylated bases in DNA from Paramecium
aurelia // Biochimica et biophysica acta. ‒ 1974. ‒ T. 374. ‒ C. 1-11.
169. Gutierrez J. C., Callejas S., Borniquel S., Martin-Gonzalez A. DNA methylation in
ciliates: implications in differentiation processes // International microbiology : the official journal of
the Spanish Society for Microbiology. ‒ 2000. ‒ T. 3. ‒ C. 139-146.
170. Hattman S., Kenny C., Berger L., Pratt K. Comparative study of DNA methylation in
three unicellular eucaryotes // Journal of bacteriology. ‒ 1978. ‒ T. 135. ‒ C. 1156-1157.
171. Nelson M., Burbank D. E., Van Etten J. L. Chlorella viruses encode multiple DNA
methyltransferases // Biological chemistry. ‒ 1998. ‒ T. 379. ‒ C. 423-428.
172. Pratt K., Hattman S. Deoxyribonucleic acid methylation and chromatin organization in
Tetrahymena thermophila // Molecular and cellular biology. ‒ 1981. ‒ T. 1. ‒ C. 600-608.
173. Rae P. M., Spear B. B. Macronuclear DNA of the hypotrichous ciliate Oxytricha fallax //
Proceedings of the National Academy of Sciences of the United States of America. ‒ 1978. ‒ T. 75. ‒
C. 4992-4996.
79
174. Rogers S. D., Rogers M. E., Saunders G., Holt G. Isolation of mutants sensitive to 2aminopurine and alkylating agents and evidence for the role of DNA methylation in Penicillium
chrysogenum // Current genetics. ‒ 1986. ‒ T. 10. ‒ C. 557-560.
175. Rojas M. V., Galanti N. DNA methylation in Trypanosoma cruzi // FEBS letters. ‒ 1990.
‒ T. 263. ‒ C. 113-116.
176. Gorovsky M. A., Hattman S., Pleger G. L. (6N)methyl adenine in the nuclear DNA of a
eucaryote, Tetrahymena pyriformis // The Journal of cell biology. ‒ 1973. ‒ T. 56. ‒ C. 697-701.
177. Bromberg S., Pratt K., Hattman S. Sequence specificity of DNA adenine methylase in
the protozoan Tetrahymena thermophila // Journal of bacteriology. ‒ 1982. ‒ T. 150. ‒ C. 993-996.
178. Harrison G. S., Findly R. C., Karrer K. M. Site-specific methylation of adenine in the
nuclear genome of a eucaryote, Tetrahymena thermophila // Molecular and cellular biology. ‒ 1986. ‒
T. 6. ‒ C. 2364-2370.
179. Karrer K. M., VanNuland T. A. Position effect takes precedence over target sequence in
determination of adenine methylation patterns in the nuclear genome of a eukaryote, Tetrahymena
thermophila // Nucleic acids research. ‒ 1998. ‒ T. 26. ‒ C. 4566-4573.
180. Zhu C. M., Henney Jr. H. R. DNA methylation pattern during the encystment of
Physarum flavicomum // Biochemistry and cell biology = Biochimie et biologie cellulaire. ‒ 1990. ‒ T.
68. ‒ C. 944-948.
181. Ванюшин Б. Ф., Кадырова Д. Х., Каримов Х. Х., Белозёрский А. Н. Минорные
основания в ДНК высших растений // Биохимия. ‒ 1971. ‒ T. 36. ‒ C. 1251-1258.
182. Kirnos M. D., Alexandrushkina N. I., Zagorskaya G., II K., Vanyushin B. F.
Superproduction of heavy minicircular mitochondrial DNA in aging wheat coleoptiles // FEBS letters.
‒ 1992. ‒ T. 298. ‒ C. 109-112.
183. Pintor-Toro J. A. Adenine methylation in zein genes // Biochemical and biophysical
research communications. ‒ 1987. ‒ T. 147. ‒ C. 1082-1087.
184. Ashapkin V. V., Kutueva L. I., Vanyushin B. F. The gene for domains rearranged
methyltransferase (DRM2) in Arabidopsis thaliana plants is methylated at both cytosine and adenine
residues // FEBS letters. ‒ 2002. ‒ T. 532. ‒ C. 367-372.
185. Fedoreyeva L. I., Vanyushin B. F. N(6)-Adenine DNA-methyltransferase in wheat
seedlings // FEBS letters. ‒ 2002. ‒ T. 514. ‒ C. 305-308.
186. van Blokland R., Ross S., Corrado G., Scollan C., Meyer P. Developmental
abnormalities associated with deoxyadenosine methylation in transgenic tobacco // The Plant journal :
for cell and molecular biology. ‒ 1998. ‒ T. 15. ‒ C. 543-551.
187. Graham M. W., Larkin P. J. Adenine methylation at dam sites increases transient gene
expression in plant cells // Transgenic research. ‒ 1995. ‒ T. 4. ‒ C. 324-331.
188. Sugimoto K., Takeda S., Hirochika H. Transcriptional activation mediated by binding of
a plant GATA-type zinc finger protein AGP1 to the AG-motif (AGATCCAA) of the wound-inducible
Myb gene NtMyb2 // The Plant journal : for cell and molecular biology. ‒ 2003. ‒ T. 36. ‒ C. 550-564.
189. Мазин А. Л., Ванюшин Б. Ф. Включение цитокинина (6-бензиламинопурина) в
ДНК простейшего Tetrahymena pyriformis // Известия АН СССР: серия биологическая. ‒ 1986. ‒
T. Январь-Фев. ‒ C. 122-125.
190. Vanyushin B. F. Replicative DNA methylation in animals and higher plants // Current
topics in microbiology and immunology. ‒ 1984. ‒ T. 108. ‒ C. 99-114.
191. Ngernprasirtsiri J., Akazawa T. Modulation of DNA methylation and gene expression in
cultured sycamore cells treated by hypomethylating base analog // European journal of biochemistry /
FEBS. ‒ 1990. ‒ T. 194. ‒ C. 513-520.
192. Rogers S. W., Rogers J. C. The importance of DNA methylation for stability of foreign
DNA in barley // Plant molecular biology. ‒ 1992. ‒ T. 18. ‒ C. 945-961.
193. Fedoreyeva L. I., Sobolev D. E., Vanyushin B. F. Wheat endonuclease WEN1 dependent
on S-adenosyl-L-methionine and sensitive to DNA methylation status // Epigenetics : official journal
of the DNA Methylation Society. ‒ 2007. ‒ T. 2. ‒ C. 50-53.
80
194. Kay P. H., Pereira E., Marlow S. A., Turbett G., Mitchell C. A., Jacobsen P. F., Holliday
R., Papadimitriou J. M. Evidence for adenine methylation within the mouse myogenic gene Myo-D1 //
Gene. ‒ 1994. ‒ T. 151. ‒ C. 89-95.
195. Reyes E. M., Camacho-Arroyo I., Nava G., Cerbon M. A. Differential methylation in
steroid 5 alpha-reductase isozyme genes in epididymis, testis, and liver of the adult rat // Journal of
andrology. ‒ 1997. ‒ T. 18. ‒ C. 372-377.
196. Ratel D., Ravanat J. L., Berger F., Wion D. N6-methyladenine: the other methylated
base of DNA // BioEssays : news and reviews in molecular, cellular and developmental biology. ‒
2006. ‒ T. 28. ‒ C. 309-315.
197. Charles M. P., Ravanat J. L., Adamski D., D'Orazi G., Cadet J., Favier A., Berger F.,
Wion D. N(6)-Methyldeoxyadenosine, a nucleoside commonly found in prokaryotes, induces C2C12
myogenic differentiation // Biochemical and biophysical research communications. ‒ 2004. ‒ T. 314. ‒
C. 476-482.
198. Adams R. L., McKay E. L., Craig L. M., Burdon R. H. Methylation of mosquito DNA //
Biochimica et biophysica acta. ‒ 1979. ‒ T. 563. ‒ C. 72-81.
199. Tronche F., Rollier A., Bach I., Weiss M. C., Yaniv M. The rat albumin promoter:
cooperation with upstream elements is required when binding of APF/HNF1 to the proximal element is
partially impaired by mutation or bacterial methylation // Molecular and cellular biology. ‒ 1989. ‒ T.
9. ‒ C. 4759-4766.
200. Knebel D., Doerfler W. N6-methyldeoxyadenosine residues at specific sites decrease the
activity of the E1A promoter of adenovirus type 12 DNA // Journal of molecular biology. ‒ 1986. ‒ T.
189. ‒ C. 371-375.
201. Truss M., Bartsch J., Chalepakis G., Beato M. Artificial steroid hormone response
element generated by dam-methylation // Nucleic acids research. ‒ 1992. ‒ T. 20. ‒ C. 1483-1486.
202. Bulanenkova S. S., Kozlova A. A., Kotova E. S., Snezhkov E. V., Azhikina T. L.,
Akopov S. B., Nikolaev L. G., Sverdlov E. D. Dam methylase accessibility as an instrument for
analysis of mammalian chromatin structure // Epigenetics : official journal of the DNA Methylation
Society. ‒ 2011. ‒ T. 6. ‒ C. 1078-1084.
203. Azhikina T., Gainetdinov I., Skvortsova Y., Sverdlov E. Methylation-free site patterns
along a 1-Mb locus on Chr19 in cancerous and normal cells are similar. A new fast approach for
analyzing unmethylated CCGG sites distribution // Mol Genet Genomics. ‒ 2006. ‒ T. 275. ‒ C. 615622.
204. Cooper D. N., Mort M., Stenson P. D., Ball E. V., Chuzhanova N. A. Methylationmediated deamination of 5-methylcytosine appears to give rise to mutations causing human inherited
disease in CpNpG trinucleotides, as well as in CpG dinucleotides // Hum Genomics. ‒ 2010. ‒ T. 4. ‒
C. 406-410.
205. Schumann G. G., Gogvadze E. V., Osanai-Futahashi M., Kuroki A., Munk C., Fujiwara
H., Ivics Z., Buzdin A. A. Unique functions of repetitive transcriptomes // Int Rev Cell Mol Biol. ‒
2010. ‒ T. 285. ‒ C. 115-188.
206. Cordaux R., Batzer M. A. The impact of retrotransposons on human genome evolution //
Nature reviews. Genetics. ‒ 2009. ‒ T. 10. ‒ C. 691-703.
207. Gogvadze E., Buzdin A. Retroelements and their impact on genome evolution and
functioning // Cell Mol Life Sci. ‒ 2009. ‒ T. 66. ‒ C. 3727-3742.
208. Boissinot S., Davis J., Entezam A., Petrov D., Furano A. V. Fitness cost of LINE-1 (L1)
activity in humans // Proceedings of the National Academy of Sciences of the United States of
America. ‒ 2006. ‒ T. 103. ‒ C. 9590-9594.
209. Brouha B., Schustak J., Badge R. M., Lutz-Prigge S., Farley A. H., Moran J. V.,
Kazazian Jr. H. H. Hot L1s account for the bulk of retrotransposition in the human population //
Proceedings of the National Academy of Sciences of the United States of America. ‒ 2003. ‒ T. 100. ‒
C. 5280-5285.
81
210. Vinogradova T. V., Leppik L. P., Nikolaev L. G., Akopov S. B., Kleiman A. M., Senyuta
N. B., Sverdlov E. D. Solitary human endogenous retroviruses-K LTRs retain transcriptional activity
in vivo, the mode of which is different in different cell types // Virology. ‒ 2001. ‒ T. 290. ‒ C. 83-90.
211. Kazazian Jr. H. H. Genetics. L1 retrotransposons shape the mammalian genome //
Science. ‒ 2000. ‒ T. 289. ‒ C. 1152-1153.
212. Buzdin A., Ustyugova S., Khodosevich K., Mamedov I., Lebedev Y., Hunsmann G.,
Sverdlov E. Human-specific subfamilies of HERV-K (HML-2) long terminal repeats: three master
genes were active simultaneously during branching of hominoid lineages // Genomics. ‒ 2003. ‒ T. 81.
‒ C. 149-156.
213. Author. PostParser. ‒ 2011. ‒ URL: http://www.postparser.net.
214. Moskalev E. A., Zavgorodnij M. G., Majorova S. P., Vorobjev I. A., Jandaghi P., Bure I.
V., Hoheisel J. D. Correction of PCR-bias in quantitative DNA methylation studies by means of cubic
polynomial regression // Nucleic acids research. ‒ 2011. ‒ T. 39. ‒ C. e77.
215. Herlyn H., Zischler H. Primate genomes // Genome Dyn. ‒ 2006. ‒ T. 2. ‒ C. 17-32.
216. Буздин А. А. Функциональный анализ вставок эндогенных ретровирусов в
контексте эволюции генома человека // Биоорганическая Химия. ‒ 2010. ‒ T. 36. ‒ C. 38-46.
217. Hahn Y., Lee B. Identification of nine human-specific frameshift mutations by
comparative analysis of the human and the chimpanzee genome sequences // Bioinformatics. ‒ 2005. ‒
T. 21 Suppl 1. ‒ C. i186-94.
218. Leister D. Tandem and segmental gene duplication and recombination in the evolution of
plant disease resistance gene // Trends in genetics : TIG. ‒ 2004. ‒ T. 20. ‒ C. 116-122.
219. Begun D. J., Lindfors H. A., Kern A. D., Jones C. D. Evidence for de novo evolution of
testis-expressed genes in the Drosophila yakuba/Drosophila erecta clade // Genetics. ‒ 2007. ‒ T. 176.
‒ C. 1131-1137.
220. Cai J., Zhao R., Jiang H., Wang W. De novo origination of a new protein-coding gene in
Saccharomyces cerevisiae // Genetics. ‒ 2008. ‒ T. 179. ‒ C. 487-496.
221. Santos F. R., Pandya A., Kayser M., Mitchell R. J., Liu A., Singh L., Destro-Bisol G.,
Novelletto A., Qamar R., Mehdi S. Q., Adhikari R., de Knijff P., Tyler-Smith C. A polymorphic L1
retroposon insertion in the centromere of the human Y chromosome // Human molecular genetics. ‒
2000. ‒ T. 9. ‒ C. 421-430.
222. Jurka J., Smith T. A fundamental division in the Alu family of repeated sequences //
Proceedings of the National Academy of Sciences of the United States of America. ‒ 1988. ‒ T. 85. ‒
C. 4775-4778.
82
8. Благодарности
Автору хотелось бы выразить благодарность своему научному руководителю Антону
Александровичу Буздину и другим коллегам из группы геномного анализа сигнальных систем
клетки.
Работа выполнялась при поддержке грантов в рамках программы «Молекулярная и
клеточная биология» Президиума РАН и грантом Президента Российской Федерации (480.
2010. 4) и грантом РФФИ (10-04-00593-а).
83
Приложение 1. Использованные олигонуклеотиды
A. Олигонуклеотидные праймеры и супрессионные адаптеры
для nMETR
Супрессионный адаптор Na21St19: tgtagcgtgaagacgacagaaagggcgtggtgcggagggcggt
Подложка к адаптору StII: accgccctccgcaccacgccct
Олигонуклеотидные праймеры для nMETR:
Na21: tgtagcgtgaagacgacagaa
St19-CG: agggcgtggtgcggagggcggtcg
Alu1for: aggtcgaggctgcagtgagccgt
Alu2for: cgaggttccagtgagccgtga
L1Ta1d-rev2: ggaaatgcagaaatcacccgt
L1Ta1d-rev3: acctcagttggaaatgcagaaatcacc
LTRHsfor830: cctccatatgctgaacgctg
LTR5’endfor: ggggcaacccacccctaca
84
Б. Олигонуклеотидные праймеры для ДНК, подвергавшейся
бисульфитной конверсии
16q22. 1
19p13. 3
19q13. 11
20q11. 21
22q13. 2
20q11. 21
GTTGGTTATGTTTTGGTGGATG
TTTTAGTTTGGGTAATAGAGTGAGAT
AGGGGTTGGATATTTTGGTGA
TTGTTTTTGGAGATTTATTTGATG
TTGGAGGTTTTAGGGTGGTTG
AGATTTGGGTAAGATGGTGAGAT
GTTGGGTTTTGGGAGGGTGT
Прямой праймер
ACCAACACTATAAAACTACCCAAT
ACATCATTCTTCCTTACTTACTTCCT
CTAACTTCATTTACAATCACTTCCA
CCACACTCAAACCCCACAATAC
ATATCAAACACTACAACAATCCCAT
CCTAACATAACCTCCCTCAATAAAC
CCTACTAACTCCCAATCCCAAT
GTTGGGTTTTGGGAGGGTGT
Обратный праймер
TGAGTGTATAATAAGTTGTTTAGAAGG TGAGTGTATAATAAGTTGTTTAGAAGG
TTTGTTTTTTTGGGTATTTTAGTA
GGTTAGGTTTAGAGTTTATAGGTAGTT
AGAGAGGGTATATTTTATGTTGAGA
TAGTTGGTTGGGGGTGTTGA
TGGAGATTTATTTGATGGGGA
TTTTTGAGAGGTTTTTTTGGAGA
Прямой праймер
GGTTAGGTTTAGAGTTTATAGGTAGTT
AGAGAGGGTATATTTTATGTTGAGA
TAGTTGGTTGGGGGTGTTGA
TGGAGATTTATTTGATGGGGA
TTTTTGAGAGGTTTTTTTGGAGA
TGAGTGTATAATAAGTTGTTTAGAAGG TGAGTGTATAATAAGTTGTTTAGAAGG
TTTGTTTTTTTGGGTATTTTAGTA
TTTGTTTTTTTGGGTATTTTAGTA
TTTGTTTTTTTGGGTATTTTAGTA
Обратный праймер
Внутренние праймеры
12q24. 11
GGTATGTGTTTGGGGTAGTGAT
TTTATTACAACTACCTCACATTCACT
TTTTTGAGAGGTTTTTTTGGAGA
Внешние праймеры
12q22
GTATTAGTAGTGTTTAAAGTTGTTGGT
CCTAATATCACTACTCCCTAATTTCA
Локус
6q21
TGGGTGGATGTTGATAGGGT
TTTTTGAGAGGTTTTTTTGGAGA
3q25.2
Таблица 1. Список олигонуклеотидных праймеров для амплификации последовательностьей ДНК,
подвергнувшейся бисульфитной консверсии.
85
Приложение 2. Последовательности мобильных элементов
и сайты отжига олигонуклеотидных праймеров,
использованных в работе
1. Консенсусная последовательность L1Ta1d ([221])
Показаны 400 п. о. с 5’- конца (-) - цепи мобильного элемента (общая длина полной
консенсусной последовательности составляет 5403 п. о.).
Gggggaggagccaagatggccgaataggaacagctccggtctacagctcccagcgtgagcgacgcagaagacgggtgatttctg
catttccaactgaggt (acgggtgatttctgcatttcc – L1Ta1d-rev2; ggtgatttctgcatttcc aactgaggt – L1Ta1d-rev3)
accaggttcatctcactggggagtgccagacagtgggcgcaggacagtgggtgcagcgcaccgtgcgtgagccgaagcagggcgaggcatcg
cctcacccgggaagcgcaaggggtcagggaattccctttcctagtcaaagaaaggggtgacagacggcacctggaaaatcgggtcactcccgcc
ctaatactgcgcttttccgacgggcttaaaaaacggcgcaccaggagattatatcccgcacctggctcggagggtcctacgcccacggagtctcgct
gattgctagcacagcagtcc. . . (нижеследующие 5 т. п. о. удалены, так как их наличие или отсутствие
для nMETR непринципиально).
2. Консенсусная последовательност HERV-K LTR (968 п. о., [212])
tgtggggaaaagcaagagagatcagattgttactgtgtctgtgtagaaagaagtagacataggagactccattttgttatgtactaagaaa
aattcttctgccttgagattctgttaatctataaccttacccccaaccccgtgctctctgaaacrtgtgctgtgtcaactcagagttraatggattaagggcg
gtgcargatgtgctttgttaaacagatgcttgaaggcagcatgctccttaagagtcatcaccactccctaatctcaagtacccagggacacaaaaactg
cggaaggccgcagggacctctgcctaggaaagccaggtattgtccaaggtttctccccatgtgatagtctgaaatatggcctcgtgggaagggaaa
gacctgaccgtcccccagcccgacacccgtaaagggtctgtgctgaggaggattagtaaaagaggaaggaatgcctcttgcagttgagacaagag
gaaggcatctgtctcctgcctgtccctgggcaatggaatgtctcggtataaaacccgattgtatgctccatctactgagatagggaaaaaccgccttag
ggctggaggtgggacctgcgggcagcaatactgctttgtaaagcattgagatgtttatgtgtatgcatatctaaaagcacagcacttaatcctttacattg
tctatgatgcaaagacctttgttcacgtgtttgtctgctgaccctctccccacaattgtcttgtgaccctgacacatccccctcttcgagaaacacccaca
gatgatcaataaatactaagggaactcagaggctggcgggatcctccatatgctgaacgctg(LTRHsfor830)gttccccgggtccccttattt
ctttctctatactttgtctctgtgtctttttcttttccaaatctctcgtcccaccttacgagaaacacccacaggtgtgtaggggcaacccacccctaca(L
TR5’endfor)
3. Консенсусная последовательность Alu1 (290 п. о., [222])
Ggccgggcgcggtggctcacgcctgtaatcccagcactttgggaggccgaggcgggaggatcacttgagcccaggagttcgagac
cagcctgggcaacatagtgaaaccccgtctctacaaaaaatacaaaaattagccgggcgtggtggcgcgcgcctgtagtcccagctactcgggag
gctgaggcaggaggatcgcttgagcccgggaggtcgaggctgcagtgagccgtga (aggtcgaggctgcagtgagccgt – Alu1for;
cgaggctgcagtgagccgtga – Alu2for) tcgcgccactgcactccagcctgggcgacagagcgagaccctgtctcaaaaaaaa
Download