Uploaded by maria.karasyuk

Характеристика генома человека

advertisement
Характеристика генома человека
Геном – это полный набор генетической информации организма, или вся последовательность его
ДНК. В нем содержится вся информация, необходимая организму для функционирования.
Ядерный геном человека находится в хромосомах, образующих 23 пары. Помимо него существует
и митохондриальный геном. В геноме человека закодированы его видоспецифичные белки и РНК.
Митохондриальная ДНК человека состоит из 16 569 пар оснований и содержит 37 генов,
кодирующих 13 белков, 22 тРНК и 2 рРНК. Ядерный геном состоит примерно из 3 200 000 000 пар
оснований, разделенных на 24 линейные молекулы (т.е. хромосомы), самая короткая длиной 50
000 000 п.о. и самая длинная 260 000 000 п.о. Эти 24 хромосомы включают в себя из 22 аутосомы и
две половые хромосомы - X и Y
Повторяющиеся последовательности
Геном человека содержит как уникальные последовательности, встречающиеся в нём всего раз
(например, последовательности белок-кодирующих генов), так и повторяющиеся
последовательности - участки ДНК, представленные несколькими или большим числом копий. По
своему характеру повторы можно разделить на часто повторяющиеся последовательности (их
число может достигать миллиона копий на геном) и умеренно повторяющиеся
последовательности. Также выделяют тандемные повторы, последовательности которых
расположены последовательно друг за другом, и диспергированные повторы, рассеянные по
геному и расположенные на расстоянии друг от друга.
К тандемным повторам относятся:
Сателлитная ДНК - представляет собой часто повторяющиеся тандемные повторы. Не смотря на
сходные названия, она не имеет отношения к сателлитным хромосомам, а получила своё
название из-за особенностей её обнаружения одним из методов исследования ДНК. Большая её
часть представляет собой некодирующие последовательности центромер и теломер.
Минисателлиты - серии повторов фрагментов, имеющих длину 10-100 пар оснований. Количество
повторов этих последовательностей сильно варьирует у разных людей, поэтому они широко
используются в криминалистике, для идентификации личности, установления отцовства и в других
областях.
Микросателлиты - широко распространенные в геноме тандемные повторы коротких
последовательностей ДНК, обычно состоящих из 1-4 пар оснований.
Некоторые гены, представленные множеством копий (например, гены рРНК).
Диспергированные повторы, составляют около 45 % всего генома человека. Большая часть из них
представлена разновидностями ретротранспозонов, которые называются LINE и SINE.
ДНК-транспозоны и ретротранспозоны
Около половины генома человека состоит из мобильных генетических элементов последовательностей ДНК, способных к перемещению из одного участка генома в другой (этот
процесс называется транспозиция). К ним относятся ДНК-транспозоны (также называемые просто
транспозонами) и ретротранспозоны. Типичный мобильный генетический элемент напоминает
упрощённый вариант вируса. Мобильные генетические элементы были впервые обнаружены в
1951 году Барбарой МакКлинток у кукурузы, за что в 1983 году, она была удостоена Нобелевской
премии по физиологии и медицине.
В упрощенном виде ДНК-транспозоны представляют собой участки ДНК, границы которых
маркируют специальные последовательности. Эти участки содержат ген фермента транспозазы.
Данный фермент распознаёт транспозон, вырезает его и вставляет в другой участок генома
клетки.
Ретротранспозоны также имеют повторы, маркирующие их границы, и содержат гены обратной
транскриптазы и интегразы. После транскрипции и синтеза этих ферментов обратная
транскриптаза синтезирует ДНК-копию ретротранспозона на матрице его РНК, затем интеграза
встраивает ее в геном клетки. Самыми распространёнными типами ретротранспозонов в геноме
являются LINE (длинные перемежающиеся ядерные элементы) и SINE (короткие перемежающиеся
ядерные элементы), которые составляют, по некоторым оценкам, не менее 34% генома человека.
Лишь очень малая часть LINE является активной. SINE представляют собой относительно короткие
некодирующие ретротранспозоны. В связи с этим они не способны к самостоятельной
транспозиции, и считается, что она осуществляется за счёт ферментов ретротранспозонов LINE.
Генетический полиморфизм человека
ДНК любого человека имеет структурные отличия от ДНК других людей. Различие в
последовательности ДНК у отдельных людей, групп или популяций называется генетическим
полиморфизмом. Источником полиморфизмов являются мутации. Полиморфизмы присутствуют
как в белок кодирующих, так и в остальных частях генома. Отличия могут быть как качественными,
так и количественными. Однонуклеотидные полиморфизмы (ОНП, SNP) являются наиболее
распространенным типом генетических вариаций у человека. Они представляют собой различие в
одну пару оснований в последовательности ДНК отдельных представителей вида. Многие из них
(но далеко не всегда) могут вызывать наследственные заболевания, такие как
серповидноклеточная анемия или муковисцидоз. Распространённость ОНП в геноме близка к 1 на
1000 пар нуклеотидов.
Помимо ОНП, индивидуальные геномы людей имеют и другие отличия, связанные с делециями
(потерями), дупликациями (удвоениями) или инверсиями (обращениями на 180°) участков
геномной ДНК, а также вариации числа копий (CNV) различных последовательностей. На
определении индивидуальных различий, например, тех или иных ОНП, основаны методы
диагностики многих наследственных заболеваний, которые более подробно будут обсуждаться в
главе “генетика человека”
Транскриптом
Полный набор всех транскриптов РНК, в том числе и некодирующих, характерных для данного
организма, или специфический набор транскриптов (молекул РНК), представленный в клетках
определенного типа называется транскриптóмом. В отличие от генома, который, как правило,
одинаков для всех клеток одной линии, транскриптом может сильно меняться в зависимости от
условий окружающей среды. Ввиду того, что понятие транскриптом включает в себя все
транскрипты данной клетки, он также отражает профиль экспрессии генов в данный момент
времени, в том числе может являться проявление патологических процессов (например,
экспрессия генов, характерных для раковых клеток). Одним из методов изучения транскриптома
является одноклеточное секвенирование РНК (РНК-Seq), т.е. секвенирование РНК, полученное из
одной клетки, которое стало возможным благодаря развитию высокоскоростных методов
секвенирования нового поколения (NGS), что будет подробно описано в главе 7. Использование
биоинформатических методов позволяет осуществить сборку полных сиквенсов всех транскриптов
и построить профили экспрессии конкретных генов.Наука о транскриптомах называется
транскриптомикой.
Протеом
Весь набор белков, экспрессируемых в данном типе клеток или в организме, в данный период
времени при данных условиях, называется протеóмом. Термин является производным слова
«протеин» (белок). Наука о протеоме называется протеомикой. Она занимается
широкомасштабным изучение белков, их структуры, физиологической роли и функций.
Международный проект «Протеом человека» является продолжением проекта «Геном человека».
По масштабу поставленной проблемы и предполагаемой трудоёмкости работ проект «Протеом
человека» является значительно более масштабным. В то время, как геном человека состоит из
порядка 20 тыс. генов, то количество белков в организме человека за счёт наличия различных
белковых протеоформ превышает 2 млн. Кроме того, в отличие от генома, протеом непрерывно
меняется в зависимости от влияния внутриклеточных и внешних факторов, и по сути представляет
собой фиксированную во времени совокупность белков в конкретном биологическом объекте и в
определённой ситуации.
Метаболом
Метаболóм - это качественный и количественный набор всех низкомолекулярных молекул
(метаболитов), присутствующих в клетке, которые являются участниками различных
метаболических реакций и необходимы для поддержания, роста и нормального
функционирования клетки. Метаболом включает в себя различные соединения, среди которых
аминокислоты, жирные кислоты, углеводы, витамины, липиды и др. Количество различных
молекул в метаболоме варьируется в зависимости от изучаемого организма. Также он
непрерывно изменяется из-за различных химических реакций, постоянно происходящих в клетке.
Все метаболиты в метаболоме образуют большую сеть метаболических реакций, где выходы
одной ферментативной химической реакции являются входами для других. По этой причине
метаболом чувствителен ко времени и гораздо более динамичен, чем протеом и геном.
Метаболиты, как продукты экспрессии генов и всех других биологических процессов, имеют
высокую степень разнообразия в своих химических свойствах.
Регуляция экспрессии генов
Под экспрессией генов понимают процесс преобразования информации, хранящейся в ДНК в
белок либо, в некоторых случаях, в некодирующую РНК. Сильно упрощая это понятие, можно
сказать, что, если ген – это “инструкция по сборке белка”, то экспрессия гена – это “сборка белка
по этой инструкции”.
Все организмы, как одноклеточные, так и многоклеточные, регулируют экспрессию своих генов.
Это связано с тем, что из множества генов какого-либо организма, значительная часть кодируют
белки и РНК, нужные только в определённых условиях. Например, кишечная палочка способна
питаться лактозой, для чего должна синтезировать некоторые белки. Однако, при отсутствии
данного углевода в среде, их производство будет являться тратой ресурсов клетки, что не
поддерживается естественным отбором. У многоклеточных организмов каждый тип клеток
отличается, в первую очередь, благодаря экспрессии различных наборов генов. Аномальная
экспрессия генов может стать причиной многих заболеваний, включая онкологические.
Процесс регуляции может осуществляться на нескольких уровнях. У эукариот он может
происходить:

на уровне перестроек хроматина (изменение расположения нуклеосом для обеспечения
доступа регуляторных белков к генам);

на уровне инициации транскрипции - транскрипция начинается только в определённых
условиях;

после трансляции - существуют механизмы, влияющие на определённые мРНК и
затрагивают синтез белка.
Ввиду более простой организации генома прокариот, они главным образом регулируют
экспрессию генов на уровне инициации транскрипции. Это осуществляется при помощи
специальных регуляторных белков, которые связываются со специфическими
последовательностями ДНК, длина которых обычно составляет около 10-15 пар нуклеотидов. В
результате связывание РНК-полимеразы с промотором (участком, где РНК-полимераза
связывается с ДНК и начинает транскрипцию) либо стимулируется (положительная регуляция),
либо тормозится (отрицательная регуляция). Белки, которые стимулируют транскрипцию
называются активаторами, а те, которые тормозят её - репрессорами
Регуляция транскрипции у прокариот
В прошлой главе была рассмотрена РНК-полимераза бактерий. Она состоит из пяти белковых
субъединиц, однако для связывания с точкой начала транскрипции требуется еще одна белковая
субъединица, которая называется σ-фактор (сигма-фактор). Существует несколько типов σфакторов, и каждый из них необходим для транскрипции определённых групп генов. Например, у
кишечной палочки известно семь σ-факторов. Образуя комплекс с РНК-полимеразой, каждый из
них позволяет этому ферменту связываться с различными типами промоторов. Благодаря этому
бактериальная клетка может переключаться на синтез определённых групп белков в зависимости
от изменения условий среды: различные σ-факторы нужны для экспрессии генов домашнего
хозяйства, генов, необходимых для защиты от повышения температуры среды, генов,
необходимых при недостатке азота, сокращении количества питательных веществ и т.д.
Бактериальная клетка “включает” и “выключает” гены не только большими группами при помощи
σ-факторов, но и регулирует активность промоторов индивидуально.
Если несколько белков прокариотической клетки являются участниками одного и того же
метаболического пути, то кодирующие их гены часто расположены рядом в геномной ДНК и
образуют оперон. Он был описан в 1961 году Франсуа Жакобом, Жаком Моно и Андре Львовым.
Оперон – это единица транскрипции прокариот, которая представляет собой группу структурных
генов, транскрипция которых происходит с одного промотора и контролируется одним и тем же
регуляторным элементом. Такой регуляторный элемент называется оператором. Это небольшой
расположенный возле промотора участок ДНК, с которым может связываться специальный белок,
что предотвращает транскрипцию. Этот белок называется репрессор. Каждый оперон бактерии
регулируется определённым типом репрессора. Все гены одного оперона транскрибируются в
составе одной мРНК. В результате такая мРНК содержит сразу несколько белок-кодирующих
последовательностей, каждая из которых имеет собственный стартовый и стоп-кодон. Эти
последовательности называются цистронами, а мРНК, содержащая более одного цистрона,
называется полицистронной.
Изменение уровня транскрипции генов в ответ на химический состав среды у бактерий можно
условно разделить на два типа: некое вещество либо стимулирует производство определенного
белка, либо напротив, тормозит его. Это называется регуляцией путём индукции и путём
репрессии соответственно. Вещество, вызывающее транскрипцию, называется индуктор, а
вещество, предотвращающее её - ко-репрессор. Оба механизма можно рассмотреть на примере
двух оперонов, присутствующих у многих бактерий: лактозного оперона и триптофанового
оперона.
Lac-оперон
Лактозный оперон (lac-оперон) представляет собой группу генов, позволяющих бактериальной
клетке питаться лактозой. Один из них - ген фермента β-галактозидаза, которая расщепляет
данный дисахарид до глюкозы и галактозы. Активная транскрипция этих генов может начаться
только при наличии лактозы в среде. В отсутствие лактозы в клетке кишечной палочки
присутствует всего несколько молекул этого фермента, однако если в среду добавить лактозу, то
количество молекул β-галактозидазы увеличивается в 1000 раз примерно за 15 минут.
В Lac-опероне выделяют следующие элементы:
Промотор и терминатор - участки, где РНК полимераза прикрепляется и диссоциирует от ДНК
соответственно.
Структурные гены - три гена, вовлечённые в метаболизм лактозы. Они расположены между
промотором и терминатором. Один из них кодирует фермент β-галактозидазу.
Оператор - расположен около промотора. Он представляет собой последовательность
нуклеотидов, которая распознаётся белком-репрессором, что предотвращает транскрипцию.
В регуляции работы Lac-оперона ключевая роль принадлежит репрессору. Рассмотрим данный
процесс более подробно:
Поскольку репрессор является белком, он также кодируется определённым геном, однако этот
ген не входит в состав самого оперона.
Небольшие количества репрессора синтезируется в бактериальной клетке постоянно.
Если репрессор связан с оператором, РНК-полимераза не имеет доступа к промотору, и
транскрипция не происходит.
Подавление транскрипции в lac-опероне при помощи белка-репрессора
Репрессор устроен таким образом, что лактоза связывается с ним и изменяет его конформацию. В
результате репрессор становится неспособным связаться с оператором, и РНК-полимераза может
осуществлять транскрипцию структурных генов.
Если вся лактоза утилизирована, то новые молекулы репрессора не будут с ней связываться, и
поэтому останутся способными связаться с оператором и блокировать транскрипцию.
Активация транскрипции в lac-опероне при помощи индуктора (лактозы)
Таким образом, можно констатировать, что lac-оперон регулируется путём индукции, так как
лактоза индуцирует транскрипцию. Поэтому в данном случае лактозу называют индуктором.
Trp-оперон
Триптофановый оперон (trp-оперон) представляет собой группу генов, которые кодируют белки,
необходимые для синтеза аминокислоты триптофана. При наличие данной аминокислоты в среде
в производстве данных белков нет необходимости. Поэтому триптофан тормозит производство
данных белков и является ко-репрессором.
Trp-оперон также можно рассматривать как отрезок ДНК, на котором расположены:
Промотор и терминатор.
Между просмотром и терминатором - пять структурных генов. Кодируемые ими белки участвуют
в синтезе триптофана.
Оператор - расположен возле промотора.
Механизм отрицательной регуляции trp-оперона подобен таковому у lac-оперона.
С оператором может связаться репрессор. Репрессор данного оперона также кодируется геном,
не входящим в его состав.
В отличие от lac-оперона, регулируемого путём индукции, trp-оперон регулируется путём
репрессии: репрессор способен присоединиться к оператору только в том случае, если он связан с
триптофаном (ко-репрессором).
Если в среде есть триптофан, транскрипция не происходит, но при его отсутствии репрессор более
не активен, и производство белков, нужных для синтеза триптофана начинается.
Регуляция транскрипции у эукариот
Транскрипция у эукариот регулируется более сложными механизмами. Это связано с тем, что у
эукариот ДНК организована в хроматин, а благодаря наличию ядра транскрипция и трансляция
разделены в пространстве и времени, что открывает возможности для большего разнообразия
регуляторных механизмов. В последние десятилетия была осознана высокая важность
эпигенетических механизмов регуляции экспрессии генов, о которых речь пойдёт далее.
Инициация транскрипции у эукариот
Как и у бактерий, инициация транскрипции у эукариот контролируется белками, которые
связываются с ДНК и либо способствуют, либо препятствуют связыванию РНК-полимеразы с
промотором. Однако у эукариот этот процесс более сложен.
В предыдущей главе говорилось о том, что у эукариот РНК-полимераза распознаёт промотор при
помощи специальных белков, которые называются факторами транскрипции (или
транскрипционными факторами, TF). Их подразделяют на общие и специфические. Общие
(базальные) факторы транскрипции – это такие белки, которые участвуют в транскрипции всех
белок-кодирующих генов. Они обязательны для инициации транскрипции. Белковый комплекс,
который образуют в области промотора базальные факторы транскрипции с РНК-полимеразой II,
называется преинициаторным комплексом. Специфические факторы транскрипции, в отличие от
общих, не являются обязательными. Те или иные специфические транскрипционные факторы
участвуют в транскрипции только определённых генов. Их роль состоит в изменении уровня
экспрессии этих генов: они либо стимулируют её (активаторы), либо тормозят (репрессоры).
Действие различных специфических факторов транскрипции зависит от типа клеток или
определённых сигналов, что может увеличивать уровень экспрессии гена относительно базового
уровня.
Промотор (полоса в нижней части рисунка) эукариот во время инициации транскрипции образуется преинициаторный комплекс: РНК-полимераза II (Pol II) и шесть общих факторов
транскрипции (TF), без которых полимераза не способна связаться с промотором. На промоторе
также указаны специальные участки, узнаваемые факторами транскрипции - ТАТА-бокс,
инициатор и др.
Промоторы РНК-полимеразы II могут иметь несколько различных типов последовательностей,
являющимися ключевыми для инициации транскрипции. К таким последовательностям относятся
TATA-боксы, инициаторы и CpG-островки.
ТАТА-бокс, названный так из-за содержащейся в нём последовательности нуклеотидов,
присутствует, по-видимому, менее чем в 25% промоторов генома человека, однако достаточно
хорошо изучен.
Число промоторов, содержащих инициаторы, по некоторым оценкам, может быть близко к 50%.
CpG островками называются области ДНК (обычно размером 100-1000 пар оснований), имеющие
высокое содержание двунуклеотидной последовательности ЦГ. Обращаем внимание, что речь
идёт не о комплементарных парах, а о идущих подряд нуклеотидах в последовательности одной
цепи (С и G обозначают цитозин и гуанин, а “p” - фосфат между ними). По некоторым оценкам они
присутствуют примерно в 70% промоторов человека. Транскрипция на таких промоторах
происходит с меньшей скоростью, чем на промоторах, содержащих TATA-бокс или инициатор. Это
может объясняться тем, что такие промоторы расположены у генов, продукты которых нужны в не
очень больших количествах (например, у генов домашнего хозяйства).
Энхансеры и сайленсеры
Некоторые участки ДНК, распознаваемые белками, которые регулируют транскрипцию,
расположены близко к промотору. Однако другие регуляторные последовательности, могут
находиться на расстояниях тысяч нуклеотидов в обоих направлениях от промотора, в том числе в
интронах. Они называются энхансеры (от англ. enhance - усиливать) и сайленсерами (от англ to
silence - заглушать). С энхансерами и сайленсерами могут быть связаны белки (активаторы и
репрессоры), которые могут взаимодействовать с общими транскрипционными факторами на
промоторах. Взаимодействия белков, расположенных на столь отдалённых участках ДНК,
возможны благодаря тому, что ДНК образует петли, длина которых может достигать 1 млн пар
оснований. За счет связывания активаторов или репрессоров, скорость экспрессии генов у
эукариот может быть сильно увеличена или уменьшена. У какого-либо гена может быть несколько
энхансеров или сайленсеров, каждый из которых может быть активен в разное время и в разных
типах клеток. В среднем каждый энхансер состоит примерно из десяти регуляторных элементов,
каждый из которых связывает только один или два специфических транскрипционных фактора.
Для достижения определённого эффекта на транскрипцию важна комбинация этих регуляторных
элементов.
Влияние структурной организации ядра на экспрессию генов
В главе 3 говорилось, что хромосомы в ядре расположены не случайно, а занимают свои
хромосомные территории. Исследования показывают, что транскрипционно активные гены
расположены по краям этих территорий. Такая организация способствует скоординированной
экспрессии этих генов. Также здесь обнаруживаются очаги активной транскрипции – так
называемые транскрипционные фабрики. Имеются свидетельства в пользу того, что некоторые
фабрики транскрибируют гены, которые регулируются одними и теми же активаторами. Таким
образом, известно, что архитектура хроматина в ядре и регуляция транскрипции взаимосвязаны,
однако изучены недостаточно. Роль, которую играет структурная организация ядра в экспрессии
генов и функциях клетки является предметом активных исследований.
Модификации гистонов и ремоделирование хроматина
В отличие от прокариот, ДНК эукариот связана с октамерами белков-гистонов, образуя
нуклеосомы. Благодаря этому осуществляется плотная "упаковка" ДНК в ядре. Диплоидная
человеческая клетка имеет около 3×10^7 нуклеосом. Еще одной функцией гистонов является
участие в регуляции экспрессии генов. Гены, расположенные в участках гетерохроматина, обычно
не экспрессируются. Это объясняется тем, что белки, необходимые для транскрипции, не имеют
доступа к участкам ДНК, тесно связанной с гистонами и другими хроматин-связывающими
белками. Хроматин такой конформации часто называют "закрытым". Чтобы транскрипция стала
возможной структура хроматина должна стать "открытой" для РНК-полимеразы. Процесс, в
результате которого ДНК, связанная с гистонами, становится доступной для регуляторов, которые
необходимы для транскрипции, называется ремоделированием хроматина. Оно также является
одним из механизмов эпигенетического наследования признаков.
Существует несколько способов получения "открытой" ДНК:
Изменение гистонового состава. Нуклеосомы обычно являются физическим барьером для РНКполимераз и других белков. Однако, к примеру, нуклеосомы с заменой гистона H2A на один из его
вариантов (H2A.Z), являются меньшим барьером. Такие нуклеосомы чаще встречаются на
промоторах и энхансерах активно экспрессируемых генов.
Модификация гистонов. Гистоны имеют так называемые “хвосты” – линейные концевые участки
полипептида, выступающие за пределы нуклеосомы. Специальные регулятрные белки могут
ковалентно присоединять к ним некоторые функциональные группы. Наиболее
распространенными модификациями гистонов являются присоединение ацетильных (-COCH3),
метильных (-CH3) или фосфатных групп. При этом может быть модифицировано сразу несколько
аминокислот гистонового “хвоста”. Комбинация таких “меток” может оказывать различные
эффекты, например, привлекать определённые регуляторные белки. Это может как
способствовать транскрипции, так и подавлять её. Однако, можно выделить некоторые общие
тенденции: например, ацетилирование гистонов чаще способствует транскрипции, а
метилирование - наоборот. В качестве иллюстрации такого механизма можно рассмотреть
следующий пример: метилирование девятого лизина в хвосте гистона H3 привлекает белок,
который связывает данную нуклеосому с другой, и, в результате, происходит более компактная
“упаковка” хроматина.
Модификации гистонов. Ac - ацетилировнаие, Me - метилирование, Ub - убиквитинирование
Перестановка или удаление нуклеосом с ДНК. Этот процесс осуществляют крупные
многосубъединичные ферменты, которые используют энергию гидролиза АТФ. Например, они
могут ослабить связь между гистонами и ДНК, в результате чего нуклеосома “скользит” по ДНК,
открывая на ней регуляторные области.
Ремоделирование хроматина
Метилирование ДНК и метилóм
Модификациям могут подвергаться не только гистоны, но и сама ДНК. Распространённой
модификацией является метилирование и деметилирование ДНК – присоединение метильных
групп к азотистым основаниям либо их удаление. Это наблюдается у большинства растений,
животных и грибов. Из всех азотистых оснований, метилируется почти всегда цитозин,
расположенный динуклеотидных последовательностях "ЦГ". У человека метилированный цитозин
присутствует примерно в 1,5% геномной ДНК. Обычно "ЦГ" сгруппированы в CpG-островки и
расположены в областях промоторов многих генов (у человека – около 70% промоторов).
Метильные группы препятствуют связыванию факторов транскрипции и других белков,
необходимых для начала транскрипции. Таким образом, метилирование является способом
“выключения” гена. Однако большая часть метилированных CpG-динуклеотидов расположена не
у белок-кодирующих генов, а в повторяющихся последовательностях ДНК. Считается, что
метилирование этих последовательностей способствует подавлению транскрипции транспозонов,
таких LINE и SINE, составляющих около половины генома человека.
Определённая “картина” метилирования нуклеиновых кислот, присутствующая в определённое
время в геноме или конкретном типе клеток называется метилóмом. Метилом зависит от клетки и
ткани, и не является постоянным, он изменяется по мере того, как клетки реагируют на условия
существования. У млекопитающих метилирование ДНК происходит после репликации ДНК и во
время дифференциации клеток, а метилом обычно наследуется дочерними клетками, и, поэтому,
является одним из механизмов эпигенетического наследования признаков.
Посттранскрипционная регуляция экспрессии генов
Транскрипция сама по себе ещё не является экспрессией гена, которая измеряется, в конечном
итоге, количеством функционального белка, который производит клетка. Многие регуляторные
механизмы, влияющие на производство белка действуют на различных этапах после
транскрипции. Их действие является посттранскрипционной регуляцией экспрессии генов.
Наличие этих механизмов позволяют клетке быстрее изменять набор производимых белков в
ответ на изменения окружающей среды.
Посттранскрипционная регуляция экспрессии генов включает многие механизмы:
Регуляция альтернативного сплайсинга. Альтернативный сплайсинг (см. главу 5) – это сборка
различных вариантов мРНК, которая приводит к появлению различных изоформ белка,
специфичных для клеток, в которых они производятся. Этот процесс регулируется при помощи
особых участков самой пре-мРНК, которые распознаются специальными белками, влияющими на
судьбу того или иного интрона или экзона.
Регуляция стабильности мРНК. Уровень экспрессии генов также зависит от того, как долго мРНК
сохраняется в цитоплазме. В отличие от прокариотических мРНК, период полураспада которых
обычно составляет около 3 мин, эукариотические мРНК очень стабильны и могут сохраняться в
течение часов, дней или даже недель. Например, транскрипты гена β-глобина имеют период
полураспада более 10 часов. Однако, мРНК, кодирующие регуляторные белки и факторы роста,
обычно гораздо менее стабильны, и могут иметь период полураспада менее 1 часа. Разрушение
РНК осуществляют экзорибонуклеазы – ферменты, удаляющие нуклеотиды с её концов. Защиту
мРНК от экзорибонуклеаз обеспечивают кэп на 5′ конце и поли-А хвост на 3′ конце. Вновь
синтезированная мРНК имеет поли-А хвост длиной около 200 нуклеотидов, однако если в
результате деаденилирования он укорачивается менее чем до ~30 нуклеотидов, мРНК
разрушается. Продолжительность существования мРНК регулируют специфические
последовательностями нуклеотидов, обычно содержащиеся вблизи 3′-конца. Также следует
упомянуть, что разрушение мРНК может происходить и при наличии в ней «преждевременного»
стоп-кодона, который может появиться в результате мутации, что предотвращает синтез
неполноценных белков (нонсенс опосредованный распад).
Регуляция при помощи некодирующих РНК – описана далее. Она также является одним из
механизмов эпигенетического наследования.
Посттрансляционная модификация белков (была рассмотрена в главе 5).
Регуляция деградации белков (была рассмотрена в главе 5).
РНК-интерференция
РНК-интерференция (RNAi) – это ингибирование экспрессии определенного гена при помощи
специальной РНК, которая связывается с комплементарной одноцепочечной мРНК, кодируемой
этим геном, и либо подавляет трансляцию, либо вызывает деградацию мРНК.
Это явление было открыто в начале 1990-х годов, когда в экспериментах с петуниями, хлебной
плесенью и нематодами, было показано, что внедрённые в них нуклеиновые кислоты приводят к
ослаблению экспрессии генов с той же последовательностью. За исследования этого явления в
2006 году Эндрю Файр и Крейг Мелло были удостоены Нобелевской премии по физиологии и
медицине.
Некодирующие РНК, участвующие в РНК-интерференции, в широком смысле называются малыми
некодирующими РНК. Они представляют собой двухцепочечные молекулы длиной 20-31
нуклеотид. К ним относятся малые интерферирующие РНК (siRNA) и микроРНК (miRNA). Они
происходят из разных источников, однако механизмы их действия схожи.
Малые интерферирующие РНК производятся из более длинных молекул двухцепочечных РНК,
которые могут появляться в клетках в результате вирусной инфекции или экспрессии
транспозонов.
Если длинные двуцепочечные РНК присутствуют в цитоплазме эукариотической клетки, они
расщепляются на двухцепочечные малые интерферирующие РНК длиной примерно 22
нуклеотида ферментом, который называется Dicer (дайсер).
Затем полученные РНК связываются с РНК-индуцированным комплексом сайленсинга – RISC
(риск).
RISC расщепляет и удаляет одну из двух цепей РНК и сохраняет другую чтобы использовать её для
нацеливания на комплементарную мРНК.
Связавшись с мРНК, RISC расщепляет её в области комплементарного совпадения с малой
интерферирующей РНК. Расщепленные фрагменты мРНК затем быстро разрушаются в клетке под
действием экзорибонуклеаз.
МикроРНК встречаются у растений и животных. Они возникают в ядре, транскрибируясь с генов
микроРНК. Исследования показывают, что в геноме человека имеется не менее 1500 таких генов.
Начальные транскрипты будущих микроРНК (при-микроРНК) обрабатываются аналогично мРНК –
они получают кэп и поли-А хвост, а некоторые содержат интроны и подвергаются сплайсингу.
Ген микроРНК имеет комплементарные участки, из-за наличия которых в пределах
синтезированной РНК происходит образование двуцепочечного участка (шпильки). Ядерный
фермент, который называется Drosha отрезает от шпильки некомплементарные 5′ и 3′ концы.
Оставшаяся молекула называется пре-микроРНК.
Пре-микроРНК экспортируются в цитоплазму, где обрабатывается аналогично малым
интерферирующим РНК: расщепляются Dicer и перерабатываются в одноцепочечные микроРНК с
помощью RISC.
МикроРНК, связанная с RISC, нацеливаются на комплементарные последовательности в мРНК,
которые обычно находятся в 3′ нетранслируемой области (“после” стоп-кодона), но также могут
быть расположены и в 5′ нетранслируемой области (перед стартовым кодоном) или в
кодирующей области. Если комплементарное совпадение микроРНК и мРНК идеально, то мРНК
расщепляется RISC и деградирует. Если же совпадение неполное (что характерно для животных),
происходит частичное подавление трансляции.
РНК-интерференция
Синтез микроРНК для подавления активности созданных самой же клеткой мРНК может при
необходимости обеспечивать быстрые изменения экспрессии генов, так как для прекращения
производства более не нужного белка подавления транскрипции обычно недостаточно. Это
связано с тем, что мРНК могут существовать в цитоплазме в течение относительно долгого
времени. РНК-интерференция.
Открытие РНК-интерференции дало мощный инструмент исследования функций генов. Если
последовательность гена известна, его функцию можно быстро подавить при помощи,
двуцепочечной РНК. Также ведутся разработки лекарств на основе явления РНК-интерференции.
Длинные некодирующие РНК
Геномы эукариот также кодируют множество длинных некодирующих РНК (более 200
нуклеотидов в длину). По некоторым оценкам, геном человека кодирует около 17 000 таких РНК.
Они образуются аналогично мРНК (происходит кэпирование и полиаденилирование, возможен
сплайсинг), однако не имеют стартового и стоп-кодонов, что указывает на то, что они не кодируют
белков. Регуляторные функции длинных некодирующих РНК разнообразны и активно
исследуются. Среди них следующие:
Некоторые такие РНК влияют на экспрессию различных генов связываясь с комплексами,
осуществляющими модификации хроматина.
Некоторые могут регулировать транскрипцию, напрямую связываясь с факторами транскрипции.
Некоторые могут связываться с комплементарными мРНК или пре-мРНК, что может влиять на
альтернативный сплайсинг, а также приводить к образованию двуцепочечной РНК, что, в свою
очередь, запускает механизм РНК-интерференции.
Регуляция на уровне трансляции
Регуляция экспрессии генов осуществляется и на уровне трансляции, чаще всего на стадии
инициации. Это может происходить при помощи регуляторных белков, которые связываются со
специфическими последовательностями или структурами в нетранслируемых областях на 5′ или 3′
конце, предотвращая присоединение рибосом. Например, у человека производство белка
ферритина обычно останавливается аконитазой – белком-репрессором трансляции. Данный
белок связывается с мРНК ферритина, препятствуя присоединению к ней рибосомы. При наличии
в клетке железа, оно связывается с аконитазой, в результате чего она отсоединяется от мРНК что
увеличивает выработку ферритина в 100 раз. Помимо этого известно, что некоторые мРНК
находятся в отдельных областях клетки и транслируются локально. Благодаря этому
распределение белков в клетке может быть ассиметричным: например, дендриты нейрона могут
содержать большее количество белков, связанных с “приёмом информации”, а аксон способствующих высвобождению нейромедиаторов.
Эпигенетическое наследование
По мере изучения организации генома и регуляции экспрессии генов, стало ясно, что
наследование некоторых признаков не объясняется одной лишь последовательностью ДНК
организма. Пример демонстрирует одна из аллелей гена мышей agouti (агути), определяющего
цвет шерсти. В норме он экспрессируется в развивающемся организме лишь в течение короткого
времени – когда формируется шерсть. Но были получены мыши, у которых экспрессия agouti
происходила на протяжении всего развития. Из-за этого они имели не характерный для
нормальных мышей жёлтый окрас (а также ряд некоторых других признаков). Однако, если
рацион беременных мышей дополнить соединениями, содержащими метильные группы
(например, фолиевой кислотой), то окрас шерсти потомства возвращается к норме, и этот эффект
сохраняется даже в последующих поколениях. Таким образом было обнаружено, что степень
изменения окраски коррелирует с уровнем метилирования ДНК. Объяснением данного феномена
является наличие перед геном agouti CpG-островка. При наличии достаточного количества
источников метильных групп ген “выключается” в необходимый период эмбрионального развития
и остается в этом состоянии в течение всей жизни животного. Таким образом, отличия между
мышами в данном примере обусловлены питанием их матерей в период беременности.
Подобный эффект, связанный с изменениями метилирования ДНК, наблюдается и у людей. В
конце Второй мировой войны, зимой 1944-45 годов, в Голландии наблюдался голод. Со временем
было обнаружено, что дети женщин, которые в тот период были на ранних сроках беременности,
во взрослом возрасте имели более высокие риски развития ожирения, повышения уровень
триглицеридов и холестерина в крови, диабета второго типа и шизофрении. В ходе исследования,
в котором такие люди сравнивались с их братьями и сестрами, родившимися до или после
описанных событий, было обнаружено различие в метилировании ДНК определенных генов.
Особенности детей, рождённых в описанных условиях, можно интерпретировать следующим
образом: при недостаточном питании беременной в развивающемся организме происходила
эпигенетическая «настройка» метаболизма, которая готовила его к последующему
существованию в условиях голода и сохранялась на протяжении всей жизни. Однако
впоследствии, после рождения, она не соответствовала реальным условиям среды, так как
количество доступной пищи оказывалось достаточным. В результате особенности метаболизма
таких людей оказывались не адаптивными, а вредными.
Подобные механизмы также объясняют случаи, когда у одного из монозиготных близнецов,
несмотря на практически идентичные геномы, развивается наследственное заболевание, а у
другого - нет. Изменения метилома наблюдаются при некоторых онкологических заболеваниях,
что вызывает “неправильную” экспрессию генов.
Исследования таких явлений привели к появлению эпигенетики - учения о наследовании
признаков, передающихся с помощью механизмов, не затрагивающих последовательность
нуклеотидов. Существует три основных эпигенетических механизма:
Обратимая модификация ДНК путем метилирования и деметилирования.
Ремоделирование хроматина.
Регуляция экспрессии генов при помощи коротких и длинных некодирующих РНК.
Специфическую структуру описанных эпигенетических модификаций, присутствующих в клетке в
определенный период времени, называют эпигеномом.
Как уже говорилось ранее, разнообразие типов клеток в организме возможно благодаря
экспрессии в них различных наборов генов. Отчасти это связано и с различиями в их эпигеноме.
Эпигеном обычно наследуется дочерними клетками в ходе репликации и митоза. Так, после
каждого цикла репликации ДНК на участках ДНК, где одна цепочка уже метилирована, происходит
метилирование дочерней цепи. Это способствует тому, что дочерние клетки остаются правильно
дифференцированными (т.е. специализированными) клетками того же типа, что и материнская.
Однако, зигота, из которой происходит организм, не является специализированной клеткой какойлибо ткани. В связи с этим, во время формирования гамет существующая “картина”
метилирования ДНК в значительной степени стирается и затем в мужских и женских половых
клетках наносится по-разному. Таким образом, оплодотворенная яйцеклетка имеет разные
“метки” на копиях определенных генов, полученных от матери или отца. Вскоре после
оплодотворения в ходе эмбрионального развития большинство из них вновь “стирается” что
позволит в дальнейшем создать новые эпигенетические модификации “с чистого листа” для
формирования более 200 типов клеток, встречающихся во взрослом организме. Однако
некоторые области генома не подвергаются этому повторному деметилированию, и
содержащиеся в них гены сохраняют “метки” материнской и отцовской хромосом. Этим можно
объяснить такое явление, как геномный импринтинг – различную экспрессию аллели, в
зависимости от пола родителя, от которого она была унаследована. Примером импринтинга
является наследование синдромов Прадера-Вилли и Ангельмана. Если хромосома 15 с некоторым
дефектом в длинном плече унаследована от отца, то у ребёнка развивается синдром ПрадераВилли, а если от матери – синдром Ангельмана. Существуют различные гипотезы, объясняющие
различия в метилировании генов женских и мужских половых клеток. Первая объясняет его
различием биологических интересов полов: картина метилирования сперматозоида способствует
тому, чтобы эмбрион получил как можно больше ресурсов от матери, а метилом яйцеклетки –
чтобы ограничить это влияние. В пользу этого говорит то, что большинство генов млекопитающих,
подвергающихся родительскому импринтингу, так или иначе связаны с внутриутробным
развитием. Другая гипотеза объясняет импринтинг улучшением совместимости матери и плода:
при отключении части отцовских генов у эмбриона будут экспрессироваться только материнские
аллели, и эмбрион станет биологически и физиологически более схож с материнским
организмом. В пользу этого может говорить то, что количество «отключенных» отцовских генов
выше, чем материнских, что находит подтверждения.
Download