Изменения сплайсинга в ходе развития мозга у приматов

advertisement
Изменения сплайсинга в ходе развития мозга у приматов
Мазин Павел
МГУ им. М.В. Ломоносова
iaa.aka@gmail.com
Гельфанд Михаил
ИППИ им. А.А. Харкевича
gelfand@iitp.ru
Хайтович Филлип
CAS-MPG PICB
khaitovich@eva.mpg.de
мозжечке, в новорожденных и взрослых. Мы
секвенировали
полиаденилированный
транскриптом из 30 особей: 10 человек, 10
шимпанзе и 10 макак.
Аннотация
Несмотря на интенсивные исследования,
молекулярные механизмы, ответственные за
анатомические, поведенческие и когнитивные
отличия
человека
от
его
ближайших
эволюционных
родственников
–
обезьян,
остаются неясными. В данной работе мы
использовали методы секвенирования нового
поколения, чтобы исследовать разницу в
сплайсинге между человеком, шимпанзе и
макакой в двух областях головного мозга префронтальной
коре
и
мозжечке,
в
новорожденных и взрослых. Мы показали, что из
более чем 10 тысяч генов, экспрессирующихся на
детектируемом уровне, более 12% имеют
значимые различия в сплайсинге белоккодирующих экзонов между видами. Таким
образом,
сплайсинг
может
играть
существенную роль в фенотипических отличиях
между приматами.
2. Материалы и методы
2.1. Экспериментальная процедура
В данной работе были использованы
префронтальная кора головного мозга и кора
мозжечка, извлеченные посмертно из 10 человек,
10 шимпанзе и 10 макак. Для всех трех видов
образцы были разбиты на две группы по 5
образцов в каждой в соответствии с возрастом:
новорожденные (до 20 дней) и взрослые (около
18, 23 и 11 лет для человека, шимпанзе и макаки
соответственно). Для секвенирования РНК,
извлеченная из одного региона мозга из одной
возрастной
группы,
была
объединена.
Секвенирование было выполнено на Illumina®
Genome Analyzer II system по протоколу для 75
нуклеотидных (нт) парных ридов.
1. Введение
Люди существенно отличаются от своих
ближайших
эволюционных
родственников,
например, от шимпанзе, в анатомическом
строении,
поведении
и
когнитивных
способностях [1]. Однако генетически человек и
шимпанзе крайне схожи. Недавние исследования
показали, что экспрессия генов значимо
варьирует между приматами и что данные
отличия могут быть связаны с ускоренной
эволюцией мозга человека в недалеком прошлом
[2]. Альтернативный сплайсинг позволяет одному
гену производить различные кодирующие РНК и,
как следствие, различные белки. Ранее при
помощи микрочипов было показано, что не менее
4% генов сплайсируются различно в человеке и
шимпанзе. В данной работе мы использовали
методы секвенирования нового поколения, чтобы
исследовать разницу в сплайсинге между
человеком, шимпанзе и макакой в двух областях
головного мозга - префронтальной коре и
2.2. Картирование ридов
Все
риды
были
картированы
на
соответствующие геномы (человек – hg19,
шимпанзе – panTro2 и макака rheMac2) при
помощи программы tophat [4] с параметрами «-a 6
-m 1 -i 20 -I 3000000 -F 0.01 --coverage-search -microexon-search
--butterfly-search».
Для
картирования все риды из данного вида были
объединены
вместе
для
увеличения
чувствительности.
В
дальнейшей
работе
использовались только корректные пары ридов,
картировавшиеся как уникально, так и в
несколько мест генома.
2.3. Соотнесение сайтов сплайсинга между
видами
Сайты сплайсинга, предсказанные tophat были
25
перенесены с каждого из трех видов на два оставшихся
при помощи программы liftOver [5]. Чтобы процедура
была полностью однозначной, каждый сайт был
перенесен 6 раз во всех возможных направлениях.
Сайты, которые переносятся в разные позиции в
зависимости
от
последовательности
переноса
(например, из человека напрямую в шимпанзе или
через макаку), были удалены (рис. 1). В результате
осталось 88% сайтов.
покрытием (
 i( s, a, r )  12
и
s ,a,r
 e(s, a, r )  12 ),
s ,a , r
были проанализированы. Для оценки статистической
значимости различий частот включения сегментов
между образцами был использован метод glm из
статистического пакета R [6]. Для каждого сегмента
была проведена биномиальная регрессия для
следующей модели:
i ( s, a, r )
~ i  sp( s )  age(a )  re( r ) 
(1)
i ( s , a , r )  e( s , a , r )
sp( s) : re(r )  sp( s ) : age(a )
где i соответствует среднему включению сегмента
sp(s) отвечает за разницу между видами, age(a)
отвечает за разницу между видами, re(r) отвечает за
разницу между областями мозга, а sp(s):re(r) и
(sp(s):age(a)
отвечают
за
взаимодействия
соответствующих факторов. Чтобы оценить значимость
каждого члена в уравнении (1), был использован тест
хи-квадрат.
Полученные
p-value
были
скорректированы, чтобы учесть множественное
тестирование методом Бенджамини-Хочберга. Все
сегменты с FDR ≤ 0.05 считались значимыми.
Функциональный анализ различных наборов генов
производился при помощи пакета GOStat [7] в R.
Чтобы получить фоновый набор генов из всех
анализируемых сегментов, была выбрана подвыборка с
распределением
по
покрытию
Рисунок 1. Соотнесение сайтов сплайсинга между
видами. На рисунке изображена процедура переноса
сайтов сплайсинга с человека на другие виды.
Черные
стрелки
обозначают
применение
программы liftOver, красные стрелки обозначают
сравнение координат и удаление несовпадающих.
Hs обозначает человека, pt обозначает шимпанзе, rm
обозначает макаку.
Только сайты, обнаруженные во всех трех видах и
на которые картировалось как минимум 4 различных
рида, были использованы в дальнейшей работе.
(
 i( s, a, r )   e( s, a, r ) ),
s ,a , r
2.4. Сборка генов
равным
такому
же
s ,a , r
распределению для сегментов, у которых влияние хотя
бы одного фактора было значимым. 1694 генов,
содержащих не менее одного такого сегмента, были
использованы как фоновый набор генов для GOStat.
Участки генома между двумя соседними сайтами
сплайсинга с пропусками в покрытии ридами не более
5 нт и со средним покрытием не менее одного рида на
нт считались экспрессирующимеся сегментами.
Используя сайты сплайсинга как вершины, а интроны,
предсказанные tophat, и сегменты как ребра, был
построен граф. Мы определили гены как связные
компоненты в этом графе. Для дальнейшего
функционального анализа мы соотнесли предсказанные
гены с аннотацией базы данных ensemble версии 62.
10288 генов имеют существенное (т.е. хотя бы один
белок-кодирующий сегмент покрыт не менее чем 24
ридами в сумме по всем трем видам) покрытие.
2.5. Анализ видоспецифичности
Для факторов «вид», «вид:область мозга» и
«вид:возраст» был вычислен размер эффекта каждого
из трех видов: h (человек), p (шимпанзе) и r (макака).
Если
|| h  r |  | p  r ||
max(| h  r |, | p  r |)
 0.5 ,
то сегмент считался видоспецифичным, если человек
отстоял от макаки дальше, чем шимпанзе то человекспецифичным, а в обратном случае сегмент считался
шимпанзе-специфичным.
2.5. Статистический анализ
Для каждого сегмента были посчитаны i(s,a,r) количество ридов, подтверждающих его включение в
транскрипт (перекрывающихся с сегментом) и e(s,a,r) количество ридов, подтверждающих его исключение из
транскрипта (картировавшихся на объединение двух
экзонов, один из которых находится справа а другой
слева от данного сегмента), где s обозначает вид, a
обозначает возраст и r обозначает область головного
мозга. Только сегменты с достаточно большим
3. Результаты и обсуждение
Всего 10288 белок-кодирующих аннотированных в
ensemble генов экспрессировались на детектируемом
уровне в наших данных. 8446 (82%) из них имели хотя
бы один альтернативный (то есть такой, что у него хотя
бы один e(s,a,r) ≠ 0) белок-кодирующий сегмент.
Однако только 4951 сегментов из 4288 генов имеют
достаточное покрытие. 1645 (33%) сегмента из 1273
26
(12.4%) генов сплайсируются значимо различно между
видами (таблица 1).
Таблица 1. Количество сегментов и генов,
показавших значимое отличие в сплайсинге в
соответствии с соответствующими факторами или
взаимодействиями факторов. В скобках указаны
проценты от общего количества тестированных
сегментов и общего числа экспрессируемых генов.
Сегменты
Гены
Вид
1645 (33%)
1273 (12.4%)
Часть мозга
427 (8.6%)
375 (3.6%)
Возраст
378 (7.6%)
318 (3.1%)
Вид:Область мозга
20 (0.4%)
18 (0.2%)
Вид:Возраст
132 (2.7%)
115 (1.1%)
Всего
4951
10288
Функциональный анализ показал, что гены, значимо
меняющие сплайсинг между видами, не обогащены и
не обеднены какими бы то ни было биологическими
функциями, то есть эволюция сплайсинга не
ограничена какой-либо функциональной системой, но
затрагивает большое число различных биологических
процессов. Гены, сплайсирующиеся по-разному в
превронтальной коре и в мозжечке, обогащены такими
функциями как «клеточная дифференцировка» и
«внутриклеточный транспорт», а так же различными
функциями, связанными с цитоскелетом и обеднены
функциями, связанными с основным метаболизмом и
синтезом макромолекул – процессами, общими для
большинства клеток организма. Гены, меняющие
сплайсинг с возрастом, обогащены функциями,
связанными с клеточными контактами, в том числе
синапсами,
трансмембранным
транспортом,
в
частности, ионными каналами. Интересно, что гены, у
которых изменения сплайсинга с возрастом зависят от
вида, обогащены функциями, связанными с развитием
и регуляцией развития центральной нервной системы
(ЦНС). Таким образом, сплайсинг, возможно, играет
значимую роль в различиях в развитии ЦНС в
приматах, и, в частности, в особенностях, характерных
для человека. Чтобы проверить эту гипотезу, каждый
сегмент, показавший значимую разницу в сплайсинге
между видами, или сегмент, у которого разница между
областями мозга или возрастами значимо зависела от
вида, был отнесен к одной из трех категории в
соответствии с тем, на какой ветви филогенетического
дерева произошли изменения: человек-специфичный,
шимпанзе-специфичный, неспецифичный (см. методы).
Сегменты, по-разному сплайсирующиеся в разных
видах, примерно поровну распределены между
человек- и шимпанзе-специфичными, с небольшим
избытком шимпанзе-специфичных (таб. 2), однако
сегменты, чье возрастное изменение зависит от вида в
основном человек-специфичны.
Таблица 2. Количество сегментов с человексецифичным,
шимпанзе-специфичным
и
не
специфичным
изменением
эффекта
соответствующего фактора.
ЧеловекНе спец.
Шимпанзеспец.
спец.
Вид
Вид:Область
мозга
Вид:возраст
357
7
886
8
402
5
60
56
16
4. Заключение
Наш
анализ
показал,
что
более
12%
экспрессируемых в мозгу генов сплайсируются
различно в человеке, шимпанзе и макаке, 3.6%
сплайсируются по-разному в мозжечке и в
префронтальной коре и 3.1% меняют сплайсинг с
возрастом. Небольшое, но существенное количество
генов (105, 1.1%) меняет сплайсинг с возрастом поразному в разных видах. Интересно, что в большинстве
из этих генов изменения произошли в человеческой
линии после разделения человека и шимпанзе и что
многие из этих генов отвечают за развитие и регуляцию
развития нервной системы. Таким образом, сплайсинг
играет существенную роль в межвидовых отличиях и
связан с человек-специфичными особенностями
развития ЦНС.
Литература
[1] G. Klein (1989) The Human Career: Human Biological
and Cultural Origins, The Univ. of Chicago Press,
Chicago, 1989.
[2] W. Enard, P. Khaitovich, J. Klose, S. Zöllner, F.
Heissig, P. Giavalisco, K. Nieselt-Struwe, E. Muchmore, A.
Varki, R. Ravid, G.M. Doxiadis, R.E. Bontrop, S. Pääbo.
Intra- and interspecific variation in primate gene
expression patterns, Science, 2002, 296, pp. 340-343
[3] J.A. Calarco, Y. Xing, M. Cáceres, J.P. Calarco, X.
Xiao, Q. Pan, C. Lee, T.M. Preuss, B.J. Blencowe. Global
analysis of alternative splicing differences between humans
and chimpanzees, Genes Dev., 2007, 21, pp. 2963-2975
[4] C. Trapnell, L. Pachter, L.S. Steven. TopHat:
discovering splice junctions with RNA-Seq. Bioinformatics,
2009, 25, 9, pp. 1105-1111.
[5] Доступен по адресу http://genome.ucsc.edu/cgibin/hgLiftOver
[6] R Development Core Team. R: A Language and
Environment for Statistical Computing, 2010,доступен по
адресу http://www.R-project.org.
[7] T. Beissbarth, T.P. Speed. GOstat: find statistically
overrepresented Gene Ontologies within a group of genes.
Bioinformatics, 2004,12;20(9), pp. 1464-1465
27
Download