M. gallisepticum

advertisement
Интеграция «омиксных»
технологий
на примере маленькой бактерии
Говорун В.М.
Казань 2014
«Омики»
Геном
ДНК
Транскриптом
РНК
Протеом
Белки
Метаболом
Белки
Сахара
Нуклеотиды
Аминокислоты
Метаболиты
Область исследований, направленная ​на
суммарную характеристику и
количественную оценку совокупностей
биологических молекул в клетке, органе
или организме.
Фенотип/Функция
Липиды
Объекты исследования:
бактерии класса Молликут
• Spiroplasma melliferum
• Acholeplasma laidlawii
• Mycoplasma gallisepticum
(основной объект)
«Минимальные» бактерии с
наиболее «простой»
организацией
Геномика. Технологические платформы
• Капиллярный
секвенатор ABI
3730XL (1000bp)
• Roche 454 FLX
(800bp)
• SOLID 4 ABI
(50bp)
• PACBIO RS II
(5-10 kbp)
Геномика
A. laidlawii
• Первый геном,
полностью
отсеквенированный
в России, 2007 год
• Технология –
секвенирование по
методу Сэнгера
(капиллярные
секвенаторыABI
3730XL)
Lazarev et al., Complete Genome and
Proteome of Acholeplasma laidlawii, J. of
Bacteriology, 2011
M. gallisepticum
• Полностью геном
прочтен в 2013
• Использованы 3
различных
секвенирующих
платформы
• Окончательная
сборка была
реализована за счет
«ручной» валидации
с применением
метода «прогулки по
хромосоме»
Gorbachev et al., DNA repair in
Mycoplasma gallisepticum, BMC
Genomics, 2013
Fisunov et al., Core proteome of the
minimal cell: comparative proteomics of
three mollicute species., PloS One, 2011
S. melliferum
• Полная
последовательность
неизвестна
• В настоящее время
существует в виде 4
геномных «контигов»
и двух полностью
собранных плазмид
• Использованы 4
различных технологии
секвенирования
Alexeev et al., Application of Spiroplasma
melliferum proteogenomic profiling for
the discovery of virulence factors and
pathogenicity mechanisms in hostassociated spiroplasmas, J. of Proteome
res., 2012
Геном A. laidlawii PG-8A
Стратегия секвенирования:
Lazarev et al, Complete Genome and Proteome of
Acholeplasma laidlawii, J. of Bacteriology, 2011
• Получение фрагментной
библиотеки
• Клонирование в вектор
pCR4Blunt-Topo
• Секвенирование по методу
Сэнгера
• Анализ результатов на
капиллярном анализаторе
ABI 3730XL
• Сборка генома
• Закрытие «дырок»
методом «прогулки по
хромосоме»
Протеогеномное профилирование
A. laidlawii
MNMNNINQLLGTK…..
• N-концевые а.к.
(~70 белков)
• Обнаружение новых белков
(~30 новых белков)
• Фосфорилирование - 79
MNNINQLLGTK
Старт белка из геномной аннотации
PTNENEIGVYMKQFKKVWRYIRRYKKL
Найденный
белок
белок
79.99
Триптические пептиды
Lazarev et al, Complete Genome and
Proteome of Acholeplasma laidlawii,
J. of Bacteriology, 2011
Геном S. melliferum KC3
характеристики генома:
- длина 1,460,000 bp
- GC состав 26%
- присутствие фаговых повторов 3х типов длинной от 6-8 kbp
Spiroplasma phage 1-C74,
Spiroplasma phage 1-R8A2B,
Spiroplasma phage SVTS2
- Экстрахромосомальная ДНК - плазмиды (сколько?)
Стратегия секвенирования и сборки генома
Копия повтора 2
Копия повтора 1
Более длинные фрагменты
Mate pair
чтения
скафолдинг
контиги
Приблизительные размеры
дырок (Gaps)
4 контига хромосомальной ДНК общей длиной 1,250,000 bp (1273 гена)
4 контига плазмидной ДНК длиной 33,677 bp (20 генов))
Графы сложности сборок, полученные с
помощью Сytoscape (contigscape)
«Сэнгер» + SOLID4
Сложность сборки после
секвенирования по Сэнгеру
«Сэнгер» + SOLID4
+PacBio RSII
Геном S. melliferum KC3
С помощью технологи PacBio :
1.Была реализована окончательная сборка
последовательности плазмидной ДНК S. melliferum
KC3
2.Проверена предшествующая сборка
хромосомальных контигов
3.Проведена сборка геномной ДНК с
использованием различных алгоритмов и
программного обеспечения.
Для завершения генома S.melliferum KC3
необходимо:
1.Увеличить представленность длинных ридов, за
счёт увеличения покрытия до 200x (PacBio)
2.Использовать парные риды со вставкой не
меньше 20kbp
Карты плазмид S. melliferum, полученные с помощью
технологии PacBio
Протеогеномный анализ S. melliferum в
отсутствии полной последовательности генома
Функциональная аннотация генома S.
melliferum и S. citri
Пример организации вирусных кластеров в геноме.
Гены, кодирующие белковые факторы патогенности,
окружены плектовирусными генами. Подобное
расположение может указывать на появление
«островков патогенности» посредством
горизонтального переноса
Alexeev et al., Application of Spiroplasma melliferum proteogenomic
profiling for the discovery of virulence factors and pathogenicity
mechanisms in host-associated spiroplasmas, J. of Proteome research,
2012
Характеристика
S. melliferum KC3
S. citri GII3
Размер (bp)
1,260,000
1,780,000
GC состав (%)
27,3
26,1
Число ORF
1142
1908
ORF с
предсказанной
функцией
720
1340
Консервативные
ORF с
неизвестной
функцией
326
180
Уникальные ORF
с неизвестной
функцией
96
354
Плотность ORF
(%)
81
74
Средний размер
гена (bp)
813
766
Число оперонов
rRNA
1
1
tRNA
31
32
Геном M. gallisepticum S6
Секвенирование на
платформе FLX Roche
5
контигов
Идентификация
уникальных
участков в «гэпах»
Сборка
Картирование и in
silico обеднение
ридами
Закрытие «гэпов» с
помощью ПЦР или
«прогулки по хромосоме»
(по Сэнгеру)
Сборка
Геном
Редукция сложности сборки
Системный анализ Mycoplasma gallisepticum
Клеточный
цикл
Математическое
моделирование
и валидация
Mycoplasma
gallisepticum
S6
Транскриптом
qPCR, RNA-seq
Количественная
протеомика
LC-MS
Характеристика
белковых
комплексов
Метаболом
LC-MS
Транскриптомика. Технологические
платформы
SOLID 4 ABI
Анализ количественных изменений всего транскриптома.
Определение стартов и стопов транскрипции.
QX100 ddPCR system Bio-Rad
Точное измерение числа копий РНК (кДНК) в клетке
FLX Roche
Разметка оперонной структуры
CFX Real-Time detection system Bio-Rad
Валидация данных полнотранскриптомного анализа методом
ОТ-ПЦР
Транскрипционное профилирование M. gallisepticum.
Общая схема эксперимента
Библиотеки
кДНК
Два способа фрагментации РНК
(химическая и ферментативная)
Фрагментная
библиотека
(сохраняется
ориентация кДНК
цепей +/-)
Обогащенная 5’концевыми
фрагментами
Протокол
разработан в
нашей
лаборатории
Нормализация с
помощью Дуплексспецифической
нуклеазы (Евроген)
Секвенирование на
платформе SOLID4
Количественные
изменения
транскриптов
Разметка стартов
транскрипции по
всему геному
Валидация
Библиотека
полноразмерных кДНК
Протокол
разработан в
нашей
лаборатории
Секвенирование на
платформе FLX
Roche
Картирование
оперонов
Транскрипционное профилирование. Валидация данных
Сравнение результатов
транскрипционного
профилирования,
полученного в результате
секвенирования кДНК (SOLID4)
и количественной ПЦР (ABI
7000) сопряженной с обратной
транскрипцией
Для валидации были
использованы данные
количественной ПЦР,
полученные для 100 генов (с
разным уровнем
транскрипции)
M. gallisepticum.
Использовались средние
значения дельта Ct трех
независимых биологических
повторностей.
В качестве величины
представленности транскрипта,
полученной в результате
секвенирования, использовали
RPKM – нормализованную
меру покрытия экзона RPKM –
(Reads Per Kilobase of exon
model per Million mapped
reads)
Транскрипционное профилирование M.
gallisepticum в разных состояниях
A
B
Количество генов, увеличивающих (A) и уменьшающих (B) транскрипцию в
разных типах стресса. Синий – тепловой стресс, жёлтый – окислительный
стресс, зелёный – солевой стресс, красный – стационарная фаза.
Транскрипционное профилирование
M. gallisepticum при тепловом стрессе
Идентификация паттернов
изменения транскрипции в
процессе теплового стресса
Полногеномное картирование сайтов
инициации транскрипции M. gallisepticum
Строение сильного промотора M. gallisepticum
450
Положение промотора относительно сайта
инициации транскрипции
350
300
250
200
150
100
50
0
100
90
80
70
60
50
40
Положение сайта
30
20
10
0
Число вхождений
400
Транскрипционное профилирование
M. gallisepticum в разных состояниях
Поведение транскрипции
Поведение транскрипции
Поведение транскрипции
Влияние генетических детерминант в промоторе на транскрипцию в
тепловом стрессе.
Идентификация сайтов связывания
рибосомы
35
30
25
20
15
10
5
0
100
90
80
70
60
50
40
30
Положение сайта относительно старт-кодона
20
10
0
Количество сайтов
40
Протеомика
Протеомное профилирование в условиях теплового
стресса. Технология SWATH
Трипсинолиз
Хроматографическое
разделение
Получение спектров
фрагментации каждого
пептида
База данных пептидов и их
фрагментов
Хроматографическое
разделение
Получение спектров
фрагментации пептидов
с широким окном
Идентификация пептидов по
результатам первого запуска
Реконструкция хроматограммы по
спектрам фрагментации
Количественная протеомика
• Получен исчерпывающий протеом M. gallisepticum (идентифицирован 561
белок).Вариации количества идентифицированных белков в независимых
экспериментах не превышают 2%
Критерии отбора: число уникальных пептидов на белок – не менее двух, global
*FDR<1% (исходя из анализа в PSPEP, пороговое значение unused score для белка
0.4). Был идентифицирован 17221 уникальный пептид (global FDR<1% по PSPEP).
• Проведена первичная полуколичественная оценка изменения протеомного
профиля в условиях теплового стресса методом дифференциального
двумерного гель-электрофореза (валидация данных MS)
• Отработан оптимальный протокол пробоподготовки для количественной
детекции изменений протеома M. gallisepticum (трипсинолиз в геле без
разделения белков, трипсинолиз в растворе (с использованием MS
совместимых детергентов (холат натрия, RapiGest, Waters отрабатывается в
настоящее время)
• Проведена количественная оценка изменения протеомного профиля в
условиях теплового стресса с применением высокопроизводительной Массспектрометрии (SWATH, MRM) MRM для ста белков по трем пептидам и трем
транзициям
• Оценка посттрансляционных модификаций (до 50 фосфорилированных
пептидов в протеоме M. gallisepticum)
Протеомное профилирование при тепловом
стрессе M. gallisepticum
Шапероны
Трансляция
Транскрипция
Транспорт
Функция
неизвестна
Представление результатов SWATH анализа
Протеомное профилирование M.
gallisepticum (логарифмическая фаза
роста культуры) в условиях теплового
стресса (460С – 30мин).
*Эксперимент был проведен в виде трех независимых
биологических повторов
Утилизация
перекиси
Метаболизм
Белок (функция)
Ко-шаперонин GroES
ClpB шаперон
Фактор трансляции EF-Tu
Фактор трансляции EF-Ts
Фактор созревания рибосом
RpoE (δ- субъединица РНК полимеразы)
HatA ABC транспортер
PotD спермидин/путресцин ABC
транспортер
Гипотетический белок (функция
неизвестна)
Гипотетический белок (функция
неизвестна)
SufC (транспортер железа)
Пероксиредоксин OsmC
тиоредоксин
тиоредоксин
НАДН оксидаза
Пируват дегидрогеназа E1 αсубъединица
Пируват дегидрогеназа E1 βсубъединица
Триозо-фосфат изомераза
Фосфолипид-связывающий белок
Гипотетический белок (функция
неизвестна)
Изменение
уровня
рост
рост
рост
рост
рост
рост
рост
рост
рост
рост
рост
рост
рост
рост
рост
падение
падение
падение
падение
падение
Представление результатов 2D-гель-электрофореза
Протеомное профилирование в условиях теплового
стресса. Технология SWATH
Концентрация белка
возрастает (совпадает с
2D-гель-электрофорезом)
• ClpB
• DnaK
Концентрация белка
падает (на 2D не
выявлялись)
• VlhA (поверхностные
антигены)
• Мембранные белки
семейства DUF
В настоящее время продолжается обсчет и анализ
данных!
Схема расположения VlhA-антигена в мембране
Гемагглютининовый домен
(вариабельный)
Пролиновая ножка
(PXPXPXP)
Трансмембранный участок
Lys- и Arg-богатый участок
32 АА
MKRKNILK---FVSLLGIGSFVMLAAASCTSATT---PTPNPTPNPEPKPDPMPNPP---SGGMNGG
Сброс поверхностных антигенов M. gallisepticum в условиях
теплового стресса
Повышение
температуры
Тест на гемагглютинацию с клетками
M. gallisepticum после теплового стресса.
Сверху вниз идут серии двукратных
разведений клеток M. gallisepticum. По
горизонтали располагаются условия,
слева направо: контроль, тепловой
стресс 5 мин, 15 мин, 30 мин. Видно
снижение гемагглютинации после
теплового стресса около 4-6 раз.
В условиях теплового шока наблюдается
рост нетриптических пептидов
поверхностных антигенов (Vlh).
Подобные результаты могут указывать
на наличие специфических протеаз,
изменяющих антигенный репертуар в
условиях стресса.
Метаболомика
Алгоритм анализа метаболома Mollicutes
50 мл культуры,log phase
MeOH, t↓
Экстракция холодным метанолом
HPLC, RX-SIL column
MS data acquisition
Обработка данных
Vanyushkina et al., Identification of intracellular Spiroplasmamelliferum
metabolites by the HPLC-MS method, Biochemistry (Mosc)., 2012
1. Реконструированы карты метаболизма
Acholeplasma laidlawii, Spiroplasma
melliferum, Mycoplasma gallisepticum
Реконструкция карты метаболизма
M. gallisepticum
Vanyushkina et al.,
Compare metabolome
of three Molicutes
species, PloS One, 2014
2. Метаболические пути трех видов бактерий
класса Mollicutes были тщательно
проанализированы и сопоставлены между
собой
3. На основе данных метаболизма, а также протеомного и геномного анализа был
проведен сравнительный анализ метаболических потенций к адаптации при
воздействии стрессовых факторов на исследуемые виды бактерий
Белки,ответственные за этот путь:
•arginine deiminase
•ornithine transcarbamylase
• carbamate kinase
• arginine/ornithine antiport
Наличие белков пути:
•MGA +/•Acl –
•Spiro +
Vanyushkina et al.,
Compare metabolome
of three molicutes
species, PloS One, 2014
4. Анализ изменения метаболома бактерий S. melliferum, A. laidlawii и
M. gallisepticum в условиях кислотного и осмотического воздействий, а также
теплового воздействия на бактерии M. gallisepticum
Изменение метаболома Mollicutes при ↓pH=5.5
Down
Thymidine
Up
2-C-Methyl-D-erythritol 2-4cyclodiphosphate
5-Amino-6-(5-P-ribosylamino)uracil
Uracil
L-Tryptophan
7
L-Leucine
0
8
AMP/dGMP
L-Proline
L-Tyrosine
L-Phenylalanine
L-Glutamate
L-Aspartate
0
4
4
NAD+
GMP
Adenine
Sucrose/a-a-Trehalose
5
Vanyushkina et al.,
Compare metabolome of
three molicutes species,
PloS One, 2014
Создание модели метаболизма
•Стехиометрическая модель
метаболизма
•Набор постоянных потоков
•Список генов, ответственных за
метаболизм
Модель состоит из следующих
подсистем:
-получение энергии
-обмен аминокислот
-обмен нуклеотидов
-обмен липидов
-обмен кофакторов
M.рneumoniae map:306 реакций,145 белков,216 метаболитов
Метаболизм пирувата у M. gallisepticum в
условиях теплового шока
Схема эксперимента:
Анализ литературы и баз
данных
Поиск гомологов (BLAST)
NOX – НАДН-оксидаза
LDH – лактат-дегидрогеназа
PDH – пируват-дегидрогеназа
PTA – фосфотранс-ацетилаза
ACK – ацетат-киназа
Схема метаболизма пирувата у
M. gallisepticum. Реконструирована на
основании геномных данных.
Наблюдается рост НАДН-оксидазы на
белковом уровне, а также рост скорости
генерации H2O2
Построение карты
метаболизма
Аэробный путь утилизации
дает +2 молекулы АТФ на 1
молекулу глюкозы
Возрастание уровня внутриклеточного АТФ
в условиях теплового стресса у M. gallisepticum
Схема эксперимента:
Быстрый лизис клеток в
стерильном DMSO (1:10)
Измерение уровня АТФ с
помошью набора «Люмтек»
(люциферин/люцифераза)
Изменение уровня АТФ при тепловом стрессе.
В качестве «нулевого» уровня была использована стерильная среда для
культивирования M. gallisepticum. Образцы подвергнутые тепловому стрессу
(5, 15 и 30 мин при 460С) демонстрируют повышение уровня внутриклеточного
АТФ по сравнению с контролем (клетки в логарифмической фазе роста).
Эксперимент был проведен в виде трех независимых биологических повторов
с тремя техническими повторами в каждом.
Transient increase of ATP as a
response to temperature up-shift
in Escherichia coli, Soini et al.,
Microbial Cell Factories, 2005
Проблема интеграции данных. Как
анализировать столько информации?
Проблема интеграции данных.
Электронный журнал как следующий уровень после баз знаний.
Геном
Транскриптом
Протеом
Метаболом
Клетка
Благодарности
Спасибо
за внимание!
Дмитрий Алексеев
Лаб. Протеомного анализа НИИ ФХМ
А также:
Сергей Ковальчук
Татьяна Семашко
Елена Кострюкова
Павел Мазин
Download