BioUML - интегрированная платформа для построения моделей виртуальной клетки и физиологических функций человека

advertisement
BioUML - интегрированная платформа
для построения моделей виртуальной
клетки и физиологических функций
человека
Колпаков Ф.А.1,2, Толстых Н.И.1, Валеев Т.Ф.1, Киселев И.Н. 1,2,
Кутумова Е.О. 1,2, Евшин И.С.1,3, Семисалов Б.В. 1,2, Шарипов Р.Н.1,4,
Кондрахин Ю.В.1,2, Кель А.Э.1,5
1ООО
«Институт системной биологии», г. Новосибирск,
2КТИ ВТ СО РАН, г. Новосибирск,
3НГУ, г. Новосибирск
4ИЦиГ СО РАН, г. Новосибирск
5geneXplain GmbH, г. Вольфенбютель, Германия
www.biouml.org
План доклада
• Технология BioUML
• Методология
• разработка компьютерной техники:
• визуальное моделирование ( графическая нотация)
•модульный подход
• определение интерфейсов
• переключатели
• разработка программного обеспечения
• итерационный подход
• функциональные тесты
• социальные технологии
• совместные исследования (collaborative research)
• crowdsourcing
• Новые экспериментальные данные
• Модель виртуальной клетки (концепция)
• Текущие результаты
• Virtual cell
• GTRD – Gene Transcription Regulation Database
модели регуляции генной экспрессии генов
• Proteome – база данных о количестве белков в клетке
• Apoptosis - модель апоптоза из 13 модулей.
• Virtual Human – база данных моделей различных физиологических функций
человека. Содержит более 40 модулей связанных с работой сердечнососудистой
системы и почки.
Технология
BioUML platform
• BioUML is an open source integrated platform for systems biology that
spans the comprehensive range of capabilities including access to
databases with experimental data, tools for formalized description, visual
modeling and analyses of complex biological systems.
• Due to scripts (R, JavaScript) and workflow support it provides powerful
possibilities for analyses of high-throughput data.
• Plug-in based architecture (Eclipse run time from IBM is used) allows to
add new functionality using plug-ins.
BioUML platform consists from 3 parts:
• BioUML server – provides access to biological databases;
• BioUML workbench – standalone application.
• BioUML web edition – web interface based on AJAX technology;
Main features
• supported standards: SBML, SBGN, BioPAX, SED-ML, SBO, MIRIAM, CellML
– some examples, CellDesigner extension support
– state concept
– SED-ML as workflow
• Modular modelling: composite models, agent based models
• systems biology – reproducible highthroughput data analyses:
• analyses: algorithms, scripts, workflows
• integration with R/Bioconductor, Galaxy
• data: microarrays, NGS, ChIP-SEQ
• visualization: genome browser
• BioUML – as platform for collaborative research
– Amazon EC2 servers
– data repository - groups, projects, import/export, FTP upload
– chat, history
www.biouml.org
JavaScript host objects allows
to merge R/Bioconductor and
Java/BioUML worlds
R world
Java/BioUML world
Main platforms for bioinformatics
and BioUML
Taverna
R/Bioconductor
standalone application
powerful workflows
standalone application
powerful workflows
scripts,
statistics, plots
scripts,
statistics, plots
BioUML platform
web interface,
collaborative research
genome browser
workflows, web interface,
collaborative research,
genome browser
Galaxy
Eclipse plug-in based
architecture,
chemoinformatics
Eclipse plug-in based
architecture,
chemoinformatics
BioClipse
Main platforms for bioinformatics
and BioUML
Taverna
R/Bioconductor
standalone application
powerful workflows
standalone application
powerful workflows
scripts,
statistics, plots
scripts,
statistics, plots
BioUML platform
web interface,
collaborative research
genome browser
workflows, web interface,
collaborative research,
genome browser
Galaxy
Eclipse plug-in based
architecture,
chemoinformatics
Eclipse plug-in based
architecture,
chemoinformatics
BioClipse
+ systems biology
• visual modelling
• simulation
• parameters fitting
•…
+ chat for on-line consultations
Методология
• разработка компьютерной техники:
• визуальное моделирование (графическая нотация)
•модульный подход
• четкое определение интерфейсов
• переключатели (состояние)
• разработка программного обеспечения
• итерационный подход
• функциональные тесты
• социальные технологии
• совместные исследования (collaborative research)
• crowdsourcing
Yuri Lazebnik “Can a biologist fix a radio?—Or,
what I learned while studying apoptosis“. Cancer
Cell, 2002, 2(3): 179-182
Biologist view
Engineer’s view
2002
However, I hope that it is only a question of time before a user-friendly and
flexible formal language will be taught to biology students, as it is taught to
engineers, as a basic requirement for their future studies. My advice to
experimental biologists is to be prepared.
Y. Lazebnik, 2002
2010
Standards in systems
biology
SBML – Systems Biology
Markup Language
SBGN – Systems Biology
Graphics Notation
TNF-α module (SBGN)
Biologist view
Engineer’s
view
Biologist view
Engineer’s
view
Last centaury:
50-70-th
Modular design
Modules:
clear specification of interfaces
input/output
contacts
Функциональные тесты
Функциональные тесты
Новые экспериментальные
данные
Global quantification of mammalian gene expression control.
Schwanhäusser B, Busse D, Li N, Dittmar G, Schuchhardt J, Wolf J, Chen W, Selbach M.
Nature. 2011 May 19; 473(7347):337-342.
- фибробласты мыши
- одновременное измерение транскриптома и протеома для 5000+ генов
- измерено время полураспада для всех мРНК и соответствующих белков
- построена полногеномная модель для предсказания скорости синтеза мРНК и белков
Deep proteome and transcriptome mapping of a human cancer cell line.
Nagaraj N, Wisniewski JR, Geiger T, Cox J, Kircher M, Kelso J, Pääbo S, Mann M.
Mol Syst Biol. 2011 Nov 8;7:548. doi: 10.1038/msb.2011.81.
- HeLa cells
- число молекул для 10 255 белков и 9207 соответствующих РНК
- проведенный анализ показывает, что покрыто большинство белков и РНК
кодирующих генов
The quantitative proteome of a human cell line.
Beck M, Schmidt A, Malmstroem J, Claassen M, Ori A, Szymborska A, Herzog F, Rinner O,
Ellenberg J, Aebersold R. Mol Syst Biol. 2011 Nov 8;7:549. doi: 10.1038/msb.2011.82.
- человек, остеосаркома – U20S клеточная линия
- количество молекул для 10 000+ белков
- диапазон измерений – 7 порядков, от десятков до 20 000 000 молекул белка на клетку.
Схема эксперимента
Виртуальная клетка
концепция модели
Базовая модель
на основе данных
Schwanhäusser et al, 2011
- транскриптом
- протеом
- параметры
- для мРНК – ksynth-RNA, kdegr-RNA
- для белков - ktransl-p, kdegr-p
воздействие
предсказание
Базовая модель
на основе данных
Schwanhäusser et al, 2011
- транскриптом
- протеом
- параметры
- для мРНК – ksynth-RNA, kdegr-RNA
- для белков - ktransl-P, kdegr-P
транскриптом
(виртуальный
микрочиповый
эксперимент)
протеом
сравнение
эксперимент
микрочип
NGS
мас-спекрометрия
воздействие
Базовая модель
на основе данных
Schwanhäusser et al, 2011
- транскриптом
- протеом
- параметры
- для мРНК – ksynth-RNA, kdegr-RNA
- для белков - ktransl-P, kdegr-P
моделирование воздействия:
- путь передачи сигнала
- задействованные гены
- модели регуляции транскрипции соответствующих генов
- базовая модель
- транскрипция  мРНК
- трансляция  белок
геном набор регуляторных сайтов, полученных
GTRD в результате мета-анализа данных:
• ChIP-SEQ
• предсказанных сайтов
• эволюционно-консервативных районов
• микрочиповых экспериментов
математические модели на основе геномных
и транскриптомных данных
транскриптом
GTRD
протеом
Proteome
регуляторные
пути
Apoptosis
Ubiquitomix
метаболом
dri
 F (rg1 , rg 2 ,...) * k synth RNA  kdeg r  RNA * ri
dt
dpi
 k synth P * ri  kdeg r  P * pi
dt
Экспериментальные данные:
- Schwanhausser et al., 2011
- Beck et al., 2011
- Nagaraj N., 2011
система АДУ + дискретные события
• модификации белков
• образование комплексов
• функции F для регуляции: транскрипции, трансляции, распада
белков (например, через убиквитинирование)
система ОДУ
Текущие результаты
GTRD
Gene Transcription Regulation Database
Целью которой является:
- построение моделей регуляции генной экспрессии для всех генов человека, мыши
и крысы
- ежеквартальное обновление моделей на основе вновь появляющихся данных
в полуавтоматическом режиме на основе сценариев (workflow)
Модели строятся на 2 уровнях:
1) набор сайтов связывания транскрипционных факторов, полученных в ходе
мета-анализа на основе данных:
- ChIP-SEQ
- предсказанных сайтов
- эволюционно-консервативных районов
- микрочиповых экспериментов.
2) математические модели регуляции отдельных генов, представленные в виде
дифференциальных уравнений;
Фрагмент сценария для автоматической
обработки ChIP-Seq данных
Моделирование генной экспрессии
Фиксируем ген-мишень G.
- экспрессия гена-мишени в момент времени t.
- гены прямо или косвенно влияющие на его экспрессию
(регуляторы).
- уровень экспрессии i-того гена-регулятора в момент времени t.
Модель регуляции гена-мишени:
Задачи:
1. Составление списка генов-регуляторов – на основе GTRD.
2. Выбор регуляторной функции (т.е. выбор модели).
Исходные данные:
Варианты моделей
1. Линейная модель со сдвигом:
2. Простая нелинейная модель:
3. Стохастическая нелинейная модель:
где
- сигма-функция.
Proteome
Apoptosis
На данный момент содержит наиболее полную модель
апоптоза, включающую
• 13 модулей
• 286 белков и их комплексов
• 684 реакции
• 719 параметров
Прототип базы данных модулей (математический моделей)
для регуляторных и метаболических путей.
Modular model of apoptosis
Mitochondron module
(BMOND ID: Int_Mitoch_module)
Bagci EZ, et al,
Biophysical J 2006
Albeck JG, et al,
PLoS Biol 2008
Additions:
Activation of CREB and
deactivation of BAD by AktPP and ERK-PP
Upregulation of Bcl-2 by
CREB
Bcl-2 suppression by p53
EGF module
(BMOND ID: Int_EGF_module)
Schoeberl B, et al: Nature
Biotechnology 2002
Borisov N, et al: Molecular
Systems Biology 2009
Additions:
Reactions of protein
syntheses and degradations
CD95L module and results of
fitting its dynamics to
experimental data
Bentele M, 2004
Neumann L, 2010
Modular model allows us to combine both up-down and
bottom-up approaches
top-down
bottom-up
Virtual human
Virtual (Physiological) Human – база данных моделей различных
физиологических функций человека.
На данный момент содержит более 40 модулей связанных с
работой сердечнососудистой системы и почки:
• проанализированы существующие модели сердечнососудистой системы человека;
• разработан подход к объединению моделей с различным
математическим формализмом на основе агентного
моделирования;
• выбранные модели объединены в комплексную модель
сердечно-сосудистой системы человека;
• комплексную модель валидирована с использованием
экспериментальных данных.
Агентное моделирование
Агентное моделирование
Элементы блочной модели
BioUML
BioUML
Модель сердечных сокращений
Q – поток
P – давление
R – сопротивление
V – объем
DO2 – кислородный долг
H – нейрогуморальный фактор
Солодянников Ю. В.
“Элементы математического моделирования и идентификация системы
кровообращения”.
Самара. Изд-во Самар. ун-та, 1994. 315 с.
Пример работы модели
мл/сек
мм рт. ст.
сек
Поток крови из желудочка в артерии
Поток крови через капилляры
сек
Среднее артериальное давление
Модель почечной регуляции
Karaaslan F. et al.
“Long-term mathematical model involving renal sympathetic nerve activity, arterial
pressure, and sodium excretion.”
Ann Biomed Eng. 2005. 33(11): 1607-1630.
Модель почечной регуляции
Обозначение
eaum
Cadh
Canp
Cal
Cat
Cr
Сsod
Fico
Fiu
Pma
Pmf
Pra
R
rsna
vas
Vecf
Описание
Эффект автономной нервной системы.
Концентрация антидиуретического гормона.
Концентрация натриуретического пептида.
Концентрация альдостерона.
Концентрация ангиотензина.
Концентрация ренина.
Концентрация натрия.
Сердечный выброс (минутный объем).
Скорость тока мочи.
Среднее артериальное давление.
Среднее наполняющее давление.
Давление в правом предсердии.
Артериальное сопротивление.
Почеченая симпатическая нервная активность.
Васкуляризация.
Объем внеклеточной жидкости.
Пример работы модели
мм рт. ст.
Среднее артериальное давление
Общее время эксперимента – 7 дней.
Потребоение соли увеличено с 0.126 до 0.26 мЭкв/л через 50
часов после начала эксперимента и уменьшено до 0.02 мЭкв/л
через 133 часа.
Модель артериального дерева
Возможные граничных условий на выходе
из сердца и на концах последних артериях:
1. Зависимость давления от времени p(t)
2. Зависимость площади от времени A(t)
3. Зависимость потока от времени Q(t)
4. Условие фильтрации: Q = KD(p-pv)
Пример работы модели
Профиль давления на
входе в аорту
На выходе – постоянное
давление 70 мм. рт. ст.
Объединение моделей, шаг 1
Объединение моделей, шаг 1
Объединение моделей, шаг 1
Среднее давление
Среднее сопротивление
Поток на выходе
Объем крови
Сопротивление на выходе
Поток на входе
Давление на входе
Комплексная модель ССС человека
Trash
Trash
Trash
Trash
Trash
Acknowledgements
Part of this work was partially supported by the grant:
European Committee grant №037590 “Net2Drug”
European Committee grant №202272 “LipidomicNet”
Integration and interdisciplinary grants №16, 91 of SB RAS.
BioUML team
Software developers
Nikita Tolstyh
Ilya Kiselev
Tagir Valeev
Elena Kutumova
Anna Ryabova
Alexey Shadrin
Biologists
Ruslan Sharipov
Ivan Yevshin
Download