Визуализация в моделях алгебры процессов биологических систем

advertisement
ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ
[3] L. Bos and B. Blobel, Eds., Medical and Care Compunetics 4, vol. 127 in Studies in
Health Technology and Informatics series. Amsterdam: IOS Press, pp. 311—315,
2007.
[4] B. G. Druss and S. C. Marcus, «Growth and decentralization of the medical
literature: implications for evidence-based medicine», J. Med. Libr. Assoc., vol. 93,
no. 4, pp. 499—501, Oct. 2005, PMID: PMC1250328.
[5] A. Mina, R. Ramlogan, G. Tampubolon, and J. Metcalfe, «Mapping evolutionary
trajectories: Applications to the growth and transformation of medical knowledge»,
Res. Policy, vol. 36, no. 5, pp. 789—806, 2007, doi: 10.1016/j.respol.2006.12.007.
[6] M. Gerhardsson de Verdier, «The Big Three Concept — A Way to Tackle the Health
Care Crisis?» Proc. Am. Thorac. Soc., vol. 5, pp. 800—805, 2008.
[7] M. Fortin, J. Dionne, G. Pinho, J. Gignac, J. Almirall, and L. Lapointe, «Randomized
controlled trials: do they have external validity for patients with multiple
comorbidities?» Ann. Fam. Med., vol. 4, no. 2, pp. 104—108, Mar.—Apr. 2006, doi:
10.1370/afm.516.
[8] C. Bishop, Pattern Recognition and Machine Learning. Springer, 2006.
[9] J. Winn and C. Bishop, «Variational Message Passing», J. Mach. Learn. Res., vol. 6,
pp. 661—694, 2005.
[10]T. Minka, J. Winn, J. Guiver, and A. Kannan, Infer.NET, Microsoft Research
Cambridge, http://research.microsoft.com/infernet.
98
ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ
Визуализация в моделях
алгебры процессов
биологических систем
В
последнем исследовании нобелевский лауреат Пол
Нурс призывает к лучшему пониманию живых организмов за счет «разработки подходящих языков для
описания обработки информации биологических систем и создания более эффективных методов для перевода
биохимических описаний в функции логических цепей, определяющих биологические феномены» [1].
Язык, который хочет видеть Нурс — это формальный
язык, который может автоматически преобразовываться в
исполняемый машинный код, и который поддерживает моделирование и техники анализа для проверки свойств биологических систем. Хотя существует множество методов формального моделирования живых систем, только некоторые из них
предоставляют исполняемые описания, которые выделяют
механистические шаги, вызывающие переход системы из одного состояния в другое [2]. Практически все техники, связанные с математическим моделированием, абстрагируются от
таких отдельных шагов для создания глобального поведения,
обычно усредненного по времени.
Компьютерная наука дает ключевые элементы для описания механистических шагов: алгоритмы и языки программирования [3]. Согласно метафоре с молекулами в качестве
процессов, приведенной в [4], вычисления процессов определяются как многообещающий инструмент для моделирования биологических систем — сложных, параллельных и
управляемых взаимодействиями своих подсистем.
Причинно-следственная связь — основное отличие методов моделирования на основе языка от других техник. Фак-
ЛУКА КАРДЕЛЛИ
(LUCA CARDELLI)
Microsoft Research
КОРРАДО
ПРИАМИ
(CORRADO
PRIAMI)
Microsoft Research —
Университет Тренто,
Центр компьютерной
и системной биологии
и Университет
Тренто (University
of Trento Centre for
Computational and
Systems Biology and
University of Trento
ЧЕТВЕРТАЯ ПАРАДИГМА
99
тически причинно-следственная связь в языках параллельного программирования четко соотносится с идеей параллельности или независимости событий, что
сильно отличает причинность от структурирования по времени. Действие A вызывает действие B, если A является необходимым условием для происхождения
B, и A влияет на действие B — то есть существует поток информации от А к В.
Вторая часть состояния, определяющего причинность, четко разделяет предшествование (которое относится только к положению во времени) и причинность
(поднабор временного упорядочения, где также учтен поток информации) [5].
Как следствие, перечень реакций системы не предоставляет информации о причинах, а дает информацию только о времени. Поэтому необходимо разработать
новые инструменты моделирования и анализа для охвата причинности.
Причинно-следственная связь является ключевой проблемой в анализе сложных взаимодействующих систем, так как она помогает разделять независимые
компоненты и упрощать модели, при этом позволяя четко определять обмен информацией между различными сигнальными каскадами. Когда экспериментатор наблюдает интересующее его событие в модели, можно сжать предыдущую
историю системы и оставить только предшествующие события, которые вызвали интересующее. Это может дать точные подсказки о причинах заболеваний,
взаимодействии лекарства с живой системой (с определением его эффективности и побочных эффектов) и механизмах регулирования изменений поведения.
Причинность — это взаимосвязь между событиями, и поэтому наиболее
естественно изучать ее в дискретных моделях, которые, в свою очередь, описаны
алгоритмическими языками моделирования. Хотя в компьютерной науке для
создания моделей параллельных систем уже определено множество языков моделирования, еще остается множество задач по созданию алгоритмических моделей для понимания биологических процессов на уровне систем. Среди таких
задач — взаимосвязь между местными взаимодействиями низкого уровня и производным глобальным поведением высокого уровня; дальнейшее исследование
систем; представление в разных уровнях и масштабах по времени, пространству
и размеру; а также причинные отношения между взаимодействиями и осведомленность о контексте внутренних компонентов. Таким образом формальные
системы моделирования, которые могут быть кандидатами для продвижения
алгоритмической системной биологии, должны быть дополнительными и иметь
возможность взаимодействия с математическим моделированием. Они должны
решать вопросы параллельности и комплексности, быть алгоритмическими и
количественными, выражать причинно-следственную связь, управляться взаимодействием, а также быть компонуемыми, масштабируемыми и модульными.
ВИЗУАЛИЗАЦИЯ ЯЗЫКА
Практичность представляет собой фундаментальную проблему использования
формальных языков в биологии. Язык моделирования должен быть понятным
100
ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ
для биологов, чтобы они могли использовать его в собственных неформальных
моделях и экспериментах.
Одна из попыток биологов по соединению формальных языков и неформальных описаний систем включает в себя использование ограниченного естественного языка, организованного в виде таблиц, которые собирают всю информацию, относящуюся к структуре и динамике системы. Такое описательное
представление достаточно информативно и структурировано для компиляции
в формальное описание, подходящее для моделирования и анализа [6, 7]. Хотя
стиль описательных моделей еще не является визуальным, он определенно более
понятен для биологов, нежели формальный язык (программирования).
Наилучшим способом сделать язык понятным для ученых и помочь в управлении всем его комплексом является визуализация языка. Это сложнее, чем визуализация данных или результатов моделей, так как язык описывает полную
кинетику системы, включая динамические взаимосвязи между событиями. Таким образом, визуализация языка должна быть динамичной и по возможности
реактивной [8], чтобы ученые могли определять и вставлять события в работающую модель при непосредственном вмешательстве. Для этого требуется точное
соответствие между внутренним исполнением формального языка и его визуализацией, чтобы кинетика языка полностью отражалась в кинетике визуализации и наоборот.
Такая возможность полного соответствия кинетики общего (полного по Тьюрингу) языка моделирования визуальным представлениям была продемонстрирована, например, для пи-исчисления [9], но для адаптации таких общих методов к специфическим требованиям визуализации сохраняется еще множество
практических вопросов (см. рисунок 1). Одним из таких требований, например,
является визуализация и отслеживание молекулярных комплексов. В этих целях
язык BlenX [10] и его средства поддержки дают возможность точного представления комплексов биологических элементов и изучения их развития во времени
[11] (см. рисунок 2). Графическое представление комплексов также полезно в
изучении процессов морфогенеза для выявления механистических шагов формирования шаблона (см. рисунок 3).
АНАЛИЗ
Создание модели является одним из шагов в научном цикле, и подходящие языки моделирования (вместе с возможностями их исполнения и визуализации)
особенно важны для моделирования сложных систем. Однако в конце концов
возникнет желание проанализировать модель с использованием большого количества техник. Некоторые из этих техник могут быть связаны с базовой математической системой, такой как анализ дифференциальных уравнений, цепей
Маркова или сетей Петри, полученных из модели. Другая техника может быть
связана с описанием модели (языка, на котором написана модель). Например,
нам может потребоваться узнать, представляют ли два различных описания мо-
ЧЕТВЕРТАЯ ПАРАДИГМА
101
Продуцирование
Деградирование
M
M
+tpn
M
TM
-tpn v
+pep
+pep a
-pep
-pep q
-tpn
MP
TMP
Выход
MeP
Деградирование
РИСУНОК 1.
Эту диаграмму можно привести в однозначное соответствие с формальными стохастическими моделями пи-исчисления [9, 12, 13], чтобы можно было редактировать или диаграммы, или
модели. Узлы представляют собой молекулярные состояния (значки узлов показаны просто для
наглядности), а маркированные дуги — взаимодействие с другими молекулами среды. В моделях
используется биохимический вариант пи-исчисления, с массовой долей в виде верхнего индекса и
знаками сложения и вычитания для добавления и удаления связующего.
дели одинаковое поведение — в соответствии с некоторыми параметрами сходства поведения. Такой тип соответствия модели может возникнуть, например,
из кажущихся различными биологических систем, которые работают по общим
фундаментальным принципам. Подобный вопрос — сможем ли мы упростить
(абстрагировать) описание модели, при этом сохранив ее поведение, опять же
с какой-то степенью схожести поведения, которая может скрывать отдельные
некритические подробности.
102
ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ
РИСУНОК 2.
Зеленые блоки с «S» на диаграмме представляют организмы, заполняющие рассматриваемую
биологическую систему. Голубые прямоугольники возле зеленых блоков представляют активные
поверхности раздела или области, доступные для комплексации и декомплексации. На диаграмме показано, как моделирование спецификации BlenX образует кольцевой комплекс и предоставляет положение и связи между блоками для изучения.
Сходство поведения фактически является первым инструментом в компьютерной науке для проверки вычислительных систем. Например, мы можем использовать схожести для обеспечения согласованности внедрения и спецификации, как можно больше абстрагируясь от синтаксических описаний, вместо
этого сосредотачиваясь на семантике (динамике) спецификаций и внедрений.
Пока что биология фокусируется на синтаксических связях между генами, геномами и белками. Совершенно новым направлением исследований является
изучение семантического сходства биологических организмов, представляющих
сложные сети взаимодействий. Такой метод может привести к новому видению
систем и усилить необходимость в компьютерной науке для улучшения системной биологии.
Биология является наукой, использующей большое количество данных. Биологические системы представляют собой огромные коллекции взаимодейству-
ЧЕТВЕРТАЯ ПАРАДИГМА
103
ВИЗУАЛИЗАЦИЯ АНАЛИЗА
РИСУНОК 3.
Зеленые, красные и синие блоки с «S» на диаграмме представляют различные виды, заполняющие
рассматриваемую биологическую систему. Голубые прямоугольники возле блоков представляют
активные поверхности раздела или области, доступные для комплексации и декомплексации.
Диаграмма поясняет, как шаблоны образуются в процессе морфогенеза при моделировании спецификацией BlenX.
Чтобы исполнение моделей было интерактивным (для динамического изменения фокуса на различные характеристики) и реактивным (для изменения их исполнения в реальном времени), им нужна визуализация. Исполнение является
одной из форм анализа; для других методов анализа также требуется визуализация. Для сложных систем нормальный метод «группового» анализа, состоящий из выполнения сложного анализа на модели с последующим получением
результатов для решения задачи, должен быть заменен более интерактивным и
исследовательским методом.
Абстрагирование модели является важным инструментом для управления
сложностью, и мы можем представить себе выполнение этой задачи в интерактивной форме — например, за счет объединения или скрывания компонентов. Для объединения затем потребуются подходящая визуализация и методы
отношения поведения исходных компонентов к поведению сгруппированных
компонентов. Это означает визуализацию не языка моделирования, а скорее
визуализацию функции абстракции между моделями. Поэтому мы предлагаем
визуализировать исполнение программ и моделей таким образом, чтобы результаты были связаны со спецификацией исходного кода и модели, а графическое
абстрагирование, выполняемое конечным пользователем, преобразовывалось в
трансформацию формальной программы и модели. Затем средство поддержки
будет проверять, какие свойства сохраняются при трансформации, а какие нет,
и извещать об этом пользователя.
Все сказанное выше усиливает необходимость в формальном и исполняемом языке для моделирования биологии как основной функции компьютерной
лаборатории для биологов, которая может стать высокопроизводительным инструментом биологии следующего поколения.
БЛАГОДАРНОСТЬ
ющих компонентов. Исследования последнего десятилетия были посвящены
определению и классификации таких компонентов, особенно на молекулярном
уровне (гены, метаболиты, протеины). Для практического использования такого количества доступных данных нам нужно полностью представить их в виде
компактных исполняемых моделей, чтобы такие процессы исполнения могли
при необходимости восстанавливать доступные данные. Такой метод объединит
синтаксис и семантику в унифицированные представления и создаст необходимость в различных методах хранения, получения и сравнения данных. Таким
образом, хранилище модели, представляющее динамику биологических процессов в компактной и механистической форме, будет крайне ценным и сможет
улучшить понимание биологических данных и базовых биологических принципов, которые управляют жизнью. Оно будет способствовать разработке прогнозов и оптимальных схем дальнейших экспериментов для перехода от сбора
данных к созданию знаний.
104
ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ
Авторы благодарят Эндрю Филлипса (Andrew Phillips) и Лоренцо Дематте
(Lorenzo Dematté) за подготовку информации.
ССЫЛКИ
[1] P. Nurse, «Life, Logic and Information», Nature, vol. 454, pp. 424—426, 2008, doi:
10.1038/454424a.
[2] J. Fisher and T. Henzinger, «Executable Cell Biology», Nature Biotechnology, vol. 25,
pp. 1239—1249, 2007, doi: 10.1038/nbt1356.
[3] C. Priami, «Algorithmic Systems Biology: An opportunity for computer science»,
Commun. ACM, June 2009, doi: 10.1145/1506409.1506427.
[4] A. Regev and E. Shapiro, «Cells as computation», Nature, vol. 419, p. 343, 2002, doi:
10.1038/419343a.
[5] P. Degano and C. Priami, «Non-interleaving semantics of mobile processes», Theor.
Comp. Sci. vol. 216, no. 1—2, pp. 237—270, 1999.
ЧЕТВЕРТАЯ ПАРАДИГМА
105
[6] M. L. Guerriero, J. Heath, and C. Priami, «An automated translation from a narrative
language for biological modelling into process algebra», Proc. of CMSB 2007, LNBI
4695, 2007, pp. 136—151, doi: 10.1007/978-3-540-75140-3_10.
[7] M. L. Guerriero, A. Dudka, N. Underhill-Day, J. Heath, and C. Priami, «Narrativebased computational modelling of the Gp130/JAK/STAT signalling pathway», BMC
Syst. Biol., vol. 3, no. 1, p. 40, 2009, doi: 10.1186/1752-0509-3-40.
[8] S. Efroni, D. Harel, and I. R. Cohen, «Reactive Animation: Realistic Modeling of
Complex Dynamic Systems», Computer, vol. 38, no. 1, pp. 38—47, Jan. 2005, doi:
10.1109/MC.2005.31. [9]A. Phillips, L. Cardelli, and G. Castagna, «A Graphical
Representation for Biological Processes in the Stochastic Pi-calculus», Trans.
Comput. Syst. Biol., VII—LNCS 4230, 2006, pp. 123—152, doi: 10.1007/11905455_7.
[10]L. Dematté, C. Priami, and A. Romanel, «The BlenX Language: a tutorial»,
Formal Meth. Comput. Syst. Biol., LNCS 5016, 2008, pp. 313—365, doi:
10.1145/1506409.1506427.
[11] L. Dematté, C. Priami, and A. Romanel, «The Beta Workbench: a computational
tool to study the dynamics of biological systems», Brief Bioinform, vol. 9, no. 5, pp.
437—449, 2008, doi: 10.1093/ bib/bbn023.
[12]C. Priami, «Stochastic pi-calculus», Comp. J., vol. 38, no. 6, pp. 578—589, 1995, doi:
10.1093/comjnl/38.7.578.
[13]A. Phillips and L. Cardelli, «Efficient, Correct Simulation of Biological Processes
in Stochastic Pi-calculus», Proc. Comput. Meth. Syst. Biol., Edinburgh, 2007, pp.
184—199, doi: 10.1007/978-3-540-75140-3_13.
106
ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ
Download