Поверхностная визуализация данных об экспрессии генов в коре

advertisement
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
О.В. СЕНЮКОВА1, А.С. КОНУШИН1,
Д.П. ВЕТРОВ1, К.В. АНОХИН2
1
Московский государственный университет им. М. В. Ломоносова
2
НИИ нормальной физиологии им. П. К. Анохина, Москва
olsen222@yandex.ru, ktosh@graphics.cs.msu.ru, vertovd@yandex.ru,
k.anokhin@gmail.com
ПОВЕРХНОСТНАЯ ВИЗУАЛИЗАЦИЯ ДАННЫХ
ОБ ЭКСПРЕССИИ ГЕНОВ В КОРЕ ГОЛОВНОГО МОЗГА
И ГИППОКАМПЕ МОЗГА МЫШИ
Рассматривается задача проецирования данных об экспрессии генов в
некоторых анатомических структурах мозга мыши на поверхность этих
структур и визуализации полученных текстурированных моделей. Рассматриваются такие структуры мозга, как кора головного мозга и гиппокамп. Предложен и реализован ускоренный алгоритм проецирования
функциональных данных на поверхность коры головного мозга, а также
метод визуализации моделей поверхностей мозга и гиппокампа со спроецированными на них экспериментальными данными.
Введение
Экспрессией гена называется процесс синтеза белка за счет активности
генов в составе ДНК, содержащейся в ядре клетки. В каждой клетке экспрессируется лишь часть генов, которые и определяют ее структуру и
функции. В мозге, в отличие от большинства других органов, экспрессируются более 80% всех генов генома [1], что отражает огромное клеточное разнообразие и организационную сложность данной структуры. Поэтому исследование активности генов в мозге является чрезвычайно важной задачей для понимания механизмов его работы.
Особенно актуален анализ экспрессии генов, регулируемых функциональными процессами в мозге. В настоящей работе рассматриваются такие гены, экспрессия которых в коре головного мозга и гиппокампе связана с механизмами памяти (например, c-fos, fos-B).
Обычно для функциональных исследований экспрессии определенного
гена лабораторное животное подвергается тем или иным воздействиям
 Данная работа выполнена при поддержке РФФИ, проект № 09-04-12215офи_м.
УДК 004.032.26(06) Нейронные сети
253
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
(например, разные задачи обучения для лабораторных мышей), в результате которых в его мозге активируется данный ген. Главная цель таких
опытов – определить, где и насколько активно экспрессировался исследуемый ген.
Для подобного анализа обычно используются тонкие (порядка 20 микронов) срезы мозга. На срезы наносится специфический для данного гена
молекулярный зонд. Визуализация зонда выявляет те клетки, где экспрессировался рассматриваемый ген.
После того, как получены изображения экспрессии гена на отдельных
срезах, они приводятся к каноническому виду – сопоставляются со специальным атласом мозга (например, [2]). Затем по ним восстанавливается
трехмерная модель мозга и трехмерные паттерны экспрессии гена.
Как правило, для этого используется воксельная визуализация экспрессии генов [3]. Но такой способ визуализации не всегда позволяет качественно оценить данные из-за того, что экспрессия гена наблюдается в
большом количестве отдельных точек, распределенных по объему структуры (рис. 1).
Рис. 1. Объемная визуализация
экспрессии гена
Поэтому более информативным методом анализа подобных данных
могла бы быть проекция данных об экспрессии гена на поверхность исследуемой анатомической структуры, например коры головного мозга.
Существует ряд работ, посвященных поверхностной подобной анатомической визуализации различных экспериментальных данных в исследованиях мозга. Однако, как правило, это данные ФМРТ (функциональная
магнитно-резонансная томография [4]) и ПЭТ (позитронно-эмиссионная
томография [5]) мозга человека.
Так, авторы работы [6] предлагают методы поверхностной визуализации данных функциональной МРТ для мозга человека. Объемные экспериментальные данные (массив вокселей со значениями-цветами) визуалиУДК 004.032.26(06) Нейронные сети
254
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
зируются на полигональной модели поверхности мозга. Каждой вершине
присваивается цвет по одному из двух методов. Цвета граней интерполируются по вершинам. Первый метод предполагает нахождение для каждой вершины поверхности мозга вокселя, в который она попадает, и присвоение вершине цвета этого вокселя. При отсутствии для данной вершины соответствующего вокселя используется трилинейная интерполяция
ближайших вокселей для определения цвета вершины. Таким образом,
этот метод позволяет визуализировать только те данные, которые находятся на поверхности мозга. Второй метод заключается в построении луча, идущего из центра мозга к заданной вершине, и присвоении вершине
цвета, равному среднему арифметическому цветов вокселей, через которые проходит этот луч.
В [7] рассматривается проецирование различных видов экспериментальных данных (таких, как функциональная МРТ, позитронноэмиссионная томография) на поверхность мозга человека. Данные представляются дискретно – в виде набора точек, распределенных по объему.
В таком же виде (каждая точка – отдельным кружком) они и визуализируются на поверхности после проецирования. Метод проецирования заключается в поиске для каждой точки ближайшей вершины поверхности –
по сути, приближенное ортогональное проецирование.
В работе [8] описано построение плоских карт для данных по функциональной авторадиографии мозга крысы. Для каждого среза строится разбиение на сектора с помощью лучей, идущих от центра среза. Для каждого сектора в каждом срезе рассчитывается среднее значение данных. Эти
значения последовательно наносятся на двумерную карту. Если каждое
значение рассматривать как цвет, то полученную карту можно использовать как текстуру модели мозга, нанося ее на поверхность коры больших
полушарий. Таким образом, схема раскраски текстуры при поверхностной
визуализации, как правило, соответствует виду начальных данных. Если
данные непрерывные – в виде массива вокселей, то и текстура строится
сглаженная. Если данные дискретные – в виде набора точек, то они и визуализируются на поверхности по отдельности.
В данной статье предлагается метод, который позволяет генерировать
сглаженную текстуру поверхности по дискретным данным экспрессии
гена.
Постановка задачи
УДК 004.032.26(06) Нейронные сети
255
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
Исходными данными для визуализации являются трехмерная полигональная модель поверхности коры головного мозга или гиппокампа,
набор трехмерных точек экспрессии некоторого гена, распределенных по
объему коры гиппокампа, а также атрибуты точек активности – интенсивность экспрессии.
Результатом работы должна являться трехмерная модель поверхности
коры головного мозга (гиппокампа) с нанесенной на нее текстурой – картой активности гена. Текстура поверхности должна быть сгенерирована
таким образом, чтобы она была сглаженная, несмотря на дискретность
исходных данных, и наглядно отображала картину экспрессии исследуемого гена.
Для построения текстуры точки экспрессии гена сначала проецируются на поверхность одним из двух методов – центральным (для коры головного мозга) или ортогональным (для коры головного мозга или гиппокампа). При этом рассматриваются либо все точки экспрессии гена, либо
только точки из указанного слоя (задается глубиной относительно поверхности и шириной).
Проецирование данных на поверхность
Для ортогонального проецирования используется приближенная схема
из [7], где для каждой точки экспрессии гена ищется не ближайшая точка
поверхности, а ближайшая вершина поверхности (рис. 2).
Рис. 2. Схема ортогонального
проецирования
Принадлежность точки указанному слою для проецирования будет
определяться ее расстоянием до этой вершины.
При центральном проецировании данных на поверхность структуры в
качестве центра проекции выбирается точка, расположенная в центре исследуемой структуры. Проекцией точки экспрессии гена на поверхность
считается пересечение луча, идущего из центра проекции и проходящего
через данную точку, с поверхностью (рис. 3). Принадлежность точки укаУДК 004.032.26(06) Нейронные сети
256
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
занному слою для проецирования будет определяться ее расстоянием до
поверхности вдоль этого луча.
Рис. 3. Схема центрального
проецирования
Авторами данной статьи предложен новый ускоренный алгоритм центрального проецирования, в котором для поиска проекции точки экспрессии гена на поверхность мозга проводится перебор не всех треугольников
модели, а только треугольников из некоторой области. Это дает значительный прирост по скорости.
Область поиска нужного треугольника определяется следующим образом. Вводится эллиптическая система координат, начало которой помещается в центр мозга – центр проекции. Таким образом, каждую вершину поверхности мозга и каждую точку экспрессии гена можно задать в этой системе координат тройкой ( ,  ,  ) , где  и  – углы, а  – расстояние
до начала координат. Параметр  в данном алгоритме не используется,
поэтому каждая точка задается только парой углов ( ,  ) (рис. 4).
Рис. 4. Эллиптическая система
координат
Рис. 5. Разбиение пространства углов
на ячейки
УДК 004.032.26(06) Нейронные сети
257
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
Пространство углов разбивается на ячейки – как показано на рис. 5.
Искомую область поиска составляют треугольники, вершины которых
попадают в ту же ячейку, что и проецируемая точка экспрессии гена. Если
в данной ячейке не найден треугольник, на который попадает проекция,
то рассматриваются ячейки, соседние с данной, затем – соседние с ними и
т.д., пока не будет найдена проекция.
Проведены замеры производительности предложенного алгоритма
центрального проецирования в среде Matlab. Для модели из 11948 треугольников и для 6304 точек экспрессии гена алгоритм работает 17 секунд. В табл. 1 также приведены результаты замеров в среде Matlab для
алгоритма центрального проецирования с полным перебором всех треугольников модели и для одного ускоренного алгоритма – [9]. Таким образом, предложенный метод превосходит на несколько порядков алгоритм
с полным перебором и превосходит в несколько раз ускоренный алгоритм
[9]. Это весьма существенно для разработки интерактивного приложения,
в котором пользователь может менять различные параметры, и необходимо проводить проецирование заново.
Таблица 1
Сравнение скоростей работы предложенного алгоритма и существующих
Полный перебор
треугольников
Ускоренный метод
[9]
Предложенный метод
30 мин
1 мин 15 с
17 с
Визуализация
Предлагаемый метод сглаженной визуализации данных об экспрессии
гена на поверхности мозга (гиппокампа) позволяет построить по спроецированным отдельным точкам сглаженную текстуру – картину экспрессии.
При построении сглаженной текстуры каждой вершине определенным
образом присваивается цвет, чтобы затем цвета граней интерполировать
по вершинам (как в [6]). Алгоритм присвоения цвета вершине зависит от
метода, которым они были спроецированы точки экспрессии гена.
Если точки были спроецированы методом центрального проецирования, то каждой вершине присваивается цвет, соответствующий суммарной
УДК 004.032.26(06) Нейронные сети
258
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
экспрессии гена в спроецированных точках, для которых эта вершина –
ближайшая.
При приближенном ортогональном проецировании несколько точек
могут проецироваться в одну и ту же вершину. Величина (интенсивность)
их экспрессии суммируется.
Таким образом, текстура поверхности получается сглаженной (рис. 6а
и 6б).
Рис. 6(а). Сглаженная поверхностная
визуализация экспрессии гена c-fos
коре (метод проецирования –
риближенное ортогональное)
Рис. 6(б). Сглаженная поверхностная
визуализация экспрессии гена crlf1
в гиппокампе
Данный способ визуализации позволяет наглядно выявлять области
повышенной экспрессии гена, а не местоположения отдельных точек.
Если требуется визуализировать экспрессию гена по точкам, то используется метод дискретной визуализации, где каждая точка экспрессии
гена изображена отдельным кружком, цвет которого зависит от интенсивности экспрессии гена в данной точке (рис. 7).
Рис. 7. Поверхностная визуализация
экспрессии гена c-fosв коре по точкам
(метод проецирования – центральное)
УДК 004.032.26(06) Нейронные сети
259
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
Интерактивное приложение
В среде MATLAB на базе предложенных алгоритмов разработано интерактивное приложение для визуализации данных об экспрессии генов
на поверхности мозга и гиппокампа (рис. 8). Разработанный прототип обладает следующими возможностями:
 отображение трехмерной модели со спроецированными на нее точками экспрессии гена (модель можно интерактивно вращать);
 выбор рассматриваемой структуры (кора или гиппокамп);
 выбор режима раскраски точек экспрессии гена в зависимости от
расстояния до поверхности или величины (интенсивности) экспрессии;
 задание процента отображаемых точек экспрессии гена;
 задание слоя для проецирования с помощью двух параметров –
глубины (расстояния до поверхности) и ширины;
 отображение исходных точек экспрессии гена (показать или
скрыть).
УДК 004.032.26(06) Нейронные сети
260
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
Рис. 8. Прототип приложения
Заключение
Разработана и реализована интерактивная система поверхностной визуализации данных об экспрессии генов в коре головного мозга и гиппокампе мыши.
Предложен и реализован ускоренный алгоритм центрального проецирования точек экспрессии гена на поверхность мозга мыши, который превосходит аналоги по скорости.
Предложен новый метод визуализации данных об экспрессии гена,
спроецированных на поверхность коры головного мозга или гиппокампа
мыши. Метод позволяет строить наглядную сглаженную картину экспрессии гена по дискретным исходным данным – точкам экспрессии.
Алгоритмы были протестированы на реальных экспериментальных
данных.
В дальнейшем по данной работе планируется построение плоской развертки структуры (мозга или гиппокампа) со спроецированными на нее
данными – карты активности гена. Также планируется разработка методов
анализа и сравнения данных. Помимо ортогонального и центрального
проецирования, будет рассматриваться метод проецирования вдоль колонок в мозге, которые будут распознаваться по данным оптической томографии.
Список литературы
 Lein Ed. S. et al. Genome-wide atlas of gene expression in the adult
mouse brain // Nature. 2007. Vol. 445. P. 168-176.
 http://mouse.brain-map.org/atlas/ARA/Coronal/browser.html
 Lau C., Ng L., Thompson C., Pathak S., Kuan L., Jones A., Hawrylycz
M. Exploration and visualization of gene expression with neuroanatomy in the
adult mouse brain // BMC Bioinformatics. 2008. Vol. 9. No. 1. P. 153.
 http://www.fmri.org/fmri.htm
 http://cfi.lbl.gov/~budinger/pet.html
 Lincoln P. Surface projection method for visualizing volumetric data.
http://sigpubs.biostr.washington.edu/archive/00000193
 Van Essen D.C., Drury H.A., Joshi S., Miller M.I. Functional and structural mapping of human cerebral cortex - Solutions are in the surfaces // ProУДК 004.032.26(06) Нейронные сети
261
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
ceedings of the National Academy of Sciences of the United States of America.
1998. Vol. 95. Issue 3. P. 788-795.
 Holschneidera D.P., Scremine O.U., Chialvog D.R., Kayd B.P., Maarekd J.-M. I. Flattened cortical maps of cerebral function in the rat: A regionof-interest approach to data sampling, analysis and display // Neuroscience Letters. 2008. Vol. 434. Issue 2. P. 179-184.
 Eaton K. "boundary" class v2.1: a wrapper for surface objects.http://www.mathworks.com/matlabcentral/fileexchange/20637
УДК 004.032.26(06) Нейронные сети
262
Download