Биоинформатика (биологическая информатика) - наука

advertisement
БИОИНФОРМАТИКА
Биоинформатика (биологическая информатика) - наука, изучающая
общие закономерности и особенности реализации информационных процессов в биосфере, организации и функционирования биологических систем разного уровня (от молекулярного до популяционного) на основе методов и
средств информатики. Решение научных проблем биоинформатики имеет как
фундаментальное, так и прикладное значение.
На практике, иногда это определение более узкое, под ним понимают
использование компьютеров для характеризации молекулярных компонентов.
Вместе с тем паспорт специальности 03.00.28 Биоинформатика, впервые введенной в 2002 году, так определяет область исследования:
1. Исследование эволюции живой природы с помощью средств информатики и математики.
2. Компьютерное и математическое моделирование информационных
процессов в биологических системах.
3. Компьютерная генетика: расшифровка и моделирование структурной
организации генов и геномов, а также кодируемых генами белков; корреляционный анализ мутаций и др.
4. Компьютерная нейробиология: моделирование природных нейронных систем, разработка и приложение нейросетей и др.
5. Исследование экологических систем с помощью информационных
технологий.
6. Компьютерное моделирование биологического действия ксенобиотиков.
7. Компьютерное моделирование процессов получения, накопления,
обработки и систематизации биологических данных.
8. Компьютерное распознавание и синтез изображений биологических
объектов.
2
9. Создание новых информационных технологий на основе результатов
исследований живой природы.
10. Организация, ведение и использование автоматизированных банков
данных по биологии и медицине, в т.ч. банков междисциплинарных данных.
11. Разработка интеллектуальных систем анализа и прогнозирования
свойств биологических объектов на основе специализированных баз и банков
данных.
12. Создание систем информационного обеспечения и поддержки биологических и медицинских исследований, включая анализ точек роста и тенденций развития научных направлений.
Когда же появилась биоинформатика, наука, которую сейчас с уверенностью называют наукой третьего тысячелетия?
Можно считать, что эта наука зародилась в XIII веке. Тогда молодой
итальянец Леонардо из Пизы, вошедший в историю математики под именем
Фибоначчи, описал решение задачи о размножении кроликов и, таким образом, построил первую математическую модель биологического процесса. По
сути, этот любопытный случай и положил начало математической биологии.
В 20-е годы XX века другой итальянский математик, Вито Вольтерра, создал
модель совместного существования двух биологических популяций типа
"хищник-жертва". У математиков появился интерес к теоретической биологии, а у биологов, в свою очередь, возникла потребность к систематизации
науки с математических позиций.
После Второй мировой войны в биологию пришли физики и математики. Это событие во многом индуцировал Шредингер выходом в свет своей
книги "Что такое жизнь с точки зрения физики?". Среди них были такие знаменитые ученые, как Алексей Андреевич Ляпунов и Игорь Андреевич Полетаев. Благодаря их научным работам начал развиваться кибернетический подход к биологическим процессам. Вадим Александрович Ратнер, ученик Ляпунова, в начале 1960-х годов применил математический подход к описанию явлений молекулярного уровня в сложных системах.
3
В 1975 году была создана первая известная количественная модель
управления развитием фага "лямбда". Его геном содержит 48 генов (совсем
немного по нынешним меркам), но имеет сложную управляющую систему.
Эта и более сложные системы уже требовали использования компьютеров. Из
математической биологии стала выделяться отдельная ветвь - биоинформатика, которая предполагает применение информационных технологий для изучения биологических систем.
Современная биоинформатика появилась на стыке наук - биологии, физиологии, математики, информатики, физики и химии, а такого рода объединения имеют стратегический характер. Самые крупные достижения возникают тогда, когда происходит синтез наук. Биология и информатика - классическое отражение этой ситуации.
В настоящее время одной из основных задач биоинформатики является
разработка вычислительных алгоритмов для анализа и систематизации данных о структуре и функциях биологических молекул, прежде всего нуклеиновых кислот и белков. Объем генетической информации, накапливаемой в банках данных, начал увеличиваться с возрастающей скоростью после того, как
были разработаны быстрые методы секвенирования (расшифровки нуклеотидных последовательностей ДНК). Биоинформатические методы позволяют
не просто обрабатывать этот огромный массив данных, но и выявлять закономерности, которые не всегда можно заметить при обычном эксперименте,
предсказывать функции генов и зашифрованных в них белков, строить модели
взаимодействия генов в клетке, конструировать лекарства.
Основная линия в проектах биоинформатики - это использование математических средств для извлечения полезной информации из шумных данных, полученных с помощью биологичеких методов.
Конечно, основой всего является геном: только зная все гены организма,
можно делать надежные выводы. Массовые данные получаются из экспериментов, поставленных на индустриальный поток: это расшифровка геномов,
изучение синтеза закодированных в генах белков, определение белок-
4
белковых взаимодействий в различных организмах, клетках, условиях роста.
Раньше для получения такого рода данных ставились специальные эксперименты. Но у средней бактерии примерно 3000 генов, у человека - на порядок
больше - 30 000, белков еще больше - сколько же надо провести экспериментов, например, для того, чтобы проверить все пары белков, взаимодействуют
ли они. При этом основные ресурсы уйдут на "пустые" эксперименты, с
невзаимодействующими белками. Массовый эксперимент - это сотня экспериментов одновременно, которые выполняют несколько десятков роботов.
Однако при этом возникает высокий уровень "шума" - случайных ошибок.
Получить на основе этих данных достоверные утверждения является одной из
важнейших задач биоинформатики.
То же самое с функциями генов. В принципе, выяснение функции одного гена в эксперименте - это год работы сильного исследователя. Но генов тысячи в каждом организме. В этом случае, оказывается, что биоинформатика
позволяет делать надежные предположения, которые поддаются уже целенаправленной экспериментальной проверке, т.е. работы осуществляются с существенно меньшими затратами ресурсов, в том числе и времени. В конечном
счете, возникает совершенно новое мощное средство для биологических исследований.
Также среди основных задач биоинформатики - описание генных сетей,
изобретение новых лекарств с заданными свойствами, разработка компьютерных моделей процессов, происходящих в организме.
Все слышали про мыло Safeguard, которое «убивает микробы». Оказалось, что есть весьма опасные стрептококки, не чувствительные к его действующему началу — триклозану. Сначала это было показано с помощью
компьютерного анализа геномов стрептококков, а потом подтверждено экспериментально.
Еще пример — анализ генетических данных людей здоровых и с какимлибо заболеванием, например ишемической болезнью сердца. Нет одного гена, ответственного за эту болезнь. Однако сопоставление данных по большо-
5
му количеству больных позволило найти так называемые ассоциации — набор
генов предрасположенности к указанной болезни, и тем самым дает возможность определить генетическую группу риска.
Биоинформатика - наука, которая позволяет получать новые знания об
организации и функционирования биологических систем разного уровня, не
наблюдая непосредственно природу (как, например, в зоологии) и не ставя
эксперименты (как в молекулярной биологии), а путем анализа гигантского
количества экспериментальных данных на основе методов и средств информатики.
Литература:
1. Афанасьева Г. Биоинформатика: виртуальный эксперимент в шаге от
реальности. // Наука и жизнь. – 2004. – № 11.
http://www.nkj.ru/archive/articles/310/
2. Гельфанд М. Биология in silico // КомпьюТерра - 21.09.2001.
gelfand@integratedgenomics.ru.
3. Макаров А.А. Профессия — биоинформатик.
http://bio.1september.ru/articlef.php?id=200500108.
4. Орлов Ю.Л. Биоинформатика - наука третьего тысячелетия // Информационный вестник ВОГиС. – 2003. – № 21-22.
http://www.bionet.nsc.ru/vogis/vestnik.php?f=2003&p=2122_2
5. Паспорт специальности 03.00.28 Биоинформатика.
http://www.originweb.info/science/codes/03/030028.html.
Берёзин Алексей Анатольевич,
Группа З-04-33
Российская академия государственной службы при Президенте
Российской Федерации
Download