МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образования «Новосибирский государственный университет» Факультет естественных наук УТВЕРЖДАЮ _______________________ «_____»__________________2014__ г. Рабочая программа дисциплины Математические методы в биологии Направление подготовки 06.03.01 БИОЛОГИЯ Квалификация (степень) выпускника академический бакалавр Форма обучения Очная Новосибирск 2014 Аннотация рабочей программы Дисциплина «Математические методы в биологии» относится к вариативной части дисциплин по выбору базового блока Б1 ООП по направлению подготовки «06.03.01 БИОЛОГИЯ» (квалификация (степень) академический бакалавр). Дисциплина реализуется на Факультете естественных наук Федерального государственного автономного образовательного учреждения высшего образования "Новосибирский национальный исследовательский государственный университет" (НГУ) кафедрой информационной биологии. Содержание дисциплины охватывает весь круг вопросов, связанных с классификацией, обработкой и анализом экспериментальных данных в области молекулярной биологии, генетики и информационной биологии методами математической статистики. Преподавание дисциплины предусматривает следующие формы организации учебного процесса: 15 ч. лекции, 15 часов практических занятий, самостоятельная работа студента 36 ч., контроль - 6 ч. Программой дисциплины предусмотрены следующие виды контроля: текущий контроль успеваемости во время семинаров в форме контрольных работ, рубежный контроль в форме экзамена. 1. Организационно-методический раздел 1.1. Цель курса Программа дисциплины «Математические методы в биологии» предусматривает изучение многомерных методов исследования массовых биологических процессов и явлений; их математического аппарата. В курсе излагаются основные понятия, приемы, математические методы и модели, предназначенные для организации сбора, стандартной записи, систематизации, свертки и обработки многомерных статистических данных с целью их удобного представления, интерпретации, получения научных и практических выводов. Курс нацелен на оснащение студентов знаниями и навыками в области основ выявления и биологической интерпретации многомерных данных, их прикладного статистического анализа, построения, идентификации и верификации статистических моделей анализируемых явлений, компьютерной реализации излагаемых приемов и методов. Для активизации учебного процесса и в целях улучшения усвоения студентами учебного материала следует широко использовать вычислительную технику, статистические пакеты прикладных программ, средства презентации. 1.2. Задачи учебного курса В результате изучения дисциплины студенты должны знать основные методы многомерного анализа данных: метод главных компонент, факторный анализ, дискриминантный анализ, регрессионные методы, многомерное шкалирование. Должны иметь представление об операциях над матрицами и об их соответствии геометрическим преобразованиям в многомерном пространстве. В результате изучения дисциплины студенты должны знать основные методы анализа одномерных и многомерных данных: вычисление квантилей, средних, среднеквадратичных отклонений, дисперсий, коэффициентов корреляции, построение графиков, ранжирование, центрирование и нормирование признаков, вычисление коэффициентов сходства/различия (расстояний) между объектами, кластерный анализ, метод главных компонент, факторный анализ, дискриминантный анализ, регрессионные методы, многомерное шкалирование, PLS-методы. Должны иметь представление об операциях над матрицами и об их соответствии геометрическим преобразованиям в евклидовых пространствах, а также о способах расчета достоверности получаемых результатов. 2. Место дисциплины в структуре ООП Дисциплина «Математические методы в биологии» относится к вариативной части дисциплин по выбору базового блока Б1 ООП по направлению подготовки «06.03.01 БИОЛОГИЯ» (квалификация (степень) академический бакалавр) и опирается на следующие дисциплины данной ООП: Биометрия Математический анализ Математическая статистика Высшая алгебра Результаты освоения дисциплины «Математические методы в биологии» используются при подготовке дипломной работы. 3. Требования к уровню освоения курса Студенты должны уметь использовать стандартные пакеты статистических программ при построении интегральных показателей и отборе наиболее информативных переменных, и снижении размерностей анализируемых моделей. Должны уметь применять как линейные, так и нелинейные методы анализа взаимного расположения объектов в многомерном пространстве и интерпретировать получаемые результаты с биологической точки зрения. 4. Структура и содержание дисциплины 4.1 Структура курса № п/п 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 Итого Раздел дисциплины С е м е с т р Виды учебной работы, включая самостоятельную работу студентов и Н трудоемкость ед Формы текущего контроля (в часах) ел успеваемости я (по неделям семестра) се Форма промежуточной ме аттестации Се С ст Лек (по семестрам) ми Р КСР ра ция на С ры 10 1 2 2 10 2 2 2 10 10 3 4 2 2 3 1 1 2 Контрольная работа Межвыборочная изменчивость 10 5 2 3 1 2 Контрольная работа 2 4 2 2 Контрольная работа экзамен 15 6 72 Введение Предварительная работа с данными Линейная алгебра Внутривыборочная изменчивость Внешние факторы Нелинейные методы Временные ряды 10 10 10 6 7 8 2 2 1 15 3 27 36 4.2. Содержание курса Тема 1. Введение. Необходимость многомерной обработки биологических данных. Геометрический подход: анализ расположения объектов в многомерном пространстве и направлений их изменчивости через корреляции с признаками. История (Ф.Гальтон, К.Пирсон, Р.Фишер, Г.Хотеллинг). Современное состояние: главные компоненты (факторный анализ), множественная регрессия, дискриминантный анализ, канонический анализ, многомерное шкалирование, PLS-методы. Возможность визуализации. Оценка достоверности и ее роль. Тема 2. Предварительная работа с данными в популяционных исследованиях. Объекты. Признаки - свойства объектов, позволяющие отличать их друг от друга и измерять расстояние между ними. Типы признаков. Допустимые преобразования и сравнения. Средние и дисперсии выборки. Нормировки. Тема 3. Линейная алгебра. Скаляры, вектора. матрицы. Евклидово пространство, точки, вектора, наборы векторов. Евклидово расстояние между точками, углы между векторами. Операции сложения и умножения. ортогональные, диагональные и единичные матрицы. Преобразования: перенос, поворот, растяжение. Центроиды, дисперсия. Корреляционная матрица. Собственные вектора. Главные компоненты. Повороты (факторный анализ). Тема 4. Внутривыборочная изменчивость. Многомерный анализ как средство поиска биологического смысла при анализе изменчивости биологических объектов. Методы исследования: главные компоненты, факторный анализ. Отсечение дальних компонент. Примеры. Тема 5. Межвыборочная изменчивость. t-критерий. Дискриминантный анализ. Проблема коллинеарности. Метод Царапкина. Объединенная внутривыборочная изменчивость. Предварительная обработка методом главных компонент. Дискриминантный PLS-анализ. Тема 6. Внешние факторы как возможные причины изменчивости. Линейная регрессия. Проекция. Проблема коллинеарности. Регрессия на главные компоненты. PLS- регрессия. Тема 7. Нелинейные методы. Неевклидовы расстояния и меры сходстваразличия. Многомерное шкалирование. Тема 8. Временные ряды. Теорема Такенса. Фазовые портреты. Гладкие и главные компоненты временных рядов. Методы прогноза временных рядов. Примеры. 5. Образовательные технологии Используется традиционная система лекций и практических занятий. В практической части курса даются непосредственные навыки статистической обработки биологических данных на современных некоммерческих статистических пакетах (PAST, R, JACOBI-4). Для текущего контроля во время семинаров проводятся контрольные работы. 6. Учебно-методическое обеспечение самостоятельной работы студентов. Оценочные средства для текущего контроля успеваемости, промежуточной аттестации по итогам освоения дисциплины Темы контрольных работ: КР№1 Пакет PAST. Построение графиков. Вычисление статистических параметров. Вычисление достоверности разности средних. Стандартизация признаков. КР№2 Пакет PAST. Корреляция признаков. Главные компоненты. Евклидовы расстояния. Кластерный анализ. Неметрическое шкалирование. КР№3 Пакет R. Построение графиков. Вычисление статистических параметров. Стандартизация признаков. Корреляция признаков. Главные компоненты. Пакет JACOBI-4. Евклидовы расстояния. Кластерный анализ. Неметрическое шкалирование. 7. Данные для учета успеваемости студентов в БАРС Таблица 1.Таблица максимальных баллов по видам учебной деятельности. 1 2 3 4 5 6 7 Другие Автоматизи Лаборат Практиче Самостоят виды рованное Семестр Лекции орные ские ельная учебной тестировани занятия занятия работа деятельно е сти 10 150 8 9 Промежу точная Итого аттестац ия 30 180 Программа оценивания учебной деятельности студента Оценка учебной деятельности студента в ходе обучения по программе курса в течение 10 семестра осуществляется в форме начисления определенной суммы баллов в соответствии с результатами текущего контроля по следующим видам учебной деятельности: Лекции: Оценивается посещаемость, посещение каждой лекции оценивается в 20 баллов. Результат самостоятельной работы студентов оценивается на контрольных работах и входит в итоговую оценку этого вида учебной деятельности. Максимальное количество баллов за контрольную работу – 10. Максимально возможная сумма баллов за все виды учебной деятельности студента за 10 семестр по дисциплине «Математические методы в биологии» составляет 180 баллов. Таблица 2. Таблица пересчета полученной студентом суммы баллов по дисциплине «Математические методы в биологии» в допуск к экзамену: 110 баллов и более «допуск» 109 баллов и менее «не допуск» Экзамен по дисциплине «Математические методы в биологии» проводится в форме устного опроса. Итоговая оценка выставляется по сумме набранных баллов. Таблица 3. Таблица пересчета полученной студентом на экзамене суммы баллов по дисциплине «Математические методы в биологии», в оценку: 5 баллов «отлично» 4 балла «хорошо» 3 балла «удовлетворительно» 2 и менее балла «неудовлетворительно» 8. Учебно-методическое и информационное обеспечение дисциплины а) основная литература: 1. Рокицкий П.Ф. Биологическая статистика. Минск: Высшая школа. 1973. 2. Глотов Н.В. и др. Биометрия. Ленинглад: ЛГУ. 1982. 3. Васильева. Биологиеская статистика. Новосибирск: ИЦиГ СО РАН. 2004. 4. Васильева Л.А. Статистические методы в биологии, медицине и сельском хозяйстве. Новосибирск: ИЦиГ СО РАН. 2007. б) дополнительная литература: 1. Шеффе Н. Дисперсионный анализ. М: Физматгиз 1963. 2. Урбах В.Ю. Биометрические методы. М: Физматгиз.1964. 3. Ван дер Варден. Математическая статистика. М: ИЛ. 1960. 4. Снедекор Дж.У. Статистические методы в приложении к исследованиям в сельском хозяйстве и биологии. М: Сельхозиздат. 1961. 5. Ефимов В.М., Ковалева В.Ю. Многомерный анализ биологических данных: учебное пособие. 2-е испр. и доп. изд. – Санкт-Петербург: ВИЗР РАСХН, 2008. –87с. 9. Материально-техническое обеспечение дисциплины Дисплейный класс либо ноутбуки у студентов. Ноутбук, медиа-проектор, экран. Программное обеспечение. Программа составлена в соответствии с требованиями ФГОС ВПО и с OC ВПО, принятыми в ФГАОУ ВО Новосибирский национальный исследовательский государственный университет с учетом рекомендаций ООП ВПО по направлению 020201.65 «Биология». Автор: Ефимов Вадим Михайлович, д.б.н., в.н.с. ИЦиГ СО РАН ___________________ Программа одобрена на заседании кафедры информационной биологии Факультета естественных наук НГУ 04 августа 2014 года, протокол № 9 (65). Секретарь кафедры _____________ Т.А. Бухарина