РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ (МОДУЛЯ) СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ПРИКЛАДНАЯ ИНФОРМАТИКА В ЭКОНОМИКЕ

advertisement
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
ПС_РПУД
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ (МОДУЛЯ)
СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ
Для направления подготовки/
профиля (магистерской программы): 230700.62 ПРИКЛАДНАЯ ИНФОРМАТИКА
ПРИКЛАДНАЯ ИНФОРМАТИКА В ЭКОНОМИКЕ
Кафедра:
Территориально-распределенных информационных систем
Аббревиатура
кафедры
ТРИС
Разработчики программы:
К.ф.-м.н. Сбоев А.Г.
Форма Д
Стр. 1 из 10
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
ПС_РПУД
Оглавление
1 ЦЕЛИ УЧЕБНОЙ ДИСЦИПЛИНЫ .............................................................. 3
2 МЕСТО УЧЕБНОЙ ДИСЦИПЛИНЫ В СТРУКТУРЕ ООП ВПО ............ 3
3 ОЖИДАЕМЫЕ РЕЗУЛЬТАТЫ ОБРАЗОВАНИЯ И КОМПЕТЕНЦИИ
СТУДЕНТА ПО ЗАВЕРШЕНИИ ОСВОЕНИЯ ПРОГРАММЫ
УЧЕБНОЙ ДИСЦИПЛИНЫ (МОДУЛЯ) ..................................................... 3
4 СТРУКТУРА
И СОДЕРЖАНИЕ
УЧЕБНОЙ
ДИСЦИПЛИНЫ
(МОДУЛЯ) ....................................................................................................... 4
4.1 Содержание учебной дисциплины............................................................ 4
4.2 Разделы/темы дисциплины, их трудоемкость и виды занятий ..... Error!
Bookmark not defined.
4.3 Формы текущего контроля успеваемости (БРС)Error! Bookmark not
defined.
4.4 Форма проведения и содержание мероприятий промежуточной
аттестации: ..................................................... Error! Bookmark not defined.
5 ОБРАЗОВАТЕЛЬНЫЕ ТЕХНОЛОГИИ ....................................................... 5
6 ОЦЕНОЧНЫЕ
СРЕДСТВА
ДЛЯ
ТЕКУЩЕГО
КОНТРОЛЯ
УСПЕВАЕМОСТИ, ПРОМЕЖУТОЧНОЙ АТТЕСТАЦИИ ПО ИТОГАМ
ОСВОЕНИЯ
ДИСЦИПЛИНЫ
И
УЧЕБНО-МЕТОДИЧЕСКОЕ
ОБЕСПЕЧЕНИЕ САМОСТОЯТЕЛЬНОЙ РАБОТЫ СТУДЕНТОВ ......... 6
6.1 Темы эссе, рефератов ................................................................................. 6
6.2 Контрольные вопросы и задания для проведения текущего контроля
(в течении семестра по темам) ....................................................................... 6
Тематика лабораторных работ: ........................ Error! Bookmark not defined.
Тематика контрольных работ ........................... Error! Bookmark not defined.
6.3 Контрольные вопросы и тематика контрольных заданий
промежуточной аттестации (по итогам изучения курса) ............................ 8
Тематика форумов (в течении семестра по темам)Error! Bookmark not
defined.
6.4 Темы курсовых работ/проектов (КР/КП)Error! Bookmark not defined.
7 УЧЕБНО-МЕТОДИЧЕСКОЕ И ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ
УЧЕБНОЙ ДИСЦИПЛИНЫ (МОДУЛЯ) ..................................................... 8
8 МАТЕРИАЛЬНО-ТЕХНИЧЕСКОЕ
ОБЕСПЕЧЕНИЕ
УЧЕБНОЙ
ДИСЦИПЛИНЫ (МОДУЛЯ) ....................................................................... 10
Форма Д
Стр. 2 из 10
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
ПС_РПУД
1 ЦЕЛИ УЧЕБНОЙ ДИСЦИПЛИНЫ
Целями изучения дисциплины являются получение знаний о современных
методах многомерного статистического анализа, их отличительных
особенностях, о выборе эффективных методов для решения конкретных
практических задач.
Задачами изучения дисциплины являются формирование у студентов
знаний, необходимых для получения обобщенной информации из «сырых»
данных, установления связи между различными явлениями на основе
современных информационных технологий и методов статистического анализа
данных.
2 МЕСТО УЧЕБНОЙ ДИСЦИПЛИНЫ В СТРУКТУРЕ ООП ВПО
Дисциплина относится к дисциплинам профиля по выбору студентами
гуманитарного, социального и экономического цикла ООП ВПО направления
подготовки 230700.62
ПРИКЛАДНАЯ ИНФОРМАТИКА профиля
ПРИКЛАДНАЯ ИНФОРМАТИКА В ЭКОНОМИКЕ.
Дисциплины, на которых базируется данная дисциплина:
1
2
3
4
Математика
Дискретная математика
Информатика и программирование
Теория вероятностей и математическая статистика
3 ОЖИДАЕМЫЕ РЕЗУЛЬТАТЫ ОБРАЗОВАНИЯ И КОМПЕТЕНЦИИ
СТУДЕНТА ПО ЗАВЕРШЕНИИ ОСВОЕНИЯ ПРОГРАММЫ УЧЕБНОЙ
ДИСЦИПЛИНЫ (МОДУЛЯ)
В результате освоения дисциплины студент должен:
1) Знать: основные методы одномерного и многомерного статистического
анализа данных, отличительные особенности каждого метода, как с
теоретической, так и практической точек зрения, его алгоритмическую и
программную реализацию, область применимости в зависимости от типа данных
и характера решаемой исследовательской задачи.
2) Уметь: проводить анализ и извлекать необходимые агрегированные
данные и обобщенную информацию из «сырых» данных, установления связи
между различными явлениями на основе современных методов статистического
анализа данных.
3) Владеть/быть в состоянии продемонстрировать навыками по
использованию основных методов одномерного и многомерного статистического
анализа данных и современных компьютерных технологий при решении
практических задач.
Форма Д
Стр. 3 из 10
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
ПС_РПУД
Процесс изучения дисциплины направлен на формирование следующих
компетенций:
ОК-1, ОК-5, ОК-7, ОК-13, ПК-20, ПК-21.
4 СТРУКТУРА И СОДЕРЖАНИЕ УЧЕБНОЙ ДИСЦИПЛИНЫ
(МОДУЛЯ)
4.1
№
п/п
Содержание учебной дисциплины
Наименование раздела/темы
дисциплины
1
Тема 1. Введение
2
Тема
2.
Подготовка
данных
для
статистического анализа
3
Тема
3.
Методы
описательной статистики.
4
Тема 4. Корреляции.
Меры связности.
5
Тема 5. Дисперсионный
анализ.
Анализ
Форма Д
Содержание раздела/темы
Задачи
анализа
структурированной
информации с помощью статистических и
математических методов: отбор признаков,
стратификация, кластеризация, ассоциации,
визуализация,
регрессия,
прогнозирование
временных рядов, последовательности. Анализ
неструктурированной
или
слабоструктурированной
информации:
категоризация, разведка и семантическая
обработка
текстов,
расширенный
поиск
информации и др.
Общие
сведения
о
многомерном
статистическом анализе данных.
Статистические данные и их основные
свойства. Первичная статистическая обработка
данных:
номинальная
порядковая,
количественные шкалы, сведение к двоичным
переменным, оцифровка номинальных и
порядковых переменных. Пропуски в данных
Средние величины. Доверительный интервал.
Форма
распределения.
Процедуры
формирования подгрупп наблюдений или
выборочных совокупностей переменных и
наблюдений. Процедура расчета частотных
таблиц. Элементы частотных таблиц и их
интерпретация.
Таблицы
сопряженности.
Графическое
представление
таблиц
сопряженности. Графический анализ данных.
Определение корреляции. Простая линейная
корреляция. Количественные критерии оценки
тесноты
связи.
Значимость
корреляций.
Выбросы. Количественный подход к выбросам.
Корреляции
в
неоднородных
группах.
Нелинейные зависимости между переменными.
Измерение
нелинейных
зависимостей.
Разведочный анализ.
Задача дисперсионного анализа. Методы
дисперсионного
анализа.
Однофакторный
Стр. 4 из 10
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
№
п/п
Наименование раздела/темы
дисциплины
зависимости.
6
Тема
6.
Методы
многомерной
классификации.
Кластерный
анализ.
Дискриминантный анализ
7
Тема
7.
Факторный
анализ и анализ главных
компонент
8
Тема 8. Основы анализа
временных
рядов
и
прогнозирования.
ПС_РПУД
Содержание раздела/темы
дисперсионный
анализ.
Многофакторный
дисперсионный анализ.
Классификация без обучения и кластерный
анализ. Этапы кластерного анализа.
Иерархические и неиерархические методы
кластерного анализа. Меры расстояния и меры
сходства. Основные типы задач и алгоритмов
кластерного анализа. Кластеризация при
большом количестве наблюдений - метод kсредних.
Зависимость выбора
алгоритма
классификации
от
цели
статистического
исследования.
Классификация
с
обучением
и
дискриминантный
анализ.
Этапы
дискриминантного
анализа.
Линейный
дискриминантный анализ. Дискриминантный
анализ при нормальном законе распределения
показателей.
Модели факторного анализа. Основные
гипотезы и основания применения методов и
алгоритмов факторного анализа.
Ограничения факторного анализа. Метод
главных факторов. Метод главных компонент.
Факторный анализ как метод редукции данных.
Факторный анализ как метод классификации.
Понятие временного ряда. Особенности
выборки временного ряда. Типы временных
рядов.
Аппроксимация
временного
ряда
различными кривыми с получением модели и ее
характеристик. Анализ тренда. Прогнозирование
временных рядов. Модель интегрированного
скользящего среднего - АРПСС (Бокс и
Дженкинс). Период сезонности временного ряда
5 ОБРАЗОВАТЕЛЬНЫЕ ТЕХНОЛОГИИ
При проведении лекционных занятий, для лучшего восприятия излагаемой
информации, используется презентационное оборудование.
Информационный материал, излагаемый на лекциях, располагается в
электронном виде на сервере кафедры.
Лабораторные занятия выполняются на персональном компьютере с
использованием необходимого программного обеспечения, действующего
сетевого оборудования.
Интерактивным формам обучения отводится не менее 20 процентов от
общего объема аудиторных занятий по дисциплине.
Форма Д
Стр. 5 из 10
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
ПС_РПУД
6 ОЦЕНОЧНЫЕ СРЕДСТВА ДЛЯ ТЕКУЩЕГО КОНТРОЛЯ
УСПЕВАЕМОСТИ, ПРОМЕЖУТОЧНОЙ АТТЕСТАЦИИ ПО ИТОГАМ
ОСВОЕНИЯ ДИСЦИПЛИНЫ И УЧЕБНО-МЕТОДИЧЕСКОЕ
ОБЕСПЕЧЕНИЕ САМОСТОЯТЕЛЬНОЙ РАБОТЫ СТУДЕНТОВ
6.1 Темы эссе, рефератов
Не предусмотрено
6.2 Контрольные вопросы и задания для проведения текущего
контроля (в течении семестра по темам)
Тема 1
1 Задачи анализа данных. Отбор признаков.
2 Задачи анализа данных. Стратификация.
3 Задачи анализа данных. Кластеризация.
4 Задачи анализа данных. Ассоциации.
5 Задачи анализа данных. Визуализация.
6 Задачи анализа данных. Регрессия.
7 Задачи анализа данных. Прогнозирование временных рядов.
8 Задачи анализа неструктурированной или слабоструктурированной
информации.
9 Понятие многомерного статистического анализа данных.
Тема 2
1 Свойства статистических данных.
2 Шкалы измерений.
3 Примеры информации, представленной в номинальной, порядковой и
количественных шкалах.
4 Преобразование данных без снижения качества.
5 Методы представления данных.
6 Агрегированные характеристики набора данных.
7 Измерители связи переменных.
8 Пропуски в данных.
Тема 3
1 Средние величины.
2 Доверительный интервал.
3 Форма распределения.
4 Алгоритм формирования подгрупп наблюдений.
5 Алгоритм формирования выборочных совокупностей.
6 Алгоритм расчета частотных таблиц.
7 Алгоритм расчета таблиц сопряженности.
8 Классификация методов графического анализа статистических данных.
Тема 4
1 Корреляционная зависимость между случайными величинами.
2 Основные задачи корреляционного анализа.
Форма Д
Стр. 6 из 10
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
ПС_РПУД
3 Линейная корреляция.
4 Количественные оценки тесноты связи.
5 Значимость корреляций.
6 Выбросы.
7 Количественная оценка выбросов.
8 Корреляция в неоднородных группах.
9 Нелинейная корреляция.
10Разведочный анализ.
Тема 5
1 Какие зависимости изучает дисперсионный анализ?
2 Что характеризует уровень значимости?
3 Классификация методов дисперсионного анализа.
4 Однофакторный дисперсионный анализ.
5 Многофакторный дисперсионный анализ.
Тема 6
1 Понятие «классификация без обучения».
2 Этапы кластерного анализа.
3 Измерение меры близости.
4 Характеристики близости объектов.
5 Классификация методов кластерного анализа.
6 Иерархические методы кластерного анализа.
7 Итеративные методы кластерного анализа.
8 Особенности кластеризации при большом количестве наблюдений.
9 Метод k-средних.
10Понятие «классификация с обучением».
11Группы задач дискриминантного анализа.
12Дискриминирующая функция.
13Этапы дискриминантного анализа.
14Линейный дискриминантный анализ.
15Дискриминантный анализ при нормальном законе распределения
показателей.
Тема 7
1 Понятие фактора.
2 Идея факторного анализа.
3 Уровни факторного анализа.
4 Этапы факторного анализа.
5 Факторный анализ как метод редукции данных.
6 Факторный анализ как метод классификации данных.
7 Линейная модель факторного анализа.
8 Методы факторного анализа.
9 Метод главных факторов
10Метод главных компонент.
Тема 8
1 Динамический ряд.
Форма Д
Стр. 7 из 10
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
ПС_РПУД
2 Временной ряд.
3 Выборка временного ряда.
4 Типы временных рядов.
5 Типы временных рядов.
6 Аппроксимация временного ряда.
7 Анализ тренда временного ряда.
8 Период сезонности.
9 Задача прогнозирования временных рядов.
10Модель прогнозирования временного ряда АРПСС.
6.3 Контрольные вопросы и тематика контрольных заданий
промежуточной аттестации (по итогам изучения курса)
1
Шкалы измерений.
2
Особенности подготовки данных для статистического анализа.
3
Описательная статистика для номинальных и порядковых шкал.
4
Частотные таблицы: валидный и кумулятивный процент.
5
Таблицы сопряженности.
6
Описательная статистика для количественных переменных.
7
Корреляционный анализ. Частные и парные корреляции.
8
Простая и множественная линейная регрессия.
9
Бинарная и мультиномиальная логистические регрессии.
10 Дискриминантный анализ.
11 Кластерный анализ: основные принципы и методы.
12 Иерархический кластерный анализ.
13 Факторный анализ и анализ главных компонент.
14 Метод «Дерево решений».
7 УЧЕБНО-МЕТОДИЧЕСКОЕ И ИНФОРМАЦИОННОЕ
ОБЕСПЕЧЕНИЕ УЧЕБНОЙ ДИСЦИПЛИНЫ (МОДУЛЯ)
Основная литература:
№
п/п
1.
2.
3.
Автор
Иода Е.В.
Козлов А.Ю.,
Мхитарян В.С.,
Шишов В.Ф.
Плохотников
К.Э.
Издательство
Год
Наличие в
ЭБС
НИЦ Инфра-М
2012
ЭБС
ZNANIUM
Статистический анализ
данных в MS Excel
ИНФРА-М
2012
ЭБС
ZNANIUM
Основы эконометрики в
пакете STATISTICA
Вузовский
учебник
2010
ЭБС
ZNANIUM
Название
Статистика
Дополнительная литература:
№
п/п
1.
Автор
Пахунова Р.Н.,
Аскеров П.Ф.,
Форма Д
Название
Общая и прикладная
статистика
Издательство
Год
Наличие в
ЭБС
НИЦ ИНФРАМ
2013
ЭБС
ZNANIUM
Стр. 8 из 10
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
2.
3.
Пахунов А.В.
Балдин К.В.,
Башлыков В.Н.,
Рукосуев А.В.
Лысенко С.Н.,
Дмитриева И.А.
ПС_РПУД
Основы теории вероятностей
и математической статистики
Общая теория статистики
Флинта:
МПСИ
2010
ЭБС
ZNANIUM
Вуз. учебник
2009
ЭБС
ZNANIUM
Интернет - ресурсы
№
п/п
Интернет ресурс (адрес)
1.
http://www.coursera.org/
2.
http://www.intuit.ru/
3.
4.
5.
6.
http://www.consultant.ru/
http://www.citforum.ru/
http://www.osp.mesi.ru/
http://www.voskhod.ru/
7.
http://citforum.ru/
Описание ресурса
Coursera. Платформа для бесплатных онлайн - лекций (проект по публикации
образовательных материалов в интернете, в виде набора бесплатных онлайн курсов).
Национальный открытый университет «ИНТУИТ» (Интернет – университет
информационных технологий). Образовательный портал дистанционного
обучения.
Официальный сайт компании «Консультант Плюс».
Сайт Новейшие компьютерные технологии.
Сайт учебного процесса МЭСИ.
Сайт ФГУП НИИ Восход.
Сервер информационных технологий - on-line библиотека информационных
материалов по компьютерным технологиям.
Перечень открытых образовательных ресурсов.
№
п./п.
Название
ресурса
Организация
Электронный адрес
1.
Coursera
Coursera
http://www.coursera.org/
2.
НОЧУ ВПО
НОУ
ИНТУИТ
http://www.intuit.ru/
3.
Национальный
открытый
университет
«ИНТУИТ»
CIT Forum
CIT Forum
http://citforum.ru/
4.
Web ИРБИС
http://irbis.mesi.ru/
5.
Grebennikon
6.
Znanium
Ассоциация
ЭБНИТ
Grebennikov
Business
career
ООО
«Научноиздательский
центр ИнфаМ»
Форма Д
http://grebennikon.ru/
http://znanium.com/
Описание ресурса
Платформа для бесплатных
онлайн - лекций (проект по
публикации образовательных
материалов в интернете, в
виде
набора
бесплатных
онлайн - курсов)
Интернет – университет
информационных технологий.
Образовательный
портал
дистанционного обучения
Сервер
информационных
технологий
on-line
библиотека информационных
материалов по компьютерным
технологиям
Электронный
каталог
библиотеки МЭСИ
Электронная
библиотека
Издательского
дома
«Гребенников»
Электронная
библиотека
Znanium
Стр. 9 из 10
РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
7.
Консультант
Плюс
8.
Учебный
портал МЭСИ
Компания
«Консультант
Плюс»
МЭСИ
ПС_РПУД
http://www.consultant.ru/
Правовой
«Консультант Плюс»
http://www.osp.mesi.ru/
Сайт
МЭСИ
учебного
сервер
процесса
8 МАТЕРИАЛЬНО-ТЕХНИЧЕСКОЕ ОБЕСПЕЧЕНИЕ УЧЕБНОЙ
ДИСЦИПЛИНЫ (МОДУЛЯ)
ПАКЕТЫ ПРИКЛАДНЫХ ПРОФЕССИОНАЛЬНЫХ ПРОГРАММ
(ПППП)
№
п/п
Название программы
Описание программы
Пакет
прикладных
программ
для
статистического анализа данных Statistica
компании StatSoft.
Statistica (trial)
Аудиторные занятия проводятся в компьютерных классах с доступом к
серверу кафедры и сети Интернет.
Программа составлена в соответствии с требованиями ФГОС ВПО с
учетом рекомендаций и ПрООП ВПО по направлению и профилю подготовки
230700.62 ПРИКЛАДНАЯ ИНФОРМАТИКА
Автор
Форма Д
А.Г. Сбоев
Стр. 10 из 10
Download