Document 4519988

advertisement
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 1 из 26
Версия
1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
I. ПОЯСНИТЕЛЬНАЯ ЗАПИСКА
Исходный уровень компетенций, которыми должен обладать студент
№ п/п
ОК- 3
ОК–6
Исходный уровень компетенций, знаний и умений, которыми должен
обладать студент, приступая к изучению данной дисциплины
способен принимать организационно-управленческие решения и готов нести
за них ответственность, в том числе в нестандартных ситуациях (ОК- 3);
владеет навыками публичной и научной речи (ОК- 6);
Цель преподавания дисциплины
цель курса – сформировать у студентов системное представление о технологиях
интеллектуального анализа данных (Data Mining), их применении и инструментах.
Задачи изучения дисциплины:
В результате изучения дисциплины студент должен:
Знать отличия Data Mining от классических статистических методов анализа и
OLAP-систем, типы закономерностей и сферы применения Data Mining.
Уметь квалифицировать
интеллектуального анализа данных.
задачи
Data
Mining,
применять
методы
Иметь представление о тенденциях технологий интеллектуального анализа
данных, стандартах и инструментах.
Средства обеспечения освоения дисциплины
При изучении дисциплины рекомендуется использовать следующие средства:
− рекомендуемую основную и дополнительную литературу;
− методические указания и пособия;
− контрольные задания для закрепления теоретического материала;
− электронные версии учебников и методических указаний для выполнения практических
работ и СРС.
Формы работы студентов.
Формы работы студентов: лекционные занятия, написание курсовых работ, эссе,
рефератов, выполнение контрольных работ;
Дисциплина «Интеллектуальный анализ данных» разбита на модули, представляющие
собой логически завершенные части курса и являющиеся теми комплексами знаний и умений,
которые подлежат контролю.
Контроль освоения модулей включает в себя выполнение письменных контрольных
работ, предусмотренных рабочей программой дисциплины.
В конце семестра проводится контрольное мероприятие, включающее контроль
последнего модуля для всех студентов и контроль, который проходят обязательно те
студенты, которые имеют задолженность по прошлым модулям, а также те, кто желает
улучшить свой рейтинг.
Для максимального усвоения дисциплины рекомендуется проведение письменного
опроса (тестирование, решение задач) студентов по материалам лекций и практических работ.
Подборка вопросов для тестирования осуществляется на основе изученного теоретического
материала. Такой подход позволяет повысить мотивацию студентов при конспектировании
лекционного материала.
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 2 из 26
Версия
1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
В курсе используются классические аудиторные методы для всех занятий. Лекционная
и внеаудиторная работа студентов получает свое практическое завершение на семинаре
(лабораторной работе).
На семинарских (лабораторных) занятиях предполагается рассмотреть наиболее
важные, существенные, сложные вопросы, которые, как свидетельствует преподавательская
практика, наиболее трудно усваиваются студентами.
В качестве организованной самостоятельной работы студента рекомендуется
использовать написание рефератов по выбранной заранее тематике.
При написании реферата студент должен в соответствии с требованиями к
оформлению работ сформулировать проблему, актуальность, поставить цель и задачи
исследования, сделать самостоятельный вывод о состоянии и путях решения заданной
проблемы.
Формирование результирующей оценки
Формирование итоговой оценки по дисциплине осуществляется в соответствии с
Положением о бально-рейтинговой системе оценки успеваемости студентов. Положение о
бально-рейтинговой системе оценки успеваемости находится на сайте ВолГУ по адресу:
http://new.volsu.ru/Student/LawDocs/
Распределение баллов по дисциплине «Интеллектуальный анализ данных»
 Лабораторные работы
 Посещение
 Контрольные работы
6 лабораторных работ x 7 баллов = 42балла
17 посещений x 0,5 баллов =8 баллов
3 контрольные работы x 10 баллов=30 баллов
1 вопрос по теории - 2 балла
Тесты по темам контрольной работы – 3
балла
1 задача – 5 баллов
ИТОГО: 80
Премиальные баллы
 Реферат
 Сдача лабораторных работ в срок
 Индивидуальное
задание
успевающих студентов
ИТОГО: 80+31=111
10 баллов
6 лабораторных работ x 1 балл = 6 баллов
для индивидуальное задание = 15 баллов
ИТОГО: 31
Формируемые компетенции.
№ п/п
ОК - 1
ОК – 2
ОК – 5
Компетенции, формируемые в результате освоения дисциплины
способен совершенствовать и развивать свой интеллектуальный и
общекультурный уровень (ОК- 1);
способен к самостоятельному освоению новых методов исследования, изменению
научного и научно-производственного профиля своей профессиональной
деятельности (ОК-2)
способность к творческой адаптации к конкретным условиям выполняемых задач
и их инновационным решениям (ОК -5);
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 3 из 26
Версия
1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
ПК – 3
ПК -10
применять методы системного анализа и моделирования для анализа архитектуры
предприятий (ПК-3);
проводить исследования и поиск новых моделей и методов совершенствования
архитектуры предприятия (ПК-10);
II. СТРУКТУРА ИЗУЧЕНИЯ ДИСЦИПЛИНЫ
Всего часов
108
В.ч.
Аудиторных занятий
Из них лекций
51
17
семинарских/практических занятий
лабораторных занятий
34
практикумов
Самостоятельных занятий
57
изучение основной и дополнительной литературы
50
написание курсовых работ, эссе, рефератов,
23
выполнение письменных домашних заданий, расчетов, проектов
10
выполнение контрольных работ, тестов
10
Подготовка к экзамену, экзамен
Другие пояснения автора
Обучение людей с ограниченными возможностями здоровья, их социальная адаптация – один
из приоритетных вопросов российского образования. Законодательство Российской Федерации в
соответствии с основополагающими международными документами в области образования
предусматривает принцип равных прав на образование для детей данной категории.
В рамках изучения курса предоставляются условия для обеспечения процесса обучения людей с
ограниченными возможностями. В частности возможности дистанционного обучения через
использование ПТК УМКА. Индивидуальные консультации с использованием сети «Интернет».
В процессе обучения будут использоваться информационные, образовательные и
компенсационные технологии. Главная задача состоит в том, чтобы в рамках изучения курса люди с
ограниченными возможностями смогли раскрыть свой интеллектуальный потенциал в рамках
образовательной деятельности, почувствовать себя полноправными членами общества, а также
повысить свой уровень жизни.
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 4 из 26
Версия
1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
III. ТЕМАТИЧЕСКИЙ ПЛАН ИЗУЧЕНИЯ ДИСЦИПЛИНЫ
«Интеллектуальный анализ данных»
Тема
Содержание
Вид занятий
Форма занятий
Количество
часов
Лекции
2
Лабораторная работа
№1
4
Изучение
дополнительной
литературы
Подготовка к
лабораторной работе
Лекции
3
Лабораторная работа
№2
4
Изучение базовой и
дополнительной
литературы
Подготовка к
лабораторной работе
3
Форма контроля
Модуль 1.
1. Анализ данных
в системах
поддержки
принятия
решений.
Задачи СППР. Архитектура СППР.
Базы данных в СППР. Требования к
данным.
Аудиторные
Самостоятельные
2. Хранилище
данных
Концепция хранилища данных.
Свойства хранилищ данных
(предметная ориентация, интеграция,
поддержка хронологии,
неизменяемость). Физические и
виртуальные хранилища данных.
Проблемы создания хранилищ данных.
Организация хранилищ данных.
Очистка данных. Показатели и
документы
Аудиторные
Самостоятельные
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 5 из 26
Версия
1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
Контрольный опрос и
защита лабораторной
работы
2
2
2
Письменный опрос в
конце лекции (5-10 мин)
Контрольный опрос и
защита лабораторной
работы
3. OLAP-системы
4. Интеллектуальный
анализ данных
(Data Mining)
5. Задачи и
Многомерная модель данных.
Определение OLAP-систем.
Концептуальное многомерное
представление. Двенадцать правил
Кодда. Дополнительные правила
Кодда. Тест FASMI. Архитектура
OLAP-систем. MOLAP-серверы.
ROLAP-серверы. HOLAP-серверы.
Контрольная работа по 1 модулю
Аудиторные
Самостоятельные
Модуль 2
Свойства знаний. Сравнение статистик, Аудиторные
машинного обучения и Data Mining.
Классификация задач Data Mining.
Сферы применения Data Mining.
Процесс Data Mining: анализ
предметной области, постановка
Самостоятельзадачи, подготовка данных, построение ные
модели, проверка и оценка моделей,
выбор модели, применение модели,
коррекция и обновление модели.
Классификация и кластеризация.
Аудиторные
Лекции
4
Лабораторная работа
№3
4
Изучение базовой и
дополнительной
литературы
Подготовка к
лабораторной работе
Написание реферата
по теме
Подготовка к
контрольной работе
по 1 модулю
3
Лекции
2
Лабораторная работа
№3
6
Изучение базовой и
дополнительной
литературы
Подготовка к
лабораторной работе
Написание реферата
по теме
3
Лекции
4
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 6 из 26
Версия
1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
Письменный опрос в
конце лекции (5-10 мин)
Контрольный опрос и
защита лабораторной
работы
2
5
5
Письменный опрос в
конце лекции (5-10 мин)
Контрольный опрос и
защита лабораторной
работы
2
5
Письменный опрос в
методы интеллектуального
анализа данных
6. Стандарты Data
Mining
Прогнозирование и визуализация.
Методы прогнозирования и
классификации: деревья решений,
метод опорных векторов, метод
«ближайшего соседа», нейронные сети.
Методы кластерного анализа.
Контрольная работа по 2 модулю
Стандарт CWM: назначение,
структура и состав. Стандарт CRISP:
структура, фазы и задачи. Стандарт
PMML. Стандарт OLE DB для Data
Mining.
Самостоятельные
Модуль 3
Аудиторные
Самостоятельные
7. Инструменты
Data Mining
Поставщики Data Mining.
Аудиторные
Классификация инструментов.
Программное обеспечение Data
Mining для поиска ассоциативных
правил. Программное обеспечение для
конце лекции (5-10 мин)
Контрольный опрос и
защита лабораторной
работы
Лабораторная работа
№3
6
Изучение базовой и
дополнительной
литературы
Подготовка к
лабораторной работе
Написание реферата
по теме
6
Лекции
2
Письменный опрос в
конце лекции (5-10 мин)
Лабораторная работа
№5
4
Контрольный опрос и
защита лабораторной
работы
Изучение базовой и
дополнительной
литературы
Подготовка к
лабораторной работе
Написание реферата
по теме
Лекции
3
Лабораторная работа
№6
6
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 7 из 26
Версия
1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
4
10
2
5
1
Письменный опрос в
конце лекции (5-10 мин)
Контрольный опрос по
вопросам лабораторной
работы
решения задач кластеризации и
сегментации. Программное
обеспечение для решения задач
классификации. Программное
обеспечение Data Mining для решения
задач оценивания и прогнозирования.
Контрольная работа по 3 модулю
Самостоятельные
Изучение базовой и
дополнительной
литературы
Подготовка к
лабораторной работе
Подготовка к
контрольной работе
по 3 модулю
Подготовка к экзамену
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 8 из 26
Версия
1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
3
2
6
0
Зачет по итогам работы в
семестре
Формы рубежного контроля
Оценка работы студента в рейтинговых баллах по дисциплине
«Интеллектуальный анализ данных».
№ п/п
Вид контроля успеваемости
Максимальное
количество баллов
Раздел I
Текущий семестровый контроль (60 баллов)
Контрольная работа (3)
Раздел II
Дополнительные баллы (15 баллов)
Контроль за посещением теоретических
занятий в течение семестра
Реферативное сообщение (2)
Экзамен (40 баллов)
60
1-10
1-25
IV. Учебно-методическое обеспечение
Базовые учебники
1. Паклин, Н. Б. Орешков, В. И. Бизнес-аналитика : от данных к знаниям /Н.Б. Паклин,
В.И. Орешков – СПб.: Питер, 2010. – 624 с. (3 экз НБ ВолГУ)
2. Кулаичев, А. П. Методы и средства комплексного анализа данных /А.П. Кулаичев. –
М.: Инфра-М, 2010. – 512 с. (20 экз НБ ВолГУ)
3. Петрова, Е.А. Интеллектуальный анализ данных: статистические методы [Электронный
ресурс]/Е.А. Петрова, А.В. Шевандрин, А.А. Трухляева – Волгоград: Консалт, 2013. – 240 с.
Дополнительная литература
1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели
анализа данных: OLAP и Data Mining. – СПб.: БХВ-Петербург, 2004
2. Барсегян А.А., Куприянов М.С.. Степаненко В.В., Холод И.И. Технологии анализа
данных : Data Mining, Visual Mining, Text Mining, OLAP- СПб.: БХВ-Петербург, 2008
3. Елманова Н., Федоров А. Введение в OLAP-технологии Microsoft – М.:Диалог-МИФИ,
2002
4. Каплан, А. В. Каплан, В. Е. Статистическая обработка и анализ экономических
данных /А.В. Каплан, В.Е. Каплан – Ростов-на-Дону: Феникс, 2007. – 330 с.
5. Макленнен Дж., Танг Ч., Криват Б. Microsoft SQL Server 2008: Data Mining интеллектуальный анализ данных – М.: BHV, 2009
6. Чубукова И.А. Data Mining. Учебное пособие – М.: Изд-во «Интернет-университет
информационных технологий – ИНТУИТ.ру, 2006
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 9 из 26
Версия
1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
Библиотечные фонды ВолГУ
-электронная библиотечная система ZNANIUM.COM.
Одновременный доступ к Электронно-библиотечной системе на
платформе ЭБС ZNANIUM.COM: 3600 (три тысячи шестьсот) пользователей.
-электронная библиотечная система Айбукс.ру/ibooks.ru.
Одновременный
доступ
к
Электронно-библиотечной
системе
Айбукс.ру/ibooks.ru: пароли и логины предоставляются для всех студентов
ВолГУ с любого компьютера, подключенного к сети Интернет.
-электронный научный информационный ресурс зарубежного
издательства Springer.
На платформе: http://link.springer.com. Одновременный доступ к
Электронно-библиотечной системе Springer с любого компьютера,
подключенного к локальной сети ВолГУ. Количество ключей не ограничено.
Научно-электронная библиотека eLIBRARY.RU
Интегрированный научно-информационный ресурс по адресам: elibrary.ru
и scienceindex.ru. Одновременный доступ к Электронно-библиотечной системе
eLIBRARY.RU с любого компьютера, подключенного к сети Интернет.
Количество ключей не ограничено.
Электронное издание базы даных Polpred.com
Количество ключей – 10000.
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 10 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
V. Контрольные вопросы.
СППР: задачи, архитектура, источник данных.
Хранилища данных: концепция, свойства, классификация.
Создание хранилищ данных
Многомерная модель данных. Правила Кодда.
Определение OLAP-систем. Архитектура OLAP. Тест FASMI
MOLAP-серверы. ROLAP-серверы. HOLAP-серверы.
Сравнение статистик, машинного обучения и Data Mining. Классификация задач Data
Mining. Сферы применения Data Mining.
8. Процесс Data Mining
9. Задачи интеллектуального анализа данных. Классификация и кластеризация
10. Задачи интеллектуального анализа данных. Прогнозирование и визуализация
11. Методы прогнозирования и классификации: деревья решений
12. Методы прогнозирования и классификации: метод опорных векторов
13. Методы прогнозирования и классификации: метод «ближайшего соседа»
14. Методы прогнозирования и классификации: нейронные сети.
15. Методы кластерного анализа.
16. Стандарт CWM: назначение, структура и состав.
17. Стандарт CRISP: структура, фазы и задачи.
18. Стандарт PMML.
19. Стандарт OLE DB для Data Mining.
20. Поставщики Data Mining. Классификация инструментов.
21. Программное обеспечение Data Mining для поиска ассоциативных правил.
22. Программное обеспечение для решения задач кластеризации и сегментации.
23. Программное обеспечение для решения задач классификации.
24. Программное обеспечение Data Mining для решения задач оценивания и прогнозирования.
1.
2.
3.
4.
5.
6.
7.
Электронные ресурсы:
1. Аналитический сайт бизнес-планирования / - Доступно из URL:
http://www.finanalis.ru
2. «Планета КИС». Информационно-аналитический сайт специалистов области ИТ /
- Доступно из URL: http://www.russianenterprisesolutons.com
3. Информационный сайт Дальневосточных информационных ресурсов «Форпост»/
- Доступно из URL: http://www.farpost.ru
4. Бизнес портал инвестиций и бизнес-планования/ - Доступно из URL:
http://www.bportal.ru
5. Информационный бюллетень / - Доступно из URL: http://www.jetinfo.ru
6. Информационно аналитический сайт области информационных технологий CNews
/ - Доступно из URL: http://www.cnews.ru
7. Информационно аналитический сайт области информационных технологий
«Citforum»/ -Доступно из URL: http://www.citforum.ru
8. Слиньков Д. Бизнес моделирование для внедрения ИСУ
предприятия.[Электронный ресурс] / Б. Слиньков - Доступно из URL:
http://www.cfin.ru
9. Боровко Р. Пользователи Интернета в России [Электронный ресурс] / Р. Боровко //
Обзор CNews Analitics - Доступно из URL: http://www.cnews.ru
10. Эксплуатация ИС как элемент стратегии развития бизнеса [Электронный ресурс] /
«Планета КИС» / - Доступно из URL: http://www.russianenterprisesolutons.com
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 11 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
11. Антончук С. HP Software Universe об управлении ИТ-инфраструктурой
[Электронный ресурс] / С. Антончук // Электронная версия журнала
ComputerWorld. - 2003. - 4 (397) 29. - Доступно из URL: http://comizdat.com
12. Пример бизнес-плана .[Электронный ресурс] / Российское Агентство
поддержки малого и среднего бизнеса. Доступно из URL: http://www.siora.ru
13. Пономарев В. ИТ-менеджеры и ИТ-специалисты - единство противоположностей
[Электронный ресурс] / В. Пономарев // «Планета КИС» - Доступно из URL:
http://www.russianenterprisesolutons.com
14. Настоящий вычислительный центр [Электронный ресурс] // Публикации «Jetinfo» Доступно из URL: http://www.jetinfo.ru
Учебно-методический комплекс по дисциплине «Интеллектуальный анализ данных»
Учебно-методический комплекс по дисциплине «Теория экономических информационных
систем» находится в ПТК «УМКа» на сайте Волгоградского государсвенного университета.
Режим доступа – http://umka.volsu.ru/newumka2
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 12 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
Приложение 1
Использование в учебном процессе активных и интерактивных форм проведения занятий
Предусмотрен
о учебным
планом
Дискуссия
6
2
из них интерактивные методы
Разбор
Опрос
проблем
Работа в
студенной
малой
тов
ситуаци
группе
и
Итого
интерактивные
методы, час
% интерактивных
методов
2
33,3
2
33,3
2
2
4
8
50
40
2
6
75
2
4
40
2
4
10
55,5
2
2
4
66,6
2
2
28,5
Компьюте
рная
сумуляция
Модуль 1
1. Анализ данных в
системах поддержки
принятия решений.
2. Хранилище
данных
3. OLAP-системы
всего
Модуль 2
4. Интеллектуальный анализ
данных (Data
Mining)
5. Задачи и методы
интел-лектуального
анализа данных
всего
Модуль 3
6. Стандарты Data
Mining
7. Инструменты Data
Mining
6
2
8
20
2
8
2
10
18
2
2
2
2
2
2
2
6
7
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 13 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
всего
Итого
13
51
4
2
4
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 14 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
2
4
4
10
6
24
85,7
47
Приложение 2
Фонд оценочных средств
1. Цели и задачи дисциплины «Интеллектуальный анализ данных»
Цель преподавания дисциплины
цель курса – сформировать у студентов системное представление о технологиях
интеллектуального анализа данных (Data Mining), их применении и инструментах.
Задачи изучения дисциплины:
В результате изучения дисциплины студент должен:
Знать отличия Data Mining от классических статистических методов анализа
и OLAP-систем, типы закономерностей и сферы применения Data Mining.
Уметь квалифицировать
интеллектуального анализа данных.
задачи
Data
Mining,
применять
методы
Иметь представление о тенденциях технологий интеллектуального анализа
данных, стандартах и инструментах.
Средства обеспечения освоения дисциплины
При изучении дисциплины рекомендуется использовать следующие средства:
− рекомендуемую основную и дополнительную литературу;
− методические указания и пособия;
− контрольные задания для закрепления теоретического материала;
− электронные версии учебников и методических указаний для выполнения практических
работ и СРС.
Формы работы студентов.
Формы работы студентов: лекционные занятия, написание курсовых работ, эссе,
рефератов, выполнение контрольных работ;
Дисциплина
«Интеллектуальный
анализ
данных»
разбита
на
модули,
представляющие собой логически завершенные части курса и являющиеся теми
комплексами знаний и умений, которые подлежат контролю.
Контроль
освоения
модулей
включает
в
себя
выполнение
письменных
контрольных работ, предусмотренных рабочей программой дисциплины. В конце
семестра проводится контрольное мероприятие, включающее контроль последнего
модуля для всех студентов и контроль, который проходят обязательно те студенты,
которые имеют задолженность по прошлым модулям, а также те, кто желает улучшить
свой рейтинг.
Для максимального усвоения дисциплины рекомендуется проведение письменного
опроса (тестирование, решение задач) студентов по материалам лекций и практических
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 15 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
работ. Подборка вопросов для тестирования осуществляется на основе изученного
теоретического материала. Такой подход позволяет повысить мотивацию студентов при
конспектировании лекционного материала.
В курсе используются классические аудиторные методы для всех занятий.
Лекционная и внеаудиторная работа студентов получает свое практическое завершение на
семинаре (лабораторной работе).
На семинарских (лабораторных) занятиях предполагается рассмотреть наиболее
важные,
существенные,
сложные
вопросы,
которые,
как
свидетельствует
преподавательская практика, наиболее трудно усваиваются студентами.
В качестве организованной самостоятельной работы студента рекомендуется
использовать написание рефератов по выбранной заранее тематике.
При написании реферата студент должен в соответствии с требованиями к
оформлению работ сформулировать проблему, актуальность, поставить цель и задачи
исследования, сделать самостоятельный вывод о состоянии и путях решения заданной
проблемы.
Формирование результирующей оценки
Формирование итоговой оценки по дисциплине осуществляется в соответствии с
Положением о бально-рейтинговой системе оценки успеваемости студентов. Положение о
бально-рейтинговой системе оценки успеваемости находится на сайте ВолГУ по адресу:
http://new.volsu.ru/Student/LawDocs/
Распределение баллов по дисциплине «Интеллектуальный анализ данных»
 Лабораторные работы
 Посещение
 Контрольные работы
6 лабораторных работ x 7 баллов = 42балла
17 посещений x 0,5 баллов =8 баллов
3 контрольные работы x 10 баллов=30 баллов
1 вопрос по теории - 2 балла
Тесты по темам контрольной работы – 3
балла
1 задача – 5 баллов
ИТОГО: 80
Премиальные баллы
 Реферат
 Сдача лабораторных работ в срок
 Индивидуальное
задание
успевающих студентов
ИТОГО: 80+31=111
10 баллов
6 лабораторных работ x 1 балл = 6 баллов
для индивидуальное задание = 15 баллов
ИТОГО: 31
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 16 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
2. Оценка уровня сформированности компетенций
Результаты обучения
(Компетенции ФГОС)
ОК - 1
ОК – 2
способен совершенствовать
и развивать свой
интеллектуальный и
общекультурный уровень
способен к
самостоятельному
освоению новых методов
исследования, изменению
научного и научнопроизводственного
профиля своей
профессиональной
деятельности
Компоненты результатов обучения
Форма оценочного Ступени уровней освоения
средства
компетенции
Знать: основные категории
дисциплины, виды и инструменты
решения практических
профессиональных задач в области
интеллектуального анализа данных,
понимать основные тенденции
развития анализа данных
экзамен,
подготовка
реферата по темам
дисциплины,
подготовка
презентаций к
лабораторным
занятиям,
подготовка
индивидуальных
заданий по
дисциплинам
Уметь: применять понятийнокатегориальный аппарат дисциплины,
выявлять тенденции развития
интеллектуального анализа данных
Владеть: навыками применения
понятийного аппарата, владеть
навыками определения решения
практических профессиональных задач
в области интеллектуального анализа
данных, владеть навыками анализа
тенденций ИАД
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 17 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
Пороговый уровень
• владеть развитыми учебными
навыками и готовностью к
продолжению образования;
• владеть логикой, необходимой для
формирования решений по
соответствующим профессиональным
проблемам.
Повышенный уровень
• иметь глубокие знания базовых
дисциплин и проявлять высокую
степень их понимания, знать и уметь
использовать на соответствующем
уровне (повышенном, продвинутом):
• демонстрировать понимание основных
тенденций развития интеллектуального
анализа данных;
• демонстрировать способность к
абстракции, в том числе умение
логически развивать отдельные
формальные теории и устанавливать
ОК – 5
способность к творческой
адаптации к конкретным
условиям выполняемых
задач и их инновационным
решениям
Знать: основные категории
дисциплины, виды и инструменты
решения практических
профессиональных задач в области
интеллектуального анализа данных,
знать основные источники
информации интеллектуального
анализа данных, возможности
применения методов ИАД в
профессиональной деятельности
Уметь: применять понятийнокатегориальный аппарат дисциплины,
выявлять тенденции развития
интеллектуального анализа данных,
определять перспективные области
применения методов ИАД в решении
практических задач профессиональной
оьласти
Владеть: навыками применения
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 18 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
экзамен,
подготовка
реферата по темам
дисциплины,
подготовка
презентаций к
лабораторным
занятиям,
подготовка
индивидуальных
заданий по
дисциплинам
связь между ними;
•
обладать способностью к
применению на практике, в том числе
умением составлять модели
планирования типовых
профессиональных задач и находить
способы их решений; интерпретировать
профессиональный (физический) смысл
полученного аналитического результата.
Пороговый уровень
• владеть развитыми учебными
навыками и готовностью к
продолжению образования;
• владеть логикой, необходимой для
формирования решений по
соответствующим профессиональным
проблемам.
Повышенный уровень
• иметь глубокие знания базовых
дисциплин и проявлять высокую
степень их понимания, знать и уметь
использовать на соответствующем
уровне (повышенном, продвинутом):
• демонстрировать понимание основных
тенденций развития интеллектуального
анализа данных;
• демонстрировать способность к
абстракции, в том числе умение
логически развивать отдельные
понятийного аппарата, владеть
навыками определения решения
практических профессиональных задач
в области интеллектуального анализа
данных, владеть навыками анализа
тенденций ИАД
ПК – 3
ПК -10
применять методы
системного анализа и
моделирования для анализа
архитектуры предприятий
проводить исследования и
поиск новых моделей и
методов
совершенствования
архитектуры предприятия
Знать: основные категории
дисциплины, виды и инструменты
моделирования при решении
практических профессиональных
задач для анализа архитектуры
предприятия, знать основные
источники информации
интеллектуального анализа данных,
возможности применения методов
ИАД при анализе и
совершенствовании архитектуры
предприятия
Уметь: применять понятийнокатегориальный аппарат дисциплины,
определять перспективные области
применения методов ИАД в решении
практических задач при анализе и
совершенствовании архитектуры
предприятия
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 19 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
экзамен,
подготовка
реферата по темам
дисциплины,
подготовка
презентаций к
лабораторным
занятиям,
подготовка
индивидуальных
заданий по
дисциплинам
формальные теории и устанавливать
связь между ними;
•
обладать способностью к
применению на практике, в том числе
умением составлять модели
планирования типовых
профессиональных задач и находить
способы их решений; интерпретировать
профессиональный (физический) смысл
полученного аналитического результата.
Пороговый уровень
• владеть развитыми учебными
навыками и готовностью к
продолжению образования;
• владеть логикой, необходимой для
формирования решений по
соответствующим профессиональным
проблемам.
Повышенный уровень
• иметь глубокие знания базовых
дисциплин и проявлять высокую
степень их понимания, знать и уметь
использовать на соответствующем
уровне (повышенном, продвинутом):
• демонстрировать понимание основных
тенденций развития интеллектуального
анализа данных;
• демонстрировать способность к
абстракции, в том числе умение
Владеть: навыками применения
понятийного аппарата, владеть
навыками определения решения
практических профессиональных задач
в области анализа и
совершенствования архитектуры
предприятия, владеть навыками
анализа тенденций совершенствования
архитектуры предприятия
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 20 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
логически развивать отдельные
формальные теории и устанавливать
связь между ними;
•
обладать способностью к
применению на практике, в том числе
умением составлять модели
планирования типовых
профессиональных задач и находить
способы их решений; интерпретировать
профессиональный (физический) смысл
полученного аналитического результата.
3. Критерии оценок знаний студентов
Итоговой формой контроля по дисциплине «Интеллектуальный анализ данных»
для направления 080500 Бизнес-информатика является дифференцированный зачет. На
зачете оцениваются теоретические знания по дисциплине и практическое применение
этих знаний при решении основных задач интеллектуального анализа данных.
Дифференцированный зачет проводится по теоретическим вопросам дисциплины и
практическому заданию. При выставлении оценок экзаменатор руководствуется
следующими критериями.
Оценка «отлично» (91-100 баллов)
Студент дал полные, развернутые ответы на все теоретические вопросы билета,
продемонстрировал знание терминологии и основных методов ИАД, умение применять
теоретические знания при решении задач. Студент показал исчерпывающие знания по
следующим направлениям: многомерная модель данных, определение OLAP-систем,
концептуальное многомерное представление, двенадцать правил Кодда, методы
прогнозирования и классификации: деревья решений, метод опорных векторов, метод
«ближайшего соседа», нейронные сети, методы кластерного анализа, студент без
затруднений ответил на все дополнительные вопросы. Задача решена полностью без
неточностей и ошибок.
Оценка «хорошо» (71-90 баллов)
Студент раскрыл в основном теоретические вопросы, однако допущены неточности в
определении основных понятий эконометрики. При этом неполно освящены
второстепенные детали, однако в полной мере освоены основные методы
интеллектуального анализа данных. При ответе на дополнительные вопросы допущены
небольшие неточности. При решении задачи допущены несущественные ошибки.
Оценка «удовлетворительно»
При ответе на теоретические вопросы студентом допущено несколько существенных
ошибок в толковании основных понятий. Логика и полнота ответа страдают заметными
изъянами. Заметны пробелы в знании основных методов. Теоретические вопросы в целом
изложены достаточно, но с пропусками материала. Имеются принципиальные ошибки в
логике построения ответа на вопрос. Студент не решил задачу или при решении
допущены грубые ошибки.
Оценка «неудовлетворительно»
Ответ на теоретические вопросы свидетельствует о непонимании и крайне неполном
знании основных понятий и методов теории экономических информационных систем.
Обнаруживается отсутствие навыков применения теоретических знаний при решении
соответствующих задач. Студент не смог ответить ни на один дополнительный вопрос.
Задача не решена.
4. Типовые модульные контрольные работы
Модульная контрольная работа №1
1. Хранилища данных: концепция, свойства, классификация
2. Многомерная модель данных. Определение OLAP-систем.
3. Архитектура OLAP-систем. MOLAP-серверы.
Практическое задание
Выбрать правильные ответы:
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 21 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
1. Часть зависимой переменной в регрессионной модели, которая может быть
объяснена значением регрессора:
a. случайное возмущение;
b. отклик;
c. уравнение регрессии;
d. остаток.
2. Гипотеза является сложной, если:
a. она состоит из конечного числа простых гипотез;
b. она состоит из бесконечного числа простых гипотез;
c. Содержит только одно предположение.
3. Коррелированность возмущений с различными номерами называется:
a. гомоскедастичностью;
b. гетероскедастичностью;
c. автокорреляцией
4. Критической областью называют:
a. совокупность значений критерия, при которых нулевую гипотезу
принимают;
b. совокупность значений критерия, при которых нулевую гипотезу отвергают.
5. Укажите формулу вычисления коэффициента детерминации для парной регрессии:
a. RSS/TSS;
b. 1-(ESS/TSS);
c. ESS/TSS.
Решите задачу
Наблюдения 16 пар (X,Y) дали следующие результаты:
ΣY2 = 526
ΣX2 = 657
ΣXY = 492
ΣY = 64
ΣX = 96
Оцените регрессию yi  axi  b   i , i  1,, n.
Сформулируйте нулевую (основную) и альтернативные гипотезы при проверке
статистической значимости коэффициентов регрессии.
Модульная контрольная работа №2
1. Сравнение статистик, машинного обучения и Data Mining. Классификация задач Data
Mining. Сферы применения Data Mining. Процесс Data Mining
2. Методы прогнозирования и классификации: деревья решений, метод опорных векторов,
метод «ближайшего соседа»
3. Методы кластерного анализа
Практическое задание
Выбрать правильные ответы:
1. Причины гетероскедастичности (множественный выбор):
e. исследование неоднородных объектов;
f. характер наблюдений;
g. ошибки спецификации;
h. ошибки измерений.
2. Под мультиколлинеарностью понимается линейная зависимость (единичный
выбор):
a. зависимой переменной с одним или несколькими регрессорами;
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 22 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
b. двух, или нескольких регрессоров;
c. зависимой переменной с возмущением;
d. регрессоров с возмущением.
3. Критерий качества МНК в множественной регрессии (множественный выбор):
n
a.
 ei ;
n
b.
i 1
e
i 1
2
i
c.
eT  e
d.
e  eT
e.
ESS
4. С увеличением объема выборки длина доверительного интервала прогнозируемого
значения зависимой переменной (единичный выбор):
a. увеличивается;
b. уменьшается
c. не меняется.
6. Обычный R2 и скорректированный R2adj коэффициенты детерминации для
множественной регрессии связаны отношением (единичный выбор):
2
a. R 2  Radj
;
2
b. R 2  Radj
2
c. R 2  Radj
;
Решите задачу
Для двух видов продукции А и Б зависимость расходов предприятия Y (тыс. руб.) от
объема производства X (шт.) характеризуется данными, представленными в таблице:
Уравнение регрессии
YA=160 +0,8 X
Коэффициент детерминации
0,8
Число наблюдений
30
1. Поясните смысл величин 0,8 и 0,6 в уравнениях регрессии.
2. Найдите значения F-критерия Фишера для уравнений регрессии.
Модульная контрольная работа №3
1. В чем состоит цель поиска ассоциативных правил. Дайте определения категориям
«транзакция», «поддержка набора», «поддержка правила», «достоверность правила».
2. Алгоритм поиска ассоциативных правил Apriori: этапы работы. В чем состоит отличие
алгоритма Apriori от алгоритмов AIS и SETM.
3. Организационные факторы при внедрении Data Mining в деятельность компании.
4. Человеческие факторы при внедрении Data Mining в деятельность компании. Основные
роли специалистов в процессах Data Mining.
5. Перечислите стандарты методологии Data Mining. В чем состоят их особенности.
5. Контрольные вопросы для подготовки к зачету
СППР: задачи, архитектура, источник данных.
Хранилища данных: концепция, свойства, классификация.
Создание хранилищ данных
Многомерная модель данных. Правила Кодда.
Определение OLAP-систем. Архитектура OLAP. Тест FASMI
MOLAP-серверы. ROLAP-серверы. HOLAP-серверы.
Сравнение статистик, машинного обучения и Data Mining. Классификация задач Data
Mining. Сферы применения Data Mining.
8. Процесс Data Mining
9. Задачи интеллектуального анализа данных. Классификация и кластеризация
10. Задачи интеллектуального анализа данных. Прогнозирование и визуализация
1.
2.
3.
4.
5.
6.
7.
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 23 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
11. Методы прогнозирования и классификации: деревья решений
12. Методы прогнозирования и классификации: метод опорных векторов
13. Методы прогнозирования и классификации: метод «ближайшего соседа»
14. Методы прогнозирования и классификации: нейронные сети.
15. Методы кластерного анализа.
16. Стандарт CWM: назначение, структура и состав.
17. Стандарт CRISP: структура, фазы и задачи.
18. Стандарт PMML.
19. Стандарт OLE DB для Data Mining.
20. Поставщики Data Mining. Классификация инструментов.
21. Программное обеспечение Data Mining для поиска ассоциативных правил.
22. Программное обеспечение для решения задач кластеризации и сегментации.
23. Программное обеспечение для решения задач классификации.
24. Программное обеспечение Data Mining для решения задач оценивания
прогнозирования.
6. Тематика реферативных сообщений
1. Инструментальные средства ИАД применительно к задачам СППР.
2. Направления развития информационных технологий ИАД.
3. Направления развития современных информационных технологий в СППР.
4. Инструментальные средства сбора и доработки данных.
5. Инструментальные средства преобразования данных.
6. Инструментальные средства оперативного (OLAP) анализа .
7. История нейрокомпьютинга.
8. Задачи ИАД на основе искусственных нейронных сетей.
9. Биологическая и математическая модели нейрона.
10. Однослойные и многослойные нейронные сети.
11. Структура искусственной нейронные сети.
12. Особенности структуры нейронных сетей и ее влияние на свойства сети.
13. Решение задач с помощью многослойного персептрона.
14. Топологии нейронных сетей.
7. Контрольные вопросы промежуточной аттестации (по итогам
изучения курса)
1. Данные и модели их представления.
2. Задачи ИАД.
1. Алгебра матриц.
2. Функции многих переменных.
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 24 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
и
3. Необходимые и достаточные условия существования экстремумов применительно
к квадратичным формам.
4. Типы шкал.
5. Допустимые преобразования в шкалах.
6. Проверка истинности утверждений.
7. Статистическая выборка.
8. Числовые характеристики распределений.
9. Комплексные числа и их применение при визуализации многомерных данных.
10. Методы и алгоритмы оцифровки графиков.
11. Методы и алгоритмы обработки изображений.
12. Простые и сложные признаки и способы оценки их информативности.
13. Алгоритмы поиска систем информативных признаков.
14. Матрица объект-признак и её статистические характеристики.
15. Проблема сжатия данных.
16. Разнотипные данные и методы их обработки.
17. Задача поиска логических закономерностей.
18. Методы классификации и прогнозирования.
19. Задачи кластерного анализа.
20. Иерархические и итеративные методы кластеризации.
21. Особенности кластеризации в качественных и количественных шкалах.
22. Кластеризация данных по матрице объект-признак.
23. Кластеризация данных по матрице матрице связи.
24. Назначение компонентного и факторного анализа.
25. Сходство и различие компонентного и факторного анализа.
26. Применение компонентного и факторного анализа к задачам ИАД.
27. Методы распознавания образов с учителем и без учителя.
28. Задачи принятия решений.
29. Метод анализа иерархий.
30. Модификации
метода
анализа
иерархий
в
интересах
интеллектуальных подсказок пользователям.
31. Основные понятия когнитивного моделирования.
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 25 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
реализации
32. Инструментальные средства ИАД применительно к задачам СППР.
33. Направления развития ИАД.
34. Направления развития современных информационных технологий в СППР.
35. Краткая история нейрокомпьютинга.
36. Задачи ИАД на основе искусственных нейронных сетей.
37. Место нейронных сетей среди других методов решения задач
38. Информационный подход к моделированию нейрона.
39. Биологический подход к моделированию нейрона.
40. Структура искусственной нейронные сети.
41. Структура двухкровневого персептрона, многоуровневого персептрона (МСП).
42. Особенности структуры нейронных сетей и ее влияние на свойства сети.
43. Алгоритм решения задач с помощью МСП.
44. Классификация задач решаемых с помощью МСП.
45. Постановка задач распознавания, аппроксимации, прогнозирования. Примеры
задач.
46. Топологии нейронных сетей.
8. Тематика практических задач промежуточной аттестации (по итогам
изучения курса)
1. Алгебра матриц.
2. Экстремумы функций многих переменных.
3. Графическое представление данных в различных типах шкал, их графическое
представление в МАТЛАБ.
4. Сжатие данных.
5. Методы классификации.
6. Метод анализа иерархий.
Название документа: Программа учебной дисциплины «Интеллектуальный анализ данных»
Разработчик зав. кафедрой ЭИУ Петрова Е.А.
стр. 26 из 26
Версия 1
Копии с данного оригинала при распечатке недействительны без заверительной надписи
Download