Системы поддержки принятия решений

advertisement
Правительство Российской Федерации
Государственное образовательное бюджетное учреждение
высшего профессионального образования
ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ВЫСШАЯ ШКОЛА ЭКОНОМИКИ
ПЕРМСКИЙ ФИЛИАЛ
Программа дисциплины
Системы поддержки принятия решений
для направления 080700.62 – Бизнес-информатика
Утверждена
Учебно-методическим Советом ПФ ГУ-ВШЭ
Одобрена на заседании кафедры
информационных технологий в бизнесе
Председатель______________Г.Е. Володина
Зав. кафедрой_______________ Т.А.Казаченко
«_______»_________________________2010 г.
«______»__________________________2010 г.
Пермь 2010
I. Пояснительная записка
1. Авторы программы:
Замятина Е.Б., доцент; Мальцев П.А.
2. Требования к студентам:
Приступая к изучению данной дисциплины, студент должен обладать знаниями
информатики и программирования, полученными на первом и втором курсе, а также
знаниями, полученными при изучении курсов «Базы данных», «Хранилища данных»,
«Эконометрика».
3. Аннотация:
Дисциплина предназначена для студентов третьего курса направления 080700.62 –
«Бизнес-информатика».
Цель дисциплины – дать подготовку, необходимую для успешного освоения
современных средств Business Intelligence. Полученные в результате освоения дисциплины
знания необходимы при решении практических задач в сфере профессиональной
деятельности, проектировании и разработке информационно-аналитических систем,
систем поддержки принятия решений и других средств Business Intelligence.
Материал учебной дисциплины используется студентами в процессе работы над
выпускными квалификационными работами бакалавров, способствует дальнейшему
совершенствованию информационно-коммуникационной компетенции студентов.
Задачи:
 познакомить студентов с современными средствами Business Intelligence;
 познакомить с принципами построения информационно-аналитических систем и
систем поддержки принятия решений;
 познакомить с технологиями OLAP и Data Mining;
 дать навыки разработки приложений Business Intelligence.
Курс призван повысить общую эрудицию студентов и расширить их практический
опыт разработки ИС.
4. Учебная задача курса:
В результате изучения курса студент должен:
 Знать:
o технологические принципы проектирования информационных систем
ориентированных на анализ данных;
o основные подходы и методы создания систем поддержки принятия
решений;
o основные характеристики и отличительные черты многомерной
модели данных её достоинства при анализе данных;
o суть технологии OLAP;
o суть, решаемые задачи и основные алгоритмы Data Mining;
o суть и возможности систем имитационного моделирования.
 Уметь:
o проектировать и разрабатывать информационно-аналитические
системы и систем поддержки принятия решений.
 Иметь представление:
o о современном состоянии теории бизнесс-анализа;
o о месте и роли Business Intelligence в современных информационных
технологиях;
o о значении, областях применения и задачах решаемых Business
Intelligence;
2

o о тенденциях и перспективах развития средств Business Intelligence;
Обладать навыками:
o использования OLAP-средств;
o проектирования гиперкубов;
o проектирования аналитических отчётов;
o использования алгоритмов интеллектуального анализа данных;
o создания имитационных моделей;
o самостоятельной работы над проектом по разработке приложения BI.
5. Формы контроля:
 Текущий контроль: согласно графику контрольных мероприятий выполняется
домашнее задание.
 Итоговый контроль: зачет ставится при условии успешного выполнения
домашнего задания, работы на семинарах и сдачи теоретического зачета.
 Итоговая оценка: складывается в соответствии с «Положением о рейтинге»,
принятом в ПФ ГУ-ВШЭ. Формы проведения определяются учебным планом.
Вид контрольного
мероприятия
Домашняя работа
Тема
Разработка информационноаналитической системы/системы
поддержки принятия решений
Сроки
Баллы
24.12.2010
40
3
II. Содержание программы
Раздел 1. Введение в BI
Тема 1. Введение.
Основные понятия и области применения систем BI и средств анализа данных.
Определение и история понятия Business Intelligence. Эффективное принятие
решений. Виды анализа данных.
Раздел 2. Оперативная аналитическая обработка данных
Тема 2. Понятие OLAP, модели данных и архитектуры.
Многомерная модель данных. Требования к OLAP-средствам (12 правил Кодда,
тест FASMI). Виды OLAP (ROLP, MOLAP, HOLAP). OLAP-сервер и OLAP-клиент.
Варианты архитектур.
Тема 3. Обзор современных OLAP-средств.
OLAP-средства Microsoft, Oracle, Business Objects, «Прогноз».
Раздел 3. Интеллектуальный анализ данных
Тема 4. Введение в Data Mining.
Определение интеллектуального анализа данных. Различия Data Mining и OLAP.
Задачи решемые Data Mining. Методы Data Mining. Примеры применения Data Mining.
Тема 5. Задачи решаемые методами Data Mining.
Постановка задачь классификации и регрессии. Алгоритм построения 1r-првил.
Алгоритм Naive Bayes. Алгоритм ID3. Алгоритм C4.5. Постановка задачи поиска
ассоциативных правил. Секвенционный анализ. Алгоритм Apriori. Постановка задачи
6. кластеризации. Алгоритм k-means. Алгоритм Fuzzy C-Means. Кластеризация по
Гюстафу-Кесселю. Адаптивные методы кластеризации.
Раздел 4. Разработка приложений BI
Тема 6. Системы поддержки принятия решения.
Технологический процесс поддержки принятия решений. Этапы процесса
принятий решений. Характеристики СППР. Типы СППР. Структура СППР. Основные
компоненты СППР. Основные функции СППР. Примеры.
Тема 7. Современные платформы для разработки приложений BI.
Средства создания приложений BI Microsoft, Oracle, IBM, Business Objects,
Deductor, Prognoz.
Раздел 5. Методы и средства имитационного моделирования
Тема 8. Введение в метод имитационного моделирования.
Понятие имитационной модели. Основные понятия: событие, активность,
процесс. Дискретное и непрерывное моделирование. Событийно-ориентированные
модели. Моделирование, ориентированное на процессы.
Тема 9. Современные системы имитационного моделирования.
Обобщенная архитектура систем имитационного моделирования. Языки
имитационного моделирования. Визуальные языки моделирования. Особенности
систем распределенного моделирования.
4
III. Учебно-методическое обеспечение дисциплины
1. Литература:
Базовый учебник:
Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data
Mining, Visual Mining, Text Mining, OLAP. – Санкт-Петербург: «БХВ-Петербург», 2008.
Основная:
1. Замятина Е.Б. Современные теории имитационного моделирования [Электронный
ресурс].
2. Ларсон Б. Разработка Бизнес-аналитики в Microsoft SQL Server 2005. – Москва: «Питер», 2008.
3. Бергер А., Горбач И., Меломед Э., Щербин В., Степаненко В. Microsoft SQL Server 2005 Analysis
Services. OLAP и многомерный анализ данных. – Санкт-Петербург: «БХВ-Петербург», 2007.
4. Имитационное моделирование: Методические указания по курсу «Системное и
прикладное программное обеспечение» / Перм. ун т; Сост. Л.Н. Лядова. – Пермь, 2003. –
60 с.
Дополнительная:
1. Материалы сайта http://www.olap.ru
2. Материалы сайта http://basegroup.ru
3. Материалы сайта http://www.gpss.ru
2. Тематика заданий по различным формам текущего контроля:
Приложение 1. Домашнее задание для проведения текущего контроля.
Приложение 3. Вопросы для самоконтроля.
3. Методические рекомендации (материалы) преподавателю:
На
лекциях
рекомендуется
использовать
мультимедийные
презентации,
иллюстрирующие материал. При этом студенты должны активно участвовать в обсуждении
вопросов. Многие из тем курса тесно связны с уже пройденными студентами курсами: «Базы
данных», «Эконометрика», «Хранилища данных». Рассмотрение подобных тем следует
начинать с повторения студентами того, как рассматриваемые вопросы освящались в рамках
пройденных курсов.
В рамках курса студенты должны самостоятельно разработать информационноаналитическую систему или систему поддержки принятия решений. Для совершенствования
навыков командной работы можно предложить выполнить данную работу объединившись в
команды по 2-3 человека. При этом работу над проектом следует организовать в следующем
порядке:
1) Преподаватель делит студентов на проектные группы по 2-3 человека. Деление
должно обеспечивать равный уровень подготовки студентов внутри каждой группы.
2) Каждая группа выбирает из своего состава руководителя проекта. Задача
руководителя в организации работы над проектом, разделении обязанностей внутри группы
и представлении результатов работы преподавателю.
3) Каждая группа выбирает предметную область, для которой им хотелось бы
разработать информационно-аналитическую систему или систему поддержки принятия
решений. При этом группа сама должна найти источники данных для разрабатываемой
системы. После этого руководитель каждой из групп согласует с преподавателем выбранную
предметную область и источники данных. Если преподаватель считает выбранную
предметную область и источники достаточными для успешного выполнения задания, то
группа может приступать к выполнению задания. В противном случае группа должна
устранить все замечания преподавателя и повторно представит тему на согласование, либо
5
преподаватель сам может назначить тему и предложить источники данных для
разрабатываемой системы.
4) На первом этапе разработки каждой группой разрабатывается проект, в котором
описывается функционал разрабатываемой системы и обязанности членов группы. Данный
проект руководитель каждой группы должен согласовать с преподавателем и только после
устранения всех замечаний группа может приступить к его реализации. На этапе
согласования
преподаватель
должен
проверить,
насколько
запланированная
функциональность соответствует темам курса, убедиться в равномерном распределении
обязанностей между членами группы и что заявленная функциональность может быть
реализована данной группой в установленный срок.
5) Для минимизации рисков работа над программной реализацией проекта может быть
разбита на несколько этапов, индивидуально для каждой из групп. Результат каждого из
этапов должен быть представлен преподавателю. Подобная организация работы позволит
избежать многих ошибок и повысить качество конечной системы.
6) Результат работы группы демонстрируется преподавателю. Преподаватель оценивает
как всей группы, так и личный вклад каждого участника группы.
4. Методические указания студентам:
Студентам рекомендуется следующая схема работы над практическим заданием:
1) проработать конспект лекций;
2) проанализировать рекомендованную литературу;
3) проанализировать варианты решений, предложенные преподавателем;
4) при затруднениях сформулировать вопросы к преподавателю.
5. Рекомендации по использованию информационных технологий
Все практические занятия проводятся в компьютерном классе. Для выполнения
практических заданий студенты должны иметь доступ к следующему программному
обеспечению:
1) MS Visual Studio 2010.
2) MS Development Network.
3) MS SQL Server 2008.
4) GPSS World (Student Version).
Авторы программы:
__________________________________________
/ П.А. Мальцев /
__________________________________________
/ Е.Б. Замятина /
6
Семинарские или
практические
занятия
Наименование тем
(с разбивкой по модулям)
№
Лекции
Аудиторные часы
Всего
Самостоятельная
работа
IV. Тематический расчет часов
Всего
часов
Раздел 1. Введение в BI0
1 Введение
2
0
2
2
4
1
1
2
2
4
1
1
2
2
4
1
0
1
2
3
1
2
3
20
23
6 Системы поддержки принятия решений
1
4
5
20
25
7 Современные платформы для разработки
приложений BI
1
2
3
2
5
2
2
4
10
14
2
4
6
20
26
12
16
28
80
108
Раздел 2. Оперативная аналитическая обработка данных
2 Понятие OLAP, модели данных и
архитектуры
3 Обзор современных OLAP-средств
Раздел 3. Интеллектуальный анализ данных
4 Введение в Data Mining
5 Задачи решаемые методами Data Mining
Раздел 4. Разработка приложений BI
Раздел 5. Методы и средства имитационного моделирования
8 Введение в метод имитационного
моделирования
9 Современные системы имитационного
моделирования
Всего
Авторы программы:
__________________________________________
/ П.А. Мальцев /
__________________________________________
/ Е.Б. Замятина /
7
Приложение 1
Домашнее задание для проведения текущего контроля
Студентам предлагается выполнить коллективную разработку информационноаналитической системы или системы поддержки принятия решений. Преподаватель
определяет группы студентов по 2-3 человека. Студенты каждой группы должны выбрать из
своего состава руководителя. Пред руководителем группы стоят следующие задачи:
1) Распределение обязанностей между членами группы.
2) Организация работы над проектом.
3) Отчёт преподавателю о работе группы.
Группа выбирает предметную область, для которой им хотелось бы разработать
информационно-аналитическую систему или систему поддержки принятия решений. При
этом группа сама должна найти источники данных для разрабатываемой системы. После
этого руководитель группы согласует с преподавателем выбранную предметную область и
источники данных. Если преподаватель считает выбранную предметную область и
источники достаточными для успешного выполнения задания, то группа может приступать к
выполнению задания. В противном случае группа должна устранить все замечания
преподавателя и повторно представит тему на согласование.
После согласования темы, группой разрабатывается проект, в котором описывается
функционал разрабатываемой системы и обязанности членов группы. Данный проект
руководитель каждой группы должен согласовать с преподавателем и только после
устранения всех замечаний группа может приступить к его реализации. Разрабатываемая
система должна реализовывать 2-5 регламентных отчётов, иметь средства оперативноаналитической обработки данных и реализовывать не менее 3 методов статистического либо
интеллектуального анализа данных.
Перед началом программной реализации системы, руководитель группы должен
поделить работу на несколько этапов, составить календарный план работы и представить
преподавателю. Первым пунктом календарного плана должна быть разработка схемы БД и
загрузка данных. Результат работы над каждым этапом календарного плана руководитель
группы должен представить преподавателю.
Критерии оценки
Оценка каждого участника группы складывается из оценки общей работы группы (32
балла) и оценки личного вклада каждого участника группы (8 баллов). При оценке общей
работы группы преподаватель руководствуется следующими критериями:
1) Соответствие представленной системы заявленной в проекте функциональности,
отсутствие фатальных ошибок - 12 баллов.
2) Удобность пользовательского интерфейса и адекватность выбранных средств
визуализации данных – 10 баллов
3) Корректность работы системы, отсутствие в системе не фатальных ошибок и
приемлемая производительность – 10 баллов.
Оценка личного вклада каждого участника группы выполняется руководителем, при
этом преподаватель должен получить от руководителя обоснование каждой оценки. Если
преподаватель считает, что оценка руководителя необъективна, то он может её изменить.
При оценивании каждого участника руководитель должен руководствоваться критериями:
o Качество исполнения закреплённых за участником блоков системы.
o Точность выполнения работ участником в установленные сроки.
o Личный вклад участника в общую работу группы.
Оценка личного вклада руководителя группы выполняется преподавателем на основе
тех же критериев.
8
Приложение 2
План практических занятий
Тема 1. OLAP (2 часа).
Многомерная модель данных. Использование средств MS SQL Server Analysis
Services.
Лекции по теме:
Понятие OLAP, модели данных и архитектуры (1 час).
Обзор современных OLAP-средств (1 час).
Литература по теме:
1. Ларсон Б. Разработка Бизнес-аналитики в Microsoft SQL Server 2005. – Москва:
«Питер», 2008.
2. Бергер А., Горбач И., Меломед Э., Щербин В., Степаненко В. Microsoft SQL Server
2005 Analysis Services. OLAP и многомерный анализ данных. – Санкт-Петербург:
«БХВ-Петербург», 2007.
Тема 2. Задачи решаемые методами Data Mining (2 часа).
Программная реализация алгоритмов: построения 1r-првил, Naive Bayes, ID3, C4.5,
Apriori, k-means, Fuzzy C-Means.
Лекции по теме:
Введение в Data Mining (1 час).
Задачи решаемые методами Data Mining (1 час).
Литература по теме:
1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных:
Data Mining, Visual Mining, Text Mining, OLAP. – Санкт-Петербург: «БХВ-Петербург», 2008.
Тема 3. Системы поддержки принятия решения (4 часа).
Рассмотрение основных этапов поддержки принятия решений. Выбор и использование
средств визуализации. Использование средств управления метаданными при разработке
приложений Business Intelligence.
Лекции по теме:
Системы поддержки принятия решений (1 час).
Литература по теме:
1. Ларсон Б. Разработка Бизнес-аналитики в Microsoft SQL Server 2005. – Москва:
«Питер», 2008.
2. Бергер А., Горбач И., Меломед Э., Щербин В., Степаненко В. Microsoft SQL Server
2005 Analysis Services. OLAP и многомерный анализ данных. – Санкт-Петербург:
«БХВ-Петербург», 2007.
Тема 4. Современные платформы для разработки приложений BI (2 часа)
Средства создания приложений BI Microsoft, Oracle, IBM, Business Objects,
Deductor, Prognoz.
Лекции по теме:
Современные платформы для разработки приложений BI (1 час).
Литература по теме:
1. Материалы сайта http://www.olap.ru
2. Материалы сайта http://basegroup.ru
Тема 5. Методы и средства имитационного моделирования (4 часа)
Дискретно-событийное и процессно-ориентированное моделирование.
Моделирование в среде GPSS World (Student Version).
9
Лекции по теме:
Введение в метод имитационного моделирования (2 часа).
Современные системы имитационного моделирования (2 часа).
Литература по теме:
1. Замятина Е.Б. Современные теории имитационного моделирования [Электронный
ресурс].
2. Имитационное моделирование: Методические указания по курсу «Системное и
прикладное программное обеспечение» / Перм. ун т; Сост. Л.Н. Лядова. – Пермь,
2003. – 60 с.
3. Материалы сайта http://www.gpss.ru
10
Приложение 3
1.
2.
3.
4.
5.
Вопросы для самоконтроля
Оперативная аналитическая обработка данных (OLAP).
Многомерная модель данных.
Требования к OLAP-средствам (правила Кодда, тест FASMI).
Уровни многомерности OLAP-средств. Виды OLAP (ROLAP, MOLAP, HOLAP) их
характеристика и различия.
OLAP-сервер и OLAP-клиент, варианты архитектур.
6. Представление отчётов в системах Business Intelligence.
7. Режимы обработки данных.
8. Сферы анализа.
9. Виды аналитической обработки данных.
10. Варианты создания отчётов.
11. Семантический слой.
12. Архитектуры для создания отчётов.
13. Средства создания отчётов.
14. Системы поддержки принятия решений (СППР).
15. Технологический процесс поддержки принятия решений.
16. Этапы процесса принятий решений.
17. Характеристики СППР. Типы СППР. Структура СППР.
18. Основные компоненты СППР.
19. Основные функции СППР. Примеры.
20. Data Mining. Отличия Data Mining от OLAP.
21. Методы Data Mining.
22. Задачи Data Mining (Классификация, регрессия, поиск
кластеризация).
23. Примеры практического применения Data Mining.
ассоциативных правил,
24. Сравнение методов математического моделирования: преимущества и недостатки,
применимость.
25. Основные понятия имитационного моделирования. Характеристики современных систем
имитационного моделирования, примеры моделей.
11
Download