Кластерный анализ Буянова Мария Фаттахова Вероника Чиркин Кирилл

advertisement
Кластерный анализ
Буянова Мария
Фаттахова Вероника
Чиркин Кирилл
Высшая школа экономики, Москва, 2013
www.hse.ru
Понятие и цели кластерного анализа
Термин «кластерный анализ» - Р. Трион, 1939
фото
«The cluster» - группа, пучок, куст, объединение каких-то
однородных явлений.
Основная
цель: классификация = типологическая
фото
группировка данных на основе множества признаков
Высшая школа экономики, Москва, 2013
2
Цели кластеризации
• Понимание данных
• Сжатие данных
• Обнаружение
новизны
фото
Высшая школа экономики, Москва, 2013
3
Задачи кластерного анализа
• Разработка типологии или классификации
• Построение новых классификаций для
слабоизученных
явлений
фото
• Проверка гипотез
Высшая школа экономики, Москва, 2013
4
Этапы кластерного анализа
• Отбор выборки для кластеризации
• Определение множества переменных
• Вычисление значений той или иной меры
сходства между объектами
фото
• Применение метода кластерного анализа
• Проверка достоверности результатов
Высшая школа экономики, Москва, 2013
5
Методы кластерного анализа
• Иерархические
• Неиерархические (итеративные)
фото
Высшая школа экономики, Москва, 2013
6
Иерархические методы
фото
Высшая школа экономики, Москва, 2013
7
Итеративные методы. Метод K-средних
фото
Исходные точки и
случайно
выбранные
начальные точки
Высшая школа экономики, Москва, 2013
Точки, отнесённые к
начальным
центрам. Разбиение
на плоскости
Вычисление
новых центров
кластеров
Предыдущие шаги
повторяются, пока
алгоритм не
сойдётся.
8
Практическое применение
Риск
фото
Доходность
Высшая школа экономики, Москва, 2013
9
Пример использования кластерного анализа
в исследовании
Исследование взаимодействия в виртуальных командах*
Выборка:
• 175 студентов MBA из США и Японии, разделённые на 35
виртуальных команд
Суть исследования:
фото
• Решение кейса в условиях коммуникации через интернетпортал
*Massey A. P., Montoya-Weiss M. M., Hung Y. Because Time Matters: Temporal Coordination in
Global Virtual Project Teams
Высшая школа экономики, Москва, 2013
10
Пример использования кластерного анализа
в исследовании
Переменные для кластеризации.
Относительное время взаимодействия, затраченное на:
• Высказывание своих мыслей
• Оценка собеседников
• Общение
фото на темы, не связанные с заданием
• Направление процесса деятельности
Высшая школа экономики, Москва, 2013
11
Пример использования кластерного анализа
в исследовании
Высказывание своих мыслей
Оценка собеседников
Общение на другие темы
Направление процесса
0.12
0.08
0.13
0.19
0.29
0.39
0.24
0.17
0.3
0.16
фото0.74
0.23
0.62
0.43
0.22
0.11
0.07
1
Высшая школа экономики, Москва, 2013
0.36
0.16
0.01
2
3
4
5
12
Back-up
Пример использования кластерного анализа
в исследовании
Кластер
Высказывание
своих мыслей
Оценка
собеседников
Общение на
другие темы
Направление
процесса
Размер
кластера
1
0.07
0.74
0.08
0.12
6
55,83
2
0.22
0.23
0.16
0.39
5
29,4
3
0.01
фото
0.62
0.24
0.13
7
56,57
4
0.11
0.43
0.17
0.29
12
18,75
5
0.16
0.36
0.30
0.19
5
10,6
Высшая школа экономики, Москва, 2013
Индекс
эффективности
15
Download