М и н с

advertisement
Министерство экономического развития и торговли
Российской Федерации
Государственный университет Высшая школа экономики
Факультет Социологии
Программа дисциплины
Анализ социологических данных-2
Для направления 040200.62 "Социология"
(подготовки бакалавра)
Для специальности 040200.65 "Социология"
(подготовки специалиста)
Авторы
Ермолаев А.В., Назаров Б. В., Мальцев В. Е.
Рекомендована секцией УМС
______________________________
Председатель
______________________________
«_____» __________________ 200 г.
Одобрена на заседании кафедры
Методов сбора и анализа социологической
информации
Зав. кафедрой
д.с.н., проф. Толстова Ю.Н.
«_____» __________________ 200 г.
Утверждена УС
факультета Социологии
Ученый секретарь
______________________________
«_____» __________________ 200 г.
Москва
1
Часть1 - Методы анализа данных о близости
Тематический план учебной дисциплины
№
Название темы
Всего часов по
дисциплине
Аудиторные часы
Лекции
Самостоятельная
работа
1.
Данные о близости
12
3
Сем. и практ.
занятия
3
2.
8
2
2
4
3.
Общий обзор методов анализа данных о
близости
Методы многомерного шкалирования
24
6
6
12
4.
Теоретико-множественные модели
16
4
4
8
5.
Методы классификации
24
6
6
12
6.
Теоретико-графовые модели
16
4
4
8
100
25
25
50
Итого:
6
----------------------------------------------------------------------------------------------------------------------------- ----------------------------
Базовый учебник (и) или ридер (ы)
1. Corter J.E. Tree models of similarity and association. Sage Publications, 1996
2. Klauer K.C., Carroll J.D. Assessing Cognitive Structure by Means of Network Models/ European
Journal of Psychological Assessment, 10, 177-191
3. Толстова, Ю. Н. Основы многомерного шкалирования. М.: Книжный дом "Университет", 2006
4. Многомерное шкалирование. Сборник статей. М.: ГУ-ВШЭ, 2001
----------------------------------------------------------------------------------------------------------------------------- ----------------------------
Формы контроля:
Итоговая оценка по учебной дисциплине складывается из следующих элементов:
Домашнее эссе (3-4 тыс. слов)
Письменный экзамен (120 мин.)
---------------------------------------------------------------------------------------------------------------------------------------------------------
Содержание программы
ТЕМА 1. ДАННЫЕ О БЛИЗОСТИ
Отношения близости. Теория данных. Формат данных, уровень измерения, модель.
Оптимальное шкалирование. Методы сбора данных о близости: прямые оценки,
агрегированные данные.
ТЕМА 2. ОБЗОР МЕТОДОВ АНАЛИЗА ДАННЫХ О БЛИЗОСТИ
2
Задачи, решаемые с помощью методов анализа данных о близости: выявление латентных
признаков, снижение размерности исходных данных, визуализация данных. Формат
данных: одна или несколько матриц близости, квадратная или прямоугольная матрица
близости. Базовые модельные предположения: механизм агрегирования, тип латентных
признаков, уровень измерения, ошибка измерения. Алгоритмы поиска решения. Способы
визуализации структуры данных.
ТЕМА 3. МОДЕЛИ МНОГОМЕРНОГО ШКАЛИРОВАНИЯ
Тема 3.1. Модель многомерного шкалирования для анализа одной матрицы близости
Классическое МШ. Проблема аддитивной константы. Метрическое и неметрическое МШ.
Функция STRESS. Общая схема алгоритма МШ. Монотонная регрессия: «мягкая» и
«жесткая» монотонность, подходы к связкам в данных. Выбор метрики. Оценка качества
модели. Проблема локального минимума. Вырожденные решения. Подходы к
определению размерности пространства.
Тема 3.2. Интерпретация результатов
Структура данных и содержательная интерпретация. Интерпретация осей. «Объективные»
повороты осей: метод главных компонент, приведение конфигурации к «простой
структуре». «Ручные» повороты осей. Привлечение дополнительной информации:
множественная регрессия. Пространственная интерпретация. МШ и фацетная теория.
Тема 3.3. Обобщения модели многомерного шкалирования для анализа нескольких матриц
близости
Различные стратегии анализа нескольких матриц близости. Модель МШ с повторениями.
Модель МШ с индивидуальными различиями: общее пространство, индивидуальные веса.
Обобщенная модель взвешенного МШ. Сравнение конфигурация. «Прокрустово» МШ.
Тема 3.4. Обобщения модели многомерного шкалирования для анализа прямоугольных
матриц близости
Модели предпочтений. Внешнее и внутреннее развертывание. Векторная модель, модель
«идеальной точки». Проблема вырожденных решений. Взвешенные модели многомерного
развертывания.
Тема
3.5. Программы
шкалирования
для
анализа
данных
о
близости
методами
многомерного
Реализация методов МШ в статистическом пакете SPSS: ALSCAL, PROXSCAL. Пакет
MDS(X).
ТЕМА 4. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ МОДЕЛИ
Критика модели МШ. Модель совпадения черт Тверски: контрастная модель и модель
отношений. Дискретные характеристики как классы объектов. Дискретные и непрерывные
признаки. Типы структур дискретные признаков: простое разбиение, иерархия, решетка.
3
ТЕМА 5. МЕТОДЫ КЛАССИФИКАЦИИ
Тема 5.1. Иерархический кластерный анализ
Классификация как модель данных о близости. Иерархический кластерный анализ.
Определение расстояния между кластерами: метод ближнего соседа, метод дальнего
соседа, центроидный метод. Критерии качества разбиения. Определение оптимального
количества кластеров. Дендрограмма как средство визуализации структуры данных о
близости.
Тема 5.2. Аддитивная классификация
Модель аддитивной классификации. Аддитивная классификация как частный случай
модели совпадения черт Тверски. Определение оптимального числа кластеров. Проблема
устойчивости решения. Инвариантность кластерной структуры. Обобщения модели
аддитивной классификации для нескольких матриц близости и прямоугольной матрице
близости.
ТЕМА 6. ТЕОРЕТИКО-ГРАФОВЫЕ МОДЕЛИ
Тема 6.1. Деревья
Деревья. Минимальное остовное дерево. Ультраметрическое неравенство. Модель
ультраметрического дерева и иерархический кластерный анализ. Аддитивное неравенство.
Аддитивное дерево как обобщение ультраметрического дерева. Особенности
интерпретации аддитивного дерева. Интерпретация дерева с точки зрения модели черт
Тверски. Модели деревьев для анализа нескольких матриц близости, прямоугольных
матриц близости. Расширенная модель аддитивного дерева. Аддитивное дерево с
пересечениями.
Тема 6.4. Сетевые модели
Пороговые графы. Сетевые модели для анализа одной матрицы близости. Необходимые
условия существования ребра графа. Сетевые модели анализа одной матрицы близости.
Обобщения модели для анализа нескольких матриц близости.
ЛИТЕРАТУРА
Основная литература
1. Arabie P., Carroll J.D., DeSabro W.S. Three-way scaling and clustering// Quantitative applications in
the social sciences №65. Newbury park, California: SAGE Publications, 1987
2. Corter J.E. Tree models of similarity and association. Sage Publications, 1996
3. Coxon A.P.M. The user’s guide to multidimensional scaling. London: Heinemann Educational Books
Ltd, 1987 (http://www.newmdsx.com)
4. Jacoby W.G. Data theory and dimensional asnalysis// Quantitative applications in the social sciences
№78. Newbury park, California: SAGE Publications, 1991
5. Klauer K.C., Carroll J.D. Assessing Cognitive Structure by Means of Network Models/ European
Journal of Psychological Assessment, 10, 177-191
6. Kruskal J.B., Wish M. Multidimensional scaling// Quantitative applications in the social sciences
№11. Newbury park, California: SAGE Publications, 1978
4
7. Интерпретация и анализ данных в социологических исследованиях. М.: «Наука», 1987 //
Многомерное шкалирование. Сборник статей. М.: ГУ-ВШЭ, 2001
8. Клигер С.А., Косолапов М.С., Толстова Ю.Н. Шкалирование при сборе и анализе
социологической информации. М.: «Наука», 1978 // Многомерное шкалирование. Сборник
статей. М.: ГУ-ВШЭ, 2001
9. Толстова Ю.Н. Теория измерения. М.: Инфра-М, 1998
10. Толстова, Ю. Н. Основы многомерного шкалирования. М.: Книжный дом "Университет", 2006
Дополнительная литература
1. Borg I., Groenen P. Modern multidimensional scaling. Theory and applications. New York: Springer,
1997
2. Cox T.F., Cox M.A.A. Multidimensional scaling. Boca Raton: Cappman&Hall/CRC, 2001
3. Young F.W. Multidimensional scaling: history, theory, and applications. Hillsdale, N.J.: L. Erlbaum
Associates, 1987
4. Дэйвисон М. Многомерное шкалирование. Методы наглядного представления данных. М.:
Финансы и статистика, 1982
5. Терехина А.Ю. Анализ данных методами многомерного шкалирования. М.: Наука, 1986
6. Barthelemy J.-P., Guenoche A. Trees and proximity representations. N.-Y.: John Wiley & Sons, 1991
7. Gordon A.D. Classification. N.-Y.: Chapman&Hall/CRC, 1999
8. Ермолаев А.В. Методы анализа и визуализации структуры данных о близости//Социология:
методология, методы, математические модели, №21, 2002
-------------------------------------------------------------------------------------------------------------------------------- -------------------------
Тематика заданий по различным формам текущего контроля:
Примерные вопросы для письменных работ даются общим списком и содержат не менее
одного вопроса на каждую тему.



Сбор и анализ данных о близости
Сравнение различных методов сбора данных о близости
Сравнение различных методов анализа данных о близости
---------------------------------------------------------------------------------------------------------------------------------------------------------
Вопросы для оценки качества освоения дисциплины














Данные о близости и их основные характеристики
Методы сбора данных о близости
Основные предположения модели, лежащей в основе метода многомерного шкалирования
Метрическое и неметрическое многомерное шкалирование
Базовый алгоритм оценки параметров модели многомерного шкалирования
Общие принципы и алгоритм монотонной регрессии
Оценка качества модели многомерного шкалирования
Подходы к определению оптимальной размерности пространства
Основные подходы к интерпретация результатов многомерного шкалирования
Анализ нескольких матриц близости с помощью метода многомерного шкалирования
Модели многомерного шкалирования для анализа данных о предпочтениях
Модели черт Тверски
Иерархический кластерный анализ
Модель аддитивной классификации
5
 Репрезентация структуры данных о близости с помощью моделей деревьев
 Сетевые модели данных о близости
---------------------------------------------------------------------------------------------------------------------------------------------------------
Автор программы: _____________________________/ Ф.И.О./
Подпись обязательна
6
Часть 2 - Ковариационные
структурные модели
ТРЕБОВАНИЯ К СТУДЕНТАМ И ОЦЕНКА ЗНАНИЙ
Описание курса:
Курс «Ковариационные структурные модели» рассчитан на 32 академических часа для студентов 4-го курса
факультета социологии специализации «Прикладные методы социологических исследований». Курс разработан для
того, чтобы дать студентам теоретическую и практическую подготовку для применения метода моделирования
структурными ковариационными уравнениями в социологических исследованиях. Предполагается знание студентами
основ статистики, теории вероятностей, линейной алгебры, а также статистических моделей, излагаемых в рамках
курса «Анализ Данных – 1» ГУ-ВШЭ.
Цели курса:
Основная цель курса – дать студентам полноценное понимание принципов построения структурных
ковариационных моделей, показать их достоинства и возможности. Курс уделяет особое внимание прикладным
проблемам применения преподаваемой методологии, специфичным для социологии. Курс призван собрать воедино
преподаваемые на младших курсах ковариационные модели в единую теоретическую базу.
Методы:
В курсе используются следующие методы и формы занятий: семинары, эссе, контрольные работы, домашние
задания, консультации преподавателей, самоподготовка.
Принципы оценки работы студентов:
Проверка знаний студентов и выставление итоговой оценки происходит следующим образом: эссе оценивается по
10-балльной системе (30% оценки; эссе представляет собой самостоятельную прикладную работу студента,
демонстрирующую умение моделировать ковариационными структурными уравнениями), 3 контрольные работы по
10-балльной системе (0%, 10% и 30% итоговой оценки), 6 домашних заданий по 10-балльной системе (5% итоговой
оценки каждая; на выполнение каждого домашнего задания даётся одна календарная неделя).
Набравшие не менее 51% получают зачёт.
СОДЕРЖАНИЕ КУРСА
№
Тема
Всего часов
по
дисциплине
Лекции
1
Теория моментов случайных величин.
Ковариация,
корреляция.
Частный
коэффициент
корреляции.
Основные
2
10
7
Самостоятел
ьная работа
Аудиторные
часы
Сем. и практ.
занятия
2
6
свойства.
2
Определения причины. Соотнесение
причины и мер оценки взаимозависимостей.
Направленные
ацикличные
графы.
Экзогенные и эндогенные переменные.
Основные свойства направленных графов,
базовые
теоремы.
Эквивалентность
ацикличных
направленных
графов
и
уравнений. Условная независимость.
9
2
2
5
3
Ковариационная структура. Путевой
коэффициент.
Классическая
регрессия.
Сложные
структуры.
Опосредованное
воздействие.
12
3
3
6
4
Латентные переменные. Двухуровневая
теория измерения. Разведывательный и
подтверждающий факторные составляющие
структурной модели. Трёхуровневая теория
измерения. Валидность и надёжность в
структурной модели.
11
3
3
5
5
Идентификация структурной модели.
Правила
нахождения
возможности
идентифицировать
произвольную
структурную
модель.
Переопределение
модели. Ошибки структурной модели.
Зависимость ошибок.
18
4
4
10
6
Оценка параметров структурной модели.
Условия состоятельности, эффективности и
несмещённости. Смещение оценивания МНК
произвольной
структурной
модели.
Двухступенчатый МНК. МНП. Оценки
согласия модели. Оценки, основанные на
Хи-квадрат, информационные критерии.
Возможности по отвержению и выбору
модели.
12
3
3
6
7
Нарушение базовых предположений
классической методологии моделирования
структурными
ковариационными
уравнениями. Моделирование случайных
величин,
распределение
которых
значительно отличается от нормального.
Общие наименьшие квадраты.
8
2
2
4
8
Работа с неколичественными данными.
Возможности нахождения корреляционной
матрицы. Особенности моделирования на
неколичественных данных.
14
3
3
8
9
Особенности генеральной и выборочной
совокупностей.
Многоуровневые
структурные
ковариационные
модели.
Многоуровневый факторный анализ.
10
2
2
6
10
Цикличные
графы.
Преобразование
графов.
Нерекурсивные
структурные
уравнения.
Оценка
параметров
нерекурсивной модели.
12
2
2
8
8
Контрольные работы:
Всего:
26
64
26
64
© Б. В. Назаров, В. Е. Мальцев
Автор программы:_____________________________/ Ермолаев А.В./
Автор программы: _____________________________/ Назаров Б. В./
Автор программы: _____________________________/ Мальцев В. Е. /
9
Related documents
Download