Оценивание линейных моделей по

advertisement
Министерство экономического развития и торговли
Российской Федерации
Государственный университет Высшая школа экономики
Факультет экономики
Программа дисциплины
«Эконометрический анализ качественных и панельных данных»
для направления 080100.68 «Экономика»
подготовки бакалавра
Авторы: к.ф.-м.н., доценты
Косова Е.В. (e_kossova@mail.ru),
Ратникова Т.А. (taratnikova@yandex.ru)
Рекомендована секцией УМС
Одобрена на заседании кафедры
Математические и статистические
«Математическая экономика и
методы в экономике
эконометрика»
Зав. кафедрой
Канторович Г.Г.
« ____» ________________2008г.
Председатель
А.С. Шведов
« ____» ___________________2008г.
Утверждена УС факультета
экономики
Ученый секретарь
Протасевич Т.А.
« ____» ___________________2008г.
Москва
Пояснительная записка
Аннотация: курс "Эконометрический анализ качественных данных" включает в себя 14 часов
лекций и рассчитан на студентов 4 курса бакалавриата направлений «Математические методы в
экономике» и «Экономическое моделирование и экономическая политика».
В ходе курса рассматриваются методы исследования моделей с дискретными зависимыми
переменными и моделей анализа панельных данных, приводятся примеры их применения в
различных областях экономики и управления, дается обзор современных статистических пакетов,
используемых при оценивании подобных моделей. Так как курс состоит только из лекционных
занятий, студентам рекомендуется самостоятельно разбирать задачи, задаваемые на лекциях.
Учебная задача курса: в результате изучения курса студент должен:
- знать в каких областях применяются изученные модели и методы исследования
адекватности данных моделей;
- уметь строить и анализировать математические модели экономических явлений;
- иметь представление о моделях с ограниченными зависимыми переменными;
- обладать навыками работы со статистическими пакетами.
Методика формирования результирующей оценки :
50% итоговой оценки – оценка за раздел 1,
50% итоговой оценки – оценка за раздел 2.
Тематический план учебной дисциплины
Название темы
Всего часов по
дисциплине
Аудиторные часы
Лекции
1
2
3
4
Самостоятельная
работа
1
5
1
2
Сем. и практ.
занятия
-
10
4
3
3
Оценивание эконометрической модели
преступности
11
-
4
7
Итого
27
7
7
13
Введение
Основные понятия и простейшие методы
оценивания регрессий по панельным
данным.
Тестирование спецификации в моделях
панельных данных
3
Базовый учебник (и) или ридер (ы)
1. Ратникова Т.А. Введение в эконометрический анализ панельных данных. ЭЖ ВШЭ,
т.10, №2 - 4, 2006
2. Ратникова Т.А. Анализ панельных данных в пакете STATA . Методические указания
к компьютерному практикуму по курсу «Эконометрический анализ панельных данных».
ГУ-ВШЭ, 2005
Формы контроля:
Методика формирования результирующей оценки по разделу 1
Итоговая оценка складывается из:
оценки за письменный зачет(80 мин) - 30%;
- оценки за письменную контрольную работу (120 мин.) - 20%;
-
Содержание программы
Раздел 1. Эконометрический анализ панельных данных
1.
Введение
Преимущества использования панельных данных.
Трудности, возникающие при работе с панельными данными.
Литература:
1. Baltagi B.H., Raj B. “A Survey of Recent Theoretical Developments in the Econometrcs of
Panel Data”.
2. Heckman J.J. “Micro Data, Heterogeneity and Evaluation of Public Policy”, Nobel Lecture, J.
of Political Economy, v.109, N4, 2001
3. Dormont B. “Introduction à l’Econométrie des données de panel”, 1989.
4. Ратникова Т.А. Введение в эконометрический анализ панельных данных. ЭЖ
ВШЭ, т.10, №2, 2006
2. Основные понятия и простейшие методы оценивания регрессий по
панельным данным.
Понятие о модели однокомпонентной ошибки или модели со специфическим
индивидуальным эффектом. Спецификация модели. Детерминированный и случайный
индивидуальный
эффект. Операторы «Between» и «Within». Виды оценок.
Сравнительный анализ оценок.
Литература:
1. Ратникова Т.А. Введение в эконометрический анализ панельных данных. ЭЖ
ВШЭ, т.10, №2, 2006
2. Dormont B. “Introduction à l’Econométrie des données de panel”, 1989.
3. Baltagi B. “ Economertic Analysis of Panel Data”, 1995.
3. Тестирование спецификации в моделях панельных данных.
Критика Мундлака спецификации модели со случайным эффектом. Тест Хаусмана. Тест
на
наличие случайного
индивидуального эффекта. Тест
на
наличие
детерминированного индивидуального эффекта.
Литература:
3. Baltagi B. “ Economertic Analysis of Panel Data”, 1995.
4. Dormont B. “Introduction à l’Econométrie des données de panel”, 1989.
5. Ратникова Т.А. Введение в эконометрический анализ панельных данных. ЭЖ
ВШЭ, т.10, №2, 2006
4. Оценивание эконометрической модели преступности.
Литература:
Ратникова Т.А. Анализ панельных данных в пакете STATA . Методические указания к
компьютерному практикуму по курсу «Эконометрический анализ панельных данных».
ГУ-ВШЭ 2005
Учебно-методическое обеспечение дисциплины по разделу 1:
Базовая литература
1. Ратникова Т.А. Введение в эконометрический анализ панельных данных. ЭЖ ВШЭ,
т.10, №2 - 4, 2006
2. Ратникова Т.А. Анализ панельных данных в пакете STATA . Методические указания к
компьютерному практикуму по курсу «Эконометрический анализ панельных данных». ГУВШЭ, 2005
Основная
3. Dormont B. “Introduction à l’Econométrie des données de panel”, 1989
4. Baltagi B. “ Economertic Analysis of Panel Data”, 1995.
Дополнительная
5. Baltagi B.H., Raj B. “A Survey of Recent Theoretical Developments in the Econometrcs of Panel
Data”.
6. Heckman J.J. “Micro Data, Heterogeneity and Evaluation of Public Policy”, Nobel Lecture, J. of
Political Economy, v.109, N4, 2001
Тематика заданий по формам текущего контроля
Образец варианта контрольной работы.
Компьютерное задание по разделу 1
Оценивание линейных моделей по панельным данным.
Предлагаемые данные представляют собой результаты 5-ой, 7-ой, 8-ой и 9-ой волн
обследования РМЭЗ (Российского мониторинга экономического положения и здоровья
населения), охватывающие период с 1994 г. по 2000 г. В опросе приняло участие свыше
10000 человек.
Информация, собранная в РМЭЗ, касается размеров, источников и структуры
доходов и расходов домохозяйств и индивидуумов, занятости, распределения времени,
уровня образования, состояния здоровья и других характеристик (свыше 500
переменных).
Используя данные предъявленных выборок, необходимо выполнить приведенные
ниже упражнения. Выборки построены по региональному принципу:
Описание переменных.
Тип переменной обозначен С для непрерывных, D для фиктивных (dummy)
переменных и никак не обозначен для переменных промежуточного типа.
idind – индивидуальный номер респондента, сохраняемый за ним на протяжении
всего периода наблюдения;
aid_i - индивидуальный номер респондента в 1994 году;
cid_i - индивидуальный номер респондента в 1996 году;
did_i - индивидуальный номер респондента в 1998 году;
eid_i - индивидуальный номер респондента в 2000 году;
year –год;
sex (D)– пол, 1 если респондент – женщина;
age (C)– возраст;
age2 (C)– возраст в квадрате;
education – образование, 1 – начальное, …, 7 – аспирантура.
stagna – стаж работы на данном предприятии: 1 – менее года; 2 – от 1 года до 2-х
лет, 3 – до 3-х лет, 4 – до 5-ти лет, 5 – до 10-ти лет, 6 – свыше 10-ти лет;
settlement (D) – место жительства: 1 – город, 0 – село;
psu – код региона проживания;
isco_1 (D) – управляющие;
isco_2 (D) – специалисты с высшим образованием, творческие и научные
работники;
isco_3 (D) – технический персонал;
isco_4 (D) – конторские служащие;
isco_5 (D) – работники сферы услуг и торговли;
isco_6 (D) – ориентированные на рынок работники сельского хозяйства;
isco_7 (D) - квалифицированные рабочие;
isco_8 (D) – водители и операторы;
isco_9 (D) – неквалифицированные рабочие;
logrealwage (C)– логарифм реальной заработной платы, полученной за последние
30 дней до момента обследования;
debt (D) – наличие долга по заработной плате;
d94 (D) – фиктивная переменная для 1994 года;
d96 (D) – фиктивная переменная для 1996 года;
d98 (D) – фиктивная переменная для 1998 года;
d00 (D) – фиктивная переменная для 2000 года;
mic_unempp (C)– вероятность потери работы для респондента с данными полом,
возрастом и образованием в данном регионе;
subord (D)- наличие подчиненных
secondjob (D)- наличие второй работы;
workhour (C)- количество часов, проработанных на основном рабочем месте за
последние 30 дней;
satisfied – степень удовлетворенности жизнью: 1 – полная удовлетворенность, …,
5 – полная неудовлетворенность.
Оценивание отдачи от человеческого капитала
в условиях переходного периода.
Вам предлагается оценить уравнение Минцера, взяв в качестве зависимой
переменной logrealwage – логарифм реальной заработной платы респондентов,
полученной за месяц, предшествующий опросу, на основном месте работы, и
продефлированной с помощью индекса потребительских цен.
Выбор независимых переменных и обоснование этого выбора – ваша
самостоятельная задача.
Вам необходимо оценить три модели:
 сквозную регрессионную модель,
 модель со случайными индивидуальными эффектами и
 модель с детерминированными индивидуальными эффектами.
Затем с помощью соответствующих тестов необходимо будет выбрать наиболее
адекватную модель и дать ее экономическую интерпретацию.
Вопросы для оценки качества освоения дисциплины по разделу 1:
Теоретическая часть.
B  B  B 2 .
 
 uW uW

2
Доказать, что E 
   .
 NT  N  K 




Вычислить V (  (  )) , если b (  )   bW  ( E   ) bB .
Доказать, что:
1.
2.
3.
( K ,1)
( K ,K )


Показать, что в модели Мундлака bM  bW ,
4.
( K ,K )



 M  bB  bW .
Практическая часть.
Оценивается функция издержек для 6 фирм, наблюдавшихся на протяжении 4 лет:
Yit     X it   it , где Yit  ln Cit , X it  ln Qit , Cit -издержки i-ой фирмы в момент t,
Qit – выпуск i-ой фирмы в момент t.
1.
Как следует преобразовать эту модель, чтобы провести “between”–
оценивание? (Привести покомпонентную запись преобразованной модели).
2.
МНК- оценивание сквозной регрессии дает результат:
Yit   4,175  0,8894 X it ,

R 2  0,9707,  2  0,0461
МНК – оценка регрессии с dummy-переменными, где
1, если наблюдение относится к i  ой фирме
:
0,
если иначе
Yit   2,6035 D1  2,9117 D2  2,440 D3  2,1345 D4  2,3108 D5  1,9035 D6  0,6613 X it
Di  
2
2
R  0,99,    0,0155
Можно ли считать, что сквозная регрессия адекватно описывает данные в такой ситуации?
(Ответ обосновать приведением соответствующего теста).
3.
В следующей таблице приведены оценки коэффициента наклона и оценки
стандартных ошибок оценок коэффициентов, полученные разными способами:
МНК
B
W
GLS

0,8894
0,9674
…
0,6023

 
 ( )
0,0350
0,1556
0,0734
0,0659
Можно ли на основании данных, приведенных в условии, восстановить пропущенное
значение?
4.
Есть ли основания считать, что в модели присутствует случайный
' 
 
индивидуальный эффект, если u w u w =0,26406,
u B u B =0,13502?
5.
Можно ли на основании уже проведенного вами анализа выбрать
верную спецификацию модели?
Какой тест вы бы провели, чтобы окончательно
убедиться в своей правоте? Проведите этот тест, пользуясь данными пункта 3.
Раздел 2. Эконометрический анализ качественных данных
Тематический план учебной дисциплины
Название темы
Всего часов по
дисциплине
Аудиторные часы
Лекции
1
2
3
4
Модели бинарного выбора
Система уравнений бинарного выбора с
коррелированными ошибками
Оценивание
вероятности
по
сгруппированным данным.
12
4
3
1
4
Модели множественного выбора
7
27
Итого
Сем. и практ.
занятия
3
Самостоятельная
работа
1
6
2
1
1
2
2
7
2
7
3
13
Базовый учебник (и) или ридер (ы)
Green (2003), Econometric Analysis, -- Pearson Prentice Hall, ch. 23, p. 772-793.
Формы контроля:
Методика формирования результирующей оценки по разделу 2
Итоговая оценка складывается из:
оценки за письменный зачет(80 мин) - 30%;
- оценки за письменную контрольную работу (120 мин.) - 20%;
Содержание программы
Тема 1. Модели бинарного выбора.
1.1 Линейная вероятностная модель (недостатки и преимущества).
1.2 Probit подход к оцениванию моделей бинарного выбора. Интерпретация
латентной переменной.
1.3 Метод максимального правдоподобия. Асимптотические свойства оценок
максимального правдоподобия. Особенности оценивания моделей
бинарного выбора.
1.4 Probit и Llogit модели. Проверка общей линейной гипотезы (о выполнении
линейных ограничений на коэффициенты): тест множителей Лагранжа,
Wald – тест, тест отношения правдоподобия. Проверка гипотез об
адекватности модели и значимости переменных.
1.5 Оценивание влияния независимых переменных на вероятность:
предельные эффекты.
1.6 Критерии качества модели. Сравнение моделей и выбор наилучшей.
1.7 Прогнозирование в бинарных моделях. Выбор порога прогнозирования.
Сравнение прогнозной силы моделей с наивным прогнозом.
1.8 Ошибки спецификации: последствия гетероскедастичности и
недоопределенности модели.
Литература:
Основная
Green (2003), Econometric Analysis, -- Pearson Prentice Hall, ch. 23, p. 772-793.
Дополнительная:
G.S. Maddala (1987), Limited-dependent and qualitative variables in econometrics,
Cambrudge university press.
Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс.
М.: Дело, 2004.
Тема 2. Система уравнений бинарного выбора с коррелированными ошибками.
2.1 Оценивание системы уравнений бинарного выбора с помощью метода
максимального правдоподобия.
2.2 Проверка гипотезы о наличии корреляции случайных ошибок.
2.3 Влияние независимых переменных на вероятность: совместные, частные и
условные предельные эффекты.
Литература:
Основная
1. Конспекты лекций
2. G reen (2003), Econometric Analysis, -- Pearson Prentice Hall, ch. 23, p. 817831.
Дополнительная:
G.S. Maddala (1987), Limited-dependent and qualitative variables in econometrics,
-- Cambrudge university press.
Тема 3. Оценивание вероятности по сгруппированным данным.
3.1 Понятие о группировке данных.
3.2 Линейная вероятностная модель. Сравнение со случаем индивидуальных
данных.
3.3 Аналог Probit и Logit моделей и другие функциональные формы
зависимости вероятности от объясняющих факторов.
Основная
Конспекты лекций
Дополнительная:
G.S. Maddala (1987), Limited-dependent and qualitative variables in econometrics,
-- Cambrudge university press.
Тема 4. Модели множественного выбора.
4.1 Порядковые (ordered) модели. Латентная переменная и ее интерпретация.
Определение направления и степени влияния независимых переменных на
вероятность принадлежности к заданной категории.
4.2 Модели последовательных значений.
4.3 Множественная Logit-модель Мак Фаддена.
4.3.1 Выбор индивидом состояния, соответствующего
альтернативе, имеющей максимальную полезность.
4.3.2 Предположение о независимости альтернатив.
4.3.3 Функция правдоподобия для модели множественного
выбора.
4.3.4 Связь логистической модели множественного выбора и
бинарных logit-моделей выбора одной из двух альтернатив.
Литература:
Основная
Green (2003), Econometric Analysis, -- Pearson Prentice Hall, ch. 23, p. 831-852.
Дополнительная:
G.S. Maddala (1987), Limited-dependent and qualitative variables in econometrics,
Cambrudge university press.
Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс.
М.: Дело, 2004.
Задания текущоконтроля по разделу 2.
1. Докажите, что сумма по всем наблюдениям предсказанных по
логистической модели вероятностей совпадает с наблюдаемым
количеством «успехов».
2. Вычислите значение максимума логарифмической функции
правдоподобия наивной модели.
3. Опишите процедуру оценивания вероятности события по
сгруппированным данным в предположении, что логарифм вероятности
является линейной комбинацией объясняющих переменных.
4. Выпишите функцию правдоподобия двумерной бинарной модели.
5. Покажите, что модель множественного выбора Мак Фадена может быть
оценена с помощью вложенных logit моделей.
Вопросы для оценки качества освоения дисциплины по
разделу 2:
1. По прилагающимся данным оценить уравнение участия с помощью logit и
probit модели.
2. Выбрать наилучшую модель (выбор обосновать).
3. Вычислить предельные эффекты по объясняющим переменным.
4. Сравнить оцененную модель с прогнозной по предсказательной силе.
5. Построить прогноз для указанных значений объясняющих переменных.
Автор программы:
Автор программы:
Коссова Е.В.
Ратникова Т.А.
Download