Эконометрика Основные понятия. Статистические показатели Грибанова Екатерина Борисовна,

advertisement
Эконометрика
Основные понятия.
Статистические показатели
Грибанова Екатерина Борисовна,
к.т.н., доцент каф.АСУ
ЧТО ТАКОЕ МОДЕЛЬ?
Модель - это абстракция объекта реального мира, созданная для того, чтобы
получить информацию об этом объекте.
продавец
аукционист
покупатель
управляющий управляющий
продавца
покупателя
Математическая модель - это абстракция
реального мира, в которой интересующие
исследователя
отношения
между
реальными
элементами
заменены
подходящими
отношениями
между
математическими категориями.
Уровень
запаса
Начальный
уровень
Объем партии
хозяин рынка
Модель – это
упрощенное,
идеализированное
представление
процессов
реального мира.
Точки
заказа
Время
Интервал Время
Доставка
между
доставки
заявками
Переменные модели
Переменную, процесс формирования значений которой нас по
каким-то причинам интересует, будем обозначать Y и называть
зависимой или объясняемой (эндогенной). Эту переменную нельзя
изменять по желанию исследователя.
Переменные, которые, как мы предполагаем, оказывают влияние на
переменную Y, будем обозначать Xj и называть независимыми или
объясняющими (экзогенными). Эту переменную можно изменять.
другие переменные
Цена
X1
Доход потребителей
X2
…
Y Спрос
Цены на конкурирующие Xk
товары
случайный фактор
Сбор данных
cross-sectional data – пространственные данные –
набор сведений по разным экономическим объектам в
один и тот же момент времени.
time-series data – временные ряды – наблюдение
одного экономического параметра в разные периоды
или моменты времени. Эти данные естественным
образом упорядочены во времени.
panel data – панельные данные – набор сведений по
разным экономическим объектам за несколько
периодов времени (данные переписи населения).
•
•
•
•
Описание
Порядок
Расстояние
Начальная точка
Виды шкал
Шкала
Особенности
Пример
1. Номинальная
Содержит только
категории, данные не
могут упорядочиваться
Хобби
2. Порядковая
Категории могут
упорядочиваться, но
разности не имеют
смысла
Место на соревнованиях
3. Интервальная
Разности могут быть
вычислены, но нет
отношений
Температура
4. Относительная
Имеется точка отсчета,
возможны отношения
между значениями
Рост
5. Дихотомическая
Содержит две категории
Пол
Какой тип шкалы?
• Возраст человека
• Семейное положение
• Место в рейтинге предприятий
Статистические показатели
Математическое ожидание
Суммарное значение
МО 
Число единиц
Сделка
Количество проданных
акций, шт.
1
5
2
3
3
1
МО-?
Статистические показатели
Математическое ожидание
Номер
Число
посещений
спорт зала
1
5
2
2
3
7
4
6
5
3
6
4
7
8
Статистические показатели
Дисперсия

2
(x  x)


2
i
n
Сделка
Количество проданных
акций, шт.
1
5
2
3
3
1
 2 ?
Среднее квадратическое отклонение:
 
2
Дисперсия
Статистические показатели
Корреляция
Примеры
1. Менеджер интересуется, зависит ли объем продаж в этом
месяце от объема рекламы в этом же периоде?
2. Врач исследует, влияет ли кофеин на сердечные болезни
и существует ли связь между возрастом человека и его
кровяным давлением?
3. Социолог исследует, какова связь между уровнем
преступности и уровнем безработицы в регионе? Связаны
ли доход от профессиональной деятельности и
продолжительность образования?
Статистические показатели
Schwen по данным 1897-1958 гг обнаружил
корреляционную связь между логарифмом
номинального дохода США и логарифмом
числа пятен на солнце
коэф-т корреляции 0.91
Статистические показатели
Корреляция
Цель – научиться отвечать на четыре вопроса:
Вопрос 1. Существует ли связь между двумя
или более переменными?
Вопрос 2. Какой тип имеет эта связь?
Вопрос 3. Насколько она сильна?
Простая и множественная
связь
Простая связь означает
наличие двух переменных
Множественная связь означает наличие
нескольких переменных
Стаж менеджера по
продажам
Годовой объем
продаж
Успеваемость студента
Успеваемость
в школе
Время на
занятия
Способности
Статистические показатели
Корреляция
Зависимость
Детерминированная (функциональная)
X - Количество проданного товара
Y - Выручка
Стохастическая
X – Продолжительность рабочего дня
Y – Число проданных товаров
График рассеяния
Даны две переменные: «продолжительность занятий»
студентов перед экзаменом и «итоговая оценка» (из
100 балов).
Положительная и
отрицательная зависимость
Визуально видно, что имеет место линейная зависимость, которая
отрицательна. Это означает, что увеличение переменной x приводит к
уменьшению второй переменной y.
Отсутствие зависимости
График показывает отсутствие зависимости времени на подготовку к
экзамену и количества вопросов, заданных преподавателем на экзамене.
Корреляция
Коэффициент корреляции измеряет силу и направление связи между
двумя переменными.
n
r
  xi  x  yi  y 
i 1
n
  xi  x 
i 1
2
n
  yi  y 
2
i 1
 n  n 
n xi yi    xi 
  yi 
i 1
 i 1  i 1 
r
2  n
n
n


 n
2
2
n xi    xi   n yi    yi
i 1
 i 1   i 1
 i 1
n



2



Значения коэффициента
корреляции
Коэффициент корреляции изменяется на отрезке от –1 до +1. Если между переменными
существует сильная положительная связь, то значение r будет близко к +1. Если между
переменными существует сильная отрицательная связь, то значение r будет близко к –1.
Когда между переменными нет линейной связи или она очень слабая, значение r будет
близко к 0.
Интерпретация коэффициента
корреляции
Значение r Уровень связи между переменными
0,75 – 1.00 Очень высокая положительная
0,50 – 0.74 Высокая положительная
0,25 – 0.49 Средняя положительная
0,00 – 0.24 Слабая положительная
0,00 – -0.24 Слабая отрицательная
-0,25 – -0.49 Средняя отрицательная
-0,50 – -0.74 Высокая отрицательная
-0,75 – -1.00 Очень высокая отрицательная
Пример вычисления
Студент
Часы
Балл за
изучения
экзамен
Иванов А.А.
3
86
Петров А.В.
5
95
Сидоров С.С.
4
92
Ермаков А.Д.
4
83
Нагайцева Е.И.
2
78
Минина К.С.
3
82
Пример вычисления
Студент
Часы
Балл за
изучения, x экзамен, y
xy
x
2
y2
Иванов А.А.
3
86
258
9
7396
Петров А.В.
5
95
475
25
9025
Сидоров С.С.
4
92
368
16
8464
Ермаков А.Д.
4
83
332
16
6889
Нагайцева Е.И.
2
78
156
4
6084
Минина К.С.
3
82
246
9
6724
21
516
1835
79
44582

 n  n 
n xi yi    xi 
  yi 
i 1
 i 1  i 1 
r
2  n
n
n


 n
2
2
n xi    xi   n yi    yi
i 1
 i 1   i 1
 i 1
n



2



Пример вычисления
Студент
Часы
Балл за
изучения, x экзамен, y
xy
x
2
y2
Иванов А.А.
3
86
258
9
7396
Петров А.В.
5
95
475
25
9025
Сидоров С.С.
4
92
368
16
8464
Ермаков А.Д.
4
83
332
16
6889
Нагайцева Е.И.
2
78
156
4
6084
Минина К.С.
3
82
246
9
6724
21
516
1835
79
44582

r
6 1835  21  516
6  79  212 6  44582  5162
 0,862
Порядковые переменные
Порядковая шкала означает, что категории могут быть
упорядочены по возрастанию.
Пример. Отметки по математике 2 < 3 < 4 < 5
В случае двух порядковых переменных для каждого
объекта измеряются значения двух признаков: (x, y).
Пример. Для каждого ученика пара (x, y) может
означать отметки по математике и физике.
Полная связь
Неполная связь
Коэффициент корреляции
n
r
  xi  x  yi  y 
i 1
n
n
2
x

x
y

y




 i
 i
i 1
2
i 1
Коэффициент корреляции
Коэффициент корреляции
Если переменные – это места, занятые n объектами, то обе переменные
принимают значения от 1 до n. В этом случае формулу для коэффициента
корреляции можно упростить:
n
r  1
6
i 1
2
2
di
n  (n  1)
Пример
n
r  1
6
i 1
2
2
di
n  (n  1)
r-?
Пример
Определение выручки
Определение выручки
Выручка  20  Объем
Определение объема
Цена  40
Объем  ?
Download