(application/msword,301568 bytes)

advertisement
Тема 4. Нелинейные регрессии
4.1. Классификация нелинейных регрессий
Между социально-экономическими явлениями и процессами не всегда существуют линейные соотношения, и часто их нельзя упрощенно выразить линейными функциями из-за
неоправданно больших ошибок, возникающих при этом. В таких случаях для описания зависимостей используют нелинейные регрессии.
Для выбора и обоснования типа кривой регрессии нет универсального метода.
Односторонняя стохастическая зависимость между явлениями может быть описана,
например, с помощью полиномиальной регрессии y  b0  b1x  b2 x 2  b3 x3  ... или с помо1
щью гиперболической регрессии y  b0  b1 . Применяются также степенная, показательx
ная, логарифмическая и тригонометрические функции.
Выбор функции регрессии должен проводиться с применением теории той конкретной
науки, на базе которой возникает задача измерения связи между явлениями. О характере
зависимости между экономическими явлениями часто судят по внешнему виду эмпирического облака рассеяния.
Классы нелинейных регрессий:
существенно линейные (квазилинейные) – регрессии, нелинейные по отношению к включенным в анализ объясняющим переменным xk , но линейные
относительно неизвестных параметров bk , k  1,2,..., m . Для них возможно
непосредственное применение МНК.
существенно нелинейные – регрессии, нелинейные как по объясняющим переменным, так и по неизвестным параметрам. Непосредственное применение
МНК для них невозможно.
Общий вид квазилинейной регрессии:
y  b0  b1F1 ( x)  b2 F2 ( x)  ...  bm Fm ( x) ,
где F1 ( x), F2 ( x),..., Fm ( x) – функции от объясняющих переменных x . Например, это могут
1
быть функции вида F1 ( x)  ln x или F2 ( x)  и т.д.
x
Для применения МНК достаточно сделать замену:
z1  F1 ( x),
z2  F2 ( x), ...,
zm  Fm ( x)
и рассматривать линейную регрессию
y  b0  b1 z1  b2 z2  ...  bm zm , параметры которой совпадают с параметрами исследуемой
квазилинейной регрессии.
1
При нахождении параметров существенно нелинейных регрессий применяют итерационные методы либо прибегают к аппроксимации параметров искомой зависимости. Строгой теории нелинейной регрессии пока нет.
Наиболее распространенный метод оценки параметров нелинейных регрессий состоит
в линейном преобразовании нелинейного уравнения регрессии, что дает возможность применять к ним МНК.
4.2. Спецификация формы связи между переменными
При подборе функции регрессии желательно, чтобы она обладала свойствами, присущими исследуемой зависимости.
Остановимся на моделировании монотонных процессов, для которых при X i 1  X i
разность Yi 1  Yi сохраняет постоянный знак. При Yi 1  Yi функцию регрессии называют
кривой роста (положительная регрессия), при Yi 1  Yi – кривой спада (отрицательная регрессия). Такие кривые позволяют описывать монотонные процессы трех основных типов:
без предела роста (спада);
с пределом роста (спада) без точки перегиба;
с пределом роста (спада) и точкой перегиба.
Процессы без предела роста можно описывать, например, с помощью функций:
линейная y  b0  b1 x ;
степенная y  b0  X b1 ,
показательная
логарифмическая
b0  0,
y  b0  b1X ,
b1  0 ;
b0  0,
b1  1;
y  b0  b1 ln x, b0  0,
b1  0
и др.
Процессы с пределом роста характерны для многих относительных показателей (потребление продуктов питания на душу населения, внесение удобрений на единицу площади, затраты на одну гривну произведенной продукции и др.). В таких случаях принимается
гипотеза о существовании асимптотического уровня и могут быть использованы, например, такие функции:
первая и вторая функции Торнквиста,
гиперболическая функция y  b0 
b1
,
X
b0  0,
b1  0 .
кривая Филипса и др.
Кривые, описывающие процессы с пределом роста и точкой перегиба широко используются при статистическом анализе спроса на некоторые новые товары. Наиболее простой
и удобной для практики является кривая Джонсона
2
ye
b0 
b1
X
,
b0 , b1  0 .
yˆ ( X )  0 при Х >0, то есть кривая Джонсона возрастает при положительных значениях Х.
b
По второй производной существует точка перегиба при X  1 .
2
Слева от этой точки наблюдается возрастание функции с положительным ускорением
b
( yˆ ( X )  0 ), а справа от точки X  1 функция растет с замедлением ( y( X )  0 ).
2
При X   , y  eb0
Y
eb0
X
b1
2
Таким образом, предварительный качественный экономический анализ исследуемого
процесса или явления может выявить особенности данной зависимости, что наложит
определенные требования на уравнение регрессии, а это сузит круг функций, подходящих
для ее описания.
4.3. Моделирование монотонных процессов
При моделировании монотонных процессов, когда количество наблюдений невелико и
неясно, есть ли асимптотический уровень и перегиб, может быть использована одна из
парных функций:
b0 
b1
X
1. ŷ  b0  b1 X ;
6. yˆ  e
2. yˆ  b0  b1 ln X ;
7. ŷ 
1
;
b0  b1 X
8. yˆ 
1
;
b0  b1 ln X
9. yˆ 
X
.
b0  b1 X
3. yˆ  b0 
b1
;
X
4. yˆ  b0  b1X ;
5. yˆ  b0  X b1 ;
;
Первые производные этих функций при X  0 имеют постоянные знаки, то есть сами
функции или всегда возрастают, или всегда убывают при положительных значениях Х (в
зависимости от значений параметров).
3
Приведенные девять зависимостей имеют такое свойство: если все опытные точки
( X i , Yi ) удовлетворяют одному из этих уравнений, то и средние значения X и Y также ему
удовлетворяют. При этом, в качестве средних могут быть:
z1  z2  ...  zn
,
n
среднее арифметическое –
Z ap 
среднее геометрическое –
Z геом  n z1z2 ...zn ,
среднее гармоническое –
Z гapм 
n
.
1  1  ...  1
z1
z2
zn
Специфика регрессионного анализа состоит в том, что с помощью уравнения регрессии
описывают стохастические зависимости. В этом случае опытные точки не лежат на некоторой кривой, а рассеяны около нее. Однако, несмотря на это, точка с координатами, равными определенным средним значениям, обязательно должна лежать на кривой. Каждая из
предложенных функций имеет свою характерную точку:
X
Y
X ap
Yap
X геом
Yap
X гарм
Yap
yˆ  b0  b1X
X ap
Yгеом
yˆ  b0  X b1
X геом
Yгеом
X гарм
Yгеом
Вид эмпирической функции
ŷ  b0  b1 X
yˆ  b0  b1 ln X
yˆ  b0 
yˆ  e
b0 
b1
X
b1
X
ŷ 
1
b0  b1 X
X ap
Yгарм
yˆ 
1
b0  b1 ln X
X геом
Yгарм
yˆ 
X
b0  b1 X
X гарм
Yгарм
Для проверки пригодности выбранной эмпирической функции, используя исходные
опытные данные, находят соответствующие средние значения X и Y . Таким образом,
наряду с диаграммой рассеивания, построенной на основании эмпирических данных, мы
получим девять характерных точек, через которые обязаны пройти девять предложенных
4
кривых. Тогда кривые можно сравнивать между собой на основании того, насколько их характерные точки согласовываются с эмпирическим облаком рассеивания.
Критерий выбора наилучшей функции регрессии:
Y Y
 min .
Y
В данном случае мы располагаем прогнозными значениями (средние значениями зависимой переменной) для случая, когда независимая переменная принимает свое среднее
значение: Y  yˆ ( X ) .
Далее нужно определить значение зависимой переменной Y  Y ( X ) , которое ожидается в реальной экономической действительности. При этом возможны два случая:
данная ситуация уже проверена опытным путем, то есть соответствующее
среднее значение X есть среди исходных статистических данных;
среднего значения объясняющей переменной нет среди исходных данных.
В первом случае мы сразу имеем реальное значение зависимой переменной.
Во втором случае соответствующее значение Y ( X ) можно определить с помощью линейной интерполяции, соединив отрезком две соседние точки с координатами ( X i , Yi ),
( X i 1 , Yi 1 ). Здесь X i и X i 1 – промежуточные значения, между которыми находится X
( X i  X  X i1 ). При этом нет ни одной опытной точки с координатами (х, y), для которой
X i  x  X или X  x  X i1 .
Из уравнения прямой получим:
Y ( X )  Yi 
Yi 1  Yi
(X  Xi) .
X i 1  X i
Процедура выбора наилучшей функции для описания некоторого монотонного процесса проходит следующим образом: для предложенных девяти функций регрессии находят координаты характерных точек. Далее определяют значения зависимой переменной
Y ( X ) и сравнивают его со значением Y с помощью указанного критерия. Результаты всех
проведенных расчетов удобно представлять в табличной форме:
Вид функции
X
Y
Y(X )
Y Y
Y
Функция, которая получит наименьшую оценку, будет считаться наилучшей для
описания данного монотонного процесса.
5
Download