Тема 4. Нелинейные регрессии 4.1. Классификация нелинейных регрессий Между социально-экономическими явлениями и процессами не всегда существуют линейные соотношения, и часто их нельзя упрощенно выразить линейными функциями из-за неоправданно больших ошибок, возникающих при этом. В таких случаях для описания зависимостей используют нелинейные регрессии. Для выбора и обоснования типа кривой регрессии нет универсального метода. Односторонняя стохастическая зависимость между явлениями может быть описана, например, с помощью полиномиальной регрессии y b0 b1x b2 x 2 b3 x3 ... или с помо1 щью гиперболической регрессии y b0 b1 . Применяются также степенная, показательx ная, логарифмическая и тригонометрические функции. Выбор функции регрессии должен проводиться с применением теории той конкретной науки, на базе которой возникает задача измерения связи между явлениями. О характере зависимости между экономическими явлениями часто судят по внешнему виду эмпирического облака рассеяния. Классы нелинейных регрессий: существенно линейные (квазилинейные) – регрессии, нелинейные по отношению к включенным в анализ объясняющим переменным xk , но линейные относительно неизвестных параметров bk , k 1,2,..., m . Для них возможно непосредственное применение МНК. существенно нелинейные – регрессии, нелинейные как по объясняющим переменным, так и по неизвестным параметрам. Непосредственное применение МНК для них невозможно. Общий вид квазилинейной регрессии: y b0 b1F1 ( x) b2 F2 ( x) ... bm Fm ( x) , где F1 ( x), F2 ( x),..., Fm ( x) – функции от объясняющих переменных x . Например, это могут 1 быть функции вида F1 ( x) ln x или F2 ( x) и т.д. x Для применения МНК достаточно сделать замену: z1 F1 ( x), z2 F2 ( x), ..., zm Fm ( x) и рассматривать линейную регрессию y b0 b1 z1 b2 z2 ... bm zm , параметры которой совпадают с параметрами исследуемой квазилинейной регрессии. 1 При нахождении параметров существенно нелинейных регрессий применяют итерационные методы либо прибегают к аппроксимации параметров искомой зависимости. Строгой теории нелинейной регрессии пока нет. Наиболее распространенный метод оценки параметров нелинейных регрессий состоит в линейном преобразовании нелинейного уравнения регрессии, что дает возможность применять к ним МНК. 4.2. Спецификация формы связи между переменными При подборе функции регрессии желательно, чтобы она обладала свойствами, присущими исследуемой зависимости. Остановимся на моделировании монотонных процессов, для которых при X i 1 X i разность Yi 1 Yi сохраняет постоянный знак. При Yi 1 Yi функцию регрессии называют кривой роста (положительная регрессия), при Yi 1 Yi – кривой спада (отрицательная регрессия). Такие кривые позволяют описывать монотонные процессы трех основных типов: без предела роста (спада); с пределом роста (спада) без точки перегиба; с пределом роста (спада) и точкой перегиба. Процессы без предела роста можно описывать, например, с помощью функций: линейная y b0 b1 x ; степенная y b0 X b1 , показательная логарифмическая b0 0, y b0 b1X , b1 0 ; b0 0, b1 1; y b0 b1 ln x, b0 0, b1 0 и др. Процессы с пределом роста характерны для многих относительных показателей (потребление продуктов питания на душу населения, внесение удобрений на единицу площади, затраты на одну гривну произведенной продукции и др.). В таких случаях принимается гипотеза о существовании асимптотического уровня и могут быть использованы, например, такие функции: первая и вторая функции Торнквиста, гиперболическая функция y b0 b1 , X b0 0, b1 0 . кривая Филипса и др. Кривые, описывающие процессы с пределом роста и точкой перегиба широко используются при статистическом анализе спроса на некоторые новые товары. Наиболее простой и удобной для практики является кривая Джонсона 2 ye b0 b1 X , b0 , b1 0 . yˆ ( X ) 0 при Х >0, то есть кривая Джонсона возрастает при положительных значениях Х. b По второй производной существует точка перегиба при X 1 . 2 Слева от этой точки наблюдается возрастание функции с положительным ускорением b ( yˆ ( X ) 0 ), а справа от точки X 1 функция растет с замедлением ( y( X ) 0 ). 2 При X , y eb0 Y eb0 X b1 2 Таким образом, предварительный качественный экономический анализ исследуемого процесса или явления может выявить особенности данной зависимости, что наложит определенные требования на уравнение регрессии, а это сузит круг функций, подходящих для ее описания. 4.3. Моделирование монотонных процессов При моделировании монотонных процессов, когда количество наблюдений невелико и неясно, есть ли асимптотический уровень и перегиб, может быть использована одна из парных функций: b0 b1 X 1. ŷ b0 b1 X ; 6. yˆ e 2. yˆ b0 b1 ln X ; 7. ŷ 1 ; b0 b1 X 8. yˆ 1 ; b0 b1 ln X 9. yˆ X . b0 b1 X 3. yˆ b0 b1 ; X 4. yˆ b0 b1X ; 5. yˆ b0 X b1 ; ; Первые производные этих функций при X 0 имеют постоянные знаки, то есть сами функции или всегда возрастают, или всегда убывают при положительных значениях Х (в зависимости от значений параметров). 3 Приведенные девять зависимостей имеют такое свойство: если все опытные точки ( X i , Yi ) удовлетворяют одному из этих уравнений, то и средние значения X и Y также ему удовлетворяют. При этом, в качестве средних могут быть: z1 z2 ... zn , n среднее арифметическое – Z ap среднее геометрическое – Z геом n z1z2 ...zn , среднее гармоническое – Z гapм n . 1 1 ... 1 z1 z2 zn Специфика регрессионного анализа состоит в том, что с помощью уравнения регрессии описывают стохастические зависимости. В этом случае опытные точки не лежат на некоторой кривой, а рассеяны около нее. Однако, несмотря на это, точка с координатами, равными определенным средним значениям, обязательно должна лежать на кривой. Каждая из предложенных функций имеет свою характерную точку: X Y X ap Yap X геом Yap X гарм Yap yˆ b0 b1X X ap Yгеом yˆ b0 X b1 X геом Yгеом X гарм Yгеом Вид эмпирической функции ŷ b0 b1 X yˆ b0 b1 ln X yˆ b0 yˆ e b0 b1 X b1 X ŷ 1 b0 b1 X X ap Yгарм yˆ 1 b0 b1 ln X X геом Yгарм yˆ X b0 b1 X X гарм Yгарм Для проверки пригодности выбранной эмпирической функции, используя исходные опытные данные, находят соответствующие средние значения X и Y . Таким образом, наряду с диаграммой рассеивания, построенной на основании эмпирических данных, мы получим девять характерных точек, через которые обязаны пройти девять предложенных 4 кривых. Тогда кривые можно сравнивать между собой на основании того, насколько их характерные точки согласовываются с эмпирическим облаком рассеивания. Критерий выбора наилучшей функции регрессии: Y Y min . Y В данном случае мы располагаем прогнозными значениями (средние значениями зависимой переменной) для случая, когда независимая переменная принимает свое среднее значение: Y yˆ ( X ) . Далее нужно определить значение зависимой переменной Y Y ( X ) , которое ожидается в реальной экономической действительности. При этом возможны два случая: данная ситуация уже проверена опытным путем, то есть соответствующее среднее значение X есть среди исходных статистических данных; среднего значения объясняющей переменной нет среди исходных данных. В первом случае мы сразу имеем реальное значение зависимой переменной. Во втором случае соответствующее значение Y ( X ) можно определить с помощью линейной интерполяции, соединив отрезком две соседние точки с координатами ( X i , Yi ), ( X i 1 , Yi 1 ). Здесь X i и X i 1 – промежуточные значения, между которыми находится X ( X i X X i1 ). При этом нет ни одной опытной точки с координатами (х, y), для которой X i x X или X x X i1 . Из уравнения прямой получим: Y ( X ) Yi Yi 1 Yi (X Xi) . X i 1 X i Процедура выбора наилучшей функции для описания некоторого монотонного процесса проходит следующим образом: для предложенных девяти функций регрессии находят координаты характерных точек. Далее определяют значения зависимой переменной Y ( X ) и сравнивают его со значением Y с помощью указанного критерия. Результаты всех проведенных расчетов удобно представлять в табличной форме: Вид функции X Y Y(X ) Y Y Y Функция, которая получит наименьшую оценку, будет считаться наилучшей для описания данного монотонного процесса. 5