РЕШЕНИЕ: 1). Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии. Таблица 1 № набл 1 2 3 4 5 6 7 8 9 10 y 121 84 119 117 129 128 102 111 112 98 x 72 52 73 74 76 79 54 68 73 64 yˆ a bx Для вычисления параметров модели следует воспользоваться функцией регрессии в М.Excel: В полеченных «выводов итогов» видно: что a = 15.93; b = 1.40 Y-пересечение Переменная X 1 Коэффициенты 15,9269103 1,403986711 1. следовательно при объеме капиталовложений = 0, объем выпуска продукции составляет 15,93 млн.руб. 2. следовательно при увеличении объема капиталовложений на 1 млн.руб. объем выпуска продукции увеличиться на 1,40 млн.руб. 2). Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков S2 ; построить график остатков. yˆ 15.93 1.40 x yˆ1 15,926 1,404 72 117,01 yˆ 6 15,926 1,404 79 126,84 2 yˆ 2 15,926 1,404 52 88,93 yˆ 7 15,926 1,404 54 91,74 yˆ 3 15,926 1,404 73 118,42 yˆ 8 15,926 1,404 68 111,40 yˆ 4 15,926 1,404 74 119,82 yˆ 9 15,926 1,404 73 118,42 yˆ 5 15,926 1,404 76 122,63 yˆ10 15,926 1,404 64 105,78 i y yˆi 1 121 117,01 3,99 и т.д. Таблица 2 Наблюдение 1 2 3 4 5 6 7 8 9 10 ИТОГО X 72 52 73 74 76 79 54 68 73 64 685 ВЫВОД ОСТАТКОВ Предсказанное, Остатки, Y 121 84 119 117 129 128 102 111 112 98 1121 ŷi i i2 117,01 88,93 118,42 119,82 122,63 126,84 91,74 111,40 118,42 105,78 1120,99 3,99 -4,93 0,58 -2,82 6,37 1,16 10,26 -0,40 -6,42 -7,78 0 15,92 24,30 0,34 7,95 40,58 1,35 105,27 0,16 41,22 60,53 297,61 Дисперсия остатков равна N S2 i 1 2 i N 2 297,61 37,20 10 2 S 6,099 Рис. 2 3 Объем капиталовложений, млн. руб.(X) График остатков 15 Остатки 10 5 0 -5 0 20 40 60 80 -10 Объем капиталовложений, млн. руб.(X) 100 4 3). Проверить выполнение предпосылок МНК. Проверка выполнения предпосылок МНК выполняется на основе анализа остаточной компоненты. Оценим адекватность построенной модели, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения (при использовании R/S-критерия взять табулированные границы 2,7—3,7). Модель значений является остаточного адекватной, ряда если случайны, математическое независимы и ожидание подчинены нормальному закону распределения.1 Проверим 3.1. помощью – d критерия (отсутствие Дарбина – автокорреляции) Уотсона по с формуле: n d независимость t 2 2 t 1 t n t 1 2 t Используем данные табл. 3 Таблица 3 Наблюдение 1 2 3 4 5 6 7 8 9 10 Сумма 1 t 3,99 -4,93 0,58 -2,82 6,37 1,16 10,26 -0,40 -6,42 -7,78 0 2t 15,92 24,30 0,34 7,95 40,58 1,35 105,27 0,16 41,22 60,53 297,61 t t 1 -8,92 5,51 -3,4 9,19 -5,21 9,1 -10,66 -6,02 -1,36 79,57 30,36 11,56 84,46 27,14 82,81 113,64 36,24 1,85 467,62 2 t t 1 Орлова И.В. Экономико-математическое моделирование. Практическое пособие по решению задач - М.: ВЗФЭИ. Вузовский учебник, 2004. 5 d 467,62 , 297,61 d 1,5712 Т.к. расчетное значение d попадает в интервал от d2 до 2 (рис. 4.7). Свойство независимости выполняется. Следовательно, модель по этому критерию адекватна. Анализ независимости с помощью критерия Дарбина – Уотсона Рис. 3 1) d1 свойство не выполняется d1 1,08 3) d2 применять другой критерий d2 1,36 4) 2 4 свойство преобразовать dn=4-d выполняется 2 4 1,5712 |r(1)|<0,36 3.2. Проверку случайности уровней ряда остатков проведем на основе критерия поворотных точек. P > [2/3(n-2) – 1, 96 – (16n-29)/90] Количество поворотных точек равно 6 (рис. 4). Рис. 4 График остатков 12 10,26 10 8 6,37 6 4 значения 0 2) 3,99 2 -2 -4 -6 1,16 0,58 0 1 2 3 4 5 6 7 8 -0,4 9 10 -2,82 -4,93 -6,42 -7,78 -8 -10 наблюдения 6 Неравенство выполняется (6 > 2). Следовательно, свойство случайности выполняется. Модель по этому критерию адекватна. Соответствие 3.3. ряда остатков нормальному закону распределения определим при помощи RS – критерия: RS max min , где S max - максимальный уровень ряда остатков, max 10,26 min - минимальный уровень ряда остатков, Se - среднеквадратическое отклонение, Se RS 2 t n 1 , Se 297,61 8 min 7,78 37,20 6,099 10,26 (7,78) 2,96 6,099 Расчетное значение попадает в интервал (2,7-3,7), следовательно, выполняется свойство нормальности распределения. Модель по этому критерию адекватна. 3.4. Проверка равенства нулю математического ожидания уровней ряда остатков. В нашем случае 0 , поэтому гипотеза о равенстве математического ожидания значений остаточного ряда нулю выполняется. 3.5. Обнаружение гетероскедастичности. Чтобы оценить нарушение гомоскедастичности по тесту ГольфельдаКвандта, необходимо упорядочить имеющиеся наблюдения по мере возрастания, разделить совокупности на две группы, определить уравнения регрессии (с помощью Excel), определить остаточные суммы квадратов 7 для регрессии, вычислить отношение между ними и сравнить с Fкритерием. yˆ1 44,58 0,9832 x1 х1 52 54 64 68 72 У1 84 102 98 111 121 ŷ1 95,71 97,68 107,51 111,44 115,37 сумма yˆ 2 57,8462 2,3846 x2 ε²1 137,11 18,70 90,41 0,19 31,65 278,06 S 2 yˆ S1 yˆ х2 73 73 74 76 79 У2 119 112 117 129 128 ŷ2 116,23 116,23 118,62 123,38 130,54 сумма ε²2 7,67 17,90 2,61 31,53 6,44 66,15 278,06 4,203 66,15 Используя надстройки Excel, найдем F – критерий равный 6,389. Fкр 0 , 05;k1 4;k 2 4 6,389 Наблюдаемое F = 4,203 меньше критического, что означает, что модель гомоскедастична. В таблице 4 собраны данные анализа ряда остатков. Анализ ряда остатков Проверяемое свойство Используемые Граница статистики наименование значение нижняя верхняя Независимость d – критерий d 1,57 1,36 2 ДарбинаУотсона Случайность Критерий 6>2 2 пиков (поворотных точек) Нормальность RS – критерий 2,96 2,7 3,7 Среднее = 0 ? t – статистика 0,000 -2,179 2,179 Стьюдента Вывод: модель статистически адекватна Таблица 4 Вывод адекватна адекватна адекватна адекватна 8 4). Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента ( 0,05). Проверка значимости отдельных коэффициентов регрессии связана с определением расчетных значений t – критерия (t – статистики) для соответствующих коэффициентов регрессии: tр Где S a1 a0 ; S a0 tр n S2 x n i 1 i a1 . S a1 x ; S a0 2 S2 xi2 n i 1 n xi x . 2 i 1 Расчетная таблица Таблица 5 Коэффициенты Y-пересечение Объем капиталовложений, млн. руб.(X) S a1 S a0 Стандартная ошибка t-статистика а0 15,927 15,352 1,037 а1 1,404 0,222 6,315 37,20 0,222 752,50 37,20 47675,0 15,352 10 752,5 tp 1,404 6,315 0,222 tp 15,927 1,037 15,352 Сравнивая расчетное значение с табличным значением (при n-2 и степеней свободы 0,05 табличное равно 2,306004). Делаем вывод о том, что фактор а0 следует исключить из модели, так как расчетное значение t меньше табличного (при этом качество модели не ухудшится). 9 5). Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F - критерия Фишера ( 0,05) , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели. Коэффициент множественной корреляции (индекс корреляции), возведенный в квадрат (R2), называется коэффициентом детерминации. t 1 y y 2 R 2 2 t t yˆ y y y t 2 2 t Таблица 6 Расчет коэффициента детерминации Наблюдение 1 2 3 4 5 6 7 8 9 10 Сумма y 2t 15,92 24,30 0,34 7,95 40,58 1,35 105,27 0,16 41,22 60,53 297,61 R2 1 y y 8,9 -28,1 6,9 4,9 16,9 15,9 -10,1 -1,1 -0,1 -14,1 0,0 79,21 789,61 47,61 24,01 285,61 252,81 102,01 1,21 0,01 198,81 1780,9 i y 2 i 297,61 0,8329 1780,9 Чем ближе R2 к 1, тем качество модели лучше. Вариация результата Y (объема выпуска продукции) на 83,29 % объясняется вариацией фактора X (объемом капиталовложений). 10 Для проверки значимости модели регрессии используется F – критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты. Если расчетное значение больше табличного при заданном уровне значимости, то модель считается значимой. F R2 k 1 R n k 1 2 , где k – количество факторов, включенных в модель. F 0,8329 10 2 39,8755 1 0,8329 F > Fтаб. =5, 32 для a = 0, 05; k1 = 1, k2 = 8. Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F > Fтаб. Оценим точность модели на основе использования средней относительной ошибки аппроксимации. Для оценки точности полученной модели будем использовать показатель относительной ошибки аппроксимации, который вычисляется по формуле: Eотн 1 n yt yˆ t 100% ˆt t , где yt y n 1 yt 11 Таблица 7 Расчет относительной ошибки аппроксимации Предсказанное Наблюдение Y Y 1 121 117,01 2 84 88,93 3 119 118,42 4 117 119,82 5 129 122,63 6 128 126,84 7 102 91,74 8 111 111,40 9 112 118,42 10 98 105,78 Сумма 1121 1120,99 Eотн t t yt 3,99 -4,93 0,58 -2,82 6,37 1,16 10,26 -0,40 -6,42 -7,78 0 0,03 0,06 0,005 0,02 0,05 0,01 0,10 0,00 0,06 0,08 0,41 1 0,41 100% 4,13 10 В среднем расчетные значения предсказанного у для линейной модели отличаются от фактических значений на 4,13 %. Если ошибка, вычисленная по формуле, не превосходит 15%, точность модели считается приемлемой.2 2 Копр по ЭММ, http://62.117.66.200/repository/{1962E801-3231-4BB1-BE75-6D0AF7088CFB}/main3.htm 12 6). Осуществить прогнозирование среднего значения показателя Y при уровне значимости 0,1 , если прогнозное значения фактора Х составит 80% от его максимального значения. Прогнозное значение Х = 79*80 % = 63,2 Прогнозируемое значение переменной у получается при подстановке в уравнение регрессии yˆ прогн ˆ ˆ xпрогн ожидаемой величины фактора х. yˆ прогн 15,926 1,404 63,2 104,6588 Используя данные таблицы 2, найдем величину отклонения от линии регрессии. S yˆ 6,099 Коэффициент Стьюдента t для m = 8 степеней свободы (m = n-2) и уровня значимости 0,1 равен 3,3554. U k SYˆ t xпрогн x 1 1 n n xi x i 1 2 2 1 63,2 68,5 U x 63, 2; n 10; 0,01 6,099 3,3554 1 21,8246 10 752,5 2 Таким образом, прогнозное значение yˆ прогн 104,6588 будет находиться между верхней границей, равной 104,6588 + 21,8246 = 126,4834 и нижней границей, равной 104,6588 - 21,8246 = 82,8342. Эластичность линейной модели равна Э bx 1,404 68,5 0,8579 a b x 15,926 1,404 68,5 На 85,79% изменяется Y (объема выпуска продукции) при изменении фактора X (объемом капиталовложений) на один процент. 13 Преобразуем график подбора (рис. 1), дополнив его данными прогноза. Рис. 5 Объем выпуска продукции, млн. руб. (Y) Объем капиталовложений, млн. руб.(X) График подбора Объем выпуска продукции, млн. руб. (Y) 140 120 Предсказанное Объем выпуска продукции, млн. руб. (Y) прогноз 100 80 60 40 верхняя граница 20 0 0 10 20 30 40 50 60 70 80 90 нижняя граница Объем капиталовложений, млн. руб.(X) 8). Составить уравнения нелинейной регрессии: гиперболической; степенной; показательной. Привести графики построенных уравнений регрессии. 8.1. Составить уравнения нелинейной регрессии гиперболической. Уравнение гиперболической функции yˆ a b x . Произведем линеаризацию модели путем замены получим линейное уравнение X 1 x. yˆ a b X . Рассчитаем его параметры по данным таблицы 8. В результате Таблица 8 Гиперболическая модель Наблюдение x y X yX 1 2 3 4 5 6 7 8 9 10 Сумма Среднее 72 52 73 74 76 79 54 68 73 64 121 84 119 117 129 128 102 111 112 98 0,0139 0,0192 0,0137 0,0135 0,0132 0,0127 0,0185 0,0147 0,0137 0,0156 1,6806 1,6154 1,6301 1,5811 1,6974 1,6203 1,8889 1,6324 1,5342 1,5313 685 68,5 1121 112,1 0,1487 0,01487 16,412 1,6412 yˆ a b X y y y y 2 X^2 0,0001929 0,0003698 0,0001877 0,0001826 0,0001731 0,0001602 0,0003429 0,0002163 0,0001877 0,0002441 0,0022573 0,0002257 8,9 -28,1 6,9 4,9 16,9 15,9 -10,1 -1,1 -0,1 -14,1 79,21 789,61 47,61 24,01 285,61 252,81 102,01 1,21 0,01 198,81 1 780,9 ŷ 117,551 87,861 118,608 119,637 121,613 124,390 91,820 113,010 118,608 107,902 1121,0 i 3,449 -3,861 0,392 -2,637 7,387 3,610 10,180 -2,010 -6,608 -9,902 0,00 yŷ2 |ε/y|*100% 11,899 14,911 0,154 6,953 54,564 13,030 103,632 4,040 43,665 98,042 350,888 2,851 4,597 0,329 2,254 5,726 2,820 9,980 1,811 5,900 10,104 46,373 4,637 Получим следующее уравнение b yX yX X X 2 2 1,6412 112,1 0,01487 5557,7951 0,0002257 0,01487 0,01487 a y b X 112,1 (5557,7951) 0,01487 194,742 гиперболической модели: yˆ 194,742 5557,7951 x 15 Определим индекс корреляции: y yˆ 1 y y 2 YX 2 1 350,888 0,8961 1780,9 Связь между показателем у и фактором х можно считать достаточно сильной. Индекс детерминации: 2 R 2 YX 0,89612 0,8030 Вариация результата Y (объема выпуска продукции) на 80,30% объясняется вариацией фактора X (объемом капиталовложений). Рассчитаем F- критерий Фишера: F R2 0,8030 n 2 10 2 32,61 2 1 0,8030 1 R F > Fтаб. =5, 32 для a = 0, 05; k1 = 1, k2 = 8. Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F > Fтаб. Средняя относительная ошибка Eотн 1 46,373 100% 4,64 10 В среднем расчетные значения ŷ для гиперболической модели отличаются от фактических значений на 4,64%. Эластичность гиперболической модели равна Э b 5557,795 0,7142 a x b 194,742 68,5 5557,795 На 71,42% изменяется Y (объема выпуска продукции) при изменении фактора X (объемом капиталовложений) на один процент. Рис. 6 Гиперболическая модель x График подбора 140 120 y 100 80 y Предсказан ное y гипербола 60 40 20 0 0 50 x 100 17 8.2. Составить уравнения нелинейной регрессии степенной. yˆ a x b Уравнение степенной модели имеет вид: Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения: lg yˆ lg a b lg x Таблица 9 Логарифмирование Наблюдение 1 2 3 4 5 6 7 8 9 10 Сумма Среднее Обозначим y 121 84 119 117 129 128 102 111 112 98 1,9912 x 72 52 73 74 76 79 54 68 73 64 1121 20,4630 685 18,3187 112,1 2,0463 68,5 1,8319 lg(y) 2,0828 1,9243 2,0755 2,0682 2,1106 2,1072 2,0086 2,0453 2,0492 lg(x) 1,8573 1,7160 1,8633 1,8692 1,8808 1,8976 1,7324 1,8325 1,8633 1,8062 Y lg yˆ , X lg x, A lg a. Тогда уравнение примет вид: Y A bX линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 10. Таблица 10 y Y x X X^2 1 2 3 4 5 6 7 8 9 10 Сумма Среднее b 121 2,0828 72 1,8573 84 1,9243 52 1,7160 119 2,0755 73 1,8633 117 2,0682 74 1,8692 129 2,1106 76 1,8808 128 2,1072 79 1,8976 102 2,0086 54 1,7324 111 2,0453 68 1,8325 112 2,0492 73 1,8633 98 1,9912 64 1,8062 1121 20,4630 685 18,3187 112,1 2,0463 68,5 1,8319 Y X Y X X X 2 2 3,7515 2,0463 1,8319 0,84 3,3592 1,8319 1,8319 A Y b X 2,0463 0,84 1,8319 0,5051 Y 0,5051 0,84 X 3,86842 3,4497 3,30207 2,9447 3,86741 3,4720 3,86592 3,4940 3,96963 3,5375 3,99870 3,6010 3,47969 3,0012 3,74807 3,3581 3,81835 3,4720 3,59651 3,2623 37,5148 33,5923 3,7515 3,3592 116,862 88,874 118,226 119,587 122,301 126,350 91,741 111,376 118,226 105,837 E i ˆ y 2 y y y y y y ŷ YX Наблюдение Степенная модель |ε/y|*100% i 4,138 -4,874 0,774 -2,587 6,699 1,650 10,259 -0,376 -6,226 -7,837 1,621 3,420 5,802 0,650 2,211 5,193 1,289 10,058 0,338 5,559 7,997 42,52 Перейдем к исходным переменным x и y: E 2 i 17,122 23,754 0,599 6,694 44,882 2,724 105,250 0,141 38,765 61,425 301,355 yˆ 10 0,5051 x 0,84 Получим уравнение степенной модели регрессии: ˆ 3,1996 x 0,84 y Определим индекс корреляции: y yˆ 1 y y 2 YX 2 1 301,355 0,8308 0,9115 1780,9 Связь между показателем у и фактором х можно считать достаточно сильной. Коэффициент детерминации равен 0,8308: 2 R 2 YX 0,9115 2 0,8308 Вариация результата Y (объема выпуска продукции) на 83,08% объясняется вариацией фактора X (объемом капиталовложений). Рассчитаем F- критерий Фишера: F R2 0,8308 n 2 10 2 39,29 2 1 0,8308 1 R F > Fтаб. =5, 32 для a = 0,05; k1 = 1, k2 = 8. Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F > Fтаб. Средняя относительная ошибка Eотн 1 42,52 100% 4,25 10 В среднем расчетные значения ŷ для степенной модели отличаются от фактических значений на 4,25%. Эластичность степенной модели равна Э b 0,84 На 84,0% изменяется Y (объема выпуска продукции) при изменении фактора X (объемом капиталовложений) на один процент. 20 Рис. 7 Степенная модель x График подбора 140 120 y 100 Предсказан ное y степенная модель y 80 60 40 20 0 0 50 x 100 21 8.3. Составить уравнения нелинейной регрессии показательной. Уравнение показательной кривой: yˆ a b x Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения: lg yˆ lg a lg x b Y lg yˆ , B lg b, A lg a. Обозначим Получим линейное уравнение регрессии: Y A Bx Рассчитаем его параметры, используя данные таблицы 11. B Y x Y x x2 x 2 140,604 2,0463 68,5 0,0058 4767,5 68,5 68,5 A Y B x 2,0463 0,0058 68,5 1,013 Y 1,65 0,0058 x yˆ 101, 65 (10 0, 0058 ) x Перейдем к исходным переменным, выполнив потенцирование данного уравнения: yˆ 44,566 1,013 x Определим индекс корреляции: y yˆ 1 y y 2 YX 2 1 408,26 0,8779 1780,90 Связь между показателем у и фактором х можно считать сильной. Коэффициент детерминации равен 0,7708. 2 R 2 YX 0,87792 0,7708 Вариация результата Y (объема выпуска продукции) на 77,08% объясняется вариацией фактора X (объемом капиталовложений). Рассчитаем F- критерий Фишера: R2 0,7708 F n 2 10 2 26,90 2 1 0,7708 1 R F > Fтаб. =5, 32 для a = 0,05; k1 = 1, k2 = 8. 22 Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F > Fтаб. Средняя относительная ошибка Eотн 1 48,20 100% 4,82 10 В среднем расчетные значения ŷ для показательной модели отличаются от фактических значений на 4,82%. Рис. 8 Показательная модель x График подбора 140 120 y y 100 80 Предсказанное y показательная модель 60 40 20 0 0 50 x 100 Таблица 11 Наблюдение 1 2 3 4 5 6 y 121 84 119 117 129 128 102 7 У 2,0828 1,9243 2,0755 2,0682 2,1106 2,1072 10 Сумма Среднее 72 52 73 74 76 79 54 2,0086 111 8 9 x 112 98 1121 112,1 Ух x^2 149,96 5184 100,06 151,51 153,05 160,40 166,47 2704 5329 5476 5776 6241 108,46 2916 139,08 149,59 4624 5329 127,44 1406,04 140,604 4096 47 675 4 767,5 68 2,0453 2,0492 1,9912 20,4630 2,0463 73 64 685 68,5 0,0365 0,1220 0,0293 0,0219 0,0643 0,0609 0,0377 0,0010 0,0029 0,0551 y y Y Y y y y y y y Показательная модель YY 2 xx x x 2 ŷ yŷ2 E |ε/y|*100% i 0,0013 3,5 12,25 112,95 64,81 8,051 6,653 0,0149 0,0009 0,0005 0,0041 0,0037 -16,5 4,5 5,5 7,5 10,5 272,25 20,25 30,25 56,25 110,25 87,24 114,42 115,91 118,94 123,64 10,47 21,00 1,20 101,24 19,03 -3,236 4,582 1,095 10,062 4,363 3,852 3,851 0,936 7,800 3,408 0,0014 -14,5 210,25 89,52 155,78 12,481 12,237 0,0000 0,0000 -0,5 4,5 0,25 20,25 107,26 114,42 13,97 5,85 3,738 -2,418 3,368 2,159 0,0030 0,0299 -4,5 20,25 752,50 101,86 14,91 408,26 40,826 -3,861 34,857 3,940 48,20 4,82 Для выбора лучшей модели построим сводную таблицу результатов (табл. 12). Таблица 12 Коэффициент параметры/модель детерминации R^2 Линейная Гиперболическая Степенная Показательная 0,8329 0,8030 0,8308 0,7708 Fкритерий Фишера 39,88 32,61 39,29 26,9 Индекс Средняя корреляции относительная рxy ошибка 0,9126 0,8961 0,9115 0,8779 4,13 4,64 4,25 4,82 Все модели имеют примерно одинаковые характеристики, но большее значение F – критерия Фишера и большее значение коэффициента R2 имеет линейная модель. Её можно взять в качестве лучшей для построения прогноза.