ЛАБОРАТОРНАЯ РАБОТА №1 По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн. руб.) от объема капиталовложений (X, млн. руб.) Требуется: 1. Построить диаграмму рассеяния для переменных «объёмы продаж» -Y и «индекс потребительских расходов» - X 2. Оценить тесноту взаимосвязи. 3. Оценить значимость вычисленного коэффициента парной корреляции. 4. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии. 5. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков S2ε; построить график остатков. 6. Проверить выполнение предпосылок МНК. 7. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (α = 0,05) 8. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F- критерия Фишера (α = 0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели. 9. Осуществить прогнозирование среднего значения показателя Y при уровне значимости α = 0,1, если прогнозное значения фактора Х составит 80% от его максимального значения. 10.Представить графически: фактические и модельные значения Y, точки прогноза. 11.Составить уравнения нелинейной регрессии: гиперболической; степенной; показательной. Привести графики построенных уравнений регрессии. 12. Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод. Вариант 1 X 66 58 73 82 81 84 55 67 81 59 Y 13 10 14 16 16 17 10 13 15 11 3 7 5 2 3 0 4 2 9 6 Решение: 1.Диаграмма рассеяния имеет вид: Объем продаж Диаграмма рассеяния 90 80 70 60 50 40 30 20 10 0 0 50 100 150 200 Индекс потребительских расходов 2. Средние значения случайных величин х и у: 1 1 х̅ = ∑𝑛𝑖=1 𝑥𝑖 = 70.6 𝑦̅ = ∑𝑛𝑖=1 𝑦𝑖 = 139.1 𝑛 𝑛 1 1102.4 𝑆𝑥2 = = 122.49 ∑(𝑥𝑖 − 𝑥̅ )2 = 𝑛−1 9 1 5364.9 𝑆𝑦2 = = 596.1 ∑(𝑦𝑖 − 𝑦̅)2 = 𝑛−1 9 Рассчитаем стандартные ошибки случайных величин х и у: 𝑆𝑥 = √ 𝑆𝑦 = √ 1 𝑛−1 1 𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 =11.07 ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 =24.42 Рассчитаем коэффициент корреляции: 1 n ( xi x)( yi y) 1∙2418.4 n 1 i 1 9 𝑟𝑥𝑦 = = SxSy 11.07∙24.42 1 2 3 4 5 6 7 8 9 y 133 107 145 162 163 170 104 132 159 x 𝑦𝑖 − 𝑦̅ 𝑥𝑖 − 𝑥̅ 66 -6,1 -4,6 58 -32,1 -12,6 73 5,9 2,4 82 22,9 11,4 81 23,9 10,4 84 30,9 13,4 55 -35,1 -15,6 67 -7,1 -3,6 81 19,9 10,4 (𝑦𝑖 − 𝑦̅)(𝑥𝑖 − 𝑥̅ ) 28,06 404,46 14,16 261,06 248,56 414,06 547,56 25,56 206,96 = 0.994 (𝑥𝑖 − 𝑥̅ )2 (𝑦𝑖 − 𝑦̅)2 21,16 158,76 5,76 129,96 108,16 179,56 243,36 12,96 108,16 37,21 1030,41 34,81 524,41 571,21 954,81 1232,01 50,41 396,01 10 116 59 -23,1 -11,6 267,96 134,56 533,61 сумма 1391 706 2418,4 1102,4 5364,9 ср. 139,1 70,6 Знач 3. Оценим значимость коэффициента корреляции. Рассчитаем значение t– статистики: 0,994√8 t = r n 22 = =25,324 √1−0,988 1 r Полученное значение коэффициента корреляции значимо. 4. Построение линейной модели парной регрессии. Определим линейный коэффициент парной корелляции: ∑(𝑦𝑖 − 𝑦̅)(𝑥𝑖 − 𝑥̅ ) 2418.4 𝑟𝑥𝑦 = = = 0.994 √∑(𝑦𝑖 − 𝑦̅)2 × ∑(𝑥𝑖 − 𝑥̅ )2 √5364.9 ∙ 1102.4 Уравнение линейной регрессии имеет вид: ŷ = a + b × x Значения параметров a и b линейной модели определим, используя данные таблицы b= y*x y*x x x 2 2 10062.3 139.1 * 70.6 2.19 5094.6 70.6 2 a=𝑦̅ − 𝑏 × 𝑥̅ = 139.1-2.194*70.6=-15.796 𝑦 ̂1 = -15.796+2.194*66=129.008 𝑦 ̂2 = −15.796 + 2.194 ∗ 58 = 111.456 𝑦 ̂3 = −15.796 + 2.194 ∗ 73 = 144.366 𝑦̂4 = −15.796 + 2.194 ∗ 82 = 164.112 𝑦 ̂5 = −15.796 + 2.194 ∗ 81 = 161.918 𝑦 ̂6 = −15.796 + 2.194 ∗ 84 = 168.5 𝑦 ̂7 = −15.796 + 2.194 ∗ 55 = 104.874 𝑦 ̂8 = −15.796 + 2.194 ∗ 67 = 131.202 𝑦 ̂9 = −15.796 + 2.194 ∗ 81 = 161.918 𝑦̂ 10 = −15.796 + 2.194 ∗ 59 = 113.65 1 2 3 4 5 6 7 8 9 10 y 133 107 145 162 163 170 104 132 159 116 x 66 58 73 82 81 84 55 67 81 59 y*x 8778 6206 10585 13284 13203 14280 5720 8844 12879 6844 x*x 4356 3364 5329 6724 6561 7056 3025 4489 6561 3481 𝑦̂ 129,008 111,456 144,366 164,112 161,918 168,5 104,874 131,202 161,918 113,65 ε |𝜀/𝑦| ∗ 100% 3,992 3,001504 -4,456 -4,16449 0,634 0,437241 -2,112 -1,3037 1,082 0,663804 1,5 0,882353 -0,874 -0,84038 0,798 0,604545 -2,918 -1,83522 2,35 2,025862 сумма ср. Знач 1391 139,1 706 100623 50946 70,6 10062,3 5094,6 -0,004 -0,52849 -0,05285 Уравнение линейной регрессии имеет вид: у̂ = -15,796+2,194*х Рассчитаем коэффициент детерминации: 2 𝑅2 = 𝑟𝑦𝑥 = 0.988 Оценку значимости уравнения регрессии проведем с помощью критерия Фишера: 2 𝑟𝑦𝑥 0.988 (𝑛 𝐹= × − 2) = × 8 = 658.667 2 1 − 𝑟𝑦𝑥 1 − 0.988 Уравнение регрессии статистически значимое. Определим среднюю относительную ошибку: |𝐸𝑖 | 1 −0.528 ̅̅̅̅̅̅ 𝐸𝑜тн = × ∑ × 100% = = −0.0528% 𝑛 𝑦 10 В среднем расчетные значения у̂ для линейной модели отличаются от фактических значений на -0,0528%. 5. Построение степенной модели. Уравнение степенной модели имеет вид: у̂ = а × х𝑏 Произведем логарифмирование обеих частей уравнения: lg у̂ = lg a + b lg x 1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 10 итого ср. знач. y(t) 133.0 107.0 145.0 162.0 163.0 170.0 104.0 132.0 159.0 116.0 1391 139.1 y x Y 133 107 145 162 163 170 2,123852 2,029384 2,161368 2,209515 2,212188 2,230449 66 58 73 82 81 84 lg (y) 2.124 2.029 2.161 2.209 2.212 2.231 2.017 2.121 2.201 2.064 21.369 2.137 x(t) 66 58 73 82 81 84 55 67 81 59 706 70.6 X YX X*X 1,819544 1,763428 1,863323 1,913814 1,908485 1,924279 3,864441 3,578672 4,027326 4,2286 4,221927 4,292007 3,31074 3,109678 3,471972 3,662683 3,642315 3,702851 𝑦̂ 127,732 108,681 144,885 167,547 164,997 172,671 lg (x) 1.819 1.763 1.863 1.914 1.908 1.924 1.741 1.826 1.908 1.771 18.437 1.844 ε 5,268 -1,681 0,115 -5,547 -1,997 -2,671 |𝜀/𝑦| ∗ 100% 3,960902 -1,57103 0,07931 -3,42407 -1,22515 -1,57118 𝜀2 27,75182 2,825761 0,013225 30,76921 3,988009 7,134241 7 8 9 10 Сум ма 104 132 159 116 1391 2,017033 2,120574 2,201397 2,064458 21,37022 55 67 81 59 706 1,740363 1,826075 1,908485 1,770852 18,43865 3,51037 3,872327 4,201333 3,65585 39,45285 3,028862 3,334549 3,642315 3,135917 34,04188 101,701 130,156 164,997 111,029 2,299 1,844 -5,997 4,971 -3,396 2,210577 1,39697 -3,7717 4,285345 5,285401 3,400336 35,96401 24,71084 141,8429 Y=lg у̂, X=lg x, A=lg a. Уравнение примет вид: Y=A+bX – линейное уравнение регрессии. ̅̅̅̅̅̅ 𝑌 ∙ 𝑋 − 𝑌̅ ∙ 𝑋̅ 3.9449 − 2.1369 ∗ 1.8437 0.005 = = = 1.25 ̅̅̅̅ 3.4036 − 1.8437 ∗ 1.8437 0.004 𝑋 2 − 𝑋̅ 2 𝐴 = 𝑌̅ − 𝑏𝑋̅ = 2.1369 − 1.25 ∗ 1.8437 = −0.168 Уравнение регрессии: Y=-0,168+1,25Х у̂ = 10−0,168 ∙ х1,25 у̂ = 0,679 ∙ х1,25 Индекс корреляции: 𝑏= 𝜌𝑦𝑥 = √1 − ∑(𝑦 − 𝑦̂)2 = 0.994 ∑(𝑦 − 𝑦̅)2 Связь между показателем у и фактором х можно считать достаточно сильной. Коэффициент детерминации: 0,989 2 𝑅2 = 𝜌𝑦𝑥 = 0.9942 = 0.989 F критерий Фишера: 𝑅2 0.989 (𝑛 𝐹= × − 2) = × 8 = 719.273 1 − 𝑅2 1 − 0.989 Cредняя относительная ошибка: 0,37 ̅̅̅̅̅̅ 𝐸𝑜тн = = 0,037% 10 В среднем расчетные значения у̂ для степенной модели отличаются от фактических на 0,037%. 6. Построение показательной функции Уравнение показательной кривой: у̂ = 𝑎𝑏𝑥 lg у̂ = lg a +x lg b Y= lg у̂, B=lg b, A=lg a. Получим линейное уравнение регрессии: Y=A+Bx y 1 2 3 4 5 6 7 Y 133 107 145 162 163 170 104 x 2,124 2,029 2,161 2,209 2,212 2,231 2,017 66 58 73 82 81 84 55 Yx x*x 140,184 117,682 157,753 181,138 179,172 187,404 110,935 4356 3364 5329 6724 6561 7056 3025 ̅ У-У -0,0129 -0,1079 0,0241 0,0721 0,0751 0,0941 -0,1199 8 9 10 2,121 2,201 2,064 21,369 2,1369 67 142,107 81 178,281 59 121,776 706 1516,432 70,6 (𝑌 − 𝑌̅)2 x-𝑥̅ (𝑥 − 𝑥̅ )2 𝑦̂ 0,000166 0,011642 0,000581 0,005198 0,00564 0,008855 0,014376 0,000253 0,004109 0,005314 0,056135 21,16 158,76 5,76 129,96 108,16 179,56 243,36 12,96 108,16 134,56 1102,4 итого Ср. знач 132 159 116 1391 139,1 -4,6 -12,6 2,4 11,4 10,4 13,4 -15,6 -3,6 10,4 -11,6 125,298 110,356 140,023 161,526 158,982 166,736 105,224 127,303 158,982 112,121 (𝑦 − 𝑦̂)2 7,702 -3,356 4,977 0,474 4,018 3,264 -1,224 4,697 0,018 3,879 4489 6561 3481 50946 ε -0,0159 0,0641 -0,0729 |𝜀/𝑦| ∗ 100% 59,3208 11,26274 24,77053 0,224676 16,14432 10,6537 1,498176 22,06181 0,000324 15,04664 160,9837 5,791 -3,136 3,4324 0,2926 2,465 1,92 -1,177 3,5583 0,0113 3,344 16,5016 1,6502 ̅̅̅̅̅̅ 𝑌 ∙ 𝑥 − 𝑌̅ ∙ 𝑥̅ 151.643 − 2.137 ∗ 70.6 = = 0.007 ̅̅̅2 ∙ 𝑥̅ 2 5094.6 − 70.6 ∗ 70.6 𝑥 𝐴 = 𝑌̅ − 𝐵 ∙ 𝑥̅ = 2.137 − 0.007 ∗ 70.6 = 1.643 Уравнение будет иметь вид: Y=1.643+0.007x 𝑦̂ = 101.643 ∗ (100.007 )𝑥 = 43.95 ∗ 1.016𝑥 𝐵= ∑(𝑦−𝑦̂)2 Индекс корреляции: 𝜌𝑦𝑥 = √1 − ∑(𝑦−𝑦̅)2 =√1 − 16.098 5364.9 = 0.998 2 Индекс детерминации: 𝑅2 = 𝑃𝑦𝑥 =0.996 F критерий Фишера: 𝑅2 0.996 (𝑛 𝐹= × − 2) = ∗ 8 = 1992 1 − 𝑅2 1 − 0.996 Cредняя относительная ошибка: 16.5016 ̅̅̅̅̅̅ 𝐸𝑜тн = = 1.6502% 10 В среднем расчетные значения у̂ для показательной функции отличаются от фактических на 1,6502%. 7. Построение гиперболической функции Уравнение гиперболической функции: у̂ = а+b/x X=1/x у̂ = а+bX y 133 107 145 162 163 170 104 132 159 116 1391 139,1 1 2 3 4 5 6 7 8 9 10 итого Ср. знач (𝑌 − 𝑌̅)2 37,21 1030,41 34,81 524,41 571,21 954,81 1232,01 50,41 396,01 533,61 5364,9 x 66 58 73 82 81 84 55 67 81 59 706 70,6 X 0,015152 0,017241 0,013699 0,012195 0,012346 0,011905 0,018182 0,014925 0,012346 0,016949 0,144939 ε 𝑦̂ 132,021 109,316 147,806 164,141 162,505 167,296 99,098 134,478 162,505 112,491 1391,657 yX 2,015152 1,844828 1,986301 1,97561 2,012346 2,02381 1,890909 1,970149 1,962963 1,966102 19,64817 (𝑦 − 𝑦̂)2 0,979 -2,316 -2,806 -2,141 0,495 2,704 4,902 -2,478 -3,505 3,509 -0,657 0,958441 5,363856 7,873636 4,583881 0,245025 7,311616 24,0296 6,140484 12,28503 12,31308 81,10465 X*X 0,00023 0,000297 0,000188 0,000149 0,000152 0,000142 0,000331 0,000223 0,000152 0,000287 0,00215 ̅ У-У -6,1 -32,1 5,9 22,9 23,9 30,9 -35,1 -7,1 19,9 -23,1 |𝜀/𝑦| ∗ 100% 0,73609 -2,16449 -1,93517 -1,3216 0,303681 1,590588 4,713462 -1,87727 -2,2044 3,025 0,865882 ̅̅̅̅̅̅ 𝑦 ∙ 𝑋 − 𝑦̅ ∙ 𝑋̅ 1.9648 − 139.1 ∗ 0.0145 = = −10864.583 ̅̅̅̅ 0.000215 − 0.0145 ∗ 0.0145 𝑋 2 − 𝑋̅ 2 𝑎 = 𝑦̅ − 𝑏𝑋̅ = 139.1 + 10864.583 ∗ 0.0145 = 296.636 Уравнение гиперболической модели: у̂ = 296.636 − 10864.583⁄𝑥 𝑏= ∑(𝑦−𝑦̂)2 𝜌𝑦𝑥 = √1 − ∑(𝑦−𝑦̅)2 =√1 − 81.105 5364.9 = 0.992 2 𝑅2 = 𝜌𝑦𝑥 = 0.9922 = 0.985 𝑅2 0.985 (𝑛 𝐹= × − 2) = ∗ 8 = 525.333 1 − 𝑅2 1 − 0.985 Cредняя относительная ошибка: 0.866 = 0.0866% 10 В среднем расчетные значения у̂ для гиперболической модели отличаются от фактических значений на 0.0866%. Для выбора лучшей модели построим сводную таблицу результатов: ̅̅̅̅̅̅ 𝐸𝑜тн = Линейная модель Степенная модель Показательная модель Гиперболическая модель Коэффициент детерминации 𝑅2 0.988 0.989 0.996 F критерий Фишера 658.667 719.273 1992 Индекс корреляции 𝜌𝑦𝑥 0.994 0.994 0.998 Cредняя относительная ошибка ̅̅̅̅̅̅ 𝐸𝑜тн -0.0528 0.037 1.6502 0.985 525.333 0.992 0.0866 Все модели имеют примерно одинаковые характеристикиб но большее значение критерия Фишера и большее значение коэффициента детерминации имеет гиперболическая модель. Ее можно взять в качестве лучшей для построения прогноза.