Файл 3 Методика (Коссов)

advertisement
1
Методические пояснения к прогнозу цен на годы вперед.
Необходимо прочитать «International Dispersion of Retail Diesel Fuel Prices and the
Estimation of Normal Price Values»
Vladimir V. Kossov
National Research University Higher School of Economics
Elena Kossova
National Research University Higher School of Economics
March 20, 2013
http://papers.ssrn.com/sol3/results.cfm
Методические рекомендации по построению прогноза цен на годы вперед
изложены на примере прогноза розничных цен на картофель в супермаркетах столиц на
2010-2013 годы по данным за 2000-2009 годы. Исходные данные о ценах взяты из
CityData, а о ВВП на душу населения из базы МВФ
/http://www.nationmaster.com/graph/eco_gdp_percap-economy-gdp-per-capita
Целью прогноза является расчет цен на картофель в Москве и Санкт Петербурге
(Питере). Идея, на которой основано построение прогноза, предполагает, что цены на
товары в разных странах отражают различия между ними по уровню экономического
развития, для описания которого используется ВВП на душу населения по паритету
покупательной способности валют (ВВП ППС). Предполагается, что в странах, у которых
значения ВВП ППС одинаковы, одинаковыми должны быть и цены на товары в одной
валюте. На этом предположении построены прогнозы: цены, существующие в странах с
более высоким уровнем экономического развития, рассматриваются как цены в России,
когда она достигнет такого же уровня экономического развития . По этой причине для
построения прогноза цен по России важно знать их существенно иными уровнями
экономического развития: как большими,так и меньшими российских. Это означает, что
прогноз по России является одним из прогнозов по странам, входящим в выборку.
При подборе городов для построения прогноза цен по этим городам необходимы
данные по городам, в отношении которых должны выполняться два условия. Первое –
2
значительная роль товара, в нашем случае картофеля, в потреблении. По этой причине,
например, нет смысла использовать данные по Токио или Риму. Второе уcловие является
техническим и связано с выполнением расчетов в EXEL, что важно для их наглядности.
Программа регрессии в EXEL ограничена 16 независимыми переменными. По этой
причине число городов для расчетов не может значительно превышать 10. В
рассматриваемом примере 11 городов:
1) Восток - Москва, Питер, Киев,Варшава, Будапешт – страны с переходной
экономикой;
2) Запад – Берлин, Амстердам, Копенгаген, Стокгольм, Хельсинки и Осло – развитые
страны, отличающихся развитыми рынками на цены на которых близки к
нормальным.
Таб.1 Потребление картофеля на душу населения, кг
Страны
Годы
Потребление
Россия
2009
113
Украина
2009
133
Польша
2008
118
Венгрия
2007
60
Германия
2007
72
Нидерланды
2007
75
Дания
2007
82
Финляндия
2007
58
Италия
2006
43
Источник: Росстат РОССИЙСКИЙ СТАТИСТИЧЕСКИЙ ЕЖЕГОДНИК 2010 ,таб.26.14
Из таблицы видно, что Россия, Украина и Польша отличаются наиболее высоким
потреблением картофеля.
Данные представлены в Приложении на листах EXEL
Лист 1 Цены.
На листе представлены:
1.1 Цены на картофель в долларах США за 2000-2012 годы. Ряды за 2000-2009 гг.
используются для построения прогноза на 2010 – 2012 гг. Обозначение цен – р.
1.2 Наивный прогноз - экстраполяция цен на 2010-2012 гг. по линейному тренду. Он
используется как тест для оценки прогноза, построенного на нормальных ценах.
Наивный прогноз строится по тренду цен за 2000-2009 годы (таб.1.1) Коэффициенты
регрессии (a и b) определяются с помощью программы Статистические/ЛИНЕЙН.
1.3 Средняя квадратическая ошибка прогноза по каждому городу,процентов. Одинаковые
знаки у относительных ошибок прогноза указывают на его систематическое смещение
по отношению к базе, в причинах которого следует разбираться.
3
Лист 2 Данные
Исходные данные представлены в таблицах:
2.1 ВВП на душу в текущих ценах с пересчетом из национальной валюты в доллары США
по рыночному курсу валют, обозначение – Y.
2.2 ВВП на душу по паритету покупательной способности валют в международных
долларах США, обозначение V;
2.3 Индекс как соотношение двух курсов валют, обозначение I, I=V/Y;
2.4 Цены барреля нефти и их логарифмы по годам.
2.5 Логарифм уровня цен, обозначение z, z=p/Y.По ней рассчитываются две группы
средних: по городам и годам.
2.6 Для подсчета средней по городам исключаются выбросы и провалы, наблюдаемые в
отдельные годы.
2.7 Логарифм ВВП по ППС. По нему рассчитываются две группы средних: по городам и
годам.
2.8 Логарифм I.
2.9 По средним из таб.2.4 и 2.6 строятся таб.2.9 и график 2.1 - проекты магистрали: по
городам и годам и их график «2.1 Два проекта магистрали». На рис.2.1 видно, что
данные по годам размещены внутри массива данных городам. По этой причине для
проекта магистрали выбираются данные по городам. Расположение трендов под
небольшим углом друг к другу позволяет считать обе выборки (по городам и по годам)
взятыми з одной совокупности.
3 Лист 3. Обоснование искусственных переменных.
Магистраль
Определение магистрали имеет решающее значение для надежности прогноза.
Магистраль вбирает в себя суть зависимости между уровнем цен и ВВП на душу
(выраженных в логарифмах) по отношению к которой сначала выявляются особенности
отдельных городов, а затем оцениваются их значения.
Разделение уровня цен на международную и национальную составляющие
напоминает магистраль между двумя большими городами (международная составляющая)
с съездами с неё (национальные составляющие). Различаются три типа национальных
составляющих по отношению к магистрали, международной составляющей.
Типы национальных составляющих.
Особенность национальной составляющей
Моделирование
параллельная дорога – изменение уровня
цен на фиксированную величину в
большую или меньшую стороны. Угол
наклона к оси абсцисс остается тем же, что
и у магистрали. Это означает неизменность
условий реализации товара в
рассматриваемом периоде.
изменение угла наклона к оси абсцисс , что
отражает постепенное изменение условий
реализации товара в рассматриваемом
Искусственная переменная –
фиксированный эффект (μ)
Произведение μ*t
4
городе
переключение, характерной особенностью
которых является график национальной
составляющей, напоминающий угол
Две искусственных переменных по одной
на сторону угла
3.1
Удаление от проектируемой магистрали как разность между ln(z) и его значением,
рассчитанным как функции от основной объясняющей переменной – ln(V).
Коэффициенты уравнения для расчета проектируемой магистрали определены в т.2.9.
3.2
Представление удалений из таб.3.1 по годам и городам. По каждому городу
рассчитываются средние удаления от магистрали и коэффициенты корреляции,
показывающие связь удалений от магистрали со временем. Среднее удаление по городу
до 0,1 принимается за положение на магистрали, выделенные жирным шрифтом: Киев,
Амстердам, Копенгаген и Осло.
По значениям коэффициентов корреляции можно судить о характере удалений от
магистрали. Их можно считать случайными для: Питера, Берлина и Осло - коэффициент
детерминации (R2<0,1) при существенно разном положении городов: Питер и Берлин
лежат выше магистрали, а Осло – на ней,. Явно не случайны (R2>0,5) они для Киева,
Копенгагена, Стокгольма и Хельсинки (красный шрифт).
По остальным четырем городам (Москва, Варшава, Будапешт, Амстердам) ситуация
меняется внутри периода. Особенности удалений от магистрали по каждому городу видны
на графиках.
3.3 Проект искусственных переменных по городам. Эти переменные определяют
удаление города от магистрали. Предполагается, что оно сохранится в прогнозируемом
периоде. Для городов, по которым коэффициент R2 <0,5 искусственные переменные
принимаются равными 1,т.е. удаление существует и не меняется на протяжении периода.
Для городов с выраженной динамикой при положительном коэффициенте они
принимаются равными ИП 1,2,…,10 (удаление от магистрали увеличивается со
временем), а при отрицательном 10,9,…,1 (удаление от магистрали уменьшается со
временем) . В обоих случаях предполагается, что удаления пересекают магистраль.
3.4
ИП – годы. Для каждого года (с 2000 до 2009) вводится искусственная бинарная
переменная, у которой данному голу соответствую 1, а все остальные – 0. По существу
переменные по годам являются поправками к цене нефти по годам, которая внутри года
не по городам не меняется.
Исходное условие – решение задачи с помощью EXELвынуждает отобрать из этих
переменных только статистически значимые. В.т.3.4 приведена модель, её первое решение
в т.3.4.0 и 3.4.1 окончательное, из которого следует, что при включении в модель
переменной цена нефти ИП по времени оказываются статистически не значимыми
(красный шрифт). Переменная считается статистически значимой и оставляется для
дальнейших расчетов при вероятности (р-значение) не выше 0,1.
Т. аб.3.4.1
окончательное решение: все ИП по годам статистически не значимы и исключаются из
дальнейших расчетов.
4. Лист 4 Оценка параметров модели.
5
Таб. 4.0 – матрица задачи. В дополнение к искусственным переменным по городам по
Стокгольму и Хельсинки введены фиксированные эффекты (1,1,….,1), допускающие
расположение городов в стороне от магистрали. Test в таб.4.0 – проверка решения.
Структура матрицы: ln(z); основные переменные (ln(V), ln(I), ln(Oil)); искусственные
переменные по городам (таб.3.3) + фиксированные эффекты по Стокгольму и Хельсинки,
введенные в процессе решения.
Ln(Int) – логарифм международной составляющей – магистраль.
Ln(Особ) – логарифм особенностей городов.
Res – остатки регрессии из таб.4.3
Оценка параметров проводится в два этапа. На первом этапе из состава
переменных исключаются статистически не значимые.
4.1 Не значимы переменные ln(Oil) и Стокгольм (красный шрифт). По Стокгольму, как и
по Хельсинки, вводим фиксированный эффект (1, 1,…,1).
4.2 ИП значимы. Не значимы ln(Oil) и слабо значим ln(I). Проверка остатков на наличие
трендов по городам. Тренды не выявлены (рис.4.2). Исключаем ln(Oil).
4.3 Все переменные значимы (зеленый). Проверка остатков на наличие тренда, рис. 4.1
показывает отсутствие тенденций.
4.4. Особенности городов (ln(Pec)) развернут в таблицу города по годам. На магистрали
находится один город – Осло. Москва, Питер,Берлин, Амстердам лежат выше магистрали,
а Варшава и Будапешт – ниже. Три города: Копенгаген, Стокгольм и Хельсинки ежегодно
удаляются от магистрали примерно на 5% (нижняя строка таб.4.5).
Итог. Нормальными для страны цены на картофель можно считать цены в Осло. Ниже
нормальных для города цены в Варшаве и Будапеште. Во остальных из исследованных
городов они выше нормальных.
4.5 Прогноз особенностей городов на 2010-2012 годы. Осло – остается на магистрали.
Копенгаген, Стокгольм и Хельсинки - изменяют свое положение с выявленной
скоростью. По остальным городам сохраняются выявленные фиксированные эффекты.
Сказанное означает предположение об отсутствии изменений в условиях формирования
цен на картофель в 2010-2012 годах по сравнению с 2000-2009 годами.
5. Лист 5 Прогноз цен
5. Прогноз ln(Int)
5.1 Значения основных переменных ( ln(V) и ln(I)) на 2010-2012 гг. принимаются по
факту из таб.2.6 и.2.8. Веса в таб.4.3 выделены синим цветом.
6
5.2 Добавка особенностей городов (транспонированная таблица 4.5) и расчет значений
прогноза (Proxy) как [exp(ln(Int)+ln(Nat)]*Y = exp(ln(Int)+ln(Nat)+ln(V)-ln(I)
5.3 Сравнение с результатами наивного прогноза(т.1.3) по среднеквадратической ошибке:
лучше - Питер, Варшава, Берлин, Амстердам, Копенгаген , Стокгольм, Хельсинки ;
практически одинаковы - Москва и Осло;
формально хуже – Киев, однако причина в резком падении цены на картофель в 2012 г.
Ошибки прогноза по 2010 и 2011 годам минимальны и имеют разные знаки.
6. Выводы
1. Прогноз на основе нормальных цен дал лучшие результаты по сравнению с
наивным прогнозом для большинства городов.
2. Ошибки прогноза значительны. Особенно велики они по 2012 г. Это означает, что
условия формирования цен, характерные для 2000-2009 годов, быстро меняются. По
Берлину, Хельсинки и Амстердаму ошибка прогноза систематическая – цены
завышаются.
3. Для точности прогноза использование данных только о прошлом недостаточно.
Необходимы сведения из сценариев развития экономики, позволяие сосавить
представления о грядущих изменениях.
Download