к вопросу о применении модели географически взвешенной

advertisement
К ВОПРОСУ О ПРИМЕНЕНИИ МЕТОДА ГЕОГРАФИЧЕСКИ
ВЗВЕШЕННОЙ РЕГРЕССИИ
Стебунова О.И.
Оренбургский государственный университет, г. Оренбург
Проблемы спецификации эконометрических моделей часто возникают,
если статистические данные являются пространственно зависимыми и
измеряются на территории неоднородной по составу. При построении
классической регрессионной модели предполагается, что исходные данные
являются однородными по всей исследуемой области, а оцениваемые
коэффициенты вычисляются по характеристикам, полученным для
конкретного местоположения объекта и, возможно, несущим его
специфические особенности. В результате получается модель, описывающая
изменения, характерные в среднем для всей исследуемой совокупности
данных. Как известно, любое усреднение сглаживает индивидуальные
характеристики объектов, поэтому получаемые модели затушевывают
особенности и не отражают реальных закономерностей, присущих
отдельным территориям. Таким образом, при моделировании экономических
явлений необходимо учитывать изменения взаимосвязей признаков в
пространстве, а также привязку объекта к конкретному местоположению.
В литературе учет территориальной неоднородности рассматривается в
контексте общей проблемы построения регрессионных моделей по
неоднородным
данным.
Для
анализа
территориальных
данных,
регрессионную неоднородность учитывают разделением исследуемой
области на однородные группы (зоны). После чего в модель вводят
фиктивные
переменные,
характеризующие
территориальную
принадлежность объектов [1]. Однако, введение фиктивных переменных
значительно увеличивает число оцениваемых коэффициентов, что зачастую
приводит к незначимым оценкам и неадекватной модели. При этом, следует
отметить, что зонирование исследуемой территории зависит от выбора
масштаба, оказывающего влияние на результаты эконометрического
моделирования и зависящего от определения границ.
Для решения вышеперечисленных проблем в работах [2, 3]
предлагается использовать метод географически взвешенной регрессии,
который можно рассматривать как некоторое обобщение модели с
фиктивными переменными и получать модель с непрерывно меняющейся
структурой. При географическом подходе считается, что модель не является
постоянной для всей исследуемой области, а меняется в зависимости от
местоположения объекта, и ее коэффициенты являются функциями
координат.
Модель географически взвешенной регрессии имеет вид:
p
yi   0 ui , i     k ui , i   xik  i ,
k 1
(1)
где u i , i  - местоположение i  го объекта (координаты i  й точки);
yi - значение результативного признака;
xik - значение k  й объясняющей переменной для i  го объекта;
 k ui , i  - неизвестные коэффициенты;
 i - регрессионные остатки;
i  1,2..., n; k  1,2,..., p.
Для оценивания параметров представленной модели регрессии
необходимо к исходным данным, характеризующим объекты исследования,
добавить их условные координаты. После получения дополнительной
информации можно приступать к расчету оценок параметров, используя
метод наименьших квадратов. В целях выявления индивидуальных
особенностей используются не все имеющиеся наблюдения, а только
соседние с i , степень близости объектов учитывается с помощью весов wij .
Вектор оценок коэффициентов для каждого местоположения i вычисляется
по формуле [2, 3]:
ˆ u i , i   X T W u i , i X  X T W u i , i Y ,
1
(2)
 wi1 0 ... 0 


 0 wi1 ... 0 
где W u i , i   
- матрица весовых коэффициентов
... ... ... ... 


 0

0
w
i1 

размерности n  n , элементы которой определяют степень влияния соседей
j на зависимость в местоположении i .
При определении элементов матрицы W (ui , vi ) исходят из того, что
более близкие соседи оказывают наибольшее влиянии. Существуют
различные методы вычисления весовых коэффициентов, описанные в
зарубежной и отечественной литературе [2, 3]:
- метод административно-территориального деления;
- метод движущегося фиксированного окна;
- метод фиксированного ядра;
- метод адаптивных ядер.
Использование дискретного подхода (методы административнотерриториального деления и движущегося фиксированного окна) при
вычислении весов позволяет учесть территориальную неоднородность, но
при этом модели для каждой однородной группы не связаны друг с другом.
Кроме того, влияние всех объектов-соседей считается одинаковым, однако, в
большинстве случаев это влияние уменьшается с увеличением расстояния.
Поэтому имеет смысл более близким соседям придавать больший вес, чем
дальним. Подход, в котором веса строятся с учетом непрерывного изменения
расстояния между исследуемыми объектами называют ядерным (методы
фиксированного ядра и адаптивных ядер). При этом, для исследования
территорий с равномерным расположением объектов рекомендуется
применять метод фиксированного ядра, а в случае неравномерной
концентрации – метод адаптивных ядер.
Исследование статистических свойств оценок коэффициентов модели
географически взвешенной регрессии, проверка гипотез о незначимости
модели, отдельных коэффициентов соответствуют стандартным процедурам
классического регрессионном анализа и подробно описаны в литературе [2,
3].
Метод географически взвешенной регрессии также можно
использовать для предварительного анализа данных. Так, при анализе
бинарных показателей для расчета статистических характеристик в
местоположении i берутся значения соседних объектов с соответствующими
весовыми коэффициентами, и определяется доля элементов совокупности p i ,
обладающая заданным признаком:
x w
j
pi 
ij
j
,
w
(3)
ij
j
где wij - вес, рассчитанный одним из методов географической
регрессии;
x j - бинарные переменные.
Аналогично с использованием географически рассчитанных весов
можно вычислить все показатели описательной статистики, например,
выборочную среднюю можно определить по формуле:
x w
j
хi 
ij
j
w
.
(4)
ij
j
Значения таких показателей будут непрерывно меняться по всей
области вычислений аналогично коэффициентам географически взвешенной
регрессии.
Как известно, изменение средней величины признака происходит
случайным образом или по определенной тенденции, обусловленной
пространственной неоднородностью. Поэтому представляет интерес
проверка гипотезы о том, что колебания средней величины возникают за счет
случайных факторов, то есть H 0 : M xi    . При выполнении этих условий
среднее значение имеет асимптотически нормальное распределение с
параметрами:
M  xi    wij  
j
zi 
xi  

w
и
Dxi     2 wij2   2  wij2 ,
j
статистика
j
 N 0,1 .
ij
j
Если нулевая гипотеза принимается, то изменение среднего значения
носит случайный характер. В противном случае выделяют зоны,
представляющие потенциальный интерес для дальнейшего анализа.
Также представляет интерес вычисление географически взвешенного
коэффициента корреляции между регрессорами. В этом случае особое
внимание уделяют зонам со значением коэффициента корреляции по
абсолютной величине близким к единице.
Таким образом, географически взвешенное моделирование позволяет
анализировать изменения коэффициентов модели в зависимости от
территориальной
принадлежности
и
определять
индивидуальные
особенности факторов, которые нивелируются при построении обычной
регрессионной модели. Все это дает возможность получать непрерывно
меняющуюся картину не только получаемых коэффициентов модели, но всех
статистических характеристик, описывающих социально-экономический
процесс.
Список литературы
1. Эконометрика: учеб. /под ред. д-ра экон. наук, проф. В.С.
Мхитаряна. – М.:Проспект, 2009. – 384 с. – ISBN 978-5-392-00188-0.
2. Эконометрическое моделирование пространственных данных:
[монография] / О.С. Балаш, А.В. Харламов. – Саратов: Научная книга, 2010.
– 112 с. – ISBN 978-5-9758-1107-3.
3. Fotheringham, A. Geographically Weighted Regression /А.
Fotheringham, С. Brunsdon, М. Charlton. John Willey & Sons, 2002 – 269 с. –
ISBN 0-471-49616-2.
Download