Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования

Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет «Высшая школа экономики» Факультет прикладной политологии Кафедра политического поведения БАКАЛАВРСКАЯ РАБОТА На тему Валидность индексов государственной состоятельности Студент группы № 443 Зверева Дарья Игоревна Руководитель ВКР доцент, к.полит.н. Стукал Денис Константинович Консультант ординарный профессор, д.полит.н. Урнов Марк Юрьевич Москва – 2013 Оглавление Введение ......................................................................................................................................... 3 Глава 1. Основные подходы к концептуализации и операционализации государственной состоятельности ............................................................................................ 7 Глава 2. Описание данных и методов исследования ................................................................ 21 2.1. Описание методов исследования.................................................................................... 21 2.2. Описание данных ............................................................................................................. 34 Глава 3. Анализ валидности индексов государственной состоятельности .......................... 38 Заключение ................................................................................................................................... 51 Список литературы ...................................................................................................................... 55 Приложение 1 ............................................................................................................................... 59 2 Введение В настоящее время все большую популярность приобретают исследования, касающиеся государственной состоятельности. Хотя изучение государства и особенностей его функционирования уходит корнями еще в античную классику и встречается в сочинениях Платона и Аристотеля, интерес к этой проблематике значительно возрастает в Новое время, когда распадается синкретичное понимание общества и государства, и последнее концептуализируется как отдельная категория политической мысли и объект исследования. В это время значительный вклад в изучение государства и его особенностей был сделан Н. Макиавелли, Т. Гоббсом, Дж. Локком, Ж.Ж. Руссо. Новейшее разновидностях время обогатило дискуссию государства изучением качества о сущности государства – и в политической науке получило распространение понятие государственной состоятельности, рассматриваемое как в сугубо теоретическом, так и в эмпирическом ключе благодаря развитию статистических методов анализа, позволяющих глубже проникнуть в различные аспекты этого явления. Один из центральных вопросов для эмпирических исследований государственной состоятельности состоит в валидности существующих индексов: действительно ли, используя существующие индексы, политологическое сообщество выявляет взаимосвязь именно этой характеристики государства с другими качествами социально-экономических и политических процессов? На сегодняшний день понятие государственной состоятельности наиболее часто изучается в рамках таких субдисциплин политической науки, как сравнительная политология и международные отношения. Ему посвящено большое число исследований факторов экономического развития, гражданских конфликтов, международной безопасности и консолидации режимов. Так, например, Д. Асемоглу (Daron Acemoglu), С. Джонсон (Simon Johnson) и Дж. Робинсон (James Robinson) уделяют особое внимание способности государства заинтересовать инвесторов, что возможно только 3 при соответствующем уровне государственной состоятельности.1 Дж. Фирон (James Fearon) и Д. Лэйтин (David Laitin) исследуют влияние размера вооруженных сил государства на вероятность возникновения гражданских конфликтов.2 А. Винчи (Anthony Vinci) изучает влияние наличия незаконных вооруженных формирований на территории государства на международную безопасность.3 Следует отметить, что названные авторы исходят из разного понимания государственной состоятельности, и потому используют различные ее эмпирические показатели. Существование большого количества подходов к концептуализации и операционализации государственной состоятельности обусловлено, прежде всего, многомерностью данного явления и его латентным (синтетическим) характером. Исследователи расходятся в используемых индексах, что иногда приводит к получению противоречивых эмпирических результатов (например, Т. Ремингтон (Thomas Remington)4 пришел к выводу, что демократизация не приводит к улучшению качества институтов и государственной состоятельности, в то время как Дж. Фортин (Jessica Fortin)5 говорит о том, что высокий уровень демократии повышает уровень государственной состоятельности). В связи с этим все более остро встает проблема определения валидности используемых индексов, то есть определения того, в какой мере эмпирические индикаторы латентного (синтетического) понятия отражают именно то, что они должны отражать. Валидность является одним из ключевых свойств любого исследования, так как от наличия или отсутствия этой характеристики у используемых индикаторов зависит ценность полученных результатов. Использование 1 2 3 4 5 Acemoglu D., Johnson D., Robinson J. (2001). The colonial origins of comparative development: An empirical investigation. American Economic Review, 91(5). pp. 1369-1401. Fearon J., Laitin D. (2003). Ethnicity, insurgency, and civil war. American Political Science Review, 97(1). pp. 75-90. Vinci A. (2008). Anarchy, Failed States, and Armed Groups: Reconsidering Conventional Analysis. International Studies Quarterly, 52(2). pp. 295–314. Remington T. Democratization, separation of powers, and state capacity. In T.J. Colton and S. Holmes, The State after Communism: Governance in the new Russia.Lanham: Rowman & Littlefield Publishers, 2006. P. 289. Fortin J. (2012). Is There a Necessary Condition for Democracy? The Role of State Capacity in Postcommunist Countries. Comparative Political Studies, 45(7). pp. 903-930. 4 показателей, не являющихся содержательно, конвергентно, предсказательно или номологически валидными, может привести исследователей к принципиально разным выводам там, где они должны быть одинаковы (и наоборот), что чревато развитием дальнейших исследований в неверном направлении. Актуальность данного исследования обусловлена не только самой важностью определения валидности индексов государственной состоятельности, но и новаторским характером данной работы, так как систематические исследования валидности этого концепта до сих пор не проводились. Исследовательский вопрос данной работы: являются ли существующие индексы государственной состоятельности валидными? Объектом исследования является категория государственной состоятельности, предметом — валидность индексов государственной состоятельности. Целью данной работы является выявление наличия или отсутствия свойства валидности у изучаемых индексов государственной состоятельности. Для достижения поставленной цели необходимо решить ряд задач:  определить основные подходы к концептуализации и операционализации государственной состоятельности;  определить основные подходы к выявлению валидности индексов;  собрать исходные данные, необходимые для построения индексов государственной состоятельности; с помощью статистических методов определить валидность существующих индексов государственной состоятельности. Методологией исследования является неоинституционализм, позволяющий учитывать не только формальные, но и неформальные институты. Основные положения неоинституционализма заключаются в том, что социальные и политические институты имеют значение (institutions 5 matter)6 и их изучение возможно с помощью количественных методов анализа, в том числе, выработанных в рамках экономической науки. Рабочей гипотезой данного исследования является предположение о том, что индексы государственной состоятельности валидны только в рамках отдельных концептуальных подходов, и не валидны в рамках других, то есть, в целом, существующие индексы государственной состоятельности не обладают свойством множественностью валидности. подходов к Это связано прежде операционализации всего с государственной состоятельности и отсутствием консенсуса по поводу концептуализации. По своей структуре работа состоит из введения, трех глав и заключения. В первой главе представлены теоретические и практические подходы к определению государственной состоятельности, а также критический анализ ряда исследований по данной тематике. Во второй главе описывается массив анализируемых данных, а также основные методы исследования: корреляционный анализ, метод главных компонент, регрессионный анализ, моделирование структурными уравнениями. В третьей главе приводятся и обсуждаются результаты, полученные с помощью количественных методов анализа данных. В заключении приведены ключевые выводы и предложены дальнейшие направления исследований. 6 North D. Structure and change in economic history. N.-Y.: Norton., 1981. 240 p. 6 Глава 1. Основные подходы к концептуализации и операционализации государственной состоятельности После достаточно продолжительного периода забвения политической наукой понятия государства и доминирования теоретических подходов, оперировавших либо более узкими категориями (индивиды, институты), либо более широкими (система), начиная с 1970-х интерес к государству возрождается: в 1968 г. Дж. Неттл (John Nettl)7 пишет статью о различных аспектах государственности, среди которых, вероятно, впервые упоминается государственная состоятельность; в 1975 под редакцией Ч. Тилли (Charles Tilly)8 публикуется сборник, посвященный формированию государств (statebuilding); в 1985 г. выходит знаменитая книга П. Эванса (Peter Evans), Д. Ройшмеера (Dietrich Rueschemeyer) и Т. Скочпол (Theda Skocpol) – «Возвращаясь к государству» (Bringing the State Back In),9 в которой авторы выдвигают тезис о том, что государство оказывает значительное влияние на политические и социальные процессы. Начиная с этого момента, все больше исследователей обращают внимание на то влияние, которое оказывает функционирование государственных институтов на экономический рост, гражданские конфликты, международную безопасность и развитие человеческого и социального капитала.10 Разнообразие сфер исследований, в которых использовалась государственная состоятельность в качестве объясняющей переменной, во многом, объясняет количество и разнообразие индикаторов, использующихся в качестве эмпирических показателей этого теоретического понятия (прокси-переменных). Nettl J. (1968). The State as a Conceptual Variable. World Politics, 20(4). pp. 559-592. Tilly Ch. The Formation of National States in Western Europe. Princeton: Princeton University Press, 1975. 711 p. 9 Evans P., Rueschemeyer D., Skocpol T. Bringing the State Back In. Cambridge University Press, 1985. 404 p. 10 Подробнее см.: Tilly Ch. Coercion, Capital and European States: AD 990 – 1992. Oxford: Wiley-Blackwell, 1992. 288 p.; Evans P. Embedded Autonomy: States and Industrial Transformation. Princeton: Princeton University Press, 1992. 366 p.; Spruyt H. The Sovereign State and Its Competitors. An Analysis of System Change. Princeton: Princeton University Press, 1994. 302 p.; Tilly Ch. Democracy. Cambridge: Cambridge University Press, 2007. 248 p. 7 8 7 Одной из первых и ключевых работ для современных исследований государства и, в частности, государственной состоятельности, является статья М. Манна (Michael Mann) «Автономная сила государства»,11 в которой автор выделил два вида власти: деспотическую и инфраструктурную. Инфраструктурная власть, с точки зрения автора, отражает способность институтов государства обеспечивать исполнение решений на своей территории. Такой тип власти связывает институты, выполняющие функцию контроля, с местными сообществами и элитами. Деспотическая власть – это некий набор действий, который элита может выполнить без согласования с гражданским обществом. Исследование М. Манна, во многом, и сейчас остается актуальным: свидетельством этого является относительно недавно опубликованная работа Х. Зойфера (Hillel Soifer) «Государственная инфраструктурная власть: подходы к концептуализации и измерению»,12 где автор связывает понятие деспотической власти с марксистской традицией изучения государства, а инфраструктурной власти – с веберовской, в которой государство представляет собой набор институтов, выполняющих функцию контроля и регуляции общественных отношений. Исследователь рассматривает три подхода к инфраструктурной власти13 — с точки зрения возможностей (capabilities) государства, осуществлять контроль, то с есть точки его зрения потенциальной охвата (reach) способности территории функционирующими государственными институтами и с точки зрения возможностей государства оказывать влияние на общество, то есть качества институтов. Очевидным достоинством этой работы является максимально широкое рассмотрение особенностей государства, так как исследователь Mann M. The autonomous power of the state: its origins, mechanisms and results. Archives européennes de sociologie 25; 1984, reprinted in M.Mann (ed.), States, war and capitalism. Oxford: Basil Blackwell, 1988. vol.25, pp. 183-213. 12 Soifer H. (2008). State Infrastructural Power: Approaches to Conceptualization and Measurement. St Comp Int Dev, 43. pp. 231-251. 13 Инфраструктурная власть часто используется как синоним государственной состоятельности. Например, в статье Дж. Фортин (2012). 11 8 принимает во внимание и объем ресурсов, которыми государство располагает для осуществления контроля, и реальное влияние («вес») государства на общество, и способность государства к эффективному контролю над своей территории. Однако необходимо учитывать, что объем ресурсов ничего не говорит о том, как они используются: государство, обладающее значительными ресурсами, может не иметь институтов контроля над их распределением. Кроме того, Х. Зойфер не предлагает никакого решения проблемы операционализации понятия, лишь утверждая, что налогообложение может быть адекватным индикатором в рамках всех трех подходов, что, очевидно, является чрезмерным упрощением. Стоит признать, что Х. Зойфер является не единственным исследователем, склонным к сведению государственной состоятельности к налогообложению, этой же точки зрения придерживается такой авторитетный ученый, как Ф. Фукуяма (Francis Fukuyama).14 Однако не все исследователи считают оптимальным настолько широкое определение инфраструктурной власти (государственной состоятельности). Под вышеуказанными компонентами инфраструктурной власти М. Браттон (Michael Bratton) и Э. Чанг (Eric Chang)15 понимают государственность (stateness). (Большинство политологов и, в том числе, профессор М.В. Ильин,16 считают, что государственная состоятельность является частью государственности).17 М. Браттон и Э. Чанг выделяют три ключевых измерения государственности: охват территории государства (обладание контролем над территорией, особенности инфраструктуры), легитимность государства и государственную состоятельность. Авторы считают, что для Fukuyama F. (2004). The Imperative of State-Building. Journal of Democracy, 15(2). pp. 17-31. Bratton M., Chang E.C. (2006). State Building and Democratization in Sub-Saharan Africa: Forwards, Backwards, or Together? Comparative Political Studies, 39(9). pp. 1059-1083. 16 Ильин М.В. Пределы государственной состоятельности стран мира // Сравнительная политика. - 2011. № 3. - C.37-45. 17 Подробнее см.: Ilyin M.V., Khavenson T., Meleshkina E.Y., Stukal D., Zharikova E. Factors of Post-Socialist Stateness / Working papers by NRU Higher School of Economics. Series PS "Political Science". 2012. No.03. P.6. 14 15 9 возникновения государственности, которую они операционализируют как среднее из пяти индикаторов управления (Governance Indicators) Всемирного банка (политической стабильности, эффективности правительства, качества регулирования, верховенства закона, контроля над коррупцией), необходима децентрализация государственной власти, гражданское общество и установление норм, регулирующих отношения между гражданами и государством. В исследовании М. Браттона и Э. Чанга государственная состоятельность определяется как наличие необходимых средств для выполнения поставленных задач. Одной из них может быть, например, установление легитимного политического порядка. Исследователи выделяют такие подкомпоненты государственной состоятельности, как развивающую мощность, мощность по обеспечению правопорядка, административную мощность, мощность социального обеспечения, мощность восприимчивости (подотчетности). Очевидно, что наличие этих признаков характерно для либеральных демократий, то есть, фактически, большинство автократий в рамках данного подхода должны быть априори признаны не обладающими государственной состоятельностью, что весьма сомнительно, если учесть опыт «азиатских тигров». Еще один пример весьма расплывчатой концептуализации изучаемого понятия может быть найден в статье «Сначала государственность?»18 Й. Моллера (Jorgen Moller) и С.-Э. Скаанинга (Svend-Erik Skaaning), которые определяют государственную состоятельность как способность к реализации политики (policy). Авторы считают, что данное определение выходит за рамки государственности, которую они вслед за Х. Линцем (Juan Linz) и А. Стефаном (Alfred Stepan)19 определяют как монополию на использование силы в пределах суверенной территории и наличие базового соглашения 18 19 о гражданстве, так как понимаемая таким образом Moller J., Skaaning S.-E. (2011). Stateness first? Democratization, 18(1). pp. 1–24. Linz J., Stepan A. Problems of Democratic Transition and Consolidation: Southern Europe, South America, and post-communist Europe. Baltimore: Johns Hopkins University Press, 1996. 504 p. 10 государственность не подразумевает наличие той управленческой способности, которая нужна для реализации политики. Й. Моллер и С.-Э. Скаанинг считают управленческую способность атрибутом либеральной демократии. Безусловно, авторы правы в том, что важно не смешивать понятия государственной состоятельности и демократии, однако, это, скорее, отражает проблему выбора адекватных индикаторов, чем теоретическое противоречие государственной между состоятельности. концептами Ведь государственности и государство, не обладающее государственной состоятельностью, вряд ли имеет высокие шансы на продолжительное существование – хотя бы в силу того, что, не обладая управленческой способностью, оно не сможет институционализировать конфликты и подавлять вызовы собственной власти. Существует целый ряд исследований (в основном, в рамках политической конфликтологии), в которых силовой аргумент является основным для признания государства обладающим свойством государственной состоятельности, которая понимается как способность с помощью силы (военной, или принудительной мощи) обеспечивать предотвращение и подавление вызовов, исходящих как извне, так и изнутри государства. Принудительная сила (мощь) часто операционализируется с помощью индикаторов из базы «Корреляты войны» (Correlates of War): количества военных на душу населения и доли расходов на содержание армии в ВВП. На сегодняшний день среди исследователей нет консенсуса о наличии и направленности причинно-следственной связи между военной мощью и особенностями протекания и исхода гражданских и военных конфликтов. Так, Б. Вальтер (Barbara Walter)20 пишет об отсутствии связи между величиной военного институционализации конфликта. 20 контингента Э. Хендерсон и (Errol вероятностью Henderson) и Walter B. (2006). Building reputation: Why governments fight some separatists but not others. American Journal of Political Science, 50(2). pp. 313-330. 11 Д. Сингер (David Singer),21 напротив, считают, что связь есть: более высокие расходы на армию увеличивают вероятность конфликта, так как среди гражданского населения возникает недовольство привилегированным положением военных.22 Военная мощь может быть ключевым фактором не только для разрешения внутренних конфликтов, но и для обеспечения международной безопасности. Если государство не может контролировать свою территорию, особенно с точки зрения преступности и терроризма, миграции населения, распространения различных заболеваний, это начинает угрожать и международной безопасности. А. Винчи (Anthony Vinci)23 пишет о том, что негосударственные вооруженные группировки могут стать самостоятельными акторами, причем более влиятельными, чем государство (примером такой группировки является Хезболла, представляющая серьезную угрозу для международной безопасности). Существенным недостатком операционализации через военную мощь (принудительную силу) является то, что она приводит исследователей к диаметрально противоположным выводам: Д. Мэсон (D. Mason) и Д. Крейн (Dale Krane)24 пришли к выводу, что высокие военные расходы увеличивают вероятность возникновения гражданских конфликтов, а Дж. Фирон (James Fearon) и Д. Лэйтин (David Laitin),25 напротив, считают что если в государстве существует большая армия, менее вероятны восстания против существующей власти, так как государство обладает мощным аппаратом принуждения. Очевидно, что большая армия может быть как признаком военной силы, так и вынужденным ответом на военную угрозу. Альтернативным подходом является определение государственной 21 22 23 24 25 Henderson E., Singer D. (2000). Civil war in the post-colonial world, 1946–1992. Journal of Peace Research, 37(3). pp. 275-299. Также о связи военных расходов и уровня коррупции см.: Gupta S., Mello L., Sharan R. (2001). Corruption and military spending. European Journal of Political Economy, 17(4). pp. 749-777. Vinci A. Ibid. Mason D., Krane D. (1989). The political economy of death squads: Toward a theory of the impact of statesanctioned terror. International Studies Quarterly, 33(2). pp. 175-198. Fearon J., Laitin D. Ibid. 12 состоятельности как исключительно управленческой (административной) способности государства. С этой точки зрения государственная состоятельность заключается в умении государства получать и использовать информацию для разрешения существующих и потенциальных проблем без использования вооруженных сил. В рамках литературы по политическому развитию государственная состоятельность часто операционализируется через различные показатели профессиональности бюрократического аппарата государства. В целом, здесь можно выделить два основных подхода: через оценку качества бюрократии и риска экспроприации. Представителями первого подхода являются Sobek).26 Авторы К. де Роуэн (Karl DeRouen) и Д. Собек (David исследуют, как качество бюрократии, операционализированное с помощью нескольких индикаторов из базы Группы по оценке политических рисков (Political Risk Service’s Group), влияет на продолжительность и исход гражданских войн. Эти индикаторы отражают то, насколько бюрократия характеризуется регулярным, меритократическим рекрутированием и продвижением; независимостью от политического давления; способностью предоставлять услуги во время смены правительства. Еще одним примером такого подхода является исследование Х. Бёк (Hanna Baeck) и А. Хадениуса (Axel Hadenius),27 которые определяют государственную состоятельность как административную способность (administrative capacity), являющуюся частью государственности, под которой авторы подразумевают поддержание суверенитета. Х. Бёк и А. Хадениус считают, что при наличии государственной состоятельности на территории государства не может быть конкурирующих с государством акторов, обладающих контролем над вооруженными силами, правом на издание законов или правом налогообложения. Используя индикаторы из базы Группы по оценке 26 DeRouen K., Sobek D. (2004). The dynamics of civil war duration and outcome. Journal of Peace Research, 41(3). pp. 303-320. 27 Baeck H., Hadenius A. (2008). Democracy and State Capacity: Exploring a J-Shaped Relationship. Governance: An International Journal of Policy, Administration, and Institutions, 21(1). pp. 1-24. 13 политических рисков (PRSG) «Качество бюрократии» и «Контроль коррупции», авторы приходят к выводу, что между демократией и государственной состоятельностью существует J-образная связь: при низких значениях демократии ее влияние на государственную состоятельность отрицательно, при средних — незначимо, а консолидированная демократия положительно влияет на государственную состоятельность. Оставляя в стороне вопрос о верности тезиса о J-кривой,28 заметим, что предложенный авторами подход к измерению государственной состоятельности является одним из наиболее популярных и используется также, например, Н. Чарроном (Nicholas Charron) и В. Лапуэнтэ (Victor Lapuente),29 которые, оценивая влияние политического режима на государственную состоятельность, предлагают концептуализировать последнюю как качество управления (способность государства выполнять свои функции эффективно и без коррупции). Авторы делают акцент не на объеме доступных государству ресурсов, а на способности управлять ими. Исследователи приходят к выводу, что бедные страны имеют более высокое качество управления при авторитарных политических режимах, а достаточно богатые — при демократических. Это связано, прежде всего, с тем, что в богатых странах уже достигнут определенный уровень общественного благосостояния, и потому политические лидеры имеют больше стимулов к улучшению качества управления, в то время как в бедных странах при недостаточном уровне благосостояния существуют заметные стимулы к перенаправлению средств на текущее потребление, а не на инвестирование в качество управления, преимущества повышения которого нельзя заметить в краткосрочном периоде. Подробнее см.: Мельвиль А.Ю., Стукал Д.К., Миронюк М.Г. "Царь горы", или почему в посткоммунистических автократиях плохие институты // ПОЛИС. - 2013. - №2. - С.125-142.; Мельвиль А.Ю., Стукал Д.К., Миронюк М.Г. Государственная состоятельность, демократия и демократизация (На примере посткоммунистических стран) // Политическая наука. - 2012. - №4. - С.83-104.; Melville A.Y., Stukal D.K. (2012). (Re-)Bulding the Ship of State at Sea? State Capacity and Regime Dynamics in PostCommunist Countries // WP BRP Series: Political Science, М.: ГУ ВШЭ, 07/2012. – 26 p. 29 Charron N., Lapuente V. (2010). Does democracy produce quality of government? European Journal of Political Research, 49(4). pp. 443-470. 28 14 Второй подход (оценка риска экспроприации) наиболее часто встречается в литературе по экономическому развитию, в которой особое внимание уделяется способности государства заинтересовать инвесторов. Д. Асемоглу (Daron Acemoglu), С. Джонсон (Simon Johnson) и Дж. Робинсон (James Robinson),30 например, используют показатель «риск экспроприации и нарушения государственных контрактов» из базы Группы по оценке политических способность рисков также (PRSG). иногда Административная операционализируется (управленческая) через индикатор финансовой силы институтов — CIM (contract intensive money), отражающий, по мнению А.Ю. Мельвиля,31 доверие населения к банковской системе. Довольно близким подходом является определение государственной состоятельности через извлекающую (extractive) мощь государства. Обычно она операционализируется через показатели налогов, сравниваемых с ВВП.32 Считается, что налоги от продаж собрать легче, чем, например, подоходные налоги,33 поэтому высокая доля внутренних налогов в ВВП является более устойчивым и правильным индикатором извлекающей мощи государства. Дж. Каглер (Jacek Kugler) и М. Арбетман (Marina Arbetman)34 предложили свой показатель относительной политической состоятельности (relative political capacity), который определяется как отношение реальных полученных налогов к ожидавшимся при данном уровне социальноэкономического развития. Авторы считают, что чем больше государство собирает налогов, тем оно более состоятельно. В эмпирических исследованиях для определения извлекающей мощи государства наиболее Acemoglu D., Johnson D., Robinson J. Ibid. Melville A.Y., Stukal D.K. (2012). Ibid. P. 8. Подробнее см.: Cheibub J.A. (1998). Political regimes and the extractive capacity of governments: Taxation in democracies and dictatorships. World Politics, 50(3). pp. 349–376.; Fauvelle-Aymar C. (1999). The political and tax capacity of government in developing countries. Kyklos, 52(2). pp.391-413.; Campbell J. (1993). The state and fiscal sociology. Annual Review of Sociology, 19. pp. 163-185. 33 Musgrave R. Fiscal Systems. New Haven, CT: Yale University Press, 1969. 318 p.; Tanzi V. Public Finance in Developing Countries. Aldershot: Edward Elgar. 1991. 258 p. 34 Kugler J., Arbetman M. (1997). Relative political capacity: Political extraction and political research. Political Capacity and Economic Behavior. Boulder, CO: Westview. pp. 11-46. 30 31 32 15 часто используются показатели Всемирного банка Bank) и способность и (World Международного валютного фонда (International Monetary Fund). Хотя операционализация извлекающую мощь не через приводит управленческую исследователей к диаметрально противоположным выводам, как это происходит с принудительной мощью, нельзя не заметить, что такой подход порожден, во многом, господством принципов и ценностей либеральной демократии. Для государственной состоятельности в рамках этого подхода необходимо существование профессиональной бюрократии, не только компетентной в своей сфере, но также и независимой от политического давления, особенно в периоды смены правительства, что практически невозможно в автократических режимах с характерной системой клиентелы. Отсутствие такой профессиональной бюрократии вовсе не означает автоматическую несостоятельность государства, поэтому данный подход также не является бесспорным. Еще одним возможным подходом к государственной состоятельности является рассмотрение качества и слаженности политических институтов. Государственная состоятельность определяется через уровень смешения демократических и недемократических черт. Наиболее распространенным и известным индикатором в рамках данного подхода является индекс «Полития» (Polity IV). Х. Хегре (Hevard Hegre) считает,35 что конфликты с большей вероятностью происходят в смешанных режимах, для которых характерно наличие как недемократических, так и демократических черт одновременно, так как обычно такие режимы не сильны ни в институционализации конфликтов, ни в подавлении вызовов политической элите. Эту точку зрения поддерживает и С. Гейтс (Scott Gates), который в статье 35 «Институциональная несостоятельность и политическая Hegre H., Ellingsen T., Gates S., Gleditsch N. (2001). Toward a democratic civil peace Democracy, political change, and civil war, 1816–1992. American Political Science Review, 95(1). pp. 33-48. 16 нестабильность»,36 используя Скалярный индекс политий (Scalar Index of Polities), пишет, что институционально состоятельные демократии и автократии существуют дольше несостоятельных (неконсолидированных режимов). Подход к государственной состоятельности через оценку качества и слаженности политических институтов даже интуитивно не кажется валидным, так как используемый для операционализации индекс «Полития» большинство исследователей политического режима, или считают же с его адекватным помощью индикатором можно оценить консолидированность режима. Уже упомянутые исследователи Дж. Фирон, Н. Чаррон и В. Лапентэ, Х. Бёк и А. Хадениус и многие другие используют понятия политического режима и консолидированности режима как зависимые или независимые переменные при моделировании связи с государственной состоятельностью, то есть считают показатель «Полития» индикатором отдельного, самостоятельного понятия. Очевидно, что вышеупомянутые подходы связаны между собой: без высокого уровня административной мощи довольно сложно собрать достаточное количество налогов, необходимое, помимо прочего, для поддержания принудительной мощи государства, без которой может быть сложно обеспечить сбор налогов. В связи с этим логичным представляется построение индексов государственной состоятельности, включающих в себя эти компоненты (возможно, в разных комбинациях), а не использование индикаторов, отражающих лишь небольшую часть концепта государственной состоятельности. Одним из примеров такого подхода является вышеупомянутое (в связи с соотношением концептов государственности и государственной состоятельности) исследование М. Браттона и Э. Чанга (2006). Индекс 36 Gates S., Hegre H., Jones M., Strand H. (2006). Institutional inconsistency and political instability: Polity duration 1800–2000. American Journal of Political Science, 50(4). pp. 893-908. 17 государственной состоятельности используется в работе Дж. Фортин (Jessica Fortin),37 которая считает ее необходимым условием для установления демократического политического режима. Государственная состоятельность концептуализируется в терминах инфраструктурной власти (понятия, разработанного М. Манном (1984)) — институциональной состоятельности государства (автократического или демократического), выражающейся в способности контролировать свою территорию и эффективно воплощать в жизнь принятые решения. С этой точки зрения, существование насильственной мощи, или военной силы государства не является необходимым для существования государственной состоятельности, так как она определяется, прежде всего, наличием инфраструктурной власти. Хотя автор использует комплексную оценку государственной состоятельности, включающую в себя и индикаторы прогресса в инфраструктурных реформах, и качество защиты прав собственности, и индикатор финансовой силы институтов CIM, ключевым показателем Дж. Фортин считает способность государства собирать налоги. Недостатком данной работы является то, что всилу концептуализации данный индекс никак не отражает принудительную силу государства, являющуюся одним из аспектов государственной состоятельности. А.Ю. Мельвиль (Andrei Melville) и Д.К. Стукал (Denis Stukal),38 отмечая некоторую содержательную неопределенность концепта государственной состоятельности, предлагают собственный индекс, представляющий собой среднее трех индикаторов: ВВП на душу населения, рассчитанного Всемирным банком; показателя финансовой силы институтов — CIM (contract intensive money), рассчитанного по данным Международного валютного фонда и индекса физической целостности из базы Сингранелли — Ричардса (CIRI). Авторы приходят к выводу о дополняющем характере связи 37 38 Fortin J. Ibid. Melville A. Y., Stukal D. (2012). Ibid. 18 между государственной состоятельностью и демократией. Данное исследование является одним из немногих, учитывающих объем ресурсов, доступных государству (через оценку ВВП на душу населения), однако, очевидной слабостью этой работы является отсутствие теории, так как авторы лишь указывают на концептуальную неопределенность государственной состоятельности, не предлагая никакого решения проблемы теоретического целостности, определения. отражающий Кроме того, распространенность индикатор в физической государстве пыток, внесудебых убийств, наличие политических заключенных и исчезновений граждан, фактически близок к индикаторам либеральной демократии, что особенно опасно в контексте того, что работа посвящена изучению связи между государственной состоятельностью и демократией. В данной работе также будет рассмотрен индекс, составленный мной на основе концептуализации Дж. Хансон (Jonathan Hanson) и Р. Сигман (Rachel Sigman),39 которые предложили выделять в государственной состоятельности подкомпоненты извлекающей (extractive) принудительной (coercive) и административной (administrative) мощи государства. Данный индекс, составленный с помощью метода главных компонент, принципиально отличается от всех вышеупомянутых включением оценки военной мощи государства, операционализированной с помощью показателя доли военных расходов в ВВП из базы «Корреляты войны». В качестве прокси-переменной извлекающей мощи государства используется показатель налогов на доходы, прибыль и капитал (в процентах от всех собранных налогов). В качестве прокси-переменной административной мощи государства используется индикатор «Качество управления» из базы Группы по оценке политических рисков (PRSG). Хотя многие ученые (М. Браттон и Э. Чанг (2006), Й. Моллер и 39 Hanson J., Sigman R. (2011). Measuring State Capacity: Assesing and Testing the Options. Annual Meeting of the American Political Science Association. pp. 1-39. 19 С.-Э. Скаанинг (2011), А.Ю. Мельвиль и Д.К. Стукал (2012)) избегают конкретных формулировок, ограничиваясь либо признанием содержательной недоопределенности концепта государственной состоятельности, либо указанием на выполнение государством своих функций без конкретизации этих функций, в последнее время среди исследователей государственной состоятельности был достигнут консенсус о сущностной многомерности государственной состоятельности. Очевидно, что данный концепт не может быть сведен ни, отдельно, к военной мощи (принудительной силе), ни к налогообложению, ни к управленческой способности государства, ни к слаженности и качеству политических институтов. Таким образом, интуитивно понятно, что исследования, использующие только один из описанных индикаторов, могут отражать только часть интересующего нас явления, но не его целиком, что является одним из сигналов низкой содержательной валидности индикаторов. Подробно понятие валидности, а также методы, с помощью которых валидность индикаторов и индексов может быть выявлена, описываются в Главе 2. 20 Глава 2. Описание данных и методов исследования 2.1. Описание методов исследования Так как прямое измерение государственной состоятельности невозможно в силу латентной (либо синтетической) природы этого концепта, необходимо использовать опосредованные оценки, каждая из которых может отражать не весь концепт, а только некоторые его компоненты, а также иметь ошибки измерения. В связи с этим, одной из важнейших задач при работе с латентными понятиями является выявление степени валидности используемых прокси-переменных или индексов, т.е. выявление того, насколько предложенная операционализация соответствует теоретическому концепту. Еще 70 лет назад исследования валидности сводились к определению того, коррелирует ли шкала измерения индикатора с самим индикатором.40 При этом в социальных науках отсутствовало единое представление о видах валидности и, соответственно, методиках выявления разных ее видов. Первая попытка систематизации типов валидности была предпринята в 1954 г. Американской психологической ассоциацией, которая предложила выделять четыре типа валидности: содержательную (content), конструктную (construct), текущую (concurrent) и предсказательную (predictive).41 Такое разделение было обусловлено целями исследований: изучалась в работах, исследования (наличие требующих данного содержательная проверки типа содержания валидности валидность предмета означало, что использующийся эмпирический индикатор полностью отражает латентный теоретический концепт). Конструктная валидность изучалась при измерении абстрактных концептов: индикаторы абстрактного концепта могли быть признаны конструктно валидными только при наличии достаточно тесной взаимосвязи между ними. Оценка текущей валидности проводилась при Guilford J.P. (1946). New standards for test evaluation. Educational and Psychological Measurement, 6(5). pp. 427-439. 41 American Psychological Association. (1954). Technical recommendations for psychological tests and diagnostic techniques. Psychological Bulletin, 51(2, supplement). pp. 201-238. 40 21 разработке новых шкал или тестов: новые виды измерений должны были коррелировать с уже существующими и признанными адекватными с точки зрения цели исследования. На наличие предсказательной валидности проверялись индикаторы, разрабатывающиеся для оценки будущих состояний предмета исследования. В 1966 году текущая и предсказательная валидности были объединены в один тип, получивший название критериальной валидности.42 Тенденция объединения типов валидности достигла своего пика к 1990-м гг., когда Л. Шепард43 (Lorrie Shepard)44 написала о том, что критериальный и содержательный типы валидности являются всего лишь подтипами конструктной валидности, то есть существует всего один основной тип валидности. Этой же точки зрения придерживался и С. Мессик45 (Samuel Messick),46 который, однако, подчеркивал необходимость разносторонней оценки валидности. Таким образом, за несколько десятков лет представление о валидности эволюционировало от взаимосвязанности шкалы измерения и предмета измерения до понимания необходимости валидизации и интерпретаций, и шкал, и тестов, и инструментов измерения одновременно. Для исследований в сфере политологии выявление валидности использующихся индикаторов также имеет большое значение, так как многие предметы исследования носят латентный характер (например, идеология, политический режим, государственность). Между типологиями психологов и политологов нет принципиальных различий, однако, в силу особенностей сферы исследования, политологи обычно изучают следующие подтипы 42 43 44 45 46 American Psychological Association. (1966). Standards for educational and psychological tests and manuals. Washington, DC: American Psychological Association. pp. 112-138. Лорри Шепард — известный профессор Университета Колорадо. В 1972 получила степень доктора философии в области исследовательской и оценочной методологии (PhD Research and Evaluation Methodology). Была президентом Американской ассоциации по исследованиям в сфере образования, а также президентом Национального совета по измерениям в сфере образования. Shepard L. (1993). Evaluating test validity. In L. Darling-Hammond, ed., Review of research in education, 19. pp. 405-450. Washington, DC: American Educational Research Association. Сэмюэл Мессик — профессор Принстонского университета, один из лидеров в изучении валидности, является автором 20 книг и более 175 статей. В честь него названа одна из премий Американской ассоциации психологов. Messick S. (1989). Validity. pp. 13-103 in R. Linn, ed., Educational Measurement. Third ed. New York: American Council on Education and Macmillan Publishing Company. 22 валидности: содержательную (content) валидность, в рамках тестирования которой устанавливается полнота соответствия эмпирических индикаторов латентным концептам. Если индикатор достаточно хорошо предсказывает значения других переменных, считающихся предопределенными латентным концептом, представленным в исследовании этим индикатором, его считают обладающим свойством предсказательной (predictive) валидности. Довольно часто политологи изучают конвергентную (convergent) валидность, свидетельством существования которой является тесная взаимосвязь разных индикаторов латентного концепта. Иногда изучается дискриминантная (discriminant) валидность, являющаяся противоположностью конвергентной: индикаторы разных латентных концептов не должны быть сильно взаимосвязанными (иногда такой тип валидности также называется дивергентным).47 В политологическом сообществе, как и в сообществе психологов, отсутствует консенсус по поводу типологизации валидности. Так, например, Р. Эдкок (Robert Adcock) и Д. Колльер (David Collier)48 считают достаточным выделение только трех подтипов валидности: содержательной (показывает насколько полно индикатор отражает латентный концепт), конвергентной / дискриминантной (определяет, достаточно ли взаимосвязаны разные индикаторы одного и того же латентного концепта / достаточно ли слаба взаимосвязь индикаторов разных теоретических концептов) и номологической (проверяет наличие устойчивой и верно определенной причинно-следственной связи). В этой типологизации вышеописанная предсказательная валидность фактически входит в номологическую. Конвергентная и дивергентная валидности по сути отражают то, что в 1950-х американские психологи называли конструктной валидностью. Несмотря на имеющиеся разногласия в выделении типов валидности, The Oxford Handbook of Political Methodology. Edited by Box-Steffenmeier J., Brady H., Collier D. USA: Oxford University Press, 2008. pp.121-122. 48 Adcock R., Collier D. (2001). Measurement Validity: A Shared Standard for Qualitative and Quantitative Research. The American Political Science Review, 95(3). pp. 529-546. 47 23 очевидно, что среди исследователей достигнут консенсус о необходимости отделения подтипа содержательной валидности от других. Данный подтип встречается во всех современных типологиях. С остальными видами валидности дело обстоит несколько сложнее: единственная общая черта у оставшихся подтипов — возможность анализа статистическими методами. Учитывая все вышесказанное, в данном исследовании индексы государственной состоятельности будут рассматриваться с точки зрения трех подтипов валидности: содержательной (концептуальной), конвергентной и предсказательной. Номологическая валидность в чистом виде не рассматривается в данном исследовании, так как перед нами не стоит задача выявления причинно-следственных связей между государственной состоятельностью и иными переменными – нас интересуют только сами показатели государственной состоятельности. Считается, что для того чтобы концепт был признан валидным, он должен иметь четкое теоретическое определение и прозрачную операционализацию в индикаторах, поддающихся измерению.49 Если среди исследователей отсутствует консенсус по поводу теоретического содержания концепта, и одни и те же эмпирические индикаторы используются разными исследователями для оценки разных концептов, обычно это говорит о низкой валидности индикаторов исследуемого концепта. Если различные индикаторы сходятся в оценках латентного концепта (что косвенно говорит о том, что они отражают одно и то же явление), можно говорить о наличии у них свойства конвергентной валидности. Такой тип валидности обычно выявляется с помощью корреляционного анализа, метода главных компонент и моделирования структурными уравнениями. Если различные индикаторы позволяют предсказывать значения друг друга (что проверяется с помощью регрессионного анализа), можно говорить о наличии у них свойства предсказательной валидности. Важно учитывать, что не все 49 Garson D. Validity. Statistical association publishers. Blue Book Series: North Carolina State University, 2012. 30 p. 24 индексы, обладающие свойством конвергентной и предсказательной валидности, являются содержательно валидными, то есть, хотя индексы могут быть согласованными в оценках (иметь высокую корреляцию, укладываться в предсказательной одномерное пространство способностью), они могут и обладать отражать высокой только часть интересующего исследователя явления или другой, смежный концепт. Иными словами, содержательная валидность — это не статистический тип валидности, проверка на наличие которого позволяет оценить, отражает ли эмпирический индикатор теоретический концепт, и если да, то насколько полно. Именно поэтому, говоря о содержательной валидности, мы будем говорить в терминах относительных (речь будет идти о различных степенях соответствия), а не «абсолютных» — индикаторы валидны или не валидны. Например, чтобы понять, является ли IQ-тест содержательно валидным, нужно определить, проверяются ли в использующихся тестах все сферы человеческого интеллекта, описанные в научной литературе. Та же самая методика может быть применена к оценке эмпирических индикаторов других латентных концептов, в том числе к государственной состоятельности: мы будем проверять, входят ли использующиеся эмпирические индикаторы в область определения латентного теоретического концепта, и насколько полно они отражают его. В отличие от содержательной валидности, конвергентная валидность может и должна измеряться статистически. Проверка конвергентной валидности позволяет оценить степень, в которой эмпирические индикаторы, которые должны быть взаимосвязанными, взаимосвязаны в действительности. Одним из наиболее распространенных методов оценки взаимосвязи является корреляционный анализ. Корреляционный анализ — это метод, позволяющий выявить силу взаимосвязи между несколькими случайными величинами. Ключевой индикатор здесь — коэффициент корреляции. В исследованиях наиболее 25 часто используются два вида коэффициентов корреляции: коэффициент К. Пирсона и коэффициент Ч. Спирмена. Оба показателя варьируются от -1 до +1, где -1 говорит о сильной отрицательной взаимосвязи, а +1 о сильной положительной. Коэффициент корреляции К. Пирсона рассчитывается по формуле где xi – i-тое наблюдение первой переменной, yi – i-тое наблюдение второй переменной, - среднее значение выборки первой переменной, - среднее значение выборки второй переменной. Коэффициент корреляции К. Пирсона отражает силу линейности взаимосвязи переменных. Значения коэффициента 0,7 и выше принято считать свидетельством наличия сильной положительной взаимосвязи, близкой к линейной; -0,7 и ниже — сильной отрицательной взаимосвязи, близкой к линейной. Значение от 0,3 до 0,7 говорят о средней по силе положительной взаимосвязи; от -0,3 до -0,7 — о средней по силе отрицательной взаимосвязи. Значения коэффициента от -0,3 до 0,3 — об отсутствии линейной взаимосвязи. Обычно коэффициент корреляции К. Пирсона рассчитывается для признаков, измеренных в количественной шкале (интервальной или шкале отношений). Следует учитывать, что он чувствителен к статистическим выбросам и не подходит для выявления нелинейных взаимосвязей. Коэффициент корреляции Ч. Спирмена при отсутствии связанных рангов рассчитывается по формуле , где S = , Ri и Mi – ранги наблюдений в первой и второй выборке, n – число анализируемых наблюдений. Коэффициент корреляции Ч. Спирмена подходит для анализа признаков, измеренных в порядковой шкале, и поэтому 26 менее чувствителен к статистическим выбросам, а также подходит для выявления разных монотонных взаимосвязей, в том числе нелинейных. Однако данный коэффициент менее информативен на признаках, измеренных в количественной шкале. Кроме того, взаимосвязь можно проверять с помощью расчета частных коэффициентов корреляции К. Пирсона. При таком анализе фиксируются значения определенных переменных, то есть мы получаем возможность оценить взаимосвязь, очищенную от влияния других переменных. Очевидно, что индикаторы одного и того же латентного концепта должны иметь высокие значения коэффициентов корреляции, так как отражают одно и то же явление. Наличие сильных корреляций будет говорить о конвергентной валидности использующихся индикаторов. Еще одним методом выявления конвергентной валидности является анализ методом главных компонент, с помощью которого можно выявить размерность интересующего нас признакового пространства. Метод главных компонент относится к классу методов снижения размерности. Идея состоит в том, чтобы от исходного признакового пространства размерности Т, содержащего много дублирующей информации, перейти к новому признаковому пространству размерности Т’ (T’<<T), не содержащему дублирующую информацию. Под информацией мы понимаем дисперсию – меру разброса случайной величины. Отсутствие дублирующей информации означает нулевую совместную изменчивость случайных величин (ковариацию), то есть ортогональность осей. Переход к новому признаковому пространству меньшей размерности приводит к потере некоторой доли информации, и наша задача состоит в том, чтобы сохранить как можно больше информации при уменьшении доли повторяющейся. Чтобы построить главные компоненты и понять, снижаема ли размерность (можно ли отбросить некоторые оси) признакового пространства, нужно вычислить собственные векторы корреляционный 27 (ковариационной) матрицы, компоненты которых будут являться весовыми коэффициентами, отражающими вклад каждой наблюдаемой переменной в формирование значения главной компоненты. При определенной нормировке собственных векторов, их собственные значения окажутся равными дисперсии главных компонент. Идея Г. Кайзера (Henry Kaiser) об извлечении стольких главных компонент, сколько собственных значений, превышающих единицу, как раз и отражает идею, что информация (дисперсия), содержащаяся в главной компоненте, не должна быть меньше дисперсии исходной стандартизованной переменной. Главные компоненты являются линейными комбинациями исходных переменных; первая главная компонента всегда учитывает наибольшую возможную долю суммарной дисперсии; остальные последовательно отражают наибольшую возможную долю остаточной суммарной дисперсии. При извлечении главных компонент также нужно ориентироваться на долю сохраненной информации.50 Если индикаторы отражают одно и то же явление (то есть обладают свойством конвергентной валидности), размерность признакового пространства будет равна единице, если же они отражают разные явления — размерность будет больше единицы. Существует еще один метод, с помощью которого можно проверять индексы на наличие конвергентной валидности. Это моделирование структурными уравнениями, или структурное моделирование. Данный метод является одной из наиболее мощных техник многомерного статистического анализа, так как представляет собой логическое обобщение развития разных методов, в том числе множественной линейной регрессии и факторного анализа. Структурное моделирование — метод, разработанный для проверки и измерения причинно-следственных связей. В рамках этого метода возможно и 50 разведывательное и (exploratory), подтверждающее (confirmatory) Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. - М.: Финансы и статистика, 1989. - 607 с. 28 моделирование, то есть моделирование структурными уравнениями подходит и для разработки теории, и для ее подтверждения. Разведывательное моделирование позволяет оценить значения неизвестных параметров (например, можно оценить латентный концепт качества жизни на основании некоторого набора наблюдаемых переменных). Для реализации подтверждающего моделирования необходимо сформулировать гипотезу о причинно-следственной связи, операционализировать взаимодействующие индикаторы, после этого статистическими методами может быть проверено соответствие реальных наблюдаемых данных построенной модели с причинно-следственными связями. Одной из сильных сторон структурного моделирования является возможность конструирования латентных переменных. Хотя в силу латентности их нельзя измерить напрямую, моделирование структурными уравнениями позволяет оценить латентный концепт с помощью наблюдаемых переменных, подбираемых в соответствии с гипотезой исследователя. При подтверждающем структурном моделировании исследователь использует два типа переменных: наблюдаемые (поддающиеся измерению) и латентные (те, которые нельзя непосредственно измерить). На этапе формирования гипотезы выдвигаются предположения о связях между наблюдаемыми и латентными переменными, после чего строится граф, являющийся моделью изучаемого явления. Например, исследователь может предположить, что значения, которые принимают некоторые переменные, объясняются латентным концептом (то есть переменные отражают латентный концепт). Чтобы можно было рассчитать коэффициенты (нагрузки) переменных, необходимо обеспечить идентифицируемость модели, которая заключается в возможности оценки неизвестных параметров по известным. Для этого исследователь должен зафиксировать (указать значение) минимально необходимое количество параметров: нужно указать, в каких единицах будет измеряться латентный конструкт — для этого фиксируется 29 равной единице нагрузка одной из наблюдаемых переменных (латентный концепт принимает единицы измерения данной переменной), а также обычно фиксируются нагрузки ошибок наблюдаемых переменных, они приравниваются к единице (предполагается, что связь между ошибкой и переменной не несет никакой дополнительной информации).51 Для структурного моделирования необходимы полные данные, пропуски значений переменных делают невозможной оценку модели, однако, эта проблема может быть решена двумя способами: можно либо восстановить значения (например, с помощью различных импутаций данных), либо оценить модель, не восстанавливая данные, на основе использования всей имеющейся информации. Одним из методов, позволяющих оценить модель при наличии пропущенных данных, является метод максимального правдоподобия с полной информацией (Full Information Maximum Likelihood). Этот метод достаточно точен и робастен, если в выборке более 100 наблюдений, а также является самым эффективным и несмещенным из методов оценок ковариационных моделей при соблюдении предположения о многомерной нормальности распределения признаков. Очевидным достоинством этого метода является то, что он не подставляет никакие значения в выборку и тем самым не смещает ее, что неизбежно возникает при использовании импутации данных, особенно в ситуации, когда пропуски в данных связаны со значениями переменных (что характерно для массива данных, использующегося в этой работе). Существует несколько критериев, по которым можно оценивать полученную модель. Основной критерий — значимость статистики хиквадрат, с помощью которой проверяется гипотеза о равенстве выборочной и модельной ковариационных матриц (то есть проверяется, подтвердилась ли построенная модель на имеющихся данных). Также необходимо проверять 51 Подробнее см.: Byrne B. Structural Equation Modeling with Mplus: Basic Concepts, Applications, and Programming (Multivariate Applications Series). Routledge, 2011. 430 p.; Pawitan Y. In All Likelihood: Statistical Modelling and Inference Using Likelihood. Oxford: Oxford Science Publications, 2005. pp. 1-19.; Lee S.-Y. Structural Equation Modeling: A Bayesian Approach. New York: Wiley, 2007. 432 p. 30 значимость факторных нагрузок, с помощью которой проверяется гипотеза о равенстве их нулю (то есть проверяется, нужно ли включать наблюдаемые переменные в модель латентного концепта). Существует целый ряд индексов адекватности модели, учитывающих качество модели (GFI, AGFI, NFI, IFI, CFI), учитывающих комплексность модели (PGFI, PNFI, PCFI), информационные индексы (AIC, BIC, ECVI) и индекс аппроксимации (RMSEA). Если построенная модель латентного концепта будет удовлетворительной с точки зрения качества, можно будет считать, что входящие в нее индикаторы обладают свойством конвергентной валидности. Если качество модели будет низким, это можно будет считать свидетельством того, что использующиеся факторы являются индикаторами разных латентных концептов. Предсказательная валидность может быть выявлена регрессионным анализом, с помощью которого можно определить, в какой мере значения одного индекса могут быть предсказаны по имеющимся значениям другого. Регрессионный анализ позволяет определить, насколько отклик чувствителен к влиянию предиктора, а также позволяет осуществлять прогнозирование. Для изучения используются взаимосвязанности коэффициенты показателей корреляции в статистике (например, обычно К. Пирсона, Ч. Спирмена, М. Кендалла). Однако эти коэффициенты отражают только наличие или отсутствие связи и ее знак, но не определяют характер и направленность связи при условии верной спецификации. В регрессионном анализе зависимая переменная выступает в роли функции, зависящей от значений аргументов – объясняющих (независимых) переменных. Результирующая переменная всегда является случайной величиной, так как зависит от влияния случайных факторов и ошибок измерения. Значения независимых переменных возможно задавать «извне», то есть они аналитически или эмпирически подконтрольны исследователю. Значение зависимой переменной состоит из двух частей. Одна 31 определяется непосредственно предиктором (это функция от х), а другая случайна по отношению к нему (обозначается буквой ε) и называется случайной ошибкой. То есть отклик можно представить как: y = f(x) + ε Есть несколько причин существования случайного члена (ошибки). Вопервых, невозможно включить в модель все предикторы в силу стохастичности мира. Многие исследователи предпочитают не включать в модель факторы, влияющие на зависимую переменную незначительно, так как объясняющая и прогностическая сила модели улучшается незначительно, но модель может становиться чрезмерно перегруженной. Во-вторых, все используемые эмпирические показатели являются случайными величинами. В измерении переменных неизбежно встречаются ошибки, а значит наблюдаемые значения будут отличаться от точных. Ошибка является проявлением этих факторов.52 Регрессионный анализ позволяет построить модели исследуемого объекта, представляющие собой уравнения типа yi = β0 + β1xi + εi и определить значения коэффициентов (β0 ; β1) и значения остатка . Коэффициент регрессии позволяет определить величину влияния одной переменной на другую. При использовании стандартизованных коэффициентов также возможно сравнение влияний разных независимых переменных на зависимую. Метод наименьших квадратов (МНК) является наиболее широко распространенным методом оценивания коэффициентов регрессии. С помощью этого или других методов (метода максимального правдоподобия, асимптотически свободного от распределения метода) могут быть найдены оценки коэффициентов, но их истинные значения всегда остаются нам неизвестны. Ошибки же (εi) должны удовлетворять условиям Гаусса — 52 Подробнее см.: Доугерти К. Введение в эконометрику. – М.: ИНФРА-М, 2009 – С. 45-46 32 Маркова: 1. математическое ожидание ошибок равно нулю; 2. гомоскедастичность (одинаковая дисперсия) ошибок; 3. отсутствие систематической связи автокорреляции между ошибок значениями (то ошибки есть у отсутствие любых двух наблюдений); 4. независимость ошибок от объясняющих переменных. Согласно теореме Гаусса — Маркова, если выполняются все четыре вышеприведенных условия, МНК-оценки являются наилучшими из всех линейных несмещенных оценок. Если же ошибки имеют нормальное распределение, то МНК-оценки также имеют нормальное распределение. Предположение о нормальности ошибок основывается на центральной предельной теореме (ЦПТ), согласно которой случайная величина, равная сумме бесконечного числа независимых или слабо зависимых случайных величин, имеет (при некоторых условиях регулярности) нормальное распределение. Если математическое ожидание остатков не равно нулю или ошибки связаны с объясняющими переменными, появляется систематическое смещение оценок. При нарушении условия гомоскедастичности или отсутствия автокорреляции оценки становятся неэффективными; кроме того, оказывается невозможным делать достоверные выводы на основе регрессионной модели. Для оценки качества построенной модели будет использоваться коэффициент детерминации (R2). Он отражает долю вариации зависимой переменной, объясненной предикторами, включенными в модель. Коэффициент детерминации может изменяться в промежутке от 0 до 1. Он представляет собой квадрат множественного коэффициента корреляции между зависимой переменной и предикторами. Так как выборочный коэффициент корреляции является случайной величиной, возведение его в квадрат также будет увеличивать ошибку, и, следовательно, увеличение 33 значения коэффициента детерминации не может быть целью при построении регрессионной модели.53 Так как этот показатель также является оценкой, а не истинным значением, возникает необходимость проверки ее значимости (статистически значимого отличия от нуля). Для проверки нулевой гипотезы о равенстве коэффициента детерминации нулю будет использоваться Fстатистика, которая имеет распределение Фишера (sir Ronald Aylmer Fisher)— Снедекора (George Snedecor), если нулевая гипотеза верна. Большие значения статистики будут говорить против нулевой гипотезы.54 Высокие значения коэффициента детерминации говорят о высоком соответствии модели имеющимся данным, то есть свидетельствуют в пользу наличия предсказательной валидности. 2.2. Описание данных В данной работе проводится эмпирический анализ пространственновременной выборки, состоящей из 140 стран мира за период с 1990 по 2010 гг. Исключение из анализа 40 стран связано с отсутствием большей части данных по ним. Импутация пропущенных значений переменных не проводится, так как нет оснований полагать, что отсутствие некоторых данных по переменным не связано со значениями этих переменных. Для построения индексов государственной состоятельности используются следующие показатели: 1. Качество управления — Quality of Government (база International Country Risk Guide (PRSG) охватывает 139 стран). Индикатор измеряется от 0 до 1, где единица отражает наилучшее качество управления. Индикатор составлен как среднее арифметическое из 3 переменных:  Коррупция (измеряется от 0 до 6). Это коррупция внутри политической системы. Она представляет угрозу для иностранных 53 54 Подробнее см.: Kennedy P. A Guide to Econometrics. Cambridge, MA: Wiley-Blackwell, 2009. P. 79-80. Подробнее см.: Gujarati D. Basic Econometrics. McGraw Hill, 2004. p.636-655. 34 инвестиций, потому что разрушает финансовую и экономическую среду, снижает эффективность государства и бизнеса из-за рекрутирования на властные позиции не по способностям, а по другим критериям; дестабилизирует политическую систему.  Закон и порядок (измеряется от 0 до 6). Закон и порядок оцениваются отдельно, каждый подкомпонент измеряется от 0 до 3. Подкомпонента закона является оценкой силы и непредвзятости правоохранительной практики. Подкомпонента порядка является оценкой общего соблюдения закона.  Качество бюрократического управления (измеряется от 0 до 4). Институциональная сила и качество бюрократии минимизируют издержки смены правительств. Высокое значение дается странам, где нет провалов в управлении и предоставлении государственных услуг. В этих странах бюрократия достаточно автономна от политического давления и имеет устоявшийся механизм отбора и обучения. 2. Индикаторы управления — Governance Indicators (база World Bank охватывает 194 страны). Эти индикаторы основаны на многочисленных переменных, измеряющих восприятие управления, индикаторы составлены из 31 базы данных, составленных 25 различными организациями. Индикаторы измеряются от -2,5 до +2,5; чем больше значение, тем лучше управление.  Политическая стабильность — Political Stability. Переменная отражает вероятность того, что действующее правительство будет дестабилизировано или свергнуто с помощью, возможно, неконституционных и/или насильственных мер, включая внутреннее насилие и терроризм.  Эффективность правительства — Government Effectiveness. Переменная отражает качество предоставления общественных благ, 35 качество бюрократии, компетентность государственных служащих, независимость государственных услуг от политического давления, способность государства давать заслуживающие доверия обещания.  Качество регулирования — Regulatory Quality. Переменная включает измерение политики, направленной против рыночной экономики, например, контроль за ценами или давление на банки, а также излишнее регулирование внешней торговли и бизнес-развития.  Верховенство закона — Rule of Law. Переменная измеряет степень уверенности агентов в верховенстве закона и соблюдении его в обществе. Это отражает реакцию на преступления, эффективность и предсказуемость судебной системы, выполняемость контрактов. Вместе эти компоненты отражают успешность развития среды, в которой честные и предсказуемые правила формируют базу для экономических и социальных взаимодействий и отражают защиту прав.  Контроль над коррупцией — Control of Corruption. Переменная отражает восприятие коррупции как поиска личной выгоды через использование властных полномочий. 3. Доля военных расходов в ВВП – Military Spending/GDP (база Correlates of War). Данные представлены по 174 странам. 4. Налоги на доходы, прибыль, капитал (% от всех собранных налогов) – Taxes on income, profits and capital gains (% of total taxes) (база World Bank). Данные представлены по 194 странам. 5. Бинарный индикатор демократий Х.А. Чейбуба, Дж. Ганди и Дж. Фриланд— Democracy (база J.A. Cheibub, J. Gandhi and J. Vreeland). Данные представлены по 193 странам. Индекс принимает значение 1, если режим в стране является демократическим (проводятся регулярные всеобщие выборы законодательной и исполнительной власти, приводящие к смене управляющих, разрешены и фактически 36 существуют политические партии (более одной)), 0 — в остальных случаях. 6. Индекс «Полития» — Polity_2 (база Polity IV), отражающий политический режим в шкале от -10 (консолидированная автократия) до +10 (консолидированная демократия). 7. ВВП на душу населения — GDP per capita (in constant 2005 US dollars) — база World Bank. Данные представлены по 194 странам. 8. Показатель финансовой силы институтов — CIM (contract intensive money), рассчитанный по данным Международного валютного фонда для 194 стран. 9. Индекс физической целостности — Physical Integrity Rights Index (база CIRI Дэвида Сингранелли (David Cingranelli) и Дэвида Ричардс (David Richards)). Значения индекса изменяются от 0 до 8, в зависимости от того, насколько широко в стране распространены пытки, внесудебные убийства, есть политические заключенные, происходят исчезновения граждан. Чем выше значение индекса, тем выше безопасность. Данные представлены по 195 странам. Вышеуказанные переменные являются компонентами индексов государственной состоятельности (кроме индекса «Полития» и бинарного показателя демократий Х.А. Чейбуба и Дж. Ганди, использующихся для разделения массива на подмассивы, что необходимо для более тонкого понимания особенностей индексов), построенных по методу главных компонент или простым усреднением, в соответствии с концептуализациями и операционализациями, предложенными К. де Роуэном и Д. Собэком (2004), Х. Бёк и А. Хадениусом (2008), Н. Чарроном и В. Лапуэнтэ (2010), М. Браттоном и Э. Чангом (2006), А.Ю. Мельвилем и Д.К. Стукалом (2012), Дж. Хансоном и Р. Сигман (2011). В Главе 3 представлен анализ валидности этих индексов государственной состоятельности. 37 Глава 3. Анализ валидности индексов государственной состоятельности Учитывая достигнутый в политологическом сообществе консенсус о сущностной многомерности концепта государственной состоятельности, одноиндикаторные операционализации государственной состоятельности априори не могут быть признаны содержательно валидными, так как отражают лишь сравнительно небольшую часть концепта государственной состоятельности. Поэтому из анализа на наличие конвергентной и предсказательной валидности сразу исключаются индикаторы из таких исследований как, например, Дж. Каглера и М. Арбетман (1997), Э. Хендерсона и Д. Сингера (2000), Х. Хегре (2001), Б. Вальтер (2006), С. Гейтса (2006). Для анализа конвергентной и предсказательной валидности были отобраны наиболее государственной известные и часто состоятельности:55 индекс встречающиеся Качества индикаторы государственного управления (Quality of Government) из базы Группы по оценке политических рисков (ICRG)56 (компоненты, составляющие этот индекс в разных комбинациях использовались в исследованиях К. де Роуэна и Д. Собэка (2004), Х. Бёк и А. Хадениуса (2008), Н. Чаррона и В. Лапуэнтэ (2010)). Анализируется индекс, составленный как среднее из пяти индикаторов управления (Governance Indicators)57 из базы Всемирного банка, которые использовались в исследовании М. Браттона и Э. Чанга (2006). Также в анализ включен индекс государственной состоятельности,58 описанный в исследовании А.Ю. Мельвиля и Д.К. Стукала (2012). Кроме того, автор предлагает к рассмотрению еще один индекс государственной состоятельности, построенный с помощью метода главных компонент, 55 56 57 58 и отражающий извлекающую, Ранжирование стран по нижеуказанным индексам см. в Приложении 1. Далее индекс называется ICRG. Далее индекс называется WBGI. Далее индекс называется GCP. 38 принудительную и административную мощь государства,59 что соответствует теории, предложенной Дж. Хансоном и Р. Сигман (2011). Так как выбранные индексы являются эмпирическими индикаторами одного и того же явления — государственной состоятельности, можно ожидать что между ними будет сильная линейная (или хотя бы монотонная) взаимосвязь, то есть с увеличением одного индекса, другой также должен увеличиваться (и наоборот). В случае обнаружения достаточно сильной взаимосвязи, как уже говорилось во второй главе, индексы можно будет считать обладающими свойством конвергентной валидности. Рассмотрим результаты корреляционного анализа индексов государственной состоятельности. Коэффициент корреляции К. Пирсона рассчитывается не только для всего массива данных, но и для отдельных подгрупп, выделенных в зависимости от типа политического режима, поскольку в государствах с различными политическими режимами индексы могут отражать различные аспекты интересующего нас явления, что будет влиять на значения коэффициента корреляции. В Таблице 1 представлены результаты измерения. Группы государств ICRGWBGI Таблица 1. Коэффициенты корреляции К. Пирсона60 ICRGICRGWBGIWBGIGCPGCP ECA GCP ECA ECA Все государства (2006 г.) 0,930** 0,704** 0,676** 0,764** 0,624** 0,450** (139) (101) (94) (127) (94) (68) 0,943** 0,831** 0,672** 0,846** 0,620** 0,622** (85) (59) (66) (66) (66) (44) 0,878** 0,493 0,607** 0,631** 0,588** 0,199 (54) (42) (28) (61) (28) (24) 0,926** 0,804** 0,703** 0,799** 0,663** 0,707** (70) (65) (45) Демократии (по Х. Чейбубу и Дж. Ганди) Автократии (по Х. Чейбубу и Дж. Ганди) Демократии (по Polity IV (6+)) (82) (61) (65) ** Коэффициенты значимы на уровне доверия 99%. * Коэффициенты значимы на уровне доверия 95%. 59 60 Далее индекс называется ECA. В скобках указано число наблюдений, по которым были рассчитаны коэффициенты корреляции. 39 Группы государств Неконсолидиров. режимы (по Polity IV (-5; +5)) Автократии (по Polity IV (-10;-6)) ICRGWBGI ICRGGCP ICRGECA Таблица 1. (Продолжение) WBGIWBGIGCPGCP ECA ECA 0,899** 0,218 0,536* 0,473** 0,488* 0,389 (32) (29) (17) (39) (17) (16) 0,847** 0,689* 0,326 0,750** 0,224 -0,206 (15) (9) (7) (18) (10) (9) ** Коэффициенты значимы на уровне доверия 99%. * Коэффициенты значимы на уровне доверия 95%. Наиболее высокие положительные значения коэффициента корреляции наблюдаются между индексами ICRG и WBGI, что говорит в пользу их конвергентной валидности. Значения выше среднего характерны и для корреляции между индексами ICRG и GCP, за исключением подвыборки неконсолидированных режимов, что, возможно, связано с тем, что в них плохо работает как «контроль сверху», так и «контроль снизу», о чем писал Х. Хегре (2001). Индексы ICRG и ECA имеют значения корреляции немного выше среднего, что в целом, не позволяет говорить об отсутствии у них конвергентной валидности. То же можно сказать и об индексах WBGI с GCP и WBGI c ECA. Наименее согласованно ведут себя индексы GCP и ECA, которые одинаково оценивают демократические режимы, но расходятся в оценке автократических. В целом, все индексы государственной состоятельности имеют более высокие значения коэффициентов корреляции на демократической выборке. Это говорит о том, что данные индексы больше всего подходят для оценки государственной состоятельности в демократиях, что не удивительно в силу использованной концептуализации. На выборке автократий значения корреляций ниже или статистически не значимы, что говорит не в пользу конвергентной валидности. Следовательно, можно сделать вывод, что данные индексы обладают ограниченной конвергентной валидностью. При проверке 40 устойчивости корреляции полученного Ч. Спирмена результата сила с помощью взаимосвязей коэффициента между индексами сохраняется. Полученные значения представлены в Таблице 2. Группы государств ICRGWBGI Таблица 2. Коэффициенты корреляции Ч. Спирмена 61 ICRGICRGWBGIWBGIGCPGCP ECA GCP ECA ECA Все государства (2006 г.) 0,886** 0,675** 0,800** 0,740** 0,722** 0,462** (139) (101) (94) (127) (94) (68) 0,919** 0,797** 0,824** 0,802** 0,757** 0,576** (85) (59) (66) (66) (66) (44) 0,861** 0,507** 0,546** 0,618** 0,524** 0,306 (54) (42) (28) (61) (28) (24) 0,889** 0,759** 0,873** 0,742** 0,826** 0,660** (82) (61) (65) (70) (65) (45) 0,826** 0,200 0,605* 0,496** 0,409* 0,326 (32) (29) (17) (39) (17) (16) 0,890** 0,673* 0,109 0,646** 0,033 -0,250 (18) (10) (9) (15) (9) (7) Демократии (по Х. Чейбубу и Дж. Ганди) Автократии (по Х. Чейбубу и Дж. Ганди) Демократии (по Polity IV (6+)) Неконсолидиров. режимы (по Polity IV (-5; +5)) Автократии (по Polity IV (-10;-6)) Для более глубокого понимания характера взаимосвязи между отдельными индексами были рассчитаны частные коэффициенты корреляции К. Пирсона, показывающие связь между индексами, «очищенную» от влияния других переменных. Результаты расчетов представлены в Таблице 3. 61 В скобках указано число наблюдений, по которым были рассчитаны коэффициенты корреляции. 41 Таблица 3. Частные коэффициенты корреляции62 Частные коэффициенты корреляции Значения 0,704 ICRG-WBGI | GCP (0,000) 0,889 ICRG-WBGI | ECA (0,000) 0,143 ICRG-GCP | WBGI (0,155) 0,598 ICRG-GCP | ECA (0,000) 0,335 ICRG-ECA | WBGI (0,001) 0,538 ICRG-ECA | GCP (0,000) 0,436 WBGI-GCP | ICRG (0,000) 0,692 WBGI-GCP | ECA (0,000) -0,029 WBGI-ECA | ICRG (0,785) 0,276 WBGI-ECA |GCP (0,024) -0,017 GCP-ECA | ICRG (0,890) 0,122 GCP-ECA | WBGI (0,325) Индексы ICRG и WBGI при фиксации других переменных сохраняют высокие значения коэффициентов корреляции, что говорит о том, что они отражают один и тот же латентный концепт, то есть конвергентно валидны. Индексы ICRG и ECA имеют общий элемент по построению, поэтому 62 В скобках указан минимальный уровень значимости коэффициентов корреляции. 42 средние значения коэффициента корреляции при фиксации других переменных говорят о том, что они лишь частично отражают один и тот же латентный концепт, это связано, прежде всего, с тем, что в индексе ECA априорно заложено больше информации (он учитывает и военную мощь государства), поэтому можно считать, что данные индексы имеют среднюю, или ограниченную конвергентную валидность. При фиксации индекса WBGI, корреляция индексов ICRG и GCP становится статистически незначимой, что говорит в пользу того, что они отражают разные латентные концепты, то есть не обладают свойством конвергентной валидности; при фиксации индекса ECA такого снижения значения коэффициента корреляции не происходит в силу общности элементов, из которых состоят индексы. Индексы WBGI и GCP при фиксации других переменных имеют средние значения коэффициентов корреляции, что говорит о том, что они частично отражают один и тот же латентный концепт, однако обладают свойством ограниченной конвергентной валидности. Индексы WBGI и ECA, а также GCP и ECA имеют низкие и статистически незначимые значения коэффициентов корреляции, поэтому не могут быть признаны конвергентно валидными. Конвергентная валидность может быть проверена не только в рамках корреляционного анализа, но и с помощью метода главных компонент. Если, несмотря на расхождения в оценке взаимосвязи, размерность признакового пространства индексов будет равна единице, это будет говорить о том, что они отражают одно и то же явление, что будет свидетельством в пользу конвергентной валидности индексов. В случае получения более высокой размерности признакового пространства можно будет говорить, что индексы отражают разные явления, а значит, не обладают свойством конвергентной валидности. При использовании метода Г. Кайзера выделяется одна главная компонента, отражающая 77% исходной информации, что является хорошим результатом. Корреляция главной компоненты с индексом ICRG 0,92; с 43 индексом WBGI 0,93; с индексом GCP 0,86; с индексом ECA 0,8. Наименьшее значение корреляции индекса ECA c главной компонентой, возможно, связано с тем, что это единственный индекс, учитывающий военную мощь государства. В целом, все это говорит о том, что, несмотря на некоторые различия, все индексы отражают один и тот же латентный концепт, а значит можно считать, что они обладают свойством конвергентной валидности. Метод главных компонент и корреляционный анализ дали противоречивые результаты. Если первый метод (корреляционный анализ) позволил сделать вывод, что индексы государственной состоятельности обладают свойством конвергентной валидности в ограниченном объеме в силу низких значений корреляций на выборке автократий, то анализ методом главных компонент говорит о наличии конвергентной валидности на всем массиве. Выявленное противоречие объясняется тем, что использованные методы оценивают конвергентную валидность с разных сторон. Результат, полученный методом главных компонент, позволяет утверждать, что все индексы входят в область определения государственной состоятельности, и в этом смысле индексы обладают свойством конвергентной валидности; результат же корреляционного анализа говорит лишь о том, что индексы отражают только часть многомерного концепта, причем в недостаточном объеме, и это является причиной недостаточно высоких корреляций на подвыборках. То есть изучаемые индексы отражают государственную состоятельность, но только частично, среди них нет индекса, отражающего латентный концепт в полном объеме. Теперь перейдем к проверке конвергентной валидности с помощью структурного моделирования. Так как предполагается, что все изучаемые индексы отражают одно и то же явление — государственную состоятельность, структура графа выглядит следующим образом: одна латентная переменная (государственная состоятельность) определяет значения четырех наблюдаемых переменных (ICRG, WBGI, GCP, ECA). Граф 44 представлен на Рисунке 1. Рисунок 1. На графе зафиксировано минимально необходимое количество параметров для идентифицируемости модели — ошибки наблюдаемых переменных и нагрузка индекса ICRG, что означает, что латентный концепт государственной состоятельности получает единицы измерения этого индекса. Так как значение статистики хиквадрат (равное 156,115 при двух степенях свободы) попадает в критическую область, гипотеза о равенстве выборочной и модельной ковариационных матриц отвергается, то есть модель не согласуется с данными. Тем не менее, факторные нагрузки статистически значимо отличаются от нуля: нагрузка латентной переменной на индекс ICRG равна 0,920; нагрузка на индекс WBGI равна 0,986; нагрузка на индекс GCP равна 0,815; и самая слабая нагрузка идет на индекс ECA, она равна 0,699. Индексы качества и информационные критерии также говорят о плохом качестве построенной модели. Все это является еще одним аргументом в пользу признания изучаемых индексов обладающими весьма ограниченной конвергентной валидностью. Проблему несогласованности модели и данных могло бы решить иное моделирование структуры графа, однако, в данной ситуации это невозможно из-за проблем с идентификацией: накладывание дополнительных ограничений не обосновано ни теорией, ни особенностями статистических данных, а введение дополнительных переменных затруднительно в силу невозможности оценки расширенной модели из-за небольшого количества известной исходной информации. 45 Предсказательную валидность можно оценить с помощью регрессионного анализа, который позволяет ответить на вопрос, в какой мере возможно предсказание одного индекса по значениям другого. Для этого необходимо определить качество модели, одним из способов отражения которого является анализ значения коэффициента детерминации. Чем ближе он к единице, тем предсказательная валидность индекса выше. Таблица 4.63 Регрессия индекса WBGI (зависимая переменная) на ICRG (независимая переменная) Все государства Демократии по Х. Чейбубу и Дж. Ганди Автократии по Х. Чейбубу и Дж. Ганди ICRG (WBGI) 0,996*** 0,921*** 1,017*** Константа 0,136*** 0,250*** 0,001 N (число наблюдений) 1369 817 551 0,860*** 0,693*** R2 (коэффициент детерминации) 0,826*** Коэффициент детерминации для всего массива данных очень высок, что говорит о том, что индекс ICRG обладает предсказательной валидностью по отношению к индексу WBGI. Так как некоторые исследователи (Х. Хегре (2001), С. Гейтс (2006)) считают, что характер государственной состоятельности может отличаться в зависимости от типа политического режима, массив данных также разделяется на две выборки — демократии и автократии. Значения коэффициентов детерминации говорят о том, что данные индексы более чувствительны к государственной состоятельности на подвыборке демократий. Так как доверительные интервалы регрессионных коэффициентов не пересекаются, можно считать что регрессии, построенные для демократий и автократий, различаются. 63 В Таблицах 4-9 обозначение *** - соответствует 99% уровню доверия; ** - соответствует 95% уровню доверия, * - соответствует 90% уровню доверия. 46 Таблица 5. Регрессия индекса GCP (зависимая переменная) на ICRG (независимая переменная) Демократии по Автократии Все государства Х. Чейбубу по Х. Чейбубу и Дж. Ганди и Дж. Ганди ICRG (GCP) 0,865*** 0,901*** 0,660*** Константа 0,419*** 0,605*** 0,105*** N (число наблюдений) 1793 937 855 0,513*** 0,228*** R2 (коэффициент детерминации) 0,409*** Коэффициент детерминации, рассчитанный для всего массива данных, принимает не слишком высокое значение, что говорит о средней предсказательной валидности данной пары индексов. Значения коэффициентов детерминации говорят о том, что данные индексы обладают большей демократий. Так предсказательной как валидностью доверительные интервалы на подвыборке регрессионных коэффициентов не пересекаются, можно снова считать что регрессии, построенные для демократий и автократий, различаются. Для подвыборки автократий характерна низкая предсказательная валидность индексов. Таблица 6. Регрессия индекса ECA (зависимая переменная) на ICRG (независимая переменная) Демократии по Автократии Все государства Х. Чейбубу по Х. Чейбубу и Дж. Ганди и Дж. Ганди ICRG (ECA) 0,733*** 0,744*** 0,573*** Константа -0,035 -0,044* -0,006 N (число наблюдений) 751 696 54 0,538*** 0,513*** R (коэффициент детерминации) 0,538*** 2 Все коэффициенты детерминации имеют среднее значение, что говорит о том, что индекс ICRG обладает ограниченной предсказательной валидностью по отношению к индексу ECA. Доверительные интервалы регрессионных коэффициентов пересекаются, так как в подвыборке автократий слишком мало наблюдений, и как следствие дисперсия оценки коэффициента высока, поэтому нельзя считать, что регрессии, построенные для демократий и автократий, различаются. 47 Таблица 7. Регрессия индекса GCP (зависимая переменная) на WBGI (независимая переменная) Демократии по Автократии Все государства Х. Чейбубу по Х. Чейбубу и Дж. Ганди и Дж. Ганди WBGI (GCP) 1,133*** 1,156*** 0,776*** Константа 0,450*** 0,474*** 0,129 N (число наблюдений) 620 550 69 0,680*** 0,318*** R2 (коэффициент детерминации) 0,652*** Данная пара индексов обладает неплохой предсказательной валидностью. Однако они более чувствительны к государственной состоятельности в демократиях. На выборке автократий предсказательная валидность низка. Доверительные интервалы регрессионных коэффициентов не пересекаются, следовательно, регрессии, построенные для демократий и автократий, различаются. Таблица 8. Регрессия индекса ECA (зависимая переменная) на WBGI (независимая переменная) Демократии по Автократии Все государства Х. Чейбубу по Х. Чейбубу и Дж. Ганди и Дж. Ганди WBGI (ECA) 0,701*** 0,703*** 0,674*** Константа -0,156*** -0,160*** -0,108** N (число наблюдений) 494 466 27 0,462*** 0,760*** R (коэффициент детерминации) 0,467*** 2 Коэффициент детерминации для всего массива данных имеет среднее значение, что говорит о том, что индекс WBGI обладает ограниченной предсказательной валидностью по отношению к индексу ECA. Значения коэффициентов детерминации говорят о том, что данные индексы обладают более высокой чувствительностью к государственной состоятельности на выборке автократий, однако, это, скорее всего, связано с небольшим числом наблюдений в выборке. Доверительные интервалы регрессионных коэффициентов пересекаются, так как в выборке автократий слишком мало наблюдений, поэтому нельзя считать что регрессии, построенные для демократий и автократий, различаются. 48 Таблица 9. Регрессия индекса ECA (зависимая переменная) на GCP (независимая переменная) Демократии по Автократии Все государства Х. Чейбубу по Х. Чейбубу и Дж. Ганди и Дж. Ганди GCP (ECA) 0,349*** 0,345*** 0,589*** Константа -0,454*** -0,464*** -0,306*** N (число наблюдений) 521 484 36 0,377*** 0,303*** R2 (коэффициент детерминации) 0,365*** Индекс WBGI обладает довольно низкой предсказательной валидностью по отношению чувствительны к к индексу причем ECA, демократическим и они примерно автократическим одинаково политическим режимам. Так как доверительные интервалы для оценок коэффициентов демократий и автократий пересекаются, нельзя считать, что регрессионные модели отличны друг от друга. Проанализированные индексы обладают лишь ограниченной конвергентной и предсказательной валидностью, но даже если бы они были признаны валидными в этих смыслах, это не означало бы, что они обладают содержательной валидностью. Оценить данный тип валидности непросто, так как не существует каких-либо статистических методов, проверяющих содержательную валидность. В случае государственной состоятельности ситуация осложняется еще и отсутствием консенсуса по поводу определения того, что она из себя представляет. Размытые, а зачастую и противоречащие друг другу формулировки не позволят признать существующие индексы содержательно валидными. Однако можно попытаться оценить данный тип валидности в относительных терминах. Индекс ICRG состоит из подкомпонент, отражающих коррупцию, верховенство Государственная закона и качество состоятельность бюрократического является сущностно управления. многомерным понятием, а данный индекс хорошо отражает лишь одну его сторону — административную (управленческую) состоятельность, оставляя без внимания принудительную (военную) мощь государства и лишь частично и косвенно 49 отражая извлекающую мощь. Если мы, вслед за Э. Хендерсоном (2000) и Б. Вальтер (2006), признаем военную мощь государства неотъемлемым компонентом государственной состоятельности, данный индекс нужно будет классифицировать как содержательно не валидный. Индекс WBGI включает в себя показатели политической стабильности, эффективности правительства, качества регулирования, верховенства закона и контроля над коррупцией. Хотя данный индекс, в основном, отражает административную (управленческую) состоятельность государства, подкомпонента политической стабильности косвенно включает в себя оценки принудительной силы государства. Таким образом, можно считать, что индекс WBGI обладает более высокой содержательной валидностью по сравнению с ICRG, хотя в нем недостаточно отражена военная и извлекающая мощь государства, а также объем доступных государству ресурсов. Индекс GCP состоит из подкомпонент ВВП на душу населения, CIM и индекса физической целостности. В отличие от двух предыдущих индексов, он отражает объем доступных государству ресурсов (через показатель ВВП), а подкомпонента CIM позволяет оценить управленческую способность. Индекс физической целостности является весьма неоднозначным индикатором: он может отражать как административную мощь государства (при высоких значениях), так и военную мощь (при низких значениях, если насилие порождается государством), однако, также низкие значения индекса физической целостности могут быть свидетельством несостоятельности государства, то есть его не способности к выполнению своих функций, в силу чего в государстве могут появляться параллельные институты «негосударственной судебной системы», когда какая-то группировка в обществе берет на себя функции «правосудия» и начинают практиковаться пытки и внесудебные убийства граждан. Индекс ECA состоит из подкомпонент налогов на доходы, прибыль и капитал; доли военных расходов в ВВП и качества управления. Данный индекс 50 отражает извлекающую, военную и административную мощь, однако он не показывает объем доступных государству ресурсов. Показатель доли военных расходов в ВВП также является неоднозначным: большие военные расходы могут быть свидетельством того, что государство не в состоянии разрешить какой-либо конфликт, то есть либо у него не хватает для этого управленческой способности, либо не хватает военной мощи для подавления вызова. Таким образом, в ходе проведенного анализа удалось установить, что индексы ICRG и WBGI являются более однозначными и «прозрачными», однако, они отражают лишь сравнительно небольшую часть концепта государственной состоятельности. Индексы GCP и ECA являются более сложными и менее однозначными, при этом они отражают несколько большую часть концепта государственной состоятельности. Однако ни один из вышеупомянутых индексов не может претендовать на полное отражение латентного концепта государственной состоятельности, а значит, ни один индекс не обладает свойством содержательной валидности. 51 Заключение В данном исследовании проверялась гипотеза о том, что индексы государственной состоятельности валидны только в рамках отдельных концептуальных подходов, и не валидны в рамках других, то есть, в целом, не обладают свойством валидности. К такому предположению нас привела существующая множественность подходов к операционализации государственной состоятельности и отсутствие консенсуса по поводу концептуализации. В научному многомерности сообществе возник государственной консенсус о состоятельности, сущностной хотя многие исследователи и избегают давать конкретные дефиниции этому концепту. Так как одноиндикаторные операционализации государственной состоятельности могут отражать только небольшую часть концепта, они автоматически были исключены из дальнейшей проверки на обладание свойством валидности. Для проверки конвергентной и предсказательной валидности были отобраны наиболее часто встречающиеся в научной литературе индексы, значения которых рассчитаны для 140 государств за период с 1990 по 2010 г. Конвергентная валидность, под которой понимается наличие тесной взаимосвязи индикаторов латентного концепта, проверялась с помощью корреляционного анализа, метода главных компонент и моделирования структурными уравнениями. Предсказательная валидность, под которой понимается возможность изучаемого латентного предсказывать концепта, была значения других проверена с индексов помощью регрессионного анализа. Корреляционный анализ показал, что отобранные индексы государственной состоятельности обладают ограниченной конвергентной валидностью. В целом, они больше подходят для оценки государственной состоятельности в демократических политических режимах, чем в 52 автократических, о чем свидетельствуют более высокие и статистически значимые коэффициенты демократий. Проверка корреляции К. Пирсона зафиксированного для результата подмассива с помощью коэффициента корреляции Ч. Спирмена показала, что он является устойчивым. Анализ частных коэффициентов корреляций показал, что наиболее схожие оценки государственной состоятельности дают индексы ICRG и WBGI, однако значения корреляций в остальных парах индексов говорят о том, что они отражают разные латентные концепты, то есть имеют существенно ограниченную конвергентную валидность. С помощью метода главных компонент удалось установить, что изучаемые индексы имеют одномерное признаковое пространство, что говорит о том, что они отражают одну синтетическую категорию, а значит обладают результатов свойством конвергентной корреляционного анализа валидности. и анализа Несогласованность методом главных компонент объясняется тем, что каждый изучаемый индекс отражает только часть многомерного концепта государственной состоятельности, причем в недостаточном объеме, однако, все они входят в область определения государственной состоятельности, поэтому признаковое пространство одномерно, но корреляции не очень высоки. Моделирование структурными уравнениями также подтвердило вывод об ограниченной конвергентной валидности, так как предполагаемая модель латентного концепта государственной состоятельности не согласовалась с имеющимися данными. Регрессионный анализ показал, что высокой предсказательной валидностью обладают только индексы ICRG и WBGI по отношению друг к другу, для остальных пар характерен средний или низкий уровни предсказательной валидности. Кроме того, оказалось, что изучаемые индексы обладают разной чувствительностью к демократическим и автократическим политическим режимам: 53 на выборке автократий предсказательная валидность гораздо ниже, чем на выборке демократий, что также говорит в пользу ограниченности предсказательной валидности индексов. Оценка содержательной валидности была затруднена в связи с тем, что консенсус по поводу определения государственной состоятельности отсутствует, однако, удалось установить, что индексы ICRG и WBGI являются более однозначными и «прозрачными», хотя отражают лишь небольшую часть концепта государственной состоятельности: в основном, административную мощь государства. Индексы GCP и ECA оказались более сложными и менее однозначными, при этом они отражают несколько большую часть концепта государственной состоятельности. Было сделано заключение, что ни один из вышеупомянутых индексов не может претендовать на полное отражение латентного концепта государственной состоятельности, а значит, ни один индекс не обладает свойством содержательной валидности в полной мере. Таким образом, изначальная гипотеза исследования о том, что, в целом, индексы государственной состоятельности не обладают свойством валидности, не может быть отвергнута. Данное исследование выявило ряд проблем, связанных с концептом государственной состоятельности, без решения которых ценность результатов, получаемых разными учеными, в значительной мере будет нивелироваться. Очевидно, что первоочередной задачей дальнейших исследований должен стать поиск исчерпывающего определения государственной состоятельности. Пока такого определения нет, ни одно исследование не может быть обоснованно признано содержательно валидным, а значит, фактически, нельзя сказать, что мы изучаем государственную состоятельность, а не что-либо еще. Кроме того, государственной стало очевидным состоятельности, которые 54 отсутствие бы индикаторов обладали высокой конвергентной и предсказательной валидностью на выборке автократических политических режимов. Еще одной задачей в дальнейших исследованиях должен стать поиск индекса, который бы обладал одинаковой чувствительностью к государственной состоятельности и в демократиях, и в автократиях. Также, поскольку в этом исследовании не был затронут вопрос номологической валидности, который также является неизученным, значительный интерес представляет определение того, насколько результаты моделирования связи государственной состоятельности с другими категориями зависят от выбора индикатора латентного концепта. Возможно, связи будут настолько устойчивыми, что это в некоторой мере нивелирует проблему ограниченной валидности существующих индексов государственной состоятельности. 55

Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования

Related documents

Products

Support

Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib