Возраст матери

advertisement
В данной главе будет рассмотрены социально-экономические факторы, влияющие на
деторождение, и если до этого множество работ описывали это влияние для семей, в
которых ребенок уже родился, то здесь будут рассматриваться семьи за год (и более) до
деторождения. Основное различие между двумя этими подходами – в том, что после
деторождения среднедушевые показатели доходов домашних хозяйств заметно падают, а
жилищные условия существенно ухудшаются. Отсюда распространенное заблуждение,
что больше детей рождается в бедных семьях, на самом же деле в большинстве случаев
семьи беднеют с рождением детей. Таким образом, неверно рассматривать домашние
хозяйства с уже родившимися детьми на предмет социально-экономических факторов
побудивших их к деторождению.
В процессе иследования было рассмотрено обследование бюджетов домашних
хозяйств (ОБДХ), проведенной Федеральной службой государственной статистики с 2003
по 2009-ый год и возобновленной в 2009-ом году, это дает возможность выделить те
домашние хозяйства, которые присутствовали в обследовании в течение более одного
года и в которых родились дети. Ведь для выяснения предпосылок рождения ребенка в
домашнем хозяйстве, необходимо сопоставить изменения социально-экономических
факторов до соответствующего ему принятия решения, в момент принятия решения и
после рождения ребенка.
совокупностях
Домашних хозяйств которые присутствуют в выборочных
подряд в двух годах достаточно много. В среднем в 4500 домашних
хозяйствах родились дети, а в 200 000 не родились дети для каждого года, чего вполне
достаточно для проведения регрессионного анализа и оценки важности того или иного
фактора. На самом деле это очень хороший показатель панельности данных, учитывая,
что всего за год обследуются приблизительно 200 000 домашних хозяйств.
Выделение из ОБДХ лонгитюдной выборочной совокупности
ОБДХ не считается панельным обследованием, но на самом деле оно им является,
дело в том, что на протяжении нескольких лет обследуются одни и те же домашние
хозяйства. В силу политики конфиденциальности номера домашних хозяйств в выборке
меняются
ежеквартально,
демографических
и
таким
образом,
социально-экономических
невозможно
показателей
отслеживать
на
динамику
протяжении
даже
отдельного года. Отсюда возникает задача поиска пар домашних хозяйств в выборочных
совокупностях по двум или нескольким квартальным обследованиям.
Для поиска пар выберем две выборочные совокупности, построенные в соседние
годы 𝑌1 и 𝑌2 (строго говоря, они не обязаны быть соседними, но поиск факторов влияющих
на рождение ребенка в периоды, отличающиеся более чем на год – неразумно 𝑌2 - год в
котором родились дети, 𝑌1 – год в котором производится поиск пар к домашним
хозяйствам). Так как ОБДХ – ежеквартальное обследование, то необходимо сложить
выборочные совокупности за один год в единую базу. Далее в массив записываются все
необходимые нам данные по этим домашним хозяйствам:
𝑅𝑒𝑔𝑗𝑘 – номер региона, в котором находится домашнее хозяйство 𝑗
𝑀𝑒𝑠𝑡𝑗𝑘 – тип населенного пункта, в котором находится домашнее хозяйство 𝑗
𝐴𝑘𝑖,𝑗 – число исполнившихся лет -ому члену домашнего хозяйства 𝑗в период 𝑘
𝑘
𝑃𝑜𝑙𝑖,𝑗
–пол -го члена домашнего хозяйства 𝑗
𝐶ℎ𝑖𝑠𝑙𝑗𝑘 –количество членов в домашнем хозяйстве 𝑗в период 𝑘
Далее рассматриваем выборочную совокупность за период 𝑌1 , просматривая все
семьи, сравниваем их с массивом семей с новорожденными детьми составленный по
выборочной совокупности за период 𝑌2 . Если выполнены условия:
𝑌
𝑌
𝑅𝑒𝑔𝑗11 = 𝑅𝑒𝑔𝑗22
𝑌
𝑌
𝑀𝑒𝑠𝑡𝑗11 = 𝑀𝑒𝑠𝑡𝑗22
𝑌
1
𝑌
2
|𝐶ℎ𝑖𝑠𝑙𝑗 1 −𝐶ℎ𝑖𝑠𝑙𝑗 2 |
{
𝑌
2
𝐶ℎ𝑖𝑠𝑙𝑗 2
(1)
> 1 − 𝐾𝑆𝑜𝑣𝑝
Другими словами домашнее хозяйство 𝑗1должно проживать в том же самомрегионе и типе
населенного пункта, что и домашнее хозяйство 𝑗2 . Более того количество членов в 𝑗1-ом
домашнем хозяйстве не должно отличаться от количества членов 𝑗2 -го домашнего
хозяйства более чем на 1 − 𝐾𝑆𝑜𝑣𝑝, ведь структура домашнего хозяйства могла претерпеть
изменение, например, добавиться или выбыть один или более членов. Но если структура
домашнего хозяйства изменилась значительно, то его нельзя считать тем же самым.
𝐾𝑆𝑜𝑣𝑝 ∈ [0,1] - коэффициент минимальной похожести, выбирается вручную, в случае
если похожих домашних хозяйств нашлось слишком мало, его можно снизить, при этом
снизится надежность, если их слишком много, то его можно наоборот увеличить и
соответственно повысить надежность.
Далее если выполнены условия (1), производится более детальное сравнение
домашних хозяйства, то есть каждого члена с каждым, при этом необходимо чтобы были
выполнены условия соответствия пола и возраста для 𝑖1 и 𝑖2 членов домашних хозяйств
𝑗1и 𝑗2 :
𝑌
𝑌
𝑃𝑜𝑙𝑖11,𝑗1 = 𝑃𝑜𝑙𝑖22,𝑗2
𝑌 ,𝑄
𝑌 ,𝑄
𝐴𝑖11,𝑗11 = 𝐴𝑖22,𝑗22 − (𝑌2 − 𝑌1 ),
при𝑄1 = 𝑄2
Если 𝑄1 > 𝑄2, то удовлетворяют условиям:
𝑌 ,𝑄
𝑌 ,𝑄
𝑃𝑜𝑙𝑖11,𝑗11 = 𝑃𝑜𝑙𝑖22,𝑗22
𝑌 ,𝑄
𝑌 ,𝑄
𝑌 ,𝑄
𝑌 ,𝑄
𝐴𝑖11,𝑗11 = 𝐴𝑖22,𝑗22 − (𝑌2 − 𝑌1 ) или 𝐴𝑖11,𝑗11 = 𝐴𝑖22,𝑗22 − (𝑌2 − 𝑌1 − 1)
Если 𝑄1 < 𝑄2, то удовлетворяют условиям:
𝑌 ,𝑄
𝑌 ,𝑄
𝑃𝑜𝑙𝑖11,𝑗11 = 𝑃𝑜𝑙𝑖22,𝑗22
𝑌 ,𝑄
𝑌 ,𝑄
𝑌 ,𝑄
𝑌 ,𝑄
𝐴𝑖11,𝑗11 = 𝐴𝑖22,𝑗22 − (𝑌2 − 𝑌1 ) или 𝐴𝑖11,𝑗11 = 𝐴𝑖22,𝑗22 − (𝑌2 − 𝑌1 + 1), при 𝑄1 < 𝑄2
где 𝑄1 и 𝑄2 – наблюдаемые кварталы, соответственно для 𝑌1 и 𝑌2 .
То есть если мы рассматриваем кварталы 𝑄1и 𝑄2 и при этом они равны, значит,
возраст отдельного члена в 𝑌1 𝑄1 должен уменьшиться ровно на значение (𝑌2 − 𝑌1 ) по
сравнению с 𝑌2 𝑄2 . Если 𝑄1 > 𝑄2 (𝑄1 < 𝑄2 ) то возраст может увеличиться ровно на
(𝑌2 − 𝑌1 ), либо если дата рождения члена домашнего хозяйства позже 𝑄2 (𝑄1), то день
рождения мог не наступить в 𝑌2 𝑄2 (𝑌1 𝑄1), и соответственно возраст мог измениться на
(𝑌2 − 𝑌1 − 1) ((𝑌2 − 𝑌1 + 1)).
Если выполняются условия соответствия возрастов, приведенные выше для 𝑖1 и 𝑖2
𝑖 ,𝑗
членов, то вводится индикатор 𝑆𝑜𝑣𝑝𝑖12,𝑗12 , который равен единице, если условия
выполнены.
𝑖 ,𝑗
𝑆𝑜𝑣𝑝𝑖12,𝑗12 = {
если условия соответствия возрастов выполнены
0,
иначе
1,
𝑗
𝑖 ,𝑗
Далее вводится 𝑆𝑜𝑣𝑝𝑗12 = ∑𝑖1 𝑆𝑜𝑣𝑝𝑖12,𝑗12 - сумма индикаторов для отдельно взятого
домашнего хозяйства. Если выполнены условия:
𝑗
𝑆𝑜𝑣𝑝𝑗12
𝑌 ,𝑄2
𝐶ℎ𝑖𝑠𝑙𝑗22
> 𝐾𝑆𝑜𝑣𝑝
𝑗
𝑆𝑜𝑣𝑝𝑗12
𝑌 ,𝑄1
1
{𝐶ℎ𝑖𝑠𝑙𝑗1
> 𝐾𝑆𝑜𝑣𝑝
то есть количество совпадающих членов удовлетворяет нашему критерию, то считаем
семью полностью совпавшей.
Если рассматривать множество всех совпавших домашних хозяйств то получится
лонгитюдная выборочная совокупность за два года 𝑌1 и 𝑌2 . Конечно, стоит оговориться,
что совпадения могут иметь случайный характер (что с этим делать?).
Модель логистической регрессии деторождения в домашних хозяйствах
В первую очередь изучалось возможное количественное влияние социальноэкономических и территориальных и других различных факторов на вероятность того, что
члены домашнего хозяйства примут решение завести ребенка. Конечно, не стоит забывать
и о том, что решение завести ребенка может быть спонтанным или ребенок может быть
незапланированным, то есть появление ребенка при неизменных параметрах, но это не
мешает
проведению
сравнительного
анализа,
более
того
позволяет
учитывать
незапланированные рождения и рождения в маргинальных семьях. В каччестве основной
модели была выбрана модель логистической регрессии, которая позволяет дать в
количественной форме оценку влияния каждого фактора на вероятность принятия
решения завести ребенка.
В силу того, что зависимая переменная 𝑦 носит бинарный характер (родился ребенок
- 1, не родился - 0) и ряд независимых показателей тоже (строго говоря почти все, разве
что доход домашнего хозяйства и возраст его членов ими не являются) применять для
количественной оценки интенсивности этой связи классическую модель линейной или
нелинейной регрессии затруднительно. В таких случаях используют специальные
функции, которые на основе независимых переменных ДХ, дают оценку вероятности того,
что данное ДХ относится к категории бедных. Если численное значение функции больше
0.5, то считается, что ДХ из категории бедных. В противном случае ДХ относится к
категории не бедных.
Общий вид функции логистической регрессии представляется
выражением:
𝑃=
1
1 + 𝑒 −𝑧
где 𝑃 – вероятность того, что в домашнем хозяйств родился ребенок, а 𝑍 = а0 + 𝑎1 𝑥1 +
𝑎2 𝑥2 + … + 𝑎𝑛 𝑥𝑛 . Величины 𝑎𝑖 являются коэффициентами регрессии, а х𝑖 – значениями
независимых переменных для конкретного домохозяйства. Таким образом, чем ближе
значение 𝑍 к нулю, тем вероятность того, что ребенок родится ближе к 0, и наоборот, чем
значение 𝑍 больше 0, тем выше вероятность того, что ребенок появится. Поэтому все
показатели, используемые в модели можно разделить на две группы: положительные и
отрицательные. Первые имеют положительные коэффициенты и потому уменьшают
вероятность рождения. Вторые наоборот, вероятность уменьшают. Надо заметить, что
знаки коэффициентов зависят от того, как обозначаются используемые показатели.
Например можно ввести переменную обозначающую в какой местности проживает
домашнее хозяйство, в сельской или городской следующим образом: сельская – 1 ,
городская – 0. Как известно в сельской местности детей рождается больше, чем в
городской, следовательно коэффициент при этом показателе будет положительным. Если
же обозначить наоборот: сельская – 0, городская – 1, то в модели коэффициенты при этом
показателе поменяют знак на обратный, но по модулю будут равными.
Существует достаточное количество методов оценки параметров логистической
модели, реализованных в разных статистических пакетах. В силу того, что наши данные
находятся в формате пакета SPSS, была использована стандартная процедура оценки,
которая реализована в
SPSS и которая основана на максимизации принципа
максимального правдоподобия.
Для построения модели логистической регрессии, необходимо определиться с
параметрами 𝑥 = (𝑥1 , … , 𝑥𝑛 ), по которым мы будем определять вероятность наступления
события 𝑦. В нашем случае событием будет рождение ребенка, а параметрами будут :
1. Территориальные факторы
2. Состав домашнего хозяйства
3. Возрастные факторы
4. Доходы и расходы домашнего хозяйства
5.
Собственность домашнего хозяйства
6. Другие факторы
Стоит подробнее остановиться на ,
Возраст матери
Так как в выборочных данных нет переменной, которая могла бы показать, в каком
родстве находятся те или иные члены домашнего хозяйства, приходится определять это,
основываясь на данных присутствующих в выборке.
Мы отметаем маловероятные случаи, такие как усыновление, когда мать как
таковая не обязательна. Поэтому для определения матери в домашнем хозяйстве будем
пользоваться исключительно возрастами членов домашнего хозяйства, так как других
данных мы не имеем.
𝑘
𝑀𝑎𝑚𝑗 = 𝑎𝑟𝑔𝑚𝑖𝑛𝑖 |𝐴𝑘𝑖,𝑗 − 𝐾𝑗 | , если 𝑃𝑜𝑙𝑖,𝑗
= 2 и 𝐴𝑘𝑖,𝑗 − 𝐾𝑗 > 15
где 𝐾𝑗 – возраст старшего ребенка в домашнем хозяйстве 𝑗, 𝑀𝑎𝑚 - номер члена домашнего
хозяйства 𝑗,который является матерью ребенка. Таким образом, матерью будет считаться
женщина, возраст которой минимально отличается от возраста старшего ребенка, но не
менее, чем на 15 лет. Конечно, не правильно считать, что женщины младше 15-ти лет не
рожают. Но, во-первых происходит это редко, во вторых это почти никогда не бывает
спланированным.
Возраст матери определяется следующим образом
𝑀𝑎𝑚𝐴𝑔𝑒𝑗 = 𝐴𝑘𝑀𝑎𝑚𝑗 ,𝑗
Стоит заметить, что если в домашнем хозяйстве вообще нет детей, то возраст
матери все равно высчитывается, по той же формуле, но с добавлением условия 𝐴𝑘𝑖,𝑗 > 18,
то есть возраст женщины, которая гипотетически может стать матерью не должен быть
меньше 18 лет.
Разница в возрасте у отца и матери
Одним из параметров регрессии является возраст отца, но так как параметры
логистической регрессии должны иметь небольшую корреляцию между собой, возраст
отца как параметр нам не подходит, так как сильно коррелирует с возрастом матери.
Таблица 1. Коэффициент корреляции между возрастом матери, возрастом отца, и
отношением возраста отца к возрасту матери по данным полученным поиском
домашних хозяйств в 2008 году соответствующим домашним хозяйствам в 2009.
Коэффициент корреляции
между
Возрастом матери
Возрастом отца
0,969
Отношением возраста
отца к возрасту матери
-0,263
Чтобы избежать этой проблемы, решено использовать не возраст отца, а разницу в
возрасте отца и матери. Но для того чтобы рассматривать разницу в возрасте между отцом
и матерью, необходимо определиться с тем, кого считать отцом. Так как в выборочных
данных нет переменной, которая могла бы показать, в каком родстве находятся те или
иные члены домашнего хозяйства, приходится снова определять это, основываясь на поле
и возрасте члена домашнего хозяйства.
𝑘
Будем считать отцом ребенка, мужчину (𝑃𝑜𝑙𝑖,𝑗
= 1) возраст, которого минимально
отличается от возраста матери
𝑘
𝑃𝑎𝑝𝑗 = 𝑎𝑟𝑔𝑚𝑖𝑛𝑖 |𝐴𝑘𝑖,𝑗 − 𝑀𝑎𝑚𝐴𝑔𝑒𝑗 | , если 𝑃𝑜𝑙𝑖,𝑗
= 1, 𝐴𝑘𝑖,𝑗 > 15, |𝐴𝑘𝑖,𝑗 − 𝑀𝑎𝑚𝐴𝑔𝑒𝑗 | < 15
и при этом он старше 15 лет, а разница в возрасте между ним и матерью не более 15 лет.
На данный момент построена логистическая регрессия по шести основным
факторам: возраст матери, разница в возрасте отца и матери, количество членов
домашнего хозяйства, количество детей в домашнем хозяйстве, проживание в сельской
или городской местности, федеральный округ, образование отца, образование матери,
работает ли отец, работает ли мать, среднедушевой доход домашнего хозяйства,
отношение среднедушевого дохода домашнего хозяйства к среднему среднедушевому
доходу по данному федеральному округу. Причем территории были разбиты по
федеральным округам, а те в свою очередь перенумерованы так, чтобы коэффициент
рождаемости и естественный прирост возрастали.
Таблица 2.
Федеральные округа
Общий коэффициент
естественного
прироста
Северо-Кавказский федеральный округ
Уральский федеральный округ
Сибирский федеральный округ
Дальневосточный федеральный округ
Приволжский федеральный округ
Южный федеральный округ (с 2010
года)
Северо-Западный федеральный округ
Центральный федеральный округ
9,2
2,5
1,3
0,9
-0,7
-0,8
-1,6
-2,5
Результаты моделирования
Рассмотрим результаты моделирования на основе данных полученных, при поиске
домашних хозяйств в выборочной совокупности 2008 года, присутствующих в 2009 году.
Таблица 3. Таблица правдоподобия модели
-2 Log
Правдоподобие
𝑅 2 Кокса и
Снелла
𝑅2
Нэйджелкерка
28381,879
0,068
0,228
Часть вариации, объясняемой моделью логистической регрессии, составляет всего
23.1%, что является не очень хорошим показателем, и связано в первую очередь с тем, что
наблюдаемых успешных значений (рождений) всего 4,2% (4 267 наблюдений), но
учитывая общее количество наблюдений (97 672) это достаточно неплохой показатель. В
представленной ниже классификационной таблице указаны количества правильных и
неправильных предсказаний модели.
Таблица 4. Таблица классификации предсказаний модели при различных разделяющих
значениях
Разделяющее
Неуспех
Успех
значение
(Не родился)
(Родился)
0,1
86,3%
55,7%
85,0%
0,09
84,1%
62,0%
83,1%
0,08
81,6%
68,3%
81,0%
0,07
78,9%
73,8%
78,6%
0,06
75,7%
79,3%
75,9%
0,05
72,1%
83,5%
72,6%
0,04
67,9%
88,2%
68,8%
Всего
95.00%
90.00%
85.00%
80.00%
75.00%
Неуспех
70.00%
Успех
65.00%
Всего
60.00%
55.00%
50.00%
0.1
0.09
0.08
0.07
0.06
0.05
0.04
Рис 1. Предсказания модели при различных разделяющих значениях
Модель дает хорошие прогнозы «не рождений» для разделяющих значений 0,1 0,05
(86,3% - 72,1%) и достаточно хороший прогноз «рождений» для разделяющих
значений 0,07 – 0,04 (74,0% - 88,2%) (Таблица 4). Средний уровень правильного
угадывания составляет 85,0% - 68,8%. Предлагается выбрать разделяющую переменную
равной 0,05, так как нас больше интересует прогностическая сила «рождений», нежели
«не рождений», но при этом при величине разделяющей переменной 0,04 общая доля
предсказанных правильно наблюдений становится достаточно малой.
В следующей таблице приведены значения коэффициентов уравнения для
выбранных переменных.
Таблица 4.
Величина
коэффициен
та регрессии
Стандар
тная
ошибка
Критерий
Вальда
Значимость
Exp(B)
Федеральный округ
Сельская/городская
местность
Количество членов в
домашнем хозяйстве
Количество детей в
домашнем хозяйстве
Тип домашнего хозяйства
-0,086
0,008
127,525
0,000
0,918
0,101
0,037
7,294
0,007
1,106
0,077
0,039
3,942
0,047
1,080
0,033
0,043
0,576
0,448
1,033
0,618
0,079
61,709
0,000
1,855
Возраст матери
-0,142
0,003
3083,778
0,000
0,868
Образование матери
0,063
0,010
41,309
0,000
1,066
Работает ли мать
0,169
0,044
14,818
0,000
1,184
Возраст отца
-1,041
0,131
62,938
0,000
0,353
Образование отца
-0,030
0,010
9,679
0,002
0,970
Работает ли отец
Среднедушевой денежный
доход
Отношение среднедушевого
дохода к среднему
среднедушевому доходу по
федеральному округу
0,584
0,073
63,898
0,000
1,794
0,002
0,002
0,498
0,480
1,002
0,025
0,036
0,474
0,491
1,025
Константа
-1,678
,573
8,584
0,003
,187
Из таблицы видно, что наибольшее влияние на деторождения оказывают
возрастные характеристики супругов, что закономерно. Более того возраст влияет
отрицательно, то есть вероятность завести ребенка с ростом возраста падает, что тоже
вполне закономерно и подтверждается федеральной статистикой (Рис.2 и Рис.3).
Неожиданным оказалось то, что возраст отца влияет значительно сильнее (-1,041),
возраста матери (-0,142), правда и стандартная ошибка значительно выше.
9.00%
8.00%
Модельные
данные
7.00%
6.00%
5.00%
4.00%
3.00%
Данные
федеральной
статистики
2.00%
1.00%
0.00%
18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56
Рис 2. Распределение частот рождений по возрасту матери
Стоит отметить, что при поиске совпадающих домашних хозяйств распределение частот
рождений по возрасту матери совпадает достаточно точно (Рис. 2). Такая статистика не
собирается по возрасту отца, но результаты выглядят достаточно правдоподобными (Рис.
3).
40.000%
35.000%
30.000%
25.000%
20.000%
Модельные
данные
15.000%
10.000%
5.000%
0.000%
18 21 24 27 30 33 36 39 42 45 48 51 54 57
Рис 3. Распределение частот рождений по возрасту отца
Еще одним важным фактором оказалось наличие работы у родителей. Причем
опять же, более важным является наличие работы у отца (0,584), чем у матери (0,169).
Проживание в сельской местности дает хоть и незначительный (0,101), но
положительный эффект (так как «городская местность» – 1, «сельская» – 2),
как и
образование матери (0,063), а вот образование отца (-0,030) наоборот снижает вероятность
завести
ребенка.
Переменная,
отвечающая
за
проживание
в
соответствующем
федеральном округе, дает отрицательный (-0,086), но не очень сильный эффект. Это
понятно, так как округа отсортированы по убыванию суммарного коэффициент
рождаемости.
Такие характеристики домашнего хозяйства как количество членов имеют слабое
влияние, но положительное (0,77). Количество детей оказалось не существенным
фактором, зато тип домашнего хозяйства имеет большую (0,618) и положительную
значимость, что вполне естественно. Удивительно то, что параметры отвечающие за
денежные доходы домашнего хозяйства оказались не значимыми. Стоит отметить
насколько велика константа (-1,678), это означает, что большая часть информации
касательно зависимой переменной не описывается выбранными факторами.
Если убрать не значимые переменные, такие как количество детей в домашнем
хозяйстве, которые коррелируют между собой, а также переменную соответствующую
величине среднего душевого дохода, которая тоже коррелирует с переменной,
отвечающей за отношение среднедушевого дохода к среднему среднедушевому доходу по
федеральному округу.
Таблица 5.
Величина
коэффициента
регрессии
Стандартная
ошибка
Критерий
Вальда
Значимость
Exp(B)
Федеральный округ
Сельская/городская
местность
Количество членов в
домашнем хозяйстве
-0,085
0,008
127,549
0,000
0,919
0,100
0,037
7,149
0,008
1,105
0,102
0,019
29,025
0,000
1,108
Тип домашнего хозяйства
0,666
0,046
205,915
0,000
1,947
Возраст матери
-0,141
0,002
3263,019
0,000
0,868
Образование матери
0,063
0,010
41,265
0,000
1,066
Работает ли мать
0,171
0,044
15,132
0,000
1,186
Возраст отца
-1,040
0,131
62,821
0,000
0,353
Образование отца
-0,031
0,010
9,886
0,002
0,970
Работает ли отец
0,592
0,072
66,673
0,000
1,808
Отношение среднедушевого
дохода к среднему
среднедушевому доходу по
федеральному округу
0,049
0,008
33,189
0,000
1,050
Константа
-2,035
0,331
37,710
0,000
0,131
Сразу
возрастает
значимость
этих
переменных,
и
если
сама
величина
коэффициента регрессии меняется незначительно, то критерий Вальда сильно вырастает
(Таблица 6.). Если же отбрасывать коррелирующие параметры другим образом, то
результаты получаются аналогичными, стоит отметить, что и величина константы
остается примерно такой же, что говорит о том, что данный набор параметров описывает
примерно одинаково данную модель.
Таблица 6.
Количество членов в домашнем
хозяйстве
Тип домашнего хозяйства
Отношение
среднедушевого
дохода
к
среднему
среднедушевому доходу по
федеральному округу
Величина
коэффициента
регрессии
Стандартная
ошибка
до
после
до
после
до
после
до
после
0,077
0,102
0,039
0,019
3,942
29,025
0,047
0,000
0,618
0,666
0,079
0,046
61,709
205,915
0,000
0,000
0,025
0,049
0,036
0,008
0,474
33,189
0,491
0,000
Критерий
Вальда
Значимость
Если рассматривать отдельно домашние хозяйства из городской и отдельно из
сельской местности, получатся достаточно интересные результаты, отличные от тех,
которые получаются при анализе всех домашних хозяйств.
Так в городской местности такие показатели, как наличие работы у матери и
наличие работы у отца становятся значительно более важными (Таблица 7), важность
возрастных показателей
у родителей тоже увеличивается, но не так сильно.
Удивительным является тот факт, что сильно падает значимость и важность образования
матери, а образование отца становится вообще не значимым. С чем это связано сказать
трудно. Во первых корреляция между образованием мужчин и женщин в городской
местности гораздо выше чем в целом, что свидетельствует о том, что пары формируются
из представителей имеющих схожий образовательный уровень. Другим интересным
фактом является заметное снижение влияние доходных факторов, что возможно является
следствием первого факта. То есть при условии того, что пары формируются из
представителей со схожим уровнем образования, хотя может быть и систематической
ошибкой выборочных данных. С другой стороны уменьшается значение константы, что
говорит о том, что данные параметры описывают городские домашние хозяйства в разрезе
рождений более полно.
Еще один странный факт, то что количество членов в домашнем хозяйстве не
является значимым. Можно сделать предположение, что он имеет и положительный и
отрицательный эффект.
Таблица 71.
1
Величина
коэффициента
регрессии
Стандартная
ошибка
Среднее
Вальда
Значимость
Exp(B)
Федеральный округ
-0,100
0,009
118,014
0,000
0,904
Количество детей в домашнем
хозяйстве
-0,123
0,030
17,061
0,000
0,885
Тип домашнего хозяйства
0,776
0,054
208,108
0,000
2,174
Возраст матери
-0,156
0,003
2162,969
0,000
0,856
Образование матери
0,022
0,011
3,769
0,052
1,022
Работает ли мать
0,304
0,058
27,440
0,000
1,355
Возраст отца
-1,466
0,167
77,330
0,000
0,231
Работает ли отец
Отношение среднедушевого
дохода к среднему
среднедушевому доходу по
федеральному округу
1,011
0,117
74,518
0,000
2,747
0,003
0,001
24,185
0,000
1,003
Константа
-1,608
0,344
21,776
0,000
0,200
Величина
коэффициента
регрессии
Стандартная
ошибка
Среднее
Вальда
Значимость
Exp(B)
Федеральный округ
-0,034
0,013
6,477
0,011
0,966
Количество членов в домашнем
хозяйстве
0,054
0,030
3,308
0,069
1,056
Количество детей в домашнем
хозяйстве
0,339
0,036
89,996
0,000
1,403
Возраст матери
-0,119
0,004
905,951
0,000
0,888
Образование матери
0,122
0,016
58,489
0,000
1,130
Возраст отца
-0,640
0,216
8,750
0,003
0,527
Образование отца
-0,091
0,017
28,925
0,000
0,913
Здесь и далее мы не будем вставлять таблицы с незначимыми факторами.
Работает ли отец
0,290
0,093
9,756
0,002
1,337
Среднедушевой денежный доход
-0,030
0,009
10,220
0,001
0,970
Отношение среднедушевого
дохода к среднему
среднедушевому доходу по
федеральному округу
0,426
0,119
12,904
0,000
1,531
Константа
0,740
0,344
4,642
0,031
2,096
Download