Сравнительный анализ основных источников данных о миграции населения России Салават Абылкаликов Уфа, 2012 Исследовательский проект Исследовательский проект «Разработка базы данных демографических показателей по регионам России и странам мира» №11-04-0039 по конкурсу Программы «Научный фонд ВШЭ» «Учитель – Ученики 2011-2012» Цель - объединение основных источников демографических показателей и предоставление доступа к накопленной информации в едином удобном формате через гибкий веб-интерфейс. Важный этап - анализ имеющихся источников данных, выявление их особенностей и недостатков, анализ интерфейса пользователя, оценка источников по широкому спектру критериев (характеру доступа, точности, форматам, периодичности обновления и т.д.). Источники Росстата Статистический сборник «Демографический ежегодник России» (Демежегодник) Бюллетень «Численность и миграция населения Российской Федерации» Электронная «Центральная база статистических данных» (ЦБСД) ЦБСД Данные в ЦБСД объединены в 16 блоков: от государственных финансов и национальных счетов, до статистики по труду и занятости. В блок «Демография» входят 10 разделов, включая раздел миграции населения. Показатели по миграции – 3 группы (прибытие, выбытие и миграционный прирост), которые можно рассмотреть по полу, возрасту, направлениям (регионам, странам) прибытия или выбытия и коэффициенты миграции (на 10 тыс. чел.). В демежегоднике имеются показатели прибытия, выбытия и миграционного прироста с характеристиками, которые не всегда присутствуют в ЦБСД. К примеру, возрастно-половой состав, гражданство, национальность международных мигрантов и т.д. Бюллетень «Численность и миграция населения Российской Федерации» содержит еще большее количество уникальной информации Временной горизонт показателей миграции Демежегодник – с 1993 года, в электронном виде на сайте Росстата доступны выпуски, начиная с издания 2001 года. Данные в ЦБСД - с 1990 года Бюллетень «Численность и миграция населения Российской Федерации» издается с 1993 года*, в электронном виде на сайте Росстата доступны выпуски, начиная с издания 2009 года. Временной горизонт ограничен 2007-2010 годами *для составления непрерывного ряда данных придется воспользоваться всеми имеющимися выпусками. Формат выдачи данных (выдача таблицы на экране в браузере), doc (Word), также pdf (Adobe Reader) Бюллетень «Численность и миграция населения Российской Федерации» - html; doc, также xls (Excel) ЦБСД - html (веб-страницы), csv (текстовый файл с разделителем) и xls. Демежегодник – html Большие массивы данных для дальнейшей работы с ними удобнее всего использовать в форматах xls и csv. Частота обновления ЦБСД может обновляться часто и без ограничений. Демежегодник и бюллетень «Численность и миграция населения Российской Федерации», несмотря на наличие электронных версий, являются ежегодными бумажными изданиями, поэтому информация в них обновляется лишь с выходом нового издания. Иногда статистическая информация, данная в выпусках разных годов, не совпадает между собой: перерасчет данных, уточненных по итогам переписей населения производится по большей части за счет миграции Так, миграционный прирост всего населения России в 2000 году составил 217 975 чел. по данным демежегодника-2001 и 241 755 чел. по данным демежегодника-2002 и всех последующих. Различия в значениях показателей в базах данных Таблица 1. Значение показателя миграционный прирост в России по данным различных источников, чел. 2004 2005 2006 2007 2008 2009 41275 107432 132319 239943 242106 247449 countries 98939 125891 154483 258193 257148 259956 125890 132319 239956 242106 247449 ЦБСД Росстата INED Developed database База данных Евростата 98939 Разрабатываемая База данных должна обладать следующими свойствами: Множественность значений показателей, полученных из различных источников Широкий перечень показателей Охват как можно большего временного ряда Полнота рядов данных Содержание информации не только из других баз данных, но и уникальных данных из таких источников, как ежегодные демографические доклады «Население России» и еженедельный демографический Интернет-журнал «Демоскоп Weekly» Разрабатываемая База данных должна обладать следующими свойствами: Единый стандарт получения данных, с возможностью копирования Работа без сбоев Своевременность обновления, с указанием даты последнего обновления. Возможность получения прямой ссылки на массивы данных Интуитивно понятный интерфейс Бесплатность доступа http://db.demoscope.ru/bd03.php Версия 1.8 от 28.09.2012 Спасибо за внимание!