Содержание Предисловие Введение. Роль статистики, её задачи и организация

Содержание Предисловие Введение. Роль статистики, её задачи и организация Тема 1 «Статистика и её информационная база» Лекция 1 «Статистическое наблюдение» Лекция 2 «Сводка и группировка материалов статистического наблюдения» Тема 2 «Статистическая совокупность и её характеристики» Лекция 3 «Абсолютные, относительные и средние величины» Тема 3 «Статистические изучение взаимосвязей и динамики» Лекция 4 «Методы изучения корреляционной связи» Лекция 5 «Индексный метод анализа в экономико-статистических исследованиях» Лекция 6 «Методы обработки и анализа рядов динамики» Дополнение 1. Обеспечение качества статистической информации 2. Статистические ряды распределения и их графическое изображение 3. Вариационный анализ. Показатели вариации 4. Статистическое изучение взаимосвязей 5. Выборочный метод наблюдения Учебно-методическое обеспечение дисциплины………………………………………….. Основная литература……………………………………….. Дополнительная литература………………………………… ПРЕДИСЛОВИЕ      Курс лекций по дисциплине «Статистика» написан в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования по направлению подготовки Менеджмент (квалификация «бакалавр»), который утверждён приказом Министерства образования и науки РФ от 20 мая 2010 г. N 544 с изменениями от 31 мая 2011 г. Дисциплина «Статистика» относится к дисциплинам математического и естественнонаучного цикла и входит в состав базовой части ООП. Освоение дисциплины готовит к работе со следующими объектами профессиональной деятельности бакалавров: процессы управления организациями различных организационно-правовых форм; процессы государственного и муниципального управления. Дисциплина готовит к решению различных задач в следующих сферах профессиональной деятельности: организационно-управленческая деятельность; информационно-аналитическая деятельность; предпринимательская деятельность Для освоения дисциплины «Статистика» обучающиеся используют знания, умения, способы деятельности и установки, сформированные в ходе изучения дисциплин «Математика», а также «Теория вероятностей и математическая статистика». Освоение данной дисциплины является необходимой основой для последующего изучения дисциплин: Экономическая теория Экономический анализ хозяйственной деятельности 1           Демография Налоги и налогообложение Статистика в здравоохранении, а также при прохождении преддипломной практики. В результате освоения дисциплины студент будет: Знать: основные понятия и инструменты теории статистики и социально-экономической статистики; Уметь: собирать и регистрировать статистическую информацию; обрабатывать эмпирические и экспериментальные данные: организовать и провести статистическое наблюдение; выполнить первичную обработку и контроль материалов наблюдения; выполнять расчёты основных статистических показателей; формулировать выводы, вытекающие из проведённого анализа. Владеть: статистическими и количественными методами решения типовых организационноуправленческих задач; методами анализа изучаемых явлений и процессов, в т. ч. с использованием средств вычислительной техники; Хотите всё знать? Изучайте статистику, потому что «СТАТИСТИКА ЗНАЕТ ВСЁ »! Успехов вам в изучении курса теории статистики! 2 Введение: «Роль статистики, её задачи и организация» От статистики не скроешься никуда. Она имеет точные сведения не только о количестве зубных врачей, колбасных, шприцев, дворников, кинорежиссеров, проституток, соломенных крыш, вдов, извозчиков и колоколов, но знает даже, сколько в стране статистиков. Ильф И., Петров Е. Двенадцать стульев Имеются три рода лжи: ложь, наглая ложь и статистика Б. Дизраэли, английский государственный деятель, писатель. План 1. Понятие статистики. 2. Основные черты статистики (как науки). 3. Понятие о статистической методологии. Из истории. Статистика имеет многовековую историю, уходя своими корнями в глубокую древность. С образованием государств появилась необходимость в статистической практике, т.е. в сборе сведений о наличии земель, численности населения, о его имущественном положении . Первой опубликованной статистической информацией можно считать глиняные таблички Шумерского царства (III — II тысячелетия до н. э.). Несколько тысячелетий назад такой учет велся в Китае, Древнем Риме, Египте. Самые ран- ние сведения об осуществлении достаточно регулярного учета численности населения имеются в Китае и относятся к XXIII веку до н.э. Наиболее совершенные организационные формы статистическая практика приобрела в Древнем Риме. В 550 году до н.э. там был создан ценз для проведения переписи свободных граждан – нечто подобное статистическому органу. Каждый свободный гражданин Рима должен был назвать цензору свое полное имя, общину, к которой он принадлежал, пол и возраст всех членов семьи, сведения об имущественном положении, в состав которых включались и сведения о рабах. По мере развития общественного производства, роста городов, активизации внутренней и внешней торговли потребность в статистической информации увеличивалась. Это способствовало совершенствованию приемов и методов статистической практики. В России становление и развитие статистической науки обязано таким ярким представителям как И.К. Кириллову (1689 –1737), В.Н. Татищеву (1686 – 1750), М.В. Ломоносову (1711 – 1765), К.Ф. Герману (1767 – 1838). И.К. Кириллов в 1727 году по материалам Петровской ревизии сделал одно из первых систематизированных экономико-географических описаний России в работе «Цветущее состояние Всероссийского государства». Крупным событием в истории отечественной статистики было появление в 1846 году работы Д.П. Журавского (1810 – 1856) «Об источниках и употреблении статистических сведений». В ней автор ввел понятие массового наблюдения как основы статистического исследования, группировке – основному методу статистического анализа, уделил большое внимание источникам статистических сведений, вопросам организации их получения, их достоверности. Работу Д.П. Журавского «Статистическое описание Киевской губернии» Н.Г. Чернышевский считал «одним из самых драгоценных приобретений, сделанных русской наукой». К концу XIX века Россия стала одним из признанных центров научной статистической мысли. Дальнейшее развитие статистики связано с именами А.В. Леонтовича (специальные исследования о кривых распределения), Е.Е. Слуцкого и А.А. Чупрова (исследования о корреляционном анализе), С.Г. Струмилина, В.С. Немчинова, Б.С. Ястремского, А.Я. Боярского и др. 1. Понятие статистики (как науки). Статистика как наука сформировалась значительно позднее. Ее истоки находятся в так называемой политической арифметике (математическое направление, считавшее количественный метод способом познания политической и социальной жизни), возникшей в конце XYII века благодаря трудам английских ученых Вильяма Пети (1623 – 1687), которого К. Маркс называл «в некотором роде изобретателем статистики», и Дж. Гранта, впервые заметившего закономерности в миграции населения. В дальнейшем это направление значительно развилось в работах бельгийского статистика Л.А.Ж. Кетле, английских ученых Ф. 3 Гальтона (1822 – 1911), К. Пирсона (1857– 1936), В. Госсета (1876 – 1936), Р. Фишера (1890 – 1962) и др. «Изобретатель» статистики Вильям Пети (1623-1687 гг.). Другой исторической дисциплиной, предшествовавшей современной статистике, было государствоведение – описание естественных условий, территории, климата, населения, экономики и других объектов, характеризующих состояние государства. Важнейшими представителями описательной школы государствоведения были немецкие ученые Герман Конринг (1606 – 1681) и Готфрид Ахенваль (1719 – 1772). Происхождение слова «статистика» берет свое начало от группы латинских слов: status – положение вещей, состояние дел; stato – государство, управляемая область; statista – знаток государства. В науку термин «статистика» ввел немецкий ученый Готфрид Ахенваль в 1746 году, предложив заменить название курса «Государствоведение», преподававшегося в университетах Германии, на «Статистику», положив тем самым начало развитию статистики как науки и учебной дисциплины. В настоящее время термин «статистика» трактуется гораздо шире и употребляется в различных значениях. 1) Под статистикой понимают отрасль практической деятельности, которая имеет своей целью сбор, обработку, анализ и публикацию массовых данных о самых различных явлениях и процессах общественной жизни. 2) Статистикой называют совокупность цифровых сведений, характеризующих какое-либо явление общественной жизни или совокупность их. Например, статистика браков (бракосочетаний), статистика посевных площадей, 3) Статистикой называют отрасль знаний, т.е. специальную научную дисциплину (статистическую науку) и соответственно этому учебную дисциплину в высших и средних специальных учебных заведениях. Статистика, социально-экономическая статистика, представляет собой сложную и разветвленную систему научных дисциплин (разделов), обладающих определенной спецификой. Основными ее разделами являются: общая теория статистики, где рассматриваются наиболее общие категории, принципы и методы статистической науки; социальная статистика изучает социально-демографические процессы: уровень жизни населения, показатели образования и здравоохранения, и т.д., т.е. показатели, характеризующие жизнь человека в обществе; 4 отраслевые статистики характеризуют показатели процесса производства в различных отраслях хозяйственной деятельности: статистика промышленности, статистика сельского хозяйства, статистика транспорта, статистика финансов и т.д.; экономическая статистика изучает процессы общественного воспроизводства в целом. Экономическая статистика разрабатывает систему показателей, характеризующих производственные силы и производственные отношения , характеризует структуру, пропорции, эффективность производства и потребления и т.п.; одним из направлений экономической статистики является международная статистика. Важнейшей задачей международной статистики является разработка методов сопоставления уровня социально-экономического развития различных стран и регионов. Схема органов статистики России Важнейшая задача статистических органов – регулярное информирование общественности и органов управления о происходящих изменениях в социально–экономическом развитии страны. Усилиями многих стран создана Глобальная статистическая система, в которую входят: 1) статистическая комиссия при ООН; 2) отраслевые статистические подразделения ООН; 3) система статистических изданий ООН и других международных организаций; 4) специальные учреждения ООН: ФАО – Комиссия ООН по продовольствию, ЮНЕСКО – Комиссия ООН по сотрудничеству в области науки, культуры и образования, ВОЗ – Всемирная организация здравоохранения, ВБ – Всемирный банк (прежнее название Международный банк реконструкции и развития), МВФ – Международный валютный фонд, ВТО – Всемирная торговая организация; 5) статистические службы межгосударственных организаций: ОЭСР – Организация экономического сотрудничества и развития, ЕЭС – Европейское экономическое сообщество, СНГ – Союз Независимых Государств; 6) региональные статистические организации: 5 ЕВРОСТАТ – Статистическая организация стран Общего рынка. Основная цель создания Глобальной статистической системы – эффективное использование имеющихся ресурсов для осуществления статистической деятельности на национальном и международном уровне. 2. Особенности предмета статистики. Предметом исследования статистики являются массовые явления социально – экономической жизни; она изучает количественную сторону этих явлений в неразрывной связи с их качественным содержанием в конкретных условиях места и времени. Основные черты и особенности статистики как науки.  Первой особенностью статистики как науки является то, что статистика исследует массовые явления и процессы, выступающие как множества отдельных фактов, обладающих как индивидуальными, так и общими признаками.  Второй особенностью статистики как науки является то, что она изучает, прежде всего, количественную сторону общественных явлений и процессов в конкретных условиях места и времени. Количественную характеристику статистика выражает через числа, которые называются статистическими показателями. Статистический показатель отражает результат измерения единиц совокупности и совокупности в целом. Статистический показатель – это понятие (категория), отображающее количественные характеристики (размеры) соотношения признаков общественных явлений. Статистический показатель имеет три обязательных атрибута (существенных свойства): количественную определенность, место и время (момент или период времени). Таким образом, в статистике нет просто цифр 200, 300 и т.д., в этой науке числа всегда именованные, относящиеся к определенному месту и времени. Например, Россия входит в группу стран с высоким уровнем развития человеческого потенциала, так как величина индекса развития человеческого потенциала (ИЧРП) России в 2008 составила 0,719, или 2010 году Российская Федерация выделила $2 млн. на финансирование Миротворческого фонда ООН.  Третья особенность статистики как науки заключается в том, что она исследует структуру общественных явлений. Структура – это внутреннее строение массовых явлений, т. е. внутреннее строение статистического множества.  Каждому общественному явлению свойственны изменения в пространстве и во времени. Изменения в пространстве выявляются посредством анализа структуры общественного явления, а изменения уровня и структуры явления исследуются во времени, т. е. в динамике. Такова четвертая особенность статистики как науки. Явления общественной жизни взаимосвязаны и взаимообусловлены - изменение одних явлений предопределяет другие; например, снижение затрат на сырье и материалы приводит к снижению себестоимости и наоборот.  Поэтому выявление связей является пятой особенностью статистики как науки, так как познание действительности невозможно без познания всех или, по крайней мере, основных взаимосвязей общественных явлений. Наибольшее значение имеет выявление причинноследственных связей, чтобы воздействовать на общественные явления с целью их изменения в интересах общества. Статистика - отрасль общественной науки, которая изучает количественную сторону качественно определенных массовых социально-экономических явлений и процессов, их структуру и распределение, размещение в пространстве, движение во времени, выявляя действующие количественные зависимости, тенденции и закономерности, причем в конкретных условиях места и времени. 3. Статистическая методология Специфические приемы, с помощью которых статистика изучает свой предмет, образуют статистическую методологию. 6 Под статистической методологией понимается система приемов, способов и методов, направленных на изучение количественных закономерностей, проявляющихся в структуре, динамике и взаимосвязях социально-экономических явлений. Все многообразие статистических методов можно систематизировать по их применению на различных этапах (стадиях) статистического исследования Выделяют, по меньшей мере, три последовательные стадии статистических исследований: 1) статистическое наблюдение, т.е. сбор первичных статистических данных; 2) статистическая сводка (группировка) результатов наблюдения (первичного статистического материала); 3) анализ полученных сводных материалов. Все эти этапы связаны между собой, отсутствие одного из них ведет к разрыву целостности статистического исследования. На каждой из трех стадий и используются свои специфические методы. На первой стадии решается задача учета всего многообразия индивидуальных значений, в которых проявляется исследуемое явление или процесс. Для решения этой задачи применяется метод массовых наблюдений. Использование метода массовых наблюдений связано с тем, что статистические закономерности в соответствии с законом больших чисел проявляются только при изучении достаточно большого количества данных. Закон больших чисел требует большого числа наблюдений для того, чтобы статистические характеристики были типичными и свободными от влияния случайных факторов. Сущность закона больших чисел состоит в том, что при изучении большого количества показателей индивидуальные значения отдельных показателей, являющиеся случайными, нетипичными для изучаемого массива данных сглаживаются. И наоборот, отчетливо проявляется значение показателей, являющихся типичными для изучаемого явления или процесса.  На второй стадии решается задача систематизации собранного статистического материала. Важнейшим методом на этой стадии статистического исследования является метод статистических группировок. Метод группировок позволяет выделить качественно однородные группы, а после изучения отдельных групп, оценивается явление в целом. Основное содержание второй стадии статистического исследования состоит в переходе от характеристики единичных показателей к сводным данным, характеризующим все явление в целом.  Основной задачей третьей стадии статистического исследования является анализ статистического материала и выявление существующих социально – экономических закономерностей. В соответствии с ранее сформулированными познавательными задачами статистики как науки в процессе статистического анализа исследуются структура, динамика и взаимосвязи общественных явлений или процессов. Выделяют следующие основные этапы анализа: 1) констатация фактов и их оценка; 2) установление характерных черт и причин явления; 3) сопоставление явления с другими, в том числе с оптимальными; 4) формулирование гипотез, выводов и предложений. Основную роль в процессе обобщения и анализа статистических данных играет расчет обобщающих агрегированных показателей: абсолютных, относительных, средних величин и индексных систем. Некоторые общие черты формирования обобщающих показателей устанавливаются посредством измерения их вариации. Изучение вариации наряду с применением средних и относительных величин имеет большое практическое и научное значение. Показатели вариации дополняют средние величины, за которыми скрываются индивиду- 7 альные различия. Они характеризуют степень однородности статистической совокупности по данному признаку. Показатели вариации определяют границы вариации признака. Соотношение показателей вариации выражает взаимосвязь признаков. Изучение структуры - исходный пункт статистического исследования. Здесь вопросы изменения и развития возникают в отраженной форме с различным уровнем развития элементов структуры. Конечная задача статистического исследования - отыскание закономерностей динамики. Исследование динамики обычно носит дифференциальный или интегральный характер. Фиксация состояний процесса образует интегральный динамический ряд, который исследуется на основе обобщающих аналитических показателей, специальных приемов обработки и моделирования рядов динамики. Прогнозирование дальнейшего хода развития общественных явлений осуществляется с помощью экстраполяции. Закономерности причинно-следственных связей общественных процессов и явлений устанавливаются с помощью корреляционно-регрессионного анализа, а также методов многомерного статистического анализа. Взаимосвязи явлений также изучаются с помощью статистических группировок, параллельных рядов, взаимосвязанных индексов и т. д. Широкое применение в статистике находят графические методы, позволяющие в наглядной форме представлять результаты статистических исследований. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.  Вопросы для самопроверки: Назовите основные особенности предмета статистики. Что такое предмет статистики и статистическая совокупность? Что является объектом статистического исследования? Дайте определение единице статистической совокупности. Понятие вариации в статистике. Что такое статистический показатель? Дайте понятие структуры массовых явлений. Перечислите основные стадии статистического исследования. Основные методы статистического исследования. В чем сущность статистических методов, и какие из них применяются в статистических исследованиях?  Литература 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 1 С.14-18 2. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.1 пп.1.1. – 1.3. Лекция 1. Тема: «Статистическое наблюдение» Факты - это воздух науки. И.П. Павлов План 1. Понятие и требования к статистическому наблюдению. 2. Программно–методологические и важнейшие организационные вопросы статистического наблюдения. 3. Ошибки статистического наблюдения. 1. Понятие и требования к статистическому наблюдению. 8 Статистическое наблюдение – это первая стадия всякого статистического исследования. Статистическим наблюдением называется планомерный, научно обоснованный сбор данных или сведений о социально – экономических явлениях и процессах путем регистрации характеризующих их признаков. О статистическом наблюдении можно говорить лишь тогда, когда, вопервых, обеспечивается регистрация устанавливаемых фактов в специальных учетных документах и, во-вторых, изучаются статистические закономерности, т.е. такие, которые проявляются только в массовом процессе, в большом числе единиц какой-то совокупности. Статистическое наблюдение должно быть планомерным, массовым и систематическим. К статистическому наблюдению предъявляются следующие требования: 1) полноты и практической ценности статистических данных; 2) достоверности и точности данных; 3) их единообразия и сопоставимости. Статистическое наблюдение может проводиться органами государственной статистики, научно-исследовательскими институтами, экономическими службами банков, бирж, фирм. Процесс проведения статистического наблюдения включает следующие этапы: 1) подготовка наблюдения; 2) проведение массового сбора данных; 3) подготовка данных к автоматизированной обработке; 4) разработка предложений по совершенствованию статистического наблюдения. Подготовка статистического наблюдения предполагает: 1) решение методологических вопросов, которые включают:  определение цели и объекта наблюдения,  состава признаков, подлежащих регистрации;  разработка документов для сбора данных;  выбор отчетной единицы и единицы, относительно которой будет проводиться наблюдение,  выбор методов и средств получения данных. 2) решение проблемы организационного характера:  определить состав органов, проводящих наблюдение;  подобрать и подготовить кадры для проведения наблюдения;  составить календарный план работ по подготовке, проведению и обработке материалов наблюдения;  провести тиражирование документов для сбора данных. Проведение массового сбора данных начинается с рассылки переписных листов, анкет, бланков, форм статистической отчетности и заканчивается их сдачей после заполнения в органы, проводящие наблюдение. Проведение массового сбора данных включает работы, связанные непосредственно с заполнением статистических формуляров. 2. Программно–методологические и важнейшие организационные вопросы статистического наблюдения. Статистическое исследование начинается с точной формулировки его цели, конкретных задач и сведений, которые необходимо получить в процессе наблюдения. После этого определяются объект и единица наблюдения, разрабатывается программа, выбираются вид и способ наблюдения. Статистические наблюдения преследуют практическую цель – получение достоверной информации для выявления закономерностей развития явлений и процессов. При подготовке наблюдения следует установить объект наблюдения. Объект наблюдения – совокупность социально-экономических явлений и процессов, которые подлежат исследованию, или точные границы, в пределах которых будут регистрироваться статистические сведения. Единицей наблюдения называется составная часть объекта наблюдения, которая служит основой счета и обладает признаками, подлежащими регистрации при наблюдении. 9 Например, при переписи населения единицей наблюдения является человек; если же изучению подлежат также и семьи, то устанавливаются две единицы наблюдения: отдельный человек и семья. Для определения состава регистрируемых признаков разрабатывают программу наблюдения. Программа наблюдения – это перечень вопросов, по которым собираются сведения, либо перечень признаков и показателей, подлежащих регистрации. Вопросы должны отражать наиболее важные черты и признаки изучаемого явления. Вопросы должны быть точными и не допускать двойных толкований. При разработке программы следует не только определить состав вопросов, но и их последовательность. При разработке программы статистического наблюдения определяется перечень обобщающих показателей, составляются макеты конечных статистических таблиц. Ответы на вопросы программы собирают в документах, называемых статистическими формулярами (бланками, анкетами). Статистический формуляр – это первичный документ, в котором фиксируются ответы на вопросы программы по каждой из единиц совокупности. Формуляры могут иметь различную форму, однако все они содержат обязательные элементы: титульную и адресную части; содержательную часть, включающую перечень вопросов программы, свободную графу для записи ответов. Формуляры бывают индивидуальные и списочные. При подготовке статистического наблюдения должен быть решен вопрос о времени проведения наблюдения. Срок (период) наблюдения – это время, в течение которого происходит заполнение статистических формуляров. Критический момент – это конкретная дата и время наблюдения, по состоянию на которое осуществляется регистрация фактов. При подготовке статистического наблюдения должен быть решен вопрос о времени проведения наблюдения. Срок (период) наблюдения – это время, в течение которого происходит заполнение статистических формуляров. Критический момент – это конкретная дата и время наблюдения, по состоянию на которое осуществляется регистрация фактов. Статистическая отчетность – это основная форма статистического наблюдения. Отчетность – это официальный документ, содержащий статистические сведения о работе предприятия, учреждения, организации и т. п. Отчетность утверждается органами государственной статистики и имеет обязательный характер; юридическую силу; документальную обоснованность. Действующую статистическую отчетность делят на типовую и специализированную. По срокам представления отчетность бывает ежедневная, недельная, двухнедельная, месячная, квартальная и годовая. Кроме годовой отчетности все перечисленные виды представляют собой текущую отчетность. По способу представления сведений отчетность делится на телеграфную, телетайпную, почтовую. Специально организованное статистическое наблюдение проводится с целью получения сведений, отсутствующих в отчетности, или для проверки ее данных. Наиболее простым примером такого наблюдения является перепись. Российская практическая статистика проводит переписи населения, материальных ресурсов, многолетних насаждений, неустановленного оборудования, строек незавершенного строительства, оборудования и др. Кроме переписей статистика проводит и другие специально организованные наблюдения, в частности бюджетные обследования, которые характеризуют структуру потребительских расходов и доходов семей. 10 Регистровая форма наблюдения – это форма непрерывного статистического наблюдения за долговременными процессами, имеющими фиксированное начало, стадию развития и фиксированный конец. В практике статистики различают регистры населения и регистры предприятий. Регистр населения – поименованный и регулярно актуализируемый перечень жителей страны. Программа наблюдения ограничена общими признаками, такими, как пол, дата и место рождения, дата вступления в брак. Регистр предприятий включает в себя все виды экономической деятельности и содержит значения основных признаков по каждой единице наблюдаемого объекта за определенный период или момент времени. Регистры предприятий содержат данные о времени создания (регистрации предприятия), его название и адрес, телефон, об организационноправовой форме, структуре, виде экономической деятельности, количестве занятых (этот показатель отражает размер предприятия) и др. Единый государственный регистр предприятий и организаций всех форм собственности (ЕГРПО) дает возможность организовать сплошное наблюдение по ограниченному кругу статистических показателей предприятий, зарегистрированных на территории России, позволяет получить непрерывные ряды показателей в случае изменения территориальной, отраслевой и других структур совокупности. Статистическая информация может быть получена различными способами, важнейшими из которых являются непосредственное наблюдение, документальный учет фактов и опрос. Способы статистического наблюдения Непосредственным называют такое наблюдение, при котором сами регистраторы путем непосредственного замера, взвешивания, подсчета или проверки работы и т. д. устанавливают факт, подлежащий регистрации, и на этом основании производят записи в формуляре наблюдения. Документальный способ наблюдения основан на использовании в качестве источника статистической информации различного рода документов, как правило, учетного характера. При надлежащем контроле за постановкой первичного учета и правильном заполнении статистических формуляров документальный способ дает наиболее точные результаты. Опрос – это способ наблюдения, при котором необходимые сведения получают со слов респондента. Он предполагает обращение к непосредственному носителю признаков, подлежащих регистрации во время наблюдения, и используется для получения информации о явлениях и процессах, но поддающихся непосредственному прямому наблюдению. В статистике применяются следующие виды опросов: устный (экспедиционный), саморегистрации, корреспондентский, анкетный и явочный. При устном (экспедиционном) опросе специально подготовленные работники (счетчики, регистраторы) получают необходимую информацию на основе опроса соответствующих лиц и сами фиксируют ответы в формуляре наблюдения. 11 При саморегистрации формуляры заполняются самими респондентами, а счетчики раздают им бланки опросного листа, разъясняют правила их заполнения, а затем их собирают. Корреспондентский способ заключается в том, что сведения в органы, ведущие наблюдения, сообщает штат добровольных корреспондентов. Анкетный способ предполагает сбор информации в виде анкет. Определенному кругу респондентов вручаются специальные вопросники (анкеты) либо лично, либо путем публикации в периодической печати. Явочный способ предусматривает представление сведений в органы, ведущие наблюдение в явочном порядке, например при регистрации браков, рождений, разводов и т.д. Виды статистического наблюдения 12 Формы, виды и способы статистического наблюдения. Ошибки статистического наблюдения Точность данных – это основное требование, предъявляемое к статистическому наблюдению. Чтобы избежать ошибок наблюдения, предупредить, выявить и исправить их возникновение, необходимо: - обеспечить качественное обучение персонала, который будет проводить наблюдение; - организовать специальные частичные или сплошные контрольные проверки правильности заполнения статистических формуляров; - провести логический и арифметический контроль полученных данных после окончания сбора информации. В зависимости от характера и степени влияния на конечные результаты наблюдения, а также исходя из источников и причин возникновения неточностей, допускаемых в процессе статистического наблюдения, обычно выделяют ошибки регистрации и ошибки репрезентативности. Ошибки регистрации возникают вследствие неправильного установления фактов в процессе наблюдения или неправильной их записи. Они подразделяются на случайные и систематические и могут быть как при сплошном, так и несплошном наблюдении. Случайные ошибки — ошибки регистрации, которые могут быть допущены как опрашиваемыми в их ответах, так и регистраторами при заполнении бланков. Систематические ошибки регистрации всегда имеют одинаковую тенденцию либо к увеличению, либо к уменьшению значения показателей по каждой единице наблюдения, и поэтому величина показателя по совокупности в целом будет включать в себя накопленную ошибку. Систематические ошибки могут быть преднамеренными, так и непреднамеренными. Преднамеренные ошибки получаются в результате того, что опрашиваемый, зная действительное положение дела, сознательно сообщает неправильные данные. Непредна3. 13 меренные ошибки вызываются различными случайными причинами (небрежностью или невнимательностью регистратора, неисправностью измерительных приборов и т.д.). Ошибки репрезентативности возникают в результате того, что состав отобранной для обследования части единиц совокупности недостаточно полно отображает состав всей изучаемой совокупности, хотя регистрация сведений по каждой отобранной для обследования единице была проведена точно. Ошибки репрезентативности могут быть случайными и систематическими. Случайные ошибки возникают из-за того, что совокупность отобранных единиц наблюдения неполно воспроизводит всю совокупность в целом. Систематические ошибки возникают вследствие нарушения принципов случайного отбора единиц изучаемой совокупности. Для выявления и устранения допущенных при регистрации ошибок может применяться счётный и логический контроль собранного материала. Счётный контроль заключается в проверке точности арифметических расчётов, применявшихся при составлении отчётности или заполнении формуляров обследования. Логический контроль заключается в проверке ответов на вопросы программы наблюдения путём их логического осмысления или путём сравнения полученных данных с другими источниками по этому же вопросу. Ошибки статистического наблюдения Ошибки репрезентативности Ошибки регистрации Случайные Систематические Преднамеренные Случайные Систематические Непреднамеренные  Вопросы для самопроверки 1. Дайте определение статистическому наблюдению. 2. Какие элементы включает в себя программно-методологический план наблюдения? 3. Что является объектом статистического наблюдения? 4. Что такое единица наблюдения? Для каких целей она используется? 5. Дайте характеристику единицы совокупности и объясните, чем она отличается от единицы наблюдения. 6. Понятие программа статистического наблюдения. 7. Какие вопросы включаются в организационную часть статистического наблюдения? 8. Какие формы статистического наблюдения вам известны? 9. Что такое статистическая отчетность? Для каких целей она применяется? 10. Для каких целей проводят специальное статистическое наблюдение? 11. Перечислите и охарактеризуйте способы статистического наблюдения. 12. Объясните суть непосредственного наблюдения? 14 13. Приведите примеры документального наблюдения? 14. Охарактеризуйте четыре разновидности опроса, а именно: экспедиционный (устный), анкетный, корреспондентский и способ саморегистрации. 15. Дайте характеристику классификации видов статистического наблюдения основные по времени регистрации и по охвату единиц совокупности. 16. Расскажите о сплошном и несплошном наблюдении. В каких случаях и для чего применяется сплошное наблюдение, а в каких несплошное? 17. При каком виде наблюдения возникают ошибки репрезентативности? 18. Ошибки, возникающие в процессе статистического наблюдения. 19. По каким причинам возникают систематические преднамеренные ошибки регистрации? 20. Можно ли избежать либо снизить размер случайных ошибок репрезентативности?  Литература 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 2 С.19-25 2. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.1 п.1.4 Лекция 2 Тема: «Сводка и группировка материалов статистического наблюдения» «Факты - это воздух науки», - писал И.П. Павлов. Но факты - еще не наука. Как груда строительного материала не является зданием, так и масса накопленных фактов (данных) не составляет содержание науки. Только сведенные в некую систему, факты приобретают определенный смысл, позволяют извлечь заключенную в них информацию. План 1. Понятия сводки статистических данных 2. Группировка статистических данных. Виды группировок 3. Способы представления статистической сводки: • статистические ряды распределения; • статистические таблицы; • графическое представление статистических данных 1. Понятия сводки статистических данных. Статистическое исследование включает в себя три последовательные стадии: 1) статистическое наблюдение, т.е. сбор информации; 2) статистическая сводка и группировка результатов наблюдения (систематизация статистического материала); 3) анализ полученных сводных материалов При статистическом наблюдении собирают данные о каждой единице совокупности. Чтобы на основании собранного материала можно было получить подробные данные, характеризующие в целом всю совокупность, и сделать определенные выводы по изучаемой совокупности, необходимо выполнить второй этап статистического исследования, - сводку статистического исследования. Цель сводки: получение на основе полученной информации обобщающих статистических показателей, отражающих сущность социально-экономических явлений и определенные статистические закономерности. Статистическая сводка осуществляется по программе, которая должна разрабатываться еще до сбора статистических данных, практически одновременно с составлением плана и программы статистического наблюдения. Программа сводки включает: 15 • • • выбор группировочных признаков; определение порядка формирования групп; разработку системы статистических показателей для характеристики групп и объекта в целом; • разработку системы макетов статистических таблиц, в которых должны быть представлены результаты сводки. Статистическая сводка – это целый комплекс статистических операций, направленных на обработку статистического материала и получение обобщающих статистических показателей, характеризующих то или иное социально–экономическое явление. Статистическая сводка включает в себя: 1) объединение зарегистрированных при наблюдении единичных показателей в группы, сходные в том или ином отношении; 2) характеристику выделенных групп системой показателей; 3) подсчет итогов по выделенным группам и по всей совокупности в целом; 4) оформление результатов сводки в виде таблиц и графиков. 2. Группировка статистических данных. Группировка-это метод (способ, прием), который широко используется на втором этапе исследования статистических совокупностей – статистической сводке. Группировка – процесс образования групп из единиц совокупности на основе какоголибо группировочного признака. Метод группировки основывается на следующих категориях (понятиях): • группировочный признак, • число групп, • интервал группировки. Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Группировочными признаками могут быть как качественными (форма собственности или отрасль производства), так и количественными признаками (численность занятых, стоимость основных фондов). Нет строгого правила для определения числа групп в совокупности. Каждый раз эта задача решается с учетом конкретных обстоятельств. Количество выделяемых групп во многом зависит от размаха варьирования. Размах варьирования (вариации) R – это разность между максимальным x max и минимальным x min значениями признака в изучаемой совокупности: R  x max  x min . При равенстве интервалов и незначительной вариации признаков N  100 можно воспользоваться формулой Стерджеса: k  1  3,322 lg N . Здесь k – число групп (интервалов), на которые разбивается вся вариация (совокупность). Интервалом называется разность между максимальным и минимальным значением признака в каждой группе. Интервалы могут быть: Интервалы могут быть:  равными, то есть разность между максимальным и минимальным значением признака в каждом из интервалов одинакова;  неравными, если ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;  открытыми в том случае, когда имеется только либо верхняя, либо нижняя граница;  закрытыми, когда имеются и нижняя, и верхняя границы. 16  Замечание 1) В случае равных интервалов величина (ширина) интервала может быть определена по формуле: i  2) 3) x  x min R .  max k 1  3,322 lg N Неравные интервалы обычно увеличиваются при переходе к большим значениям признака. Например, выделяются следующие группы интервалов по численности рабочих: до 100, 101-200, 201-500, 501-1000, 1000 – 3000, 3001-10000, 10001 и более. При определении числа групп необходимо учитывать следующее:  число групп детерминируется (зависит) уровнем колеблемости группировочного признака. Чем значительнее вариация признака, тем больше при прочих равных условиях должно быть групп;  число групп должно отражать реальную структуру изучаемой совокупности;  не допускается выделение пустых групп. Если проблема пустых групп все же возникает, при проведении структурных группировок используют неравные интервалы Примеры простой первичной группировки. Укажите группировочный признак и тип интервала. Табл.1 Возраст сотрудни- Число сотрудников, чел., f i ков, лет 18-21 112 21-24 100 24-27 50 27-30 10 30-33 Табл. 2 15 Табл. 3 Продолжительность безработицы, мес. Число безработных, чел., f i до 1 597 от 1 до 3 1482 от 3 до 6 1470 от 6 до 12 1802 от 12 до 24 1669 Группы рабочих по сменной выработке изделия, шт. Число рабочих, чел., f i До 50 5 50-70 17 70-90 16 90-110 18 110-130 20 130-150 14 Свыше 150 10 Совершенно верно! Группировочными признаками являются: возраст сотрудников (табл. 1), сменная выработка (табл. 2) и продолжительность безработицы (табл.3). В первом случае интервалы равные и закрытые. Во втором примере внешние интервалы открытые, а внутренние интервалы имеют одинаковую ширину. В третьем примере имеем неравные и открытый снизу интервалы. 17 Статистические группировки и классификации преследуют следующие цели: 1) выделение социально-экономических типов явлений; 2) изучение структуры совокупности и структурных сдвигов, происходящих в ней; 3) изучение взаимосвязи между явлениями и их признаками. Каждой из этих целей и решаемым задачам соответствует особый вид группировки: типологическая, структурная, аналитическая (факторная). Типологическая группировка решает задачу выявления и характеристики социальноэкономических типов (частных подсовокупностей). Структурная группировка - это группировка, выявляющая состав (строение, структуру) однородной в качественном отношении совокупности по какому-либо признаку. Примером могут служить группировки предприятий по проценту выполнения плана, по числу рабочих и т.д. Аналитическая группировка - это группировка, которая применяется для исследования взаимосвязи между явлениями. Используя аналитические группировки, определяют факторные и результативные признаки изучаемых явлений. Факторные - это признаки, оказывающие влияние на другие, связанные с ними признаки. Результативные признаки – это признаки, которые изменяются под влиянием внешних (факторных) признаков, или просто факторов. Простая группировка – группировка, в которой объединение единиц совокупности в группы производится по одному какому-либо признаку. Например, группировка предприятий по величине основных фондов. Сложная группировка проводится по двум и более признакам. Многомерная группировка производится по двум и более признакам. Частным случаем многомерной группировки является комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи, в комбинации. Группировка первичная – группировка, выполняемая непосредственно по первичным данным статистического наблюдения. Вторичные группировки – группировки, в которых проводится образование новых групп на основе ранее проведенной группировки. 3. Способы представления статистической сводки 18 3.1 Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по одному группировочному признаку. Ряды распределения, образованные по качественным признакам, называют атрибутивными. Ряды распределения, построенные по количественному признаку, называются вариационными рядами. Пример атрибутивного ряда распределения, образованного по качественному признаку Группы предприятий по техническому уровню оснащенности Число предприятий, f i Ниже среднего уровня 25 Среднего уровня 15 Выше среднего уровня 20 Итого: 60 (объем ряда) Вариационные ряды распределения состоят их двух элементов: вариант и частот. Варианта – это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Частотами называются численности отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или процентах к итогу, называются частностями. Сумма частот составляет объем ряда распределения или объём вариации. Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Примеры интервального и дискретного вариационных рядов Продолжительность безработицы, мес. (варианта) Число безработных, чел., f i (частота) до 1 597 от 1 до 3 1482 от 3 до 6 1470 от 6 до 12 1802 от 12 до 24 1669 Итого: (объем ряда) 7020 Месячная з/пл. (варианта) 1100 Число рабочих, чел., f i (частота) 2 1300 6 1600 16 1900 12 2200 14 Итого: (объем ряда) 50 19 3.2 Результаты сводки и группировки материалов наблюдения представляются также в виде статистических таблиц. Таблица статистическая – это форма рационального и наглядного представления статистических данных о явлениях и процессах общественной жизни. По виду построения таблица представляет собой совокупность строк и столбцов (колонок). По существу таблица представляет собой статистическое предложение, имеющее подлежащее и сказуемое. Макет таблицы Наименование подНаименование сказуемого лежащего Заголовки сказуемого (верхние заголовки) А 1 2 3 4 Подлежащее (боковые заголовки) Основные составляющие элементы статистической таблицы. Значение статистических таблиц состоит в том, что они позволяют охватить материалы статистической сводки в целом. Поэтому необходимо научиться правильно их составлять и анализировать. Подлежащее таблицы показывает, о каком явлении идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым таблицы называются показатели, с помощью которых изучается объект, т.е. подлежащее таблицы. В основном в сказуемом отражаются численные значения и характеристика изучаемого явления. 20 Виды таблиц в зависимости от разработки подлежащего Простая перечневая (от сл. «перечень-перечисление») таблица – это таблица, подлежащее которых содержит перечень единиц изучаемого объекта по различному признаку – видовому, территориальному, временному. В ней дается перечисление единиц совокупности. В групповой таблице дается не перечень единиц совокупности, а их группы. Познавательная сторона комбинационной таблицы заключается в том, что появляется возможность проследить влияние на признаки сказуемого не одного, а двух и более факторов, т.е. признаков, которые легли в основание комбинированной группировки или в подлежащее комбинационной таблицы. Каждая из групп, на которые разбивается подлежащее, в свою очередь разбивается на подгруппы. Виды таблиц по характеру сказуемого Простая разработка. Такая разработка, в которой мы используем лишь 1-2 отдельно взятых признака. Сложная разработка. Используется комбинация признаков. 21 Пример таблицы: по виду разработки подлежащего - простая перечневая; по характеру сказуемого – простая. Местоположение жилья Цена за 1 кв. м, млн. руб. Митино 5,2 Южное Бутово 4,9 Северное Бутово 5,8 Отрадное 6,5 Веерная улица 7,6 Жулебино 4,9  Замечание. Основные правила построения и оформления таблиц: 1. По возможности таблицу следует составлять небольшой по размеру, легко обозримой. Иногда целесообразно вместо одной большой таблицы построить несколько органически связанных между собой, последовательно расположенных таблиц. 2. Общий заголовок таблицы должен кратко выражать ее основное содержание. В нем обычно указывается время, территория, к которым относятся данные, единица измерения, если она выступает единой для всей совокупности. Следует также заголовки строк подлежащего и граф сказуемого формулировать точно, кратко и ясно. 3. Обычно строки подлежащего и графы сказуемого располагают в виде частных слагаемых с последующим подведением итогов по каждому из них. 4. Когда в таблице приводится наряду с отчетными данными сведения расчетного порядка, следует об этом сделать соответствующую оговорку. По возможности эти пояснения лучше сделать в самой таблице или заглавие к ней. Этапы анализа статистической таблицы 22  Замечание. Анализ статистической таблицы логичнее начинать с общего итога, который позволяет получить общую характеристику совокупности, затем переходит к изучению данных определенных строк и граф, т.е. к оценке частей изучаемого объекта, исследуя при этом вначале наиболее важные, а потом уже и все остальные элементы таблицы. 3.3 Графическое представление статистической информации Использование графиков для изложения статистических показателей позволяет придать им наглядность и выразительность, облегчить их восприятие, а во многих случаях помогает уяснить сущность изучаемого явления, его закономерности и особенности, увидеть тенденции его развития, взаимосвязь характеризующих его показателей. Статистические графики можно классифицировать по разным признакам: назначению (содержанию), способу построения и характеру графического образа. По содержанию или назначению можно выделить графики сравнения в пространстве, графики различных относительных величин (структуры, динамики и т.п.), графики вариационных рядов, графики размещения по территории, графики взаимосвязанных показателей. Возможны и комбинации этих графиков, например графическое изображение вариации в динамике или динамики взаимосвязанных показателей и т.п. По способу построения графики можно разделить на диаграммы, картодиаграммы и картограммы. По характеру графического образа различают графики точечные, линейные, плоскостные (столбиковые, почасовые, квадратные, круговые, секторные, фигурные) и объемные. Для изображения вариационных рядов применяются линейные и плоскостные диаграммы, построенные в прямоугольной системе координат. При дискретной вариации признака графиком вариационного ряда служит полигон распределения. Полигон распределения представляет собой замкнутый многоугольник, абсциссами вершин которого являются значения варьирующегося признака, а ординатами – соответствующие им частоты. В качестве иллюстрации рассмотрим возможности графического представления информации, представленной в таблице: 23 Продолжительность безработицы, мес. Число безработных, чел. 597 0-1 1-3 3-6 6-12 12-24 1482 1470 1802 1669 1) Гистограмма распределения 2000 0-1 1500 1-3 1000 3-6 6-12 500 12-24 0 Число безработных, чел. 2) Объемный вариант обычной гистограммы 2000 0-1 1500 1-3 1000 3-6 6-12 500 0 12-24 Число безработных, чел. 3) Круговая гистограмма Число безработных, чел. 0-1 1-3 3-6 6-12 12-24 4) Трубчатая гистограмма 24 Число безработных, чел. 1802 1669 14701482 12-24 6-12 3-6 1-3 597 0-1 0 500 1000 1500 2000 Число безработных, чел. 5) Полигон распределения Число безработных, чел. 2000 1750 1500 1250 1000 750 500 250 0 0 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19  Вопросы для самопроверки: Дайте определение статистической сводке. Что такое сводка и группировка и чем они отличаются друг от друга? Как вы понимаете статистическую группировку? Охарактеризуйте понятие группировочного признака. Дайте определение и покажите сущность качественного группировочного признака. Что учитывается при определении числа групп? Расскажите о равных и неравных интервалах и дайте их определение. Перечислите задачи и виды группировок. В чем сущность структурных группировок? Дайте определение аналитических группировок и расскажите, для каких целей они применяются. Как оформляются результаты сводки и группировки? Что такое вариационные ряды распределения? Дайте определение статистического подлежащего и статистического сказуемого таблицы. Назовите известные вам виды таблиц. Что такое комбинационные таблицы? Для каких целей они применяются? Дайте классификацию статистических графиков. 25  Литература 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 3, 7 С.26-33; С.58-71 2. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.1 пп.1.4, 1.5. Лекция 3. Тема: «Абсолютные, относительные и средние величины» Повседневная жизнь-это обязательная школа цифр: словарь дебета и кредита, натурального обмена, цен рынка, колеблющихся курсов денег захватывает и подчиняет любое мало-мальски развитое общество. Бродель Ф. План Введение. 1. Абсолютные и относительные статистические величины Понятие абсолютной и относительной величины в статистике Виды и взаимосвязи относительных величин 2. Средние величины 2.1. Понятие средней величины в статистике 2.2 Средняя арифметическая и ее свойства 2.3 Другие виды степенных средних величин 2.4 Мода и медиана 2.5 Квартили и децили Введение.  Второй особенностью статистики как науки является то, что она изучает, прежде всего, количественную сторону общественных явлений и процессов в конкретных условиях места и времени, т. е. предметом статистики выступают размеры и количественные соотношения социально-экономических явлений, закономерности их связи и развития. Количественную характеристику статистика выражает числами, которые называются статистическими показателями. Статистический показатель отражает результат измерения единиц совокупности и совокупности в целом. Статистический показатель – это понятие (категория), отображающее количественные характеристики (размеры) соотношения признаков общественных явлений. Статистический показатель имеет три обязательных атрибута: количественную определенность, место и время (момент или период времени). Совокупность показателей, всесторонне отражая сложное явление, составляет систему показателей. Задачами статистики в этом направлении являются: 1. Правильное определение содержания статистического показателя. 2. Разработка методологии подсчета и расчета статистического показателя. Иначе, необходимо ответить на вопросы: Что? Где? Когда? и Как? измерять. 1.1 Понятие абсолютной и относительной величины в статистике Результаты статистического наблюдения регистрируются, прежде всего, в форме первичных абсолютных величин. Абсолютная величина отражает уровень развития явления. В отличие от математического понятия абсолютной величины, абсолютные величины в статистике могут быть как положительными, так и отрицательными (убытки, убыль, потери и т.п.). В статистике все абсолютные величины являются именованными, т.е. всегда измеряются в конкретных единицах. Единицы измерения абсолютных показателей: 26  натуральные единицы измерения могут быть 1. простыми (тонны, штуки, метры, литры); 2. составными (сложными), являющимися комбинацией нескольких разноименных величин (грузооборот железнодорожного транспорта выражается в тонно-километрах, производство электроэнергии – в киловатт-часах);. 3. условно-натуральными единицами измерения, когда есть несколько видов продукции, обладающих общими потребительскими свойствами (например, различные виды топлива пересчитываются в условное топливо).  стоимостные единицы измерения используются, например, для выражения объема разнородной продукции в стоимостной (денежной) форме – рублях.  трудовые единицы измерения (человеко-дни, человеко-часы) учитывают общие затраты труда на предприятии, трудоемкость отдельных операций. С точки зрения конкретного исследования совокупность абсолютных величин можно рассматривать как состоящую из показателей индивидуальных, характеризующих размер признака у отдельных единиц совокупности, и суммарных, характеризующих итоговое значение признака по определенной части совокупности. Поскольку абсолютные показатели – это основа всех форм учета и приемов количественного анализа, то следует разграничивать моментные и интервальные абсолютные величины. Первые показывают фактическое наличие или уровень явления на определенный момент, дату (например, наличие запасов материалов или оборотных средств, величина незавершенного производства, численность проживающих и т.д.). Вторые – итоговый накопленный результат за период в целом (объем произведенной продукции за месяц или год, прирост населения за определенный период, величина валового сбора зерна за год и за пятилетку и т.п.). Замечание. Сама по себе абсолютная величина не дает полного представления об изучаемом явлении, не показывает его структуру, соотношение между отдельными частями, развитие во времени. В ней не выявлены соотношения с другими абсолютными показателями. Эти функции выполняют определяемые на основе абсолютных величин относительные показатели. Относительные величины в статистике – это обобщающие показатели, которые получают в результате сравнения различных экономических показателей между собой. Относительные величины в статистике представляют собой частное от деления двух статистических величин и характеризуют количественное соотношение между ними. Знаменатель относительной величины называют основанием или базой сравнения. Таким образом, по способу получения относительные показатели – всегда величины производные, определяемые в форме коэффициентов, процентов, промилле, продецимилле и т.п. Нужно всегда помнить, что этим безразмерным по форме показателям может быть, в сущности, приписана конкретная, и иногда довольно сложная, единица измерения. Так, например, относительные показатели естественного движения населения, такие как коэффициенты рождаемости или смертности, исчисляемые в промилле (‰), показывают число родившихся или умерших за год в расчете на 1 000 человек среднегодовой численности; относительная величина эффективности использования рабочего времени – это количество продукции в расчете на один отработанный человеко-час и т.д. Важно. Основное условие правильного расчета относительной величины – сопоставимость сравниваемых показателей и наличие реальных связей между изучаемыми явлениями. 1.2. Виды и взаимосвязи относительных величин Относительные величины образуют систему взаимосвязанных статистических показателей. Относительные (величины) показатели динамики (ОПД) используются для характеристики изменения изучаемого явления во времени: 27 ОПД  Текущий показатель . Предшествующий или базисный показатель ОПД показывает, во сколько раз текущий уровень превышает предшествующий (базисный), или какую долю от последнего составляет.  Замечание. Если показатель динамики рассчитан в виде коэффициента, то он называется коэффициентом роста К Р  . При умножении этого коэффициента на 100% получают темп роста Т Р  . Сопоставляя показатели динамики разных явлений, получают еще один вид относительных величин сравнения – коэффициенты опережения (отставания) по темпам роста или прироста. Например, если производительность труда на предприятии возросла на 12%, а фонд оплаты труда увеличился на 7,5 %, то коэффициент опережения производительности труда по темпам роста составит 112%  1,042 ; 107,5% а коэффициент опережения по темпам прироста будет равен 12  1,6 . 7,5 Все субъекты финансово–экономической сферы осуществляют перспективное планирование своей деятельности и сравнивают реально достигнутые результаты с ранее намеченными. Для этой цели используются относительные показатели плана (ОПП) и реализации плана (ОПРП): Показатель, Показатель, Показатель, ОПРП  Показатель, ОПП  планируемый достигнутый достигнутый планируемый на (i  1) период ; в i  м периоде в (i  1) периоде . на (i  1) период Между относительными показателями плана, реализации плана и динамики существует следующая взаимосвязь: ОПП  ОПРП  ОПД Относительный показатель структуры (ОПС) характеризует состав изучаемых совокупностей, т.е. показывает долю отдельных частей в общем объеме совокупности: ОПС  Показатель, характеризующий часть совокупнос ти . Показатель по всей совокупнос ти в целом ОПС выражается в долях единицы или в процентах. Рассчитанные величины соответственно называются долями или удельными весами. Относительные показатели координации (ОПК) характеризуют соотношение отдельных частей целого между собой (и применяются для сравнения различных частей совокупности между собой): ОПК  Показатель, характеризующий i  ю часть совокупнос ти Показатель, характеризующий часть совокупнос ти, выбранную в качестве базы сравнения . Замечание. В качестве базы сравнения выбирается та часть, которая имеет наибольший удельный вес или является приоритетной с экономической, социальной или какой либо другой точки зрения. 28 Например, в III квартале 2011 г. внешнеторговый оборот России составил (по дан- ным Банка России) 612,5 млрд. долл. Экспорт за этот период составил 380,4 млрд. долл., импорт - 232,1 млрд. долл. Представьте данные в виде простой статистической таблицы и рассчитайте относительные показатели структуры (удельные веса) и координации. Структура внешнеторгового оборота России в III квартале 2011 г. Внешнеторговый оборот Млрд. долл. США А 1 Экспорт 380,4 Импорт 232,1 В том числе 612,5 Решение 1. Удельные веса экспорта и импорта (или относительные показатели структуры) составляют: 232,1млрд.долл  100%  37,89% 612,5 млрд.долл 380,4 млрд.долл 1,64 2. Относительный показатель координации равен: ОПК  , что  232,5 млрд.долл 1 dЭ  380,4 млрд.долл  100%  62,11%, 612,5 млрд.долл dИ  означает: на каждый миллиард долларов экспорта приходилось 1,64 млрд. долл. экспорта (доля экспорта превышает долю импорта во внешнеторговом обороте РФ в 1,64 раза), или ОПК  232,1млрд.долл 0,61 , т.е. на каждый млрд. долл. импорта приходилось 610 тыс.  380,4 млрд.долл 1 долл. экспорта. Замечание. ОПК показывают, во сколько раз одна часть совокупности больше другой либо сколько единиц одной части приходится на 1, 10, 100, 1000, ... единиц другой части. Относительные величины координации могут рассчитываться и по абсолютным показателям, и по показателям относительным. Например, по данным предыдущей задачи получаем: По абсолютным показателям ОПК  380,4 млрд.долл 1,64  232,5 млрд.долл 1 и по относительным показателям (удельным весам): ОПК  62,11% 1,64  37,89% 1 Относительный показатель сравнения (ОПСр) представляет собой соотношение одноименных абсолютных показателей, характеризующих разные объекты (предприятия, фирмы, районы, области, страны и т.п.): ОПСр  Показатель, характеризующий объект Показатель, характеризующий объект А В ОПСр характеризует сравнительные размеры одноименных абсолютных величин, относящихся к одному и тому же периоду либо моменту времени, но к различным объектам или территориям. Посредством этих показателей сопоставляются мощности различных видов оборудования, производительность труда отдельных рабочих, производство продукции данного вида разными предприятиями, районами, странами. Например, сравним урожайность пшеницы в России (2,15 т/га) и Германии (7,74 т/га) по итогам сельскохозяйственного сезона 2009-2010 гг.: ОПСр  7,74  3,6 , т.е. уро2,15 жайность пшеницы в Германии была в 3,6 раза выше, чем урожайность пшеницы в России. 29 Относительные показатели интенсивности (ОПИ) показывают, насколько широко распространено изучаемое явление в той или иной среде: ОПИ  Показатель, характеризующий явление А . Показатель, характеризующий среду распространения явления А ОПИ представляют собой отношение абсолютного уровня одного показателя, свойственного изучаемой среде, к другому абсолютному показателю, также присущему данной среде и, как правило, являющемуся для первого показателя факторным признаком. Так, при изучении демографических процессов рассчитываются показатели рождаемости, смертности, естественного прироста и т.д. как отношение числа родившихся (умерших) или величины прироста населения за год к среднегодовой численности населения данной территории в расчете на 1000 чел. Если получаемые значения очень малы, то делают расчет на 10 000 человек. Относительными величинами интенсивности выступают, например, показатели выработки продукции в единицу рабочего времени, затрат на единицу продукции, трудоемкости, эффективности использования производственных фондов и т.д., поскольку их получают сопоставлением разноименных величин, относящихся к одному и тому же явлению и одинаковому периоду или моменту времени. Метод расчета относительных величин интенсивности применяется при определении средних уровней (среднего уровня выработки, средних затрат труда, средней себестоимости изделий, средней цены и т.д.). Поэтому распространено мнение, что относительные величины интенсивности – это один из способов выражения средних величин. Например. В 2010 году население России составило 142,9млн. человек, при этом в России работало 600,18 тыс. врачей. Вычислить показатель, характеризующий обеспеченность населения России врачами. Этот показатель вычисляется как ОПИ и рассчитывается исходя из численности врачей, приходящейся на 10000 человек: ОПИ  600,18 тыс. врачей  10000  42,0 врача на 10000 человек . 142900 тыс. человек Направления сопоставления  Вопросы для самопроверки 30 1. 2. 3. 4. 5. Что такое абсолютная величина? Каковы её роль и значение? В каких единицах измеряются абсолютные величины? Дайте понятие относительной величины. На какие виды подразделяются относительные величины? Дайте определения относительным величинам динамики, планирования, выполнения плана, структуры, координации, интенсивности и сравнения. 2.1 Понятие средней величины в статистике Если мой сосед бьет свою жену ежедневно, а я не бью ее никогда, то в свете статистики мы оба бьем ее через день. Джордж Бернард Шоу (о статистике) Если ты имеешь кастрюлю с кипятком, а твой сосед курицу, то в среднем у вас куриный суп. Автор неизвестен Средние величины – это обобщающие показатели, в которых проявляются общие, закономерные черты, свойственные для всей совокупности изучаемого явления. В средних величинах погашаются индивидуальные различия в величине признака, которые возникают по тем или иным причинам у отдельных единиц изучаемой совокупности, и, наоборот, определяется уровень варьирующего признака, типичный для большинства единиц данной совокупности. Основным условием правильного использования средних величин является качественная однородность совокупности, по которой рассчитывается средняя величина. Средняя величина (в статистике) – обобщающий показатель, характеризующий типичный размер или уровень общественных явлений в расчете на единицу совокупности при прочих равных условиях. С помощью метода средних решаются задачи: 1. Характеристики уровня развития явлений. 2. Сравнения двух или нескольких уровней. 3. Изучения взаимосвязей социально - экономических явлений. 4. Анализа размещения социально-экономических явлений в пространстве. Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак. Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон. Существуют различные средние. 2.2. Средняя арифметическая и ее свойства Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений: x  x  x ... xn  xi x 1 2 3  n n Простая средняя арифметическая применяется в случаях, когда имеются отдельные значения признака, т.е. данные не сгруппированы. Если данные представлены в виде рядов распределения или группировок, то средняя арифметическая исчисляется иначе: x x1 f1  x2 f 2  x3 f 3  ...  xn f n n1  n2  n3  ...  nn  xi f i x  fi 31 Полученная формула называется средней арифметической взвешенной. Из нее видно, что средняя зависит не только от значений признака, но и от их частот (повторяемости или весов), т.е. от состава совокупности, от ее структуры. Если статистический материал в результате обработки в виде интервальных вариационных рядов с закрытыми или открытыми интервалами, то средняя арифметическая определяется по формуле средней взвешенной: x  x f f i i . i Но в данном случае за x i принимается середина i  го интервала (или групповая средняя), f i – число значений показателя, принадлежащих данному интервалу, f i  n– объём выборки (число наблюдений). Основные свойства средней арифметической. 1. Если все частоты разделить или умножить на какое-либо число, то величина средней не изменится. 2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней: Kx  Kx 3. Средняя суммы (разности) двух или нескольких величин равна сумме (разности) их средних: x  y  x  y 4. Если х = с, где с - постоянная величина, то x  c  c . 5. Сумма отклонений значений признака от средней арифметической равна нулю («нух  х   0 левое свойство» средней):  2.3 Другие виды (степенных) средних величин Средняя гармоническая величина – это величина обратная средней арифметической из обратных значений признака. Формула для расчета средней гармонической простой будет иметь вид: x n  1 1 1 1    ...  x1 x2 x3 xn n 1 x i Формула для расчета средней гармонической взвешенной: x f1  f 2  ...  f n  1 1 1 f1  f 2  ...  fn x1 x2 xn f 1  x i fi i Средняя гармоническая может использоваться для расчета средней производительности труда, средней скорости движения тела. Средняя хронологическая применяется для оценки среднего уровня ряда динамики. При наличии информации на моменты времени с равными интервалами между ними используется средняя хронологическая простая: 1 1 х1  х2  х3  ...  хn 2 х 2 , n 1 где n – число моментов (дат) Средняя геометрическая применяется, как правило, для оценки среднего показателя относительных величин (например, средний темп роста). Средняя геометрическая простая определяется по формуле: xn x x 1 2  ...  xn Средняя квадратическая используется при расчете показателей вариации:  простая: х  х 2 i n 32 x n n 2  взвешенная: x  i i i Замечание. При расчете различных степенных средних по одним и тем же данным статистического наблюдения средние не будут одинаковы (свойство мажорантности средних ): хгарм  xгеом  xар  xкв 2.4 Структурные средние. Для характеристики структуры совокупности применяются особые показатели, которые можно назвать структурными средними. К таким показателям относятся мода и медиана. Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой. Например, если совокупность состоит из значений: 2,4,5,4,5,3,2,4,5,5,5,4,4,3,3,2,3,4, то мода равна 4, поскольку значение варианты, равное 4, повторяется чаще других: 6 раз. Для дискретных рядов распределения модой будет значение варианты с наибольшей частотой. Для интервальных рядов распределения с равными интервалами мода определяется по формуле: M o  x M o  iM o * f f M o  f M o1 Mo  f M o1    f M o  f M o1  . где x Mo - начальное значение интервала, содержащего моду; i Mo - величина модального интервала; f Mo - частота модального интервала; f Mo1 - частота интервала, предшествующего модальному; f Mo1 - частота интервала, следующего за модальным. При этом модальным интервалом называется интервал с наибольшей частотой. Медиана - это варианта, расположенная в середине упорядоченного вариационного ряда. Если ряд распределения дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда (упорядоченный ряд - это расположение единиц совокупности в возрастающем или убывающем порядке). Если же сумма накопленных частот против одной из вариант равна точно половине сумме частот, то медиана определяется как средняя арифметическая этой варианты и последующей. Медиана интервального вариационного ряда распределения определяется по формуле Me  x Me  i Me 0,5 f  S Me1 f Me где x Me — начальное значение интервала, содержащего медиану; i Me — величина медианного интервала; f — сумма частот ряда; S Me1 — сумма (кумулята) накопленных частот, предшествующих медианному интервалу; f Me — частота медианного интервала. Квартили и децили В системе структурных показателей в качестве показателей последовательного распределения частот используют квантили или градиенты. Некоторые квантили имеет особые наименования: квартили, квинтили, децили и перцентили. 33 Различают порядковые статистики, отсекающие четверти совокупности, которые называются квартили; в первую или нижнюю (отсекающие четверть совокупности снизу), третью или верхнюю (отсекающие четверть сверху). Вторая квартиль является медианой. Далее можно говорить об отсекающих десятые части — децилях и т.д. Определение этих порядковых статистик в вариационном ряду, так же как и определение медианы, начинается с расчета порядкового номера соответствующего варианта, а затем по накопленным частотам определяется интервал, в котором находится соответствующий вариант. Определение величины накопленного варианта внутри интервала тоже абсолютно аналогично нахождению медианы. В интервальном вариационном ряду квартили внутри определенного по накопленным частотам интервала рассчитываются по следующим формулам: 3  f  S x3 нижняя квартиль вычисляется по формуле: Q3  x0  i 4 , f Q3 1  f  S x1 верхняя квартиль Q1  x0  i 4 , f Q1 где x 0 – нижняя граница квартальных интервалов; i — величина интервала; f i — сумма частот;  S x1 — накопленная частота интервала, предшествующего нижнему квартилю; S х3 — накопленная частота интервала, предшествующего верхнему квартилю; f Q1 - частота квартального интервала. Формулы для децилей в интервальном вариационном ряду записываются следую- 1 2 f  S d11   f  Sd11 щим образом: d1  x01  i 10 – первая дециль, d 2  x02  i 10 – f d1 f d1 вторая дециль и т.д.  Вопросы для самопроверки 1. Что такое средние величины? Каковы роль и значение средних показателей? 2. Какие существуют средние величины и как рассчитываются средняя арифметическая простая и взвешенная? 3. Как осуществляется расчет средней арифметической по данным интервального ряда? 4. Перечислите свойства средней арифметической. 5. Для исчисления средних каких показателей используются средняя хронологическая, средняя гармоническая, средняя геометрическая, средняя квадратическая? 6. Как вы понимаете термин «структурные средние»? Приведите примеры структурных средних? 7. В чем сущность моды и как она рассчитывается для вариационного и интервального ряда? 8. Что такое медиана, какими свойствами она обладает и как рассчитывается медиана для интервального ряда? 9. Для каких целей применяются и как рассчитываются квартили и децили?  Литература 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 4, 5 С.34-45 34 2. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.2 пп.2.1. – 2.3. Лекция 4 «Методы изучения корреляционной связи» Математические модели строятся и используются для трех целей: объяснения; предсказания; управления. Плпн 1. Функциональная зависимость и корреляция. Предпосылки корреляционно - регрессионного анализа 2. МНК и построение уравнения линейной регрессии. 3. Оценка качества построенной модели 4. Решение типовой задачи 1. Функциональная зависимость и корреляция Корреляционной связью называется важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой переменной. В статистике принято различать следующие варианты зависимостей: 1. парная корреляция – связь между двумя признаками (результативным и факторным или двумя факторными) 2. частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков. 3. множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование По направлению различают прямую связь, при которой с увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) значений результативного, и обратную связь, при которой значения факторного признака изменяются под воздействием факторного в противоположном направлении. Корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты, направления связи и установление аналитической формы связи. Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение результативного признака обусловлено влиянием одного или нескольких факторов, а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Корреляция и регрессия тесно связаны между собой: первая оценивает силу статистической связи, вторая исследует ее форму. Предпосылки корреляционно-регрессионного анализа. 1. Наличие данных по достаточно большой совокупности явлений. Это общее условие всякого статистического исследования. Обычно считается, что число наблюдений должно быть в 5-6 (а лучше – не менее чем в 10 раз) больше числа факторов. Большое число наблюдений позволяет закону больших чисел, действуя в полную силу, обеспечить эффективное взаимопогашение случайных отклонений от закономерного характера связи признаков. 35 2. Качественная однородность тех единиц, которые подвергаются изучению методами корреляционно-регрессионного анализа. 3. При выполнении вышеуказанных требований далее необходимо провести количественную оценку однородности исследуемой совокупности по комплексу признаков. Одним из возможных вариантов такой оценки является расчет относительных показателей вариации (традиционно широкое применение для этих целей получил коэффициент вариации). 4. При ограничении числа факторов, вводимых в модель, наряду с качественным анализом целесообразно использовать и количественные оценки, позволяющие конкретно охарактеризовать влияние факторов на результативный показатель. Включаемые в исследование факторы должны быть независимы друг от друга, так как наличие тесной связи между ними свидетельствует о том, что они характеризуют одни и те же стороны изучаемого явления и дублируют друг друга. 5. Целесообразным является изучение формы распределения исследуемых признаков, т.к. все основные положения теории корреляции разрабатывались применительно к предположению о нормальном характере распределения исследуемых признаков. Это условие связано с применением метода наименьших квадратов (МНК) при расчете параметров корреляции: только при нормальном распределении МНК дает оценку параметров, отвечающую принципам максимального правдоподобия. На практике эта предпосылка выполняется приближенно. Однако при значительном отклонении распределения признаков от нормального закона возникают проблемы с оценкой надежности рассчитанных по выборочным данным коэффициентов корреляции. В соответствии с сущностью корреляционной связи ее изучение имеет две цели: 1. измерение тесноты связи двух или более признаков между собой 2. измерение параметров уравнения, выражающего зависимость средних величин результативного признака от значений одного или нескольких факторных признаков; 2. Измерение степени тесноты корреляционной связи в случае парной зависимости Показатели тесноты связи используются для решения следующих задач: 1. Вопрос о необходимости изучения данной связи и целесообразности ее практического применения. 2. Вопрос о степени различий тесноты связи для конкретных условий. 3. Для выявления решающих факторов, воздействующих главным образом на формирование величины результативного признака. Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции Пирсона: xy  x  y r  x  y Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к к нормальному. Он принимает значения в интервале –1 ≤ r ≤ 1. Отрицательные значения указывают на обратную связь, положительные – прямую. При r=0 линейная связь отсутствует. Чем ближе r по абсолютной величине к 1, тем теснее связь между признаками. При r=  1 связь функциональная. Квадрат коэффициента корреляции r2 представляет собой коэффициент детерминации, который показывает долю вариации результативного признака, объясненную влиянием вариации факторного признака. 36 Для оценки существенности (значимости) линейного коэффициента корреr n2 ляции используется тот факт, что величина t расч  при условии отсутствия 1 r2 связи в генеральной совокупности распределена по закону Стьюдента с (n-2) степенями свободы (где n – объем выборки). Полученную tрасч сравнивают табличным значением. Коэффициент корреляции признается значимым при уровне значимости  , если tрасч>tтабл. В этом случае практически невероятно, что найденное значение коэффициента корреляции обусловлено только случайными совпадениями. Уровень значимости  показывает вероятность принятия ошибочного решения, например, при  =0,05 в среднем пяти случаях из ста есть риск сделать ошибочное заключение о значимости коэффициента корреляции (в социально-экономических исследованиях обычно  =0,1,  =0,05 или  =0,01). 3. Вычисление параметров уравнения регрессии Задачи регрессионного анализа: 1. установление формы зависимости 2. определение функции регрессии 3. использование уравнения для оценки неизвестных значений зависимой переменной Важнейшим этапом построения регрессионной модели является установление математической функции, которая лучше других выражает реальные связи между анализируемыми признаками. Выбор типа функции может опираться на теоретические знания об изучаемом явлении, опыт предыдущих аналогичных исследований, или осуществляться эмпирически – перебором и оценкой функций разных типов и т.п. Уравнение однофакторной парной линейной корреляционной связи имеет вид: у =a0+a1x, где у – теоретические значения результативного признака, полученные по уравнению регрессии; a0, a1 – параметры уравнения регрессии Параметры уравнения a0, a1 находят посредством МНК, при котором в качестве решения принимается точка минимума суммы квадратов отклонений эмпирических данных yi от теоретических у i, рассчитанных по модели, т.е. Σ(yi - у i)2  min Для нахождения минимума данной функции, ее частные производные приравнивают нулю и получают систему нормальных уравнений: na0 + a1 Σx= Σy a0 Σx+ a1 Σx2= Σxy Решая систему в виде, получают значения параметров уравнения. Параметр a1 называется коэффициентом регрессии. Его можно найти также по формуле: a1  rxy y x Коэффициент регрессии a1 показывает, насколько в среднем изменяется величина результативного признака (в его единицах измерения) при изменении факторного признака на единицу. Параметр a0 показывает усредненное влияние прочих факторов на результативный признак. Параметр a0 связан с коэффициентом регрессии a1 соотношением 37 a0  y  a1 x Коэффициент регрессии a1 применяется также для расчета коэффициента эластичности, который показывает, на сколько процентов изменится величина результативного признака при изменении факторного признака на 1%: x Э х  a1 y Исследование объективно существующих связей между явлениями – важнейшая задача всякого научного исследования. В частности различают функциональные связи и нефункциональные. Функциональная зависимость между двумя переменными величинами характеризуется тем, что каждому значению одной из них соответствует вполне определенное (причем единственное!) значение другой. Например, между радиусом круга r и его площадью S существует функциональная зависимость, которая выражается формулой S  r 2 . На практике часто встречаются такие виды связей между величинами, которые нельзя отнести к функциональным зависимостям. На существование таких связей и зависимостей указывал уже Гиппократ в 6 веке до нашей эры. Именно он обратил внимание на наличие связи между телосложением и темпераментом людей, между строением тела и предрасположенностью к тем или иным заболеваниям. Таким образом, помимо функциональных связей существуют и т.н. статистические или стохастические (случайные) зависимости. При статистической (вероятностной) зависимости изменение одной переменной приводит к изменению распределения другой. Например, статистической является связь между урожайностью и количеством внесенных удобрений, между ростом и весом человека и др. Статистическую зависимость называют корреляционной, если каждому значению одной переменной соответствует определенное условное математическое ожидание другой. Замечание. Термин «корреляция» (от лат. correlatio – соотношение, связь) впервые применил Ж. Кювье в труде «Лекции по сравнительной анатомии» (1806). Математическое обоснование метода измерения корреляции было дано в 1846 г. французским ученым О. Браве, который занимался кристаллографией. Корреляционная связь (от лат. correlatio – соотношение, связь) не является точной зависимостью одного признака от другого: она может иметь различную степень: от полной независимости до очень сильной связи. Степень корреляции определяется различными показателями, введенными для установления силы связи между количественными признаками. Такими показателями являются коэффициент корреляции, корреляционное отношение, тетрахорический и полихорический показатели связи, частный и множественный коэффициенты корреляции; характер связи между разными признаками может быть различен по форме и направлению. По форме корреляция может быть линейной и нелинейной, по направлению – прямой (или положительной) и обратной (или отрицательной). Формула статистической связи между переменными называется уравнением регрессии. Если эта формула линейна, то регрессия называется линейной. Если уравнение регрессии связывает только две переменные, то регрессия называется парной, если переменных больше, чем две, то регрессия множественная. Замечание. Термин «регрессия» (от лат. regressio- движение назад) ввел в биологию Ф. Гальтон, изучавший наследование количественных признаков. Он обнаружил, что потомство высокорослых и низкорослых родителей возвращается, регрессирует, на 1/3 в сторону среднего уровня этого признака в данной популяции. С развитием биометрии этот термин утратил свое буквальное значение и стал применяться для обозначения корреляционной зависимости между переменными величинами. Для отражения того факта, что реальные значения зависимой переменной не всегда совпадают с ее условным математическим ожиданием и могут быть различными при одном 38 и том же значении объясняющей переменной, фактическая зависимость должна быть дополнена некоторым слагаемым  , которое должно отражать влияние случайных, неучтенных факторов. При этом регрессионная модель (регрессионное уравнение) имеет вид Y  M x Y    , где  – случайная величина, называемая возмущением или случайной ошибкой.  Замечание. В эконометрике принято классифицировать переменные на эндогенные и экзогенные . Эндогенная переменная (называемая также зависимой, объясняемой, результирующей) характеризует результат функционирования анализируемой экономической системы. Её значения формируются внутри процесса функционирования этой системы под воздействием ряда факторов, только часть которых поддается регистрации. В регрессионном анализе эндогенная переменная выступает в роли функции, значения которой всегда стохастичны (случайны) по своей природе. Экзогенная переменная (объясняющая, независимая, регрессор, фактор) описывает функционирование изучаемой экономической системы и задается как бы «извне». В регрессионном анализе она играет роль аргумента той функции, в качестве которой рассматривается эндогенная (зависимая) переменная. По своей природе регрессоры могут быть как случайными, так и неслучайными.  Замечание. Классификация переменных на экзогенные и эндогенные зависит от теоретической концепции принятой модели. Экономические переменные – как эндо -, так и экзогенные. Внеэкономические переменные обычно выступают как экзогенные, например, климатические условия. Целесообразно в качестве экзогенных переменных выбирать такие переменные, которые могут быть объектом регулирования. Например, в модели производительности труда экономический показатель - производительность труда является эндогенной (объясняемой) переменой, а в качестве экзогенных (объясняющих) переменных можно выбрать:  фондовооруженность труда;  энерговооруженность труда;  квалификацию рабочих. Построение уравнения регрессии начинается с вопроса о спецификации модели. Проблема спецификации включает в себя два круга вопросов: – отбор факторов; – выбор уравнения регрессии.  Замечание: 1. Анализ уравнения регрессионной модели Y  M x Y    показывает, что любая эконо- мическая модель, точнее объясняемая переменная Y, включает в себя две части:  объясненную (зависимую от рассматриваемых в модели факторов X) и  случайную  (не зависящую от рассматриваемых в модели факторов). 2. Включать в модель случайный фактор надо обязательно, поскольку он компенсирует многие просчеты моделирования:  неправильный выбор функциональной формы модели,  ошибки измерений,  ограниченность статистических данных,  включение в модель переменной, которая не оказывает существенного воздействия на результативный признак;  невключение в модель всех объясняющих переменных (учесть ВСЕ невозможно!), например, спрос на конкретный товар может определяться не только ценой, но и доходом на душу населения. С математической точки зрения регрессионные модели оказываются существенно более простыми объектами, чем экономические модели общего вида. Связи между экономическими величинами необязательно выражаются линейными функциями – они могут быть и нелинейными. Так обратная зависимость спроса от цены не обязательно характеризуется линейной функцией y  a  b  x . 39 Возможны и другие соотношения: y  a  x b , ya b , x y 1 . a  b x В демографических расчетах и страховом деле применяется функция вида y  A  bc , которая называется уравнением Гомперца (1799-1865). x Для описания развития производства новых товаров и роста численности населения используется логистическая функция (функция Ферхюльста) y  K . 1  bc  ax Различают три класса нелинейных регрессий: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам, и их комбинации. Примерами нелинейной регрессии по включенным в нее объясняющим переменным являются следующие функции:  полиномы разных степеней: y  b0  b1 x  b2 x 2 ,   y  b0  b1 x  b2 x 2  b3 x 3 и др. b равносторонняя гипербола: y  b0  1 . В 1857 году немецкий статистик Э. Эйнx гель (Энгель) на основе исследования семейных расходов сформулировал закономерность: с ростом доходов доля доходов, расходуемых на продовольствие, уменьшается (а на непродовольственные товары будет возрастать). Для описания кривой Энгеля в 1943 г. Уоркинг и в 1964 году Лизер для этих целей применили полулогарифмическую кривую: y  b0  b1  ln x уравнения с квадратными корнями, например, y  b0  b1 x , использовались в исследованиях урожайности, трудоемкости с/х производства К нелинейным регрессиям по оцениваемым параметрам относятся функции:  степенная y  b0  x b1 применяется при моделировании кривых спроса;   показательная y  b0  b1x (т.н. кривая Филлипса (англ. экономист, конец 50-х годов 20 века) характеризует соотношение между нормой безработицы x и процентом прироста заработной платы y );  экспоненциальная y  e a bx и др. Уравнение Гомперца y  A  bc является примером нелинейности, как по включенным объясняющим переменным, так и по параметрам На практике могут встречаться комбинации основных функций. Например, величина Y, зависящая от 3 факторов X1, X2, X3, может моделироваться формулой x y  a0  a1 ln x1  a2  a3 x3a4 , где a0 , a1 , a2 , a3 , a4 – параметры уравнения, подлежащие x2 определению из экспериментальных данных. Перейдем к решению конкретной экономической задачи – восстановлению зависимости между наблюдаемыми переменными, например, Y и X . Замечание. Пер во е пр им ен е ни е пар но й р егр е сс и и м о ж но о т нес т и к ко н ц у 1 9 – н ача л у 2 0 ве ка . Дж. Э. Юл (1895, 1896 гг.) изучал связи между ур о в нем б ед но ст и и фо р м ам и по м о щ и бе д ным . Г. Хуке (1901 г.) изучал связи между ур о в нем бр а чно ст и в В е л и ко бр и та н и и и б ла го со сто я н ием , в котором использовалось несколько индикаторов благосостояния. 2. Метод наименьших квадратов и построение уравнения линейной регрессии В различных исследованиях приходится использовать формулы, составленные на основании наблюдений или эксперимента. Одним из лучших способов получения таких формул является метод наименьших квадратов (МНК). 40 Замечание. Первая работа, в которой использовался МНК, принадлежит французскому математику Лежандру. В 1805 году в статье «Новые методы определения кометных орбит» он писал, что для определения коэффициентов в уравнениях орбит был использован простой метод, который состоит в отыскании минимума суммы квадратов ошибок. Гаусс в 1821 году показал, что оценки, получаемые МНК, обладают наименьшими погрешностями. Приближение функций МНК было изучено П.Л. Чебышевым. Наиболее строгое и изящное обоснование метода дано А.А. Марковым. Пусть в результате наблюдений получена таблица значений переменной y для ряда значений (независимой) переменной x : x x1 y1 y x2 y2 x3 … xn y3 … yn Предположим, что точки M 1 ( x1 ; y 2 ), M 2 ( x2 ; y 2 ),..., M n ( xn ; y n ) примерно располагаются на одной прямой. Это означает, что зависимость между x и y близка к линейной Y  ax  b . Подберем неизвестные коэффициенты a и b так, чтобы прямая Y  ax  b лежала по возможности ближе к каждой из нанесенных точек. Назовем отклонением в точке xi разность Yi  yi , где Yi  axi  b , а yi – значение функции в точке xi , полученное из опыта. Сущность МНК заключается в том, что искомую прямую Y  bx  a выбирают таким образом, чтобы сумма квадратов отклонений Yi  yi была наименьшей. Таким образом, неn известные параметры a и b находят из условия, что сумма  (Y i 1 n  (bx i 1 i i  y i ) 2 , т.е.  a  yi ) 2 , имела бы наименьшее значение. Поскольку xi и yi – постоянные числа (данные опыта), то указанная сумма есть функция параметров a и b : n  (bx i  a  yi ) 2   ( a, b). i 1 Чтобы найти эти значения параметров a и b , воспользуемся необходимым условием экстремума функции нескольких переменных: найдем частные производные функции  ( a; b) по a и b , и приравняем их к нулю:   a  2 (bxi  a  yi ) xi  0      2 (bx  a  y )  0  i i  b Следовательно, параметры a и b , для которых осуществляется наилучшее приближение (в указанном смысле), определяется из системы уравнений, которую можно переписать в следующем виде: n n 1 1  n 2  1 b   xi2  a   xi   xi yi b x  a x  xi yi   i   i  n i n i  1  n i 1 1    n  n 1 1 b x  an   b   xi  a   yi 1 yi i    n i n i 1 b  x 2  a  x  xy .   b  x  a  y 41 Можно доказать, что эта система всегда имеет единственное решение найденных чисел a и b функция  ( a; b) достигает максимума. и что для a  y b x   b  xy  x  y  cov( x, y )  var( x ) x2  x 2 Коэффициент b называется выборочным коэффициентом регрессии Y по X . Коэффициент регрессии Y по X показывает, на сколько единиц в среднем изменяется переменная Y при увеличении переменной X на одну единицу. cov( X , Y )  выборочный корреляционный момент или выборочна ковариация Подставляя найденные значения a и b в уравнение Y  ax  b , получим линейную функцию, наилучшим образом отражающую (аппроксимирующую) зависимость между величинами x и y , полученную из опыта. Полученное уравнение называется уравнением регрессии Y на X Уравнения регрессии позволяют прогнозировать возможные значения зависимых переменных, иначе, позволяют предсказывать поведение одного из параметров при целенаправленном изменении другого. Регрессионные модели применимы для определения оптимальной области приложения усилий, например, границы, за рамки которой дальнейшее вложение капитала уже не приносит пропорционального увеличения прибыли. Перейдем к оценке тесноты корреляционной зависимости. Коэффициент корреляции Коэффициент корреляции измеряет степень и определяет направление только прямо- rxy линейных связей. Коэффициент парной корреляции r   1;1 есть безразмерная величина, значе- ния которой принадлежат отрезку: xy . При отрицательной корреляционной связи увеличение одной из переменных ведет к уменьшению другой. Соответствие между значениями rxy и характером связи может быть представлено следующей таблицей (таблица Чеддока): Значение коэффициента пар- Связь ной корреляции, rxy Функциональная Очень сильная Сильная (тесная) Значительная (заметная) Умеренная Слабая Отсутствует 1 >0,9 0,7 – 0,9 0,5 – 0,7 0,3 – 0,5 <0,3 0 Выборочный коэффициент парной корреляции rxy  rxy вычисляется по формуле: XY  X  Y  x y , При решении задач, когда заполнена таблица экспериментальных данных, и найдены n n n n n i 1 i 1 i 1 i 1 i 1 значения  xi ,  yi ,  xi2 ,  yi2 ,  xi yi , удобно пользоваться следующей формулой для коэффициента корреляции 42 n rxy  n n n  xi y i   x i  y i i 1 n  n  n  xi2    xi  i 1  i 1  i 1 i 1 2 n  n  n  yi2    yi  i 1  i 1  2 . Свойства коэффициента корреляции: 1. Коэффициент корреляции принимает значения на отрезке [-1;1], т.е.  1  rxy  1 . Чем ближе rxy к единице, тем теснее связь между Y и X (тем ближе связь к линейной). Геометрически это означает, что чем больше по модулю коэффициент корреляции, тем ближе экспериментальные точки прилежат к линии регрессии. Проанализируем виды корреляционных полей, представленных на графиках. Очевидно, что в первом случае связь между переменными сильная, а во втором случае – слабая. 2. Если коэффициент корреляции положителен rxy  0 , то связь между переменными является прямой, а если rxy  0 , то связь обратная (в том смысле, что с увеличением фактора – переменной x – результативный признак – переменная y – будет уменьшаться). Графически это будет выглядеть следующим образом: 3. Если rxy  1 , то между величинами Y и X наблюдается функциональная зависимость, и все экспериментальные точки лежат на линии регрессии. 43 4. Если rxy  0 , то линейная корреляционная связь между переменными отсутствует, то rxy  0 .  Замечание. Следует помнить, что равенство коэффициента нулю говорит лишь об отсутствии линейной связи между переменными, но при этом между ними может существовать какая либо другая связь. 3. Оценка качества построенной модели Цель регрессионного анализа состоит в объяснении поведения зависимой переменной Y. Оценку качества построенной модели (в первом приближении) дает коэффициент (индекс) детерминации и средняя ошибка аппроксимации. Коэффициент (индекс) детерминации Оценку качества модели дает коэффициент детерминации R2, являющийся характеристикой прогностической силы модели:  y n R2   i 1 n y i 1  y n где  i 1 xi y xi  y  2  y 2 i 2  ESS , TSS  ESS – сумма квадратов отклонений расчетных значений от среднего (чаще всего называется объясненной регрессией или факторной), n  y i 1  y   TSS – сумма квадратов отклонений наблюдаемых значений от среднего (об2 i щая сумма квадратов отклонений). Коэффициент детерминации показывает, какая доля изменения (дисперсии) зависимой переменной обусловлена изменением объясняющей переменной. Например, R2=0,75 – это 44 значит, что на 75% изменение зависимой величины Y обусловлено изменением фактора X и на 25% – действием других неучтенных факторов. 2 Коэффициент детерминации равен квадрату коэффициента корреляции R 2  rxy , по2 2 этому значения R лежат в промежутке [0;1]. Чем ближе значение R , тем лучше модель описывает экспериментальные данные, тем ближе точки прилежат к линии регрессии.  Замечание. Коэффициент детерминации имеет смысл только при наличии свободного члена в уравнении регрессии. Средняя ошибка аппроксимации Помимо коэффициента детерминации о качестве модели говорит средняя ошибка аппроксимации [< лат. approxi mare приближаться]– среднее отклонение расчетных значений от фактических:  1 n yi  y xi A   100% , n i 1 yi  где y i – наблюдаемое в i-том опыте значение величины Y, y x – значение, рассчитанное по i уравнению регрессии для данного xi , n – число опытов. Допустимый предел значений A , при котором качество модели считается приемлемым, – не более 8-10%.  Решение типовой задачи Задача Имеются следующие данные о прибыли автотранспортного предприятия (в сопоставимых ценах) и о доле товара A в его грузообороте: Прибыль, Доля товара A в Год 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 тыс. руб. 1200 1820 950 760 129 650 1450 2100 2670 1950 1810 1760 грузообороте, % 34 38 30,5 28,6 20,7 22,3 35,6 40,5 45,7 38,8 36,7 32,6 1) построить корреляционное поле данных и сделать предположение о направлении и тесноте связи между прибылью Y ( тыс. руб.) автотранспортного предприятия и долей X (%) товара A в грузообороте данного предприятия; 2) построить линейное уравнение парной регрессии y на x; 3) рассчитать линейный коэффициент парной корреляции и оценить тесноту связи; 4) рассчитать индекс детерминации. Какой смысл имеет индекс детерминации? 5) оценить полученную модель через среднюю ошибку аппроксимации; 6) оценить статистическую значимость параметров уравнения регрессии и коэффициента корреляции; 7) сделать точечный прогноз: вычислить прогнозное значение y p при прогнозном значении x p , составляющем 108% от среднего уровня; 8) оценить точность прогноза, рассчитав ошибку прогноза  p и его доверительный интервал; Выводы оформить в аналитической записке. Решение задачи средствами Excel даёт следующие результаты: 45 линейное уравнение парной регрессии ~ y  94,67 x  1749,76 линейный коэффициент парной корреляции и оценить тесноту связи величина прибыли Y почти на 92% зависит от X (доли товара A в грузообороте данного предприятия), а 8% вариации Y происходит под влиянием других, неучтенных в модели качество построенной модели оценивается несколько ниже, чем удовлетворительное. R 2  0,919 средняя ошибка аппроксимации A оценка статистической значимости уравнения регрессии в целом 1  2,2296  100  18,58% 12 делаем вывод о статистической значимости индекса детерминации и, следовательно, уравнения регрессии в целом. Иначе нулевая Fнабл  113,08 гипотеза H 0 : R  0 отвергается на уровне 2 Fтабл (0,05; k1  1; k 2  10)  4,96 оценка статистической значимости параметров уравнения регрессии и коэффициента корреляции значимости   0,05 Параметры уравнения регрессии и знач ение коэффициента корреляции статистически значимы на уровне значимости   0,05 t b0  5,72 t b1  t r  10,63 t табл (0,05;12  2  10)  2,228 Вывод: Оценка точности прогноза что свидетельствует о положительной (прямой) и очень сильной связи между признаками X и Y . rxy  0,96 индекс детерминации точечный прогноз: вычислить уровня при увеличении переменной X – доли товара A в грузообороте предприятия – на 1% переменная Y (прибыль предприятия) в среднем увеличится на 94,67тыс. руб . построенную регрессионную модель можно использовать для прогноза x p  1,08  x  1,08  33,666  36,36(%)  y p  94,67  36,36  1749,76  1692( тыс. руб ) ~ ~ y p   p  Yp  ~ yp   p m p  225,173  p  t ;n 2  m p  p  t  ; n  2  m p  225,173  2,228  502 если доля товара A в грузообороте предприятия составит x p  36,36(%) , то прогнозное t ;n 2  2,228  кратность ошибки, где ( x p  x )2 1 mp  s  1   n  ( xi  x ) 2 стандартная (случайная) ошибка прогноза, s  215,11 стандартная ошибка регрессии. – значение фактора (прибыль предприятия) с вероятностью 95% примет одно из значений интервала: 1692  502  Y p  1692  502 1190  Y p  2194 тыс. руб.  Вопросы для самоконтроля 1. Дайте определение функциональному, статистическому и корреляционному типам связи. 46 2. Назовите основные условия применения корреляционно-регрессионного метода анализа статистических связей. 3. Какие задачи решаются методом корреляционно-регрессионного анализа? Приведите примеры. 4. Приведите примеры различных видов уравнений парной и множественной регрессии. 5. Дайте определение парному и множественному линейным коэффициентам корреляции. 6. Как оценивается значимость коэффициента корреляции? 7. Чем характеризуются функционально связанные между собой факторы? 8. Что характеризуют параметры регрессионного уравнения? Объясните сущность коэффициента парной линейной регрессии. 9. В чем заключается метод наименьших квадратов? Каковы основные условия его применения? 10. Как оценивается значимость параметров регрессионного уравнения? 11. Дайте определение частному коэффициенту эластичности. Что он характеризует? 12. Дайте определение стандартизованному коэффициенту регрессии. Что он характеризует? 13. Что позволяет оценить множественный коэффициент детерминации? 14. Для чего используется корректированный множественный коэффициент детерминации? 15. Как оценить статистическую надежность регрессионного уравнения в целом?  Литература 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 11 С.113-122 2. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.4 п.4.2 Лекция 5. Тема: «Индексный метод анализа в экономико-статистических исследованиях» Современная экономическая теория все больше использует индексы. Это является логическим результатом тяготения экономической науки к количественному анализу. В. В. Леонтьев (24 июня 1935 г. статья «Товарные агрегаты и проблема индексных показателей» была представлена на собрании Эконометрического общества г. Колорадо-Спрингс и опубликована в ж. Econometrica. 1936. Jan. Vol.4. No.1) План 1. Статистические индексы: понятие и классификация. 2. Индивидуальные и общие индексы. Свойства общих индексов. 3. Агрегатные индексы и методика их построения. Агрегатные индексы цен, физического объема и товарооборота. 4. Другие формы построения общих индексов:  Средневзвешенные индексы.  Средние арифметические и гармонические индексы 5. Расчеты недостающих индексов с помощью индексных систем С помощью индексов можно показать изменения в росте или снижении производства, изменения в урожайности, состоянии себестоимости и цен выпускаемой продукции, численности работающих, производительности труда, заработной платы, изменения в цене акций на фондовых рынках (индекс Доу-Джонса), сравнительную характеристику изменения погоды за определенный период времени (температуры, влажности, давления). 1. Статистические индексы 47 Индексы относятся к важнейшим обобщающим показателям. Слово «индекс» (с лат. index) имеет несколько значений: показатель, указатель, опись, реестр. Определение: (в статистике) индексом называется относительный показатель, характеризующий соотношение во времени (динамический И.) или в пространстве (территориальный И.) социально экономических явлений: цен отдельных товаров, объемов различной продукции, себестоимости и т.п. Индексный метод (в статистике) – метод статистического исследования, основанный на построении и анализе относительных показателей, позволяющих соизмерять сложные социально-экономические явления. С помощью экономических индексов решаются следующие задачи:  измерение динамики социально-экономического явления за два и более периодов времени;  определения экономической значимости причин, объясняющих абсолютное различие сравниваемых уровней;  измерение соотношения показателей по разным регионам;  определение степени влияния изменений значений одних показателей на динамику других;  пересчет значения макроэкономических показателей из фактических цен в сопоставимые. Экономические индексы можно классифицировать по следующим признакам: По степени охвата явления индексы бывают индивидуальные и общие (сводные). По базе сравнения все индексы можно разделить на две группы: динамические и территориальные. Динамические индексы бывают базисными и цепными. Вторая группа индексов (территориальные) применяется для межрегиональных сравнений. По виду весов различают индексы с постоянными и переменными весами. В зависимости от формы построения различаются индексы агрегатные и средние. Последние делятся на арифметические и гармонические. Агрегатная форма общих индексов является основной формой экономических индексов. Средние индексы - производные, они получаются в результате преобразования агрегатных индексов. По характеру объекта исследования общие индексы подразделяются на индексы количественных (объемных) и качественных показателей. По объекту исследования строят индексы производительности труда, себестоимости, физического объема продукции, стоимости продукции и т.д. По составу явления можно выделить две группы индексов: постоянного (фиксированного) состава и переменного состава. Деление индексов на эти две группы используется для анализа динамики средних показателей. По периоду исчисления индексы подразделяются на годовые, квартальные, месячные, недельные. Для обозначения индексируемых показателей (величин), как правило, используются следующие символы: q – количество (объем) произведенной продукции (или количество проданного товара) данного вида в натуральном выражении (в кг, м, шт.); p – цена единицы продукции или товара; z – себестоимость единицы продукции; t – затраты рабочего времени (труда) на производство единицы продукции данного вида, т.е. трудоемкость единицы изделия; T – общие затраты рабочего времени (труда) на производство продукции данного вида или численность работников предприятия, фирмы и т.д.; w q – производство продукции данного вида в единицу времени или в расчете на одного T рабочего, т.е. уровень производительности труда в стоимостном выражении; F  zq – общие затраты на производство продукции данного вида; Q  pq – общая стоимость произведенной продукции данного вида или товарооборот. 48 2. Индивидуальные и общие индексы. В международной практике индексы принято обозначать символами i – индивидуальные, частные индексы и I – общие индексы. Знак внизу справа (нижний индекс) означает период: 0 – базисный и 1 – отчетный: i0 , I 0 или i1 , I1 . Индивидуальные индексы i характеризуют изменение только одного элемента совокупности. Индивидуальные индексы получают в результате сравнения однотоварных явлений. Например, индекс цен на растительное масло определяется как отношение цены на этот товар в текущем периоде к цене базисного периода. Индивидуальные индексы представляют собой относительные величины динамики, выполнения плана, сравнения, и их расчет не требует знания специальных правил. В зависимости от экономического назначения индивидуальные индексы бывают физического объема продукции, себестоимости, цен, трудоемкости и т.д. Для расчета индивидуальных индексов используют формулы: - индекс цен i р  р1 , р0 где р1 - цена в отчетном периоде, р0 – цена в базисном периоде. - индекс физического объема iq  q1 , q0 где q1 – физический объем в отчетном периоде; q 2 – физический объем в базисном периоде. - индекс товарооборота i рq  где р1 q1 , р0 q0 p1q1 – товарооборот в отчетном периоде; p 0 q 0 – товарооборот в базисном периоде. В экономических расчетах чаще всего используются общие индексы, которые характеризуют изменение какого-либо показателя (например, средней цены) по всей совокупности (некоторой группе товаров) в целом. Общие (сводные) индексы I характеризуют изменение по всей совокупности элементов сложного явления. Общие индексы обладают синтетическими и аналитическими свойствами. Синтетические свойства индексов состоят в том, что посредством индексного метода производится соединение (агрегирование) в целом разнородных единиц статистической совокупности. Аналитические свойства индексов состоят в том, что посредством индексного метода определяется влияние факторов на изменение изучаемого показателя. В зависимости от цели исследования и наличия исходных данных используют различную форму построения общих индексов: агрегатную или средневзвешенную. Для определения индекса надо произвести сопоставление не менее двух величин. При изучении динамики социально-экономических явлений сравниваемая величина (числитель индексного отношения) принимается за текущий (или отчетный) период, а величина, с которой производится сравнение — за базисный период. Основным элементом индексного отношения является индексируемая величина. Под индексируемой величиной понимается значение признака статистической совокупности, изменение которой является объектом изучения. 49  Замечание. Методика построения общего индекса предусматривает решение трех вопросов: 1) какая величина будет индексируемой; 2) по какому составу разнородных элементов явления необходимо исчислить индекс; 3) что будет служить весом (соизмерителем) при расчете индекса. При выборе веса (соизмерителя) индекса принято руководствоваться следующим правилом: если строится индекс количественного показателя, то веса берутся за базисный период, при построении индекса качественного показателя используются веса отчетного периода. 3. Агрегатные индексы Основной формой общих индексов являются агрегатные индексы. Агрегатный индекс - сложный относительный показатель, который характеризует среднее изменение социально-экономического явления, состоящего из несоизмеримых элементов. Агрегат (с лат. aggregates) означает складываемый, суммируемый. Особенность этой формы индекса состоит в том, что в агрегатной форме непосредственно сравниваются две суммы одноименных показателей. В настоящее время это наиболее распространенная форма индексов, используемая в практической статистике многих стран мира. В качестве соизмерителей индексируемых величин выступают тесно связанные с ними экономические показатели: цены, количество и др. Произведение каждой индексируемой величины на соизмеритель образует в индексном отношении определённые экономические категории. Агрегатный индекс цен можно определить двумя способами: 1. по формуле, предложенной немецким экономистом Г. Пааше, поэтому он называется индексом цен Пааше: I pП  q p q p 1 1 1 0 В данном случае качестве соизмерителя индексируемых величин p1 и p0 принимается количество реализации товаров в текущем периоде q1 : q p 1 1 – сумма стоимости продажи товаров в текущем периоде по ценам того же те- кущего периода; q1 p0 – сумма стоимости продажи товаров в текущем периоде по ценам базисного  периода. 2. по формуле предложенной немецким экономистом Э. Ласпейресом: I pЛ  q q 0 p1 0 p0 – индекс цен Ласпейреса. В качестве соизмерителя индексируемых величин p1 и p0 принимается количество реализации товаров в базисном периоде q 0 : q 0 p1 – сумма стоимости продажи товаров в базисном периоде по ценам текущего 0 p0 – сумма стоимости продажи товаров в базисном периоде по ценам того же ба- периода; q зисного периода. Индекс Пааше характеризует влияние изменения цен на стоимость товаров, реализованных в отчётном периоде. Индекс Ласпейреса показывает влияние изменения цен на стоимость количества товаров, реализованных в базисном периоде. Замечание 1. Расчёты индексов цен Пааше и Ласпейреса дают различные показатели роста цен. Это связано с тем, что эти индексы характеризуют изменения, происходящие с различными совокупностями. 2. Применение индексов Пааше и Ласпейреса зависит от поставленных целей. Если при изучении расчётных данных необходимо определить, как изменился товарооборот по ассортименту отчётного периода за счёт изменения цен в отчётном периоде по сравнению с базис- 50 ным, применяется формула Пааше. Если целью анализа является определение общей стоимости товарооборота при продаже в предстоящем периоде такого же набора товаров, что и в базисном периоде, но по новым ценам, то применяется индекс Ласпейреса. 3. Индекс Ласпейреса, отражая динамику цен по потребительской корзине базисного периода q 0 , не учитывает изменений в структуре потребления, которые возникают из-за изменения цен благ. Отражая лишь эффект дохода и игнорируя эффект замещения, этот индекс даёт завышенную оценку инфляции при росте цен и заниженную в случае их снижения. 4. Индекс Пааше, отражая динамику цен по потребительской корзине текущего периода q1 , не в полной мере отражает эффект дохода. В результате получается завышенная оценка изменения цен при их снижении и заниженная в случае роста. 5. Наряду с индексами цен Пааше и Ласпейреса существует так называемая «идеальная формула» индекса цен, предложенная американским экономистом И. Фишером, которая представляет собой среднюю геометрическую из индексов цен Пааше и Ласпейреса: I Фp  I pП  I pЛ Агрегатные индексы физического объёма товарной массы. 1. В качестве соизмерителя индексируемых величин q1 и q 0 применяются неизменные цены базисного периода p0 : I q  где q p q 1 0 0 q p q p 1 0 0 0 , – сумма стоимости товарной массы текущего периода в базисных ценах; p0 – сумма стоимости товарной массы базисного периода в ценах того же базис- ного периода. Данный индекс является агрегатным индексом товарооборота в сопоставимых (базисных) ценах. 2. Агрегатный индекс физического объёма товарооборота может определяться посредством использования в качестве соизмерителя индексируемых величин q1 и q 0 цен текущего периода p1 : Iq  q p q p 1 1 0 1 Замечание. Аналогичным образом производится расчёт индекса себестоимости, при этом сравниваются суммы затрат в производстве в отчётном периоде ( q1 z1 – числитель индек-  са) с суммой затрат в производстве на продукцию отчётного периода по себестоимости базисного периода ( q z 1 0 — знаменатель): I z  q z q z 1 1 1 0 3. Агрегатная формула общего индекса товарооборота в действующих ценах: I рg   р1q1  р0 q0 Такой индекс показывает, во сколько раз возросла (уменьшилась) стоимость продукции (товарооборота) отчетного периода по сравнению с базисным, или сколько процентов составляет рост (снижение) стоимости продукции. Если из значения индекса стоимости вычесть 100%, то разность покажет, на сколько процентов возросла (уменьшилась) стоимость продукции в текущем периоде по сравнению с базисным.  Замечание. 51 1. Для выявления роли каждого фактора в отдельности индекс сложного показателя (например, товарооборота) разлагают на частные (факторные) индексы (цен и физического объема), которые характеризуют роль каждого фактора: I z  I q  I zq . 2. Используя систему взаимосвязанных индексов, можно рассчитать абсолютные изменения, например, товарооборота – в целом и в том числе за счет влияния отдельных факторов – цены и физического объема продаж. Для этого необходимо найти разности между числителем и знаменателем соответствующих индексов: - общее абсолютное изменение объема товарооборота рq рq    р1q1   р0 q0 - изменение объема товарооборота за счет изменения цен рq р    р1q1   р0 q1 - изменение объема товарооборота за счет изменения физического объема продаж рqq    р0 q1   р0 q0 Вывод. В экономическом анализе индексы используются не только для сопоставления уровней изучаемого явления, но, главным образом, для определения экономической значимости причин, объясняющих абсолютное различие сравниваемых уровней. Например. Стоимость продукции определенного предприятия 2006 г. составляла 125000 рублей, а стоимость продукции p q 0 0 в базисном периоде  p q , произведенной в отчет0 1 ном периоде 2006 г. составила 155000 рублей. Найдем общий индекс физического объема: Iq = Iq  q p q p 1 0 0 0  155000  1,24 или 124% , 125000 т.е. общий выпуск продукции в отчетном периоде по сравнению с базисным увеличился на 24%. Вычитая из числителя индекса знаменатель, получим: рqq    р0 q1   р0 q0  155000  12500  30000 руб. Вывод: за счет увеличения объема производства на 24% стоимость продукции в абсолютном выражении в отчетном периоде увеличилась на 30000 рублей. 4. Другие формы общих индексов. 4.1. Средневзвешенные индексы. Под изменением структуры явления понимается изменение доли отдельных групп единиц совокупности в общей их численности. Например, средняя заработная плата на предприятии может вырасти в результате роста оплаты труда работников (1) или увеличения доли высокооплачиваемых сотрудников (2). Если на изменение среднего значения показателя оказывают воздействие несколько факторов (например, два фактора), то возникает задача определить степень влияния каждого из факторов на общую динамику средней. Эта задача решается с помощью индексного метода, т.е. путем построения системы взаимосвязанных индексов, в которую включаются три индекса: переменного состава, постоянного состава и структурных сдвигов. Индексом переменного состава называется индекс, выражающий соотношение средних уровней изучаемого явления, относящихся к разным периодам времени. I перем  X1  X0 x n : x n n n 1 1 0 0 1 0 (такая форма индекса называется средневзвешенной) Индекс переменного состава отражает изменение не только индексируемой величины, но и структуры совокупности (весов). Индекс постоянного (фиксированного) состава - это индекс, исчисленный с весами, зафиксированными на уровне одного какого-либо периода, и показывающий изменение только индексируемой величины. 52 Индекс постоянного состава характеризует изменение среднего уровня признака сложной совокупности в отчетном периоде по сравнению с базисным с фиксированной структурой, т.е. с постоянными весами: I пост  x n : x n n n 1 1 0 1 1 1 Индекс фиксированного состава определяется как агрегатный индекс. I пост  x n x n 1 1 0 1 Под индексом структурных сдвигов понимают индекс, характеризующий влияние изменения структуры изучаемого явления на динамику среднего уровня этого явления. Индекс влияния структурных сдвигов характеризует изменение среднего уровня признака сложной совокупности в отчетном периоде по сравнению с учетом изменения только структуры, значения признака фиксируются на базисный период: I стр.  x n : x n n n 0 1 0 1 0 0 Если индексы постоянного состава и влияния структурных сдвигов перемножить, то это произведение будет равно значению индекса переменного состава: I перем  I пост  I стр 4.2. Средние арифметические и гармонические индексы Всякий агрегатный индекс может быть преобразован в средний арифметический из индивидуальных индексов. Для этого индексируемая величина отчётного периода, стоящая в числителе агрегатного индекса, заменяется произведением индивидуального индекса на индексируемую величину базисного периода. Так, индивидуальный индекс цен равен i p  p1 p , откуда p1  i p  p 0 или p 0  1 . ip p0 Следовательно, преобразование агрегатного индекса цен в средний арифметический имеет вид: Ip  q p i q p 1 0 p 1 Аналогично индекс себестоимости равен i  q z =  q z i . q z  q z 1 1 1 0 1 0 1 0 . 0 z1 , откуда z1  iz0 , следовательно, I z = z0 Аналогично индекс физического объёма продукции равен i  довательно, I p = q p =  q p i q p  q p 1 0 0 0 0 0 0 0 q1 , откуда q1  iq0 , слеq0 Преобразование агрегатного индекса цен в средний гармонический имеет вид: Ip  q p q p  i 1 1 0 1 p 5. Связь между индексами. 53 Многие экономические индексы тесно связаны между собой и образуют индексные системы. Так, индекс цен связан с индексом физического объема товарооборота или физического объема продукции, образуя следующую индексную систему:  p q  q p  p q q p 1 1 1 0 0 1 0 0  p q p q 1 1 0 , или I p  I q  I pq 0 Произведение индекса цен на индекс физического объема товарооборота или продукции дает индекс физического объема товарооборота в фактических ценах, или индекс стоимости продукции. Индекс себестоимости промышленной продукции связан с индексом физического объема продукции по себестоимости, образуя следующую индексную систему:  z q  q z  z q q z 1 1 1 0 0 1 0 0  z q z q 1 1 0 , или I z  I q  I zq 0 Произведение индекса себестоимости продукции на индекс физического объема дает индекс затрат в производстве. Если индексы постоянного состава и влияния структурных сдвигов перемножить, то это произведение будет равно значению индекса переменного состава: I перем  I пост  I стр Связь между индексами используется  для выявления роли каждого фактора в отдельности на величину сложного показателя;  для расчёта недостающих индексов;  для контроля вычислений.  Вопросы для самоконтроля 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. Что такое сложная статистическая совокупность? Перечислите признаки классификации и виды индексов. Какие индивидуальные индексы вам известны? Как рассчитать индивидуальный индекс физического объема? В чем сущность соизмерителя в агрегатной форме общего индекса? Как определяется общий индекс цен Пааше? Что характеризует разность числителя и знаменателя общего индекса цен Пааше. Охарактеризуйте сводный индекс физического объема. Что представляет собой агрегатный индекс товарооборота? Анализ влияния изменения товарооборота под влиянием воздействия различных факторов. Что такое индекс переменного состава? В чем сущность средневзвешенных индексов? Индекс постоянного состава и индекс влияния структурных сдвигов. Взаимосвязь общих индексов. Когда используются средние арифметические и гармонические индексы?  Литература 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 9 С.88-98 2. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.6 Лекция 6 Тема: «Методы обработки и анализа рядов динамики» Анализ взаимосвязей экономических данных, представленных в виде временных рядов, является необходимой составной частью современных 54 исследований в области макроэкономической динамики, переходной экономики, эконометрики финансовых рынков. Канторович Г. Г. Сложение случайных причин порождает волнообразные ряды. E. E. Слуцкий План. 1. Понятие о статистических рядах динамики и их классификация 2. Статистические показатели динамики: абсолютные, относительные и средние. 3. Выявление структуры временного ряда 3.1. Проверка ряда на наличие тренда. Методы выделения тренда. 3.2. Анализ сезонных колебаний 4. Анализ взаимосвязанных рядов динамики. 1. Понятие о статистических рядах динамики и их классификация Существует два типа исходных данных: – данные, характеризующие совокупность различных объектов в определенный момент (период) времени; – данные, характеризующие один объект за ряд последовательных моментов (периодов) времени. C течением времени, изо дня в день, от месяца к месяцу, от квартала к кварталу изменяется численность населения, его состав, объем произведённой продукции промышленности и сельского хозяйства, уровень производительности труда и т.д. Ряды динамики – статистические данные, отображающие развитие во времени изучаемого явления. Их также называют динамическими рядами, временными рядами. В каждом ряду динамики имеется два основных элемента: 1. показатель времени t ; 2. соответствующие им уровни развития изучаемого явления yt . В частности, различают начальный уровень ряда y1 и конечный уровень ряда y n . В качестве показаний времени в рядах динамики выступают либо определенные даты (моменты), либо отдельные периоды (годы, кварталы, месяцы, сутки). Уровни рядов динамики отображают количественную оценку (меру) развития во времени изучаемого явления. Они могут выражаться абсолютными, относительными или средними величинами. Классификация РД Ряды динамики различаются по следующим признакам: 1) по времени. Моментные ряды динамики отображают состояние изучаемых явлений на определенный момент времени. Интервальные ряды динамики отражают итоги развития изучаемых явлений за отдельные периоды времени. Посредством моментных рядов динамики в торговле изучаются товарные запасы, состояние кадров, количество оборудования и других показателей, отображающих состояние изучаемых явлений на отдельные даты (моменты) времени. Особенностью интервального ряда динамики является то, что каждый его уровень складывается из данных за более короткие интервалы времени. Посредством интервальных рядов динамики в торговле изучают изменения во времени поступления и реализации товаров, суммы издержек обращения и других показателей, отображающих итоги функционирования изучаемого явления за отдельные периоды. 2) по форме представления уровней. Могут быть построены ряды динамики, уровни которых представляют собой абсолютные, относительные и средние величины. Они также могут быть либо моментными, либо 3) по расстоянию между датами или интервалам времени выделяют полные и неполные ряды динамики. Полные ряды динамики имеют место тогда, когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами. 4) по числу показателей можно выделить изолированные и комплексные (многомерные) ряды динамики. Если ведется анализ во времени одного показателя, имеем изолиро- 55 ванный ряд динамики. Комплексный ряд динамики получается в том случае, когда в хронологической последовательности дается система показателей, связанных между собой единством процесса или явления. Пример. Дайте характеристику следующему ряду динамики продукции с/х РФ за 2006-2009 гг., млн. руб.: Продукция с/х 2006 2007 2008 2009 Всего, 309217 307583 611993 781576 в том числе: растениеводства 171486 152289 327992 426581 животноводства 137731 155294 284001 354995 Ответ: задан комплексный, полный, интервальный ряд средних показателей сельскохозяйственной продукции. Требования, предъявляемые к рядам динамики: 1) Сопоставимость статистических данных Основным условием для получения правильных выводов при анализе рядов динамики является сопоставимость его элементов. Несопоставимость в рядах динамики вызывается различными причинами. Это могут быть: неодинаковость показаний времени, неоднородность состава изучаемых совокупностей во времени, изменения в методике первичного учета и обобщения исходной информации, различия применяемых в различное время единиц измерения и т. д. 2) Величины временных интервалов должны соответствовать интенсивности изучаемых процессов. Чем больше вариация уровней во времени, тем чаще следует делать замеры. Соответственно для стабильных процессов интервалы можно увеличить. 3) Числовые уровни рядов динамики должны быть упорядоченными во времени. Не допускается анализ рядов с пропусками отдельных уровней, если же такие пропуски неизбежны, то их восполняют условными расчетными значениями. Смыкание динамических рядов. Для приведения информации, содержащейся в различных рядах, к сопоставимому виду осуществляется действие, получившее название смыкание динамических рядов. Пример. Имеются данные о динамике процентных ставок в стране с 2000 по 2009 г. Данные взяты из двух источников, изданных в разные годы: Первый источник (публикация 2004 г.). За базу взяты данные 2000 г. 2000 2001 2002 2003 2004 2005 100 98 99 102 108 110 Второй источник (публикация 2009 г.). За базу взяты данные 2005 г. 2005 2006 2007 2008 2009 100 103 109 112 110 Необходимо привести информацию к сопоставимому виду, т.е. единой базе. Решение. Найдем в обоих рядах показатель, относящийся к одному и тому же году: это величина процентной ставки в 2005 г. Определим коэффициент пересчета: k  110  1,1 100 Умножим на этот коэффициент данные второго источника и построим единый динамический ряд: 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 100 98 99 102 108 110 113,3 119,9 123,2 121 Или можно построить динамический ряд на базе 2005 г. 56 В этом случае коэффициент пересчета будет равен k  2000 91 2001 89 2002 90 2003 93 2004 98 2005 100 100  0,909 . 110 2006 103 2007 109 2008 112 2009 110 При изучении рядов динамики необходимо понимать, что уровень ряда (численное значение статистического показателя) может формироваться под влиянием следующих типов факторов: долговременно действующих факторов, причин и условий развития. Эти факторы порождают основную тенденцию и формируют тренд ряда. С течением времени условия могут измениться и породить уже другую тенденцию развития изучаемого объекта. периодически действующие факторы приводят к колебаниям уровней ряда и порождают (формируют) циклическую и (или) сезонную составляющие ВР. под влиянием множества случайных факторов формируется случайная составляющая временного ряда. Всякий ряд динамики теоретически может быть представлен в виде следующих составляющих: 1) тренда – основной тенденции развития динамического ряда; 2) циклической и (или) сезонной составляющей; 3) случайной составляющей.  Замечание. Реальный временной ряд может содержать только одну составляющую – случайную. С помощью рядов динамики изучаются закономерности развития социально – экономических явлений в следующих направлениях: 1) Характеристика уровней развития изучаемых явлений во времени; 2) Измерение динамики изучаемых явлений посредством системы статистических показателей; 3) Выявление и количественная оценка основной тенденции развития (тренда); 4) Изучение периодических колебаний; 5) Экстраполяция и прогнозирование. Под взаимосвязанными рядами динамики понимают такие, в которых уровни одного ряда в какой – то степени определяют уровни другого (явление коинтеграции ВР). Например, ряд, отражающий внесение удобрений на 1 га, связан с временным рядом урожайности; ряд уровней средней выработки связан с рядом динамики средней заработной платы; ряд среднегодового поголовья молочного стада определяет годовые уровни надоев молока и т.д. 2. Статистические показатели динамики В основе расчета показателей рядов динамики лежит сравнение его уровней. Возможны два способа сопоставления показателей динамики: каждого последующего с предыдущим (исчисление цепных показателей) или значение каждого показателя сравниваются с начальным уровнем ряда (исчисление базисных показателей) или вычисление показателей на переменной и постоянной базах сравнения. 2.1. Абсолютные показатели 1) Цепной абсолютный прирост y iц определяется как разность между сравниваемым уровнем yi и уровнем, который ему предшествует yi1 : yiц  yi  yi 1  Замечание. Абсолютный прирост с переменной базой (цепной абсолютный прирост) иначе называют скоростью роста. 57 б 2) Базисный абсолютный прирост yi – это разность между сравниваемым уров- нем yi и уровнем, принятым за постоянную базу сравнения y0 : yiб  yi  y0 Абсолютный прирост может иметь и отрицательный знак, показывающий, насколько уровень изучаемого периода ниже базисного или уровня предыдущего периода. Между базисными и абсолютными приростами существует связь: сумма цепных абсолютных приростов  y ц i равна базисному абсолютному приросту последнего ряда ди- намики y n  y 0 : ynб1  yn  y0   y ц i . Ускорение – это разность между абсолютными цепными приростами за данный и предыдущий периоды равной длительности:  y  y n  y n 1 Показатель абсолютного ускорения применяется только в цепном варианте, но не в базисном. Отрицательная величина ускорения говорит о замедлении роста или об ускорении снижения уровней ряда. 2.2.Относительные показатели. Коэффициент роста определяется как отношение двух сравниваемых уровней и показывает, во сколько раз данный уровень превышает уровень базисного периода. 1) При сравнении с постоянной базой (начальным уровнем) коэффициенты роста базисные исчисляется по формуле: k Pi  б yi . y0 2) При сравнении с переменной базой коэффициенты роста цепные исчисляются делением сравниваемого уровня yi на предыдущий уровень yi 1 : k Pi  ц yi . y i 1 Если коэффициенты роста выражают в процентах, то их называют темпами роста: базисные темпы роста: TPi  б yi y  100% и цепные темпы роста: TPiц  i  100% . y0 yi 1 Между базисными и цепными коэффициентами роста имеется взаимосвязь: 1) произведение последовательных цепных коэффициентов роста равно базисному коэффициенту роста. Например. Если k Pц1  y y2 ц y ц , k P 2  3 , k P3  4 , y0 y1 y3 то k Pб 3  y4 , y0 или k Pб3  k цp1  k цp 2  k цp3 . 2) частное от деления последующего базисного коэффициента роста на предыдущий равно соответствующему цепному коэффициенту роста. Например. Если k б P1 k pб 2 y3 y3 y2 б ц ц  , k P2  , то k P 2  или k P 2  б . k р1 y0 y0 y2 Коэффициенты прироста характеризуют абсолютный прирост в относительных величинах. Темп прироста показывает, на сколько процентов изменился сравниваемый уровень по отношению к уровню, принятому за базу сравнения. Этот показатель может быть рассчитан двумя способами: 1) как отношение абсолютного прироста к уровню, принятому за базу сравнения: Tпi  yi  y 0  100% – темп прироста базисный; y0 58 Tпi  yi  yi 1  100% - темп прироста цепной. yi 1 2) Как разность между темпом роста (в процентах) и 100%: Tпi  T pi  100% Важным статистическим показателем динамики социально – экономических процессов является темп наращивания, который в условиях интенсификации экономики измеряет наращивание во времени экономического потенциала. yi  yi 1  100% y0 Абсолютное значение одного процента прироста Ai рассчитывают как отношение Вычисляются темпы наращивания по формуле: Tн  абсолютного прироста (цепного) к темпу прироста (цепному) за тот же период времени: Ai  yi  yi 1 yi  yi 1 y   i 1  0,01  yi 1 . yi  yi 1 Tni 100  100% yi 1 2.3. Средние показатели в рядах динамики Для получения обобщающих показателей динамики социально – экономических явлений определяются средние величины. Средний уровень ряда динамики характеризует типическую величину абсолютных уровней. В интервальных рядах динамики средний уровень ряда определяется по формуле простой средней арифметической: y y n i , где n – число уровней ряда. В моментном ряду динамики с равноотстоящими датами времени средний уровень определяется по формуле средней хронологической: 1 1 y1  y 2  ...  y n 1  y n 2 . y 2 n 1 В моментном ряду динамики с неравными промежутками между временными датами средний уровень ряда вычисляется по формуле средней арифметической взвешенной: y  y t t i i , i где t i – количество дней (месяцев) между смежными датами. Средний абсолютный прирост (или средняя скорость роста) рассчитывается как средняя арифметическая из показателей абсолютных цепных приростов:  y y  ц i n 1 или по формуле: y  yn  y0 , n 1 где n – число уровней ряда. Средний коэффициент роста вычисляется по формуле средней геометрической из показателей цепных коэффициентов роста за отдельные периоды: K p  n1 K1  K 2  ...  K n1 или по формуле: K p  n1 yn . y0 Средний темп роста представляет собой средний коэффициент роста, выраженный в процентах: T p  K p  100% Средний темп прироста можно определить на основе взаимосвязи между темпами роста и прироста: Tn  T p  100% 59 3. Изучение структуры ВР Как было отмечено, значения уровней временных рядов экономических показателей складываются из следующих составляющих (компонент): тренда, сезонной, циклической и случайной: – длительные, постоянно действующие факторы оказывают на изучаемое явление определяющее влияние и формируют основную тенденцию ряда, называемую трендом T (t ) ; – кратковременные, периодические факторы формируют сезонные колебания ряда S (t ) , период сезонных колебаний не превышает одного года; если период более одного года, то говорят о наличии циклической составляющей ВР V (t ); – случайная компонента  (t ) отражает влияние неподдающихся учету и регистрации случайных факторов. Определение: модель, в которой временной ряд представлен как сумма перечисленных компонент, т.е. y (t )  T (t )  S (t )  V (t )   (t ) , называется аддитивной. Модель, в которой временной ряд представлен как произведение перечисленных компонент, т.е. y (t )  T (t )  S (t )  V (t )   (t ) , называется мультипликативной. Модель, представленная уравнением y (t )  T (t )  S (t )  V (t )   (t ) , называется смешанной. Важно! Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний: если амплитуда сезонных колебаний приближенно постоянная, используют аддитивную модель. Если амплитуда возрастает или уменьшается, то используют мультипликативную модель. Основная задача исследования временных рядов (ВР) состоит в выявлении каждой из перечисленных компонент, чтобы использовать полученную информацию для прогнозирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов. 3.1. Проверка ряда на наличие тренда. Методы выделения тренда Важнейшей классической задачей при исследовании экономических временных рядов является выявление и статистическая оценка основной T (t ) тенденции развития изучаемого процесса и отклонений от нее. Прежде чем перейти к выделению тренда, следует проверить статистическую гипотезу о том, существует ли он вообще. Отсутствие основной тенденции (тренда) означает неизменность среднего уровня ряда во времени Изучение тренда включает в себя два основных этапа: 1) Ряд динамики проверяется на наличие тренда 2) Производится выравнивание временного ряда и непосредственное выделение тренда с экстраполяцией полученных показателей – результатов. Проверка на наличие тренда в ряду динамики может быть осуществлена по нескольким критериям. 1) Метод средних. Изучаемый ряд динамики разбивается на несколько интервалов (обычно на два), для каждого из которых определяется средняя величина ( y1 , y 2 ) . Выдвигается гипотеза о несущественном различии средних H 0 : y1  y 2 , для проверки которой используется t  критерий Стьюдента. Если эта гипотеза отклоняется, то признается наличие тренда. 2) Фазочастотный критерий знаков первой разности (критерий Валлиса и Мура). Суть его заключается в следующем: наличие тренда в динамическом ряду утверждается в том случае, если этот ряд не содержит либо содержит в приемлемом количестве фазы – изменение знака разности первого порядка (абсолютного цепного прироста). 3) Критерий Кокса и Стюарта. Весь анализируемый ряд динамики разбивают на три равные по числу уровней группы (в том случае, когда число уровней ряда не делится на три, недостающие уровни надо добавить) и сравнивают между собой уровни первой и последней групп. 60 4) Метод серий. По этому способу каждый конкретный уровень временного ряда считается принадлежащим к одному из двух типов: например, если уровень ряда меньше медианного значения, то считается, что он имеет тип A , в противном случае – тип B . Теперь последовательность уровней выступает как последовательность типов. В образовавшейся последовательности типов определяется число серий (серия – любая последовательность элементов одинакового типа, с обеих сторон граничащая с элементами другого типа). Если в ряду динамики общая тенденция к росту или снижению отсутствует, то количество серий является случайной величиной, распределенной приближенно по нормальному закону ( n  10 ). Непосредственное выделение тренда может быть произведено тремя методами. 1) Метод укрупнения интервалов. Ряд динамики разделяют на некоторое достаточно большое число равных интервалов. Если средние уровни по интервалам не позволяют увидеть тенденцию развития явления, переходят к расчету уровней за большие промежутки времени, увеличивая длину каждого интервала (одновременно уменьшается количество интервалов). 2) Метод скользящей средней. В этом методе исходные уровни ряда заменяются средними величинами, которые получают из данного уровня и нескольких симметрично его окружающих. Недостаток методики сглаживания скользящими средними состоит в условности определения сглаженных уровней для точек в начале и конце ряда. Получают их специальными приемами – расчетом средней арифметической взвешенной. Так, при сглаживании по трем точкам (т.е. с интервалом сглаживания равным 3), y  yi  yi 1 скользящие средние (начиная с ~ . yi  i 1 y 2 ) вычисляются по формулам: ~ Выровненное значение в начале ряда рассчитывается по формуле: 3 5 y  2 y 2  y3 ~ . y 1 1 6 Для последней точки расчет симметричен. При сглаживании по пяти точкам (с интервалом сглаживания равном 5) имеем такие уравнения: 3 y1  2 y 2  y3  y 4 , 5 4 y  3 y 2  2 y3  y 4 y 2 1 10 y1 Для последних двух точек ряда расчет сглаженных значений полностью симметричен сглаживанию в двух начальных точках. 3) Аналитическое выравнивание. Одним из наиболее распространенных способов моделирования тенденции ВР является построение аналитической функции, характеризующей зависимость уровней ряда от времени или тренда. Этот способ называется аналитическим выравниванием ВР. Зависимость от времени может принимать разные формы, поэтому для ее формализации можно использовать различные виды функций. Для построения трендов чаще всего применяются следующие функции: – линейный тренд yˆ t  a  bt ; – гипербола yˆ t  a  – экспонента b ; t yˆ t  e a bt или yˆ t  a  b t ; – тренд в форме степенной функции yˆ t  a  t b ; – полиномы различных порядков yˆ t  a  b1t  b2 t 2  b3t 3  ...  bk t k . 61 Параметры, каждого из перечисленных выше трендов можно определить МНК (методом наименьших квадратов), используя в качестве независимой переменной время t  1,2,3,..., n , а в качестве зависимой переменной – фактические уровни ВР yt . Важно! Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации Существует различные способы определения типа тенденции: – построение и визуальный анализ графика зависимостей уровней ряда от времени; – расчет некоторых показателей динамики: 1) Линейная зависимость выбирается в тех случаях, когда в исходном временном ряду наблюдаются более или менее постоянные базисные и цепные приросты, не проявляющие тенденции ни к увеличению, ни к снижению. 2) Параболическая зависимость используется, если абсолютные цепные приросты сами по себе обнаруживают некоторую тенденцию развития, но абсолютные цепные приросты абсолютных цепных приростов (разности второго порядка) никакой тенденции развития не проявляют. 3) Экспоненциальные зависимости применяются в том случае, когда в исходном временном ряду наблюдается:  более или менее постоянный относительный рост (устойчивость цепных темпов роста, темпов прироста, коэффициентов роста),  или отсутствие такого постоянства, т.е. устойчивость в изменении показателей относительного роста (цепных темпов роста цепных же темпов роста, цепных коэффициентов роста цепных же коэффициентов или темпов роста и т.д.). – использование коэффициентов автокорреляции уровней ряда:  если ВР имеет линейную тенденцию, то его соседние уровни yt и y t 1 тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Выбор наилучшего уравнения в случае нелинейной тенденции осуществляется путем перебора основных форм тренда, рассчитывая по каждому уравнению скорректированный индекс детерминации R 2 . Выбирается уравнение тренда с максимальным значением R 2 . 3.2. Анализ сезонных колебаний Первые исследования экономических временных рядов с целью выделения бизнес-циклов были выполнены фр. экономистом К. Жюгляром (ранее занимавшимся физикой) (18191905) . Им была обнаружена цикличность инвестиций (продолжительность цикла 7-11 лет). Затем была выявлена цикличность обновления оборотных средств (3-5 лет), циклы в строительстве (15-20 лет), долгосрочные волны, или «большие циклы» Кондратьева, продолжительностью 45-60 лет (С. Китчин, С. Кузнец, Н. Кондратьев). В 2003 г. за методы анализа экономических ВР с меняющейся волатильностью (Энгл) и за методы анализа экономических ВР с общими трендами (коинтеграция) Нобелевской Премии были удостоены Роберт Энгл и Клайв Грейнджер. Предложенные Энглом методы широко используются при анализе финансовых рынков. Исследования проводились методами гармонического анализа и периодограмманализа (эти методы перенесены в экономику из астрономии, метеорологии, физики). В ходе исследования сезонности являются следующие задачи: 1) определение наличия сезонности, численное выражение проявления сезонных колебаний и выявление их силы и характера в различных фазах годичного цикла; 2) характеристика факторов, вызывающих сезонные колебания; 3) оценка последствий, к которым приводит наличие сезонных колебаний; 4) математическое моделирование сезонности. 62 Для измерения сезонных колебаний статистикой предложены разные методы, наиболее простыми и часто употребляемыми среди которых являются следующие: 1) метод абсолютных разностей; 2) метод относительных разностей как развитие метода абсолютных разностей; 3) построение индексов сезонности; 4) методы гармонического анализа. Первые два способа предполагают нахождение разностей фактических уровней и уровней, найденных при выявлении основной тенденции развития. Сезонные колебания характеризуются специальными показателями, которые называются индексами сезонности I s . Совокупность этих показателей отражает сезонную волну. Индексы сезонности представляют собой процентные отношения фактических внутригодовых уровней к постоянной или переменной средней. Если ряд динамики не содержит ярко выраженной тенденции, то индексы сезонности вычисляются непосредственно по эмпирическим данным без их предварительного выравнивания: I S  yi  100% . y Если же ряд динамики содержит определенную тенденцию в развитии, то путем аналитического выравнивания ряда динамики эта тенденция выявляется, и рассчитываются теоретические уровни ряда. Индекс сезонности будет равен отношению фактического значения уровня ряда и его теоретического за тот же период: I S  yi  100% . yˆ t Циклическая компонента подобно сезонной компоненте ряда динамики представляет собой волнообразные движения (на графике), но она более продолжительна и менее предсказуема, чем сезонные колебания. Экономисты уделяют большое внимание анализу деловых циклов и их причинам. Другим методом изучения уровня сезонности является гармонический анализ. Его выполняют, представляя временной ряд как совокупность гармонических колебательных процессов. При исследовании периодических явлений в качестве аналитической формы развития во времени применяется уравнение, называемое рядом Фурье: yˆ t  a0   (ak  cos kt  bk sin kt) В этом уравнении величина k определяет гармонику ряда Фурье и может быть взята с разной степенью точности (чаще всего от 1 до 4). Методом наименьших квадратов находят уравнения для отыскания параметров a 0, a k , bk : a0  1 2 2 y i , a k   y i  cos kt , bk   y i  sin kt  n n n Для изучения сезонных колебаний на протяжении года необходимо взять n  12 (по числу месяцев в году). 4. Анализ взаимосвязанных рядов динамики При оценке тесноты связи между динамическими рядами первостепенной значение приобретает логический анализ связи между показателями. При использовании корреляционного анализа в динамических рядах встаёт двоякая задача: 1) измерить связь последовательных уровней одного и того же динамического ряда; 2) измерить связь между изменением двух параллельных рядов разного содержания, но так или иначе связанных друг с другом. В первом случае измеряются коэффициенты автокорреляции и авторегрессии, показывающие зависимость между последовательными уровнями ряда, во втором – коэффициенты корреляции и регрессии. Если будет доказано наличие автокорреляции уровней исходного ряда динамики, то её необходимо исключить. Есть несколько способов исключения автокорреляции. Один из них связан с корреляцией отклонений фактических уровней от тренда. Исключение трендов позволяет осла- 63 бить автокорреляцию. При коррелировании отклонений фактических уровней от выровненных необходимо выполнить следующее: 1) произвести аналитическое выравнивание сопоставимых рядов динамики; 2) определить величину отклонений каждого фактического уровня динамики от соответствующего ему выровненного значения; 3) рассчитать коэффициент корреляции по полученным отклонениям. К аналогичному результату в оценке степени тесноты связи рядов динамики можно прийти путем вычисления коэффициента корреляции первых разностей рядов динамики y (t ) и x(t ) , т.е. между величинами yi  yi  yi 1 (абсолютные приросты первого ряда) и xi  xi  xi 1 (абсолютные приросты второго ряда). Из перечисленных методов исключения автокорреляции наиболее простым является второй, однако более эффективен первый. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.  Вопросы для самоконтроля Дайте определение ряда динамики. Проведите классификацию рядов динамики. Перечислите требования, которым должны соответствовать временные ряды. Как строятся цепные и базисные показатели, характеризующие изменение уровней ряда динамики? Перечислите абсолютные показатели и запишите формулы для их вычислений. Перечислите относительные показатели и запишите формулы для их вычислений. Как вычисляется абсолютное значение одного проценту прироста Ai ? Перечислите средние показатели и запишите формулы для их вычислений. Какие факторы формируют уровни временного ряда? Назовите возможные составляющие временного ряда. Дайте понятие тренда ряда динамики. Какие существуют методы проверки на наличие тренда в ряду динамики? Какие формы может принимать зависимость уровня временного ряда от времени? Какие существуют способы определения типа тенденции? Как осуществляется анализ сезонных колебаний? Как вы понимаете взаимосвязанность рядов динамики? Как можно обнаружить наличие связи (или её отсутствие) между рядами динамики  Литература 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 8 С.72-87 2. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.5 Дополнение Тема 1. Обеспечение качества статистической информации Каждый хочет, чтобы его информировали честно, беспристрастно, правдиво — и в полном соответствии с его взглядами. Гилберт Честертон План 1. Понятие статистической информации 2. Понятие качества статистической информации 3. Пути (способы) обеспечения качества статистической информации 64 1. Статистическая информация - это цифровая информация в виде числовых рядов различных показателей, прогнозных моделей и оценок. Данные представлены в виде средних или относительных величин и позволяют выявлять закономерности развития социально-экономических явлений и процессов. Статистическая информация - показатели, рассчитанные по совокупности компаний, фирм, корпораций, банков и других организаций, рынкам , географическим и административным территориям и т.д. Статистическая информация предоставляется чаще всего государственными службами, а также компаниями, занятыми исследованиями и разработками, консалтинговыми фирмами. Одним из важнейших источников информации являются статистические публикации отдельных стран и специализированных органов ООН по экономике и отдельным отраслям. Таблица 1. Международные статистические организации и их основные публикации Международные организа- Статистические служ- Основные статистические пубции бы ликации Система ООН Статистический ежегодник "Statistical Year book" Ежемесячный статистический бюллетень "Monthly bulletin of Секретариат Статистическое бюро statistics" Ежегодник статистики международной торговли "Yearbook of International trade statistics" Ежемесячный выпуск "Статистические показатели краткоКонференция европей- срочных изменений в странах Региональные экономических статистов. Конфе- Европы" ские комиссии при секреренция азиатских ста- "Статистический ежегодник для тариате тистов. Азии и районов Тихого океана" "Статистика внешней торговли стран Африки" Специализированные учреждения системы ООН "Ежегодник статистики по труду" МОТ Конференция по труду "Квартальный бюллетень статистики по труду" "Ежегодник по производству" ФАО (продовольственная и "Ежегодник по торговле" сельскохозяйственная ор- Конференция "Ежегодник статистики мировой ганизация) торговли зерном" "Статистический ежегодник ЮНЕСКО" ЮНЕСКО Статистический отдел "Краткий статистический обзор образования в мире" "Получение образования за гра65 ницей. "Ежегодник мировой санитар ВОЗ Отдел статистики ной статистики" Международные валютно-финансовые учреждения - Международный банк ре"Годовой отчет Международноконструкции и развития. го банка и международной ассо- Международная финанстатистические службы циации развития". Ежегодник совая корпорация. "Тенденции в развивающихся - Международная ассоциастранах". ция развития. Сборник "Международная финансовая статистика". Ежеме- Международный валютСтатистическая служба сячник "Направления торговли". ный фонд. "Ежегодник платежных балансов". Статистический бюллетень по II. Международный америЛатинской Америке. "Обзор канский статистический Региональная комиссия экономического положения институт. стран Латинской Америки" В ряде стран, например в США, при составлении ежемесячника международной торговли, используются данные Бюро переписи и данные Бюро экономического анализа. Это позволяет оценить реальный экспорт товаров и услуг для будущего экономического выпуска ВВП. Основные источники статистической информации России: 1) официальная статистическая информация Госкомстата России; 2) данные, содержащиеся в официальных документах органов государственного управления; 3) данные, получаемые с помощью массовых опросов; 4) данные, получаемые с помощью опросов экспертов; 5) данные средств массовой информации; 6) данные, которые содержатся в соответствующих научных трудах. Статистическая информация Госкомстата России Официальные статистические данные Российской Федерации представлены в многочисленных изданиях (разовых и продолжающихся) Госкомстата России. Вот лишь некоторые из них: "Российский статистический ежегодник "; " Социальноэкономическое положение России"; "Социальное положение и уровень жизни населения России"; "Труд и занятость в России"; "Статистический бюллетень"; "Россия в цифрах" и др. Информация Госкомстата России занимает особое положение в ряду всех видов информации, которые функционируют в обществе. Ее главная особенность в том, что она носит официальный характер и рассматривается как наиболее достоверная. Производителем этой информации является государство. Вопрос о достоверности, истинности информации Госкомстата России относится к числу вечно открытых. Объективной информации вообще не бывает, поскольку ее собирают люди, субъекты, то она всегда содержит субъективный элемент. Информация Госкомстата России остается уникальной по широте отражения проблем: от браков и разводов, рождаемости и смертности в регионах России до здравоохранения, туризма, положения в странах мира. Уникальность этой информации также в том, что она носит количественный характер и охватывает длительные периоды времени. Данные, содержащиеся в официальных документах Речь идет о документах, принимаемых (утверждаемых) органами власти и публикуемых в официальных изданиях. Субъектами, производящими эту информацию, яв66 ляются такие органы, как Федеральное Собрание страны, Администрация Президента, Правительство, министерства, правовые структуры (Конституционный Суд, Прокуратура и др.). Центробанк и другие организации. К числу таких документов относятся, во-первых, законодательные акты страны: Конституция, Трудовой кодекс, Уголовно-процессуальный кодекс, Земельный кодекс, Закон о милиции и др. Во-вторых, официальные документы по текущим проблемам управления: постановления, программы и решения Правительства, министерств и ведомств; указы Президента по конкретным вопросам управления страной; текущие распоряжения официальных лиц в государственном аппарате, официальная переписка и др. Особенность этого вида социальной информации состоит в том, что она представлена в текстовой форме, поэтому для ее использования нужны особые методы. Для обработки документальной информации используются методы контентанализа. В этом отличие официальной документальной информации от официальных статистических данных, которые обрабатываются теми или иными математическими методами. Уникальность документальной информации состоит в следующем: официальные документы раскрывают характер проводимой государством экономической и социальной политики. Никакие другие источники - ни статистические, ни анкетные не дают и не могут дать столь ясного представления о политике, проводимой государством в тот или иной момент времени, о выдвигаемых глобальных целях и принимаемых способах их достижения. Информация, собираемая с помощью массовых опросов Поскольку массовые опросы чрезвычайно трудоемки (подчас они охватывают десятки тысяч респондентов), то они проводятся не отдельными людьми, а специальными организациями. В России такими организациями являются: ВЦИОМ (Всероссийский центр изучения общественного мнения), ФОМ (Фонд "Общественное мнение"), РОМИР (Российский мониторинг информации о России) и др. Эти организации специализированы на сборе данных по множеству актуальных проблем России. Например, ВЦИОМ собирает информацию об отношении населения России к рыночным реформам, о настроении общества, о рейтингах политиков и др.1 Особенность этой информации состоит в том, что, в отличие от двух первых видов данных, она собирается для научных целей - изучения общественного мнения. Экспертная информация - данные, полученные с помощью опросов экспертов Наряду с опросами населения важнейшим источником социальной информации являются опросы экспертов. Они используются для сбора информации по наиболее сложным проблемам, касающимся направлений трансформации экономики и общества. Такого рода вопросы можно адресовать лишь достаточно компетентным экспертам. Экспертные опросы начали проводиться и использоваться в России с начала 1990-х гг. В 1991-1993 гг. была сформирована "экспертная панель" в составе 200 экспертов. В последующие годы экспертные опросы получили широкое распространение и заняли заметное место в социологической науке. Формы их очень разнообразны. Опубликовано немало сборников с данными экспертных опросов, в которых немало полезных практических предложений и аналитических наблюдений. Экспертные панели Маркетинговое Агентство Step by Step постоянно заботится о повышении профессионализма и качества выполняемых работ. Одним из важнейших гарантов качества исследования является достоверность используемой информации. К сожалению, в силу специфики организации бизнеса в нашей стране большинство рынков являются закрытыми, многие предприятия не предоставляют информацию о своей деятельности, данные официальной статистики во многом неполные. Поэтому одним из основных способов получения информации о рынке являются беседы с экспертами. 67 Оптимальным способ организации работы с экспертами - это создание профессиональных сообществ на рынке или экспертных панелей. Сообщества специально создаются силами агентства путем целенаправленного поиска экспертов по выбранным рынкам. Со всеми участниками панели регулярно проводятся интервью о ситуации на рынке, прогнозах его изменения и других значимых вопросах. На основе этих и других данных регулярно выпускаются отчеты. Экспертная панель позволяет сделать рынок более прозрачным и понятным как для его игроков, так и для всех иных заинтересованных лиц. Со всеми участниками экспертных панелей поддерживаются регулярные контакты, происходит двухсторонний обмен информацией. Данные средств массовой информации Особенность этого вида информации состоит в том, что она не является целевой, т.е. собирается не для определенных целей (скажем, науки), а собственно ради информации, содержащейся в газетах, журналах, радио - и телепрограммах и т.п. Особенность информации, содержащейся в научной литературе, по тем или иным социально-экономическим вопросам состоит в том, что она представляет собой научно обработанные, прошедшие анализ и синтез данные по изучаемым проблемам, почерпнутые из разных источников. Отсюда достоинства этого вида информации - систематизированность, обобщенность, глубина, достоверность и др. 2. В условиях стремительной информатизации общества актуальной задачей для системы государственной статистики является использование современных информационных технологий для представления статистических данных с целью не только максимального удовлетворения потребностей пользователей статистики, но и лучшего понимания широкой публикой опубликованных официальных статистических данных. Обеспечение всех групп пользователей полной, достоверной и своевременной статистической информацией о социальном, экономическом, демографическом и экологическом положении страны – это одна из самых главных задач Федеральной службы государственной статистики. В этих условиях важнейшим показателем деятельности российской статистической службы становится оценка качества статистической информации пользователями, выражающаяся в их удовлетворенности этой информацией и в уровне доверия к ее производителю. Круг пользователей статистической информации весьма широк и охватывает такие разные их группы, как  органы государственной власти всех уровней,  коммерческие либо некоммерческие организации,  учебные заведения и исследовательские организации,  средства массовой информации,  граждане,  международные организации,  иностранные правительственные организации и  частные компании. Несмотря на разнообразие информационных запросов, пользователям всех категорий должен быть обеспечен равный доступ к статистическим данным, что является одной из центральных задач государственной статистики. Статистическая служба в своем взаимодействии с пользователями должна ориентироваться на общепринятые критерии оценки качества статистической информации, сформулированные в официальных документах Евростата, ОЭСР и других международных организаций:  релевантность,  конфиденциальность, 68     объективность, доступность и четкость, достоверность данных, оперативность и пунктуальность. 3. Инструментарий обследований предполагает комплексное изучение различных сторон деятельности статистической службы и различных характеристик получаемой статистической информации. При этом одновременно оценивается как уровень удовлетворенности предоставляемой информацией и услугами, так и уровень доверия к ее производителю. В обследованиях определяется степень использования респондентами в своей профессиональной деятельности статистических данных по различным предметным областям (рынок труда, уровень жизни населения, демография, социальная сфера, цены и тарифы, экономика, охрана окружающей среды). Статистические данные оцениваются по таким параметрам, как актуальность данных и их надежность, детализированность данных и оперативность выхода, периодичность представления и сопоставимость во времени. Изучаются также такие аспекты статистических данных, как легкость чтения и понимания материалов, наличие методических комментариев, графического представления информации, легкость ее дальнейшего использования. Полученные результаты свидетельствуют о достаточно высоком уровне удовлетворенности и доверия пользователей к официальной статистической информации, о позитивной оценке различных сторон деятельности статистической службы, прежде всего его сотрудников, и предлагаемых услуг. Табл. 1. Расчет индекса удовлетворенности пользователей официальной статистической информацией Показатель Значение показателя Средняя оценка качества статистической информации 7.24 Средняя оценка качества представления статистических данных 7.40 Средняя оценка информации, размещенной на сайте статистической службы 7.04 Средняя оценка обслуживания клиентов, получающих информацию по электронной почте и телефону 7.82 Средняя оценка работы сотрудников статистической службы 8.42 Средняя оценка доверия к важнейшим статистическим показателям, публикуемым Росстатом 6.84 Средний балл для общей оценки статистической службы 7.19 Средний балл для оценки деятельности Росстата в целом 6.92 Индекс удовлетворенности пользователя 7.36 Индекс доверия пользователей 7.03 69 В таблице приведены результаты проведенных 2008-2009 гг. пилотных обследований: Показатель 2008 г. 2009 г. Итоговый общий средний индекс удовлетворенности пользователя (Q) 7.36 7.71 Индекс доверия ( C ) 7.03 7.42 Средняя оценка качества статистической информации 7.24 7.50 Средняя оценка качества представления статистических данных 7.40 7.90 Средняя оценка информации, размещенной на сайте статистической службы 7.04 7.50 Средняя оценка обслуживания клиентов, получающих информацию по электронной почте и телефону 7.82 7.90 Средняя оценка работы сотрудников статистической службы 8.42 8.44 Средняя оценка доверия к важнейшим статистическим показателям, публикуемым Росстатом 6.84 7.24 Средний балл для общей оценки статистической службы 7.19 7.70 Средний бал для оценки деятельности Росстата в целом (общая удовлетворенность) 6.92 7.50 Составляющие индексы Результаты двух обследований свидетельствуют о достаточно высоком уровне удовлетворенности и доверия к официальной статистической информации (оценка 10 соответствует максимальному уровню удовлетворенности и доверия, 1 – абсолютной неудовлетворенности). Прослеживается отчетливая тенденция как к увеличению общего уровня доверия к статистическим данным (разность составляет около 0.5), так и их составляющим. Обследование пользователей статистической информации предполагается проводить с регулярностью один раз в год во всех федеральных округах. Обследование организуется независимой научно-исследовательской организацией социологического профиля, отбираемой на конкурсной основе. проведение обследований пользователей помогает Росстату лучше оценивать потребность и уровень удовлетворенности статистическими данными у различных категорий пользователей, определять степень их доверия к официальной статистической информации. Полученная информация по итогам проведенных обследований пользователей и накопленный методический опыт будут использованы Росстатом для дальнейшего развития системы обследований удовлетворенности пользователей деятельностью Росстата и качеством статистической информации. Официальные сайты государственных учреждений РФ www.kremlin.ru http://www.gks.ru Официальный сайт Президента РФ Госкомстат России Основные социально-экономические показатели России. Российская государственная 70 http://www.cbr.ru http://www.minfin.ru http://www.nalog.ru http://www.economy.gov.ru http://www.cea.gov.ru http://stat.hse.ru http://www.gov.ru http://www.council.gov.ru http://www.government.ru http://www.duma.gov.ru http://www.scrf.gov.ru http://www.cikrf.ru http://www.ksrf.ru http://www.supcourt.ru http://www.arbitr.ru http://www.fsb.ru http://www.fps.ru http://www.mchs.gov.ru www.mid.ru http://www.mvdinform.ru http://www.minjust.ru http://www.economy.gov.ru http://www.minfin.ru http://www.mintrans.ru http://www.minprom.gov.ru http://www.rosculture.ru http://www.mzsrrf.ru http://www.minsvyaz.ru http://www.ed.gov.ru Центральный Банк Российской Федерации Министерство финансов Российской Федерации Министерство по налогам и сборам Российской Федерации Министерство экономического развития и торговли Российской Федерации Центр Экономической коньюктуры при Правительстве Российской Федерации Базы данных экономической статистики РФ Сервер органов государственной власти РФ Официальный сайт Совета Федерации Федерального Собрания РФ Официальный сайт Правительства РФ Официальный сайт Государственной Думы РФ Официальный сайт Совета Безопасности РФ Официальный сайт Центральной избирательной комиссии РФ Официальный сайт Конституционного Суда РФ Официальный сайт Верховного Суда РФ Официальный сайт Высшего Арбитражного Суда РФ Официальный сайт Федеральной службы безопасности РФ Официальный сайт Пограничной службы ФСБ РФ Официальный сайт МЧС РФ статистика (1802 г. – наше время) Макроэкономическая статистика Официальный сайт Министерства РФ по делам гражданской обороны, чрезвычайным ситуациям и ликвидации последствий стихийных бедствий (МЧС России) МИД РФ Официальный сайт Министерства внутренних дел РФ Официальный сайт Министерства юстиции РФ Официальный сайт Министерства экономического развития и торговли РФ Официальный сайт Министерства финансов РФ Официальный сайт Министерства транспорта и связи РФ Официальный сайт Министерства промышленности и энергетики РФ Федеральное агентство по культуре и кинематографии РФ Официальный сайт Министерства здравоохранения и социального развития РФ Официальный сайт Министерства информационных технологий и связи РФ Официальный сайт Министерства образования и науки РФ  Литература 1. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.1, п.1.1. 71 Тема 2: «Статистические ряды распределения и их наглядное изображение Статистические ряды распределения и их наглядное изображение повышают эффективность использования информации Автор неизвестен План 1. Понятие рядов распределения 2. Параметры вариационных рядов распределения 3. Наглядное представление рядов распределения: полигон распределения, гистограмма распределения и кумулята. ВВЕДЕНИЕ. Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения. Первичные данные обрабатываются в целях получения обобщенных характеристик изучаемого явления по роду существенных признаков для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном рационально изложенном виде, удобном для использования и дальнейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины, с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований. Результаты сводки и группировки материалов статистического наблюдения можно представить в виде статистических рядов распределения, таблиц и графиков. Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по одному группировочному признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. На основе рядов распределения рассчитываются относительные величины структуры, средние показатели, устанавливается типичность обобщающих показателей. Ряды распределения, образованные по качественным признакам, называют атрибутивными. Пример атрибутивного ряда: Число случаев юридической Вид юридической помощи, оказанной помощи п/п адвокатами всего, тыс. % к итогу 1 Устные советы 5 109 69,43 2 Составление документов 991 13,47 3 Поручения по ведению уголовных дел 1021 13,87 4 Поручения по ведению гражданских 238 3,23 дел Всего: 7 359 100,00 72 Ряды распределения, построенные по количественному признаку, называются вариационными рядами. Примером атрибутивных рядов могут служить распределения населения по полу, занятости, национальности, профессии и т.д. Примером вариационного ряда распределения могут служить распределения населения по возрасту, рабочих – по стажу работы, заработной плате и т.д. Вариационные ряды распределения состоят их двух элементов: вариант и частот. Варианта – это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Частотами называются численности отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или процентах к итогу, называются частностями. Сумма частот составляет объем ряда распределения. Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Пример дискретного ряда распределения Группы семей, прожиЧисло семей № вающих в квартирах с всего, тыс. ед. % к итогу п/п числом комнат 1 1 4 064 16,3 2 2 12 399 49,7 3 3 7 659 30,7 4 4 и более 832 3,3 Всего 24 954 100,0 Для наглядного изображения дискретного ряда распределения строится полигон распределения. 14,000 12,000 10,000 8,000 6,000 4,000 2,000 0 0 1 2 3 4 5 Пример интервального ряда распределения. Выработка продавцов, Число Кумулятивная (накопленВ %-х к итогу тыс. руб. продав ная) численность продав73 А 80-100 100-120 120-140 140-160 160-180 Итого цов 1 8 12 20 8 2 50 цов 3 8 20 40 48 50 2 16 24 40 16 4 100 Гистограмма (или столбчатая диаграмма) применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. В результате мы получим гистограмму - график, на котором ряд распределения изображен в виде смежных друг с другом столбиков. 25 20 80-100 15 100-120 120-140 10 140-160 160-180 5 0 1 Для графического изображения вариационных рядов может также использоваться кумулятивная кривая. При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение. При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, т. е. кумуляту. 74 60 50 40 30 20 10 0 0 1 2 3 4 5 6  Вопросы для самоконтроля 1. 2. 3. 4. 5. Что представляет собой ряд распределения? Какие бывают ряды распределения? Из каких элементов состоит ряд распределения? Назовите виды графического представления рядов распределения? Как строится полигон распределения? Гистограмма? Кумулята?  Литература 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 7 С.58-71 Тема 3. Вариационный анализ. Показатели вариации Концентрация на понимании вариаций необходима для любого обоснованного анализа числовых значений. Генри Р. Нив «Пространство Доктора Деминга» План 1. Понятие и виды вариации. 2. Абсолютные и средние показатели вариации. 3. Показатели относительного рассеивания. Введение  Первой особенностью статистики как науки является то, что исследуются не отдельные факты, а массовые явления и процессы, выступающие как множества отдельных фактов, обладающих как индивидуальными, так и общими признаками. Единицы совокупности наряду с общими для всех единиц признаками, обусловливающими качественную определенность совокупности, обладают индивидуальными особенностями и различиями, отличающими их друг от друга, т. е. существует вариация признаков. Вариация этих признаков обусловлена различным сочетанием условий, составляющих развитие элементов множества. Вариация – это изменение величины либо значение признака при переходе от одного объекта (или группы объектов) к другому; точнее говоря – от одной единицы совокупности к другой. Обычно под вариацией мы понимает обусловленное перекрещивающимся влиянием различных факторов на данное явление изменение величин только в пределах однородной совокупности. Именно наличие вариации предопределяет необходимость статистики. Вариация признака отражается статистическим распределением. 1. Понятие и виды вариации 75 Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом отдельном случае. Средняя величина — это абстрактная, обобщающая характеристика признака изучаемой совокупности, но она не показывает строения совокупности, которое весьма существенно для ее познания. Средняя величина не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены ли они вблизи или значительно отклоняются от нее. В некоторых случаях отдельные значения признака близко примыкают к средней арифметической и мало от нее отличаются. В таких случаях средняя хорошо представляет всю совокупность. В других, наоборот, отдельные значения совокупности далеко отстают от средней, и средняя плохо представляет всю совокупность. Колеблемость отдельных значений характеризуют показатели вариации. Термин «вариация» произошел от латинского variatio –«изменение, колеблемость, различие». Однако не всякие различия принято называть вариацией. Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Различают вариацию признака: случайную и систематическую. Вариация, порождаемая существенными факторами, носит систематический характер, т.е. наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности. Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации. Степень близости данных отдельных единиц к средней измеряется рядом абсолютных, средних и относительных показателей. 2 Абсолютные и средние показатели вариации Для характеристики совокупностей и исчисленных величин важно знать, какая вариация изучаемого признака скрывается за средним. Для характеристики колеблемости признака используется ряд показателей. Размах колебаний (размах вариации) – это разность между наибольшим ( x mak ) и наименьшим ( x min ) значениями вариантов R  x mak  x min Среднее линейное отклонение вычисляется по следующим формулам: d для несгруппированных данных x i x n для сгруппированных данных (вариационного ряда) d  x x f f i  i i Основными обобщающими показателями вариации в статистике являются дисперсии и среднеквадратическое отклонение. Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от общей средней. Дисперсия обычно называется средним квадратом отклонений и обозначается S 2 и рассчитывается по следующим формулам: S 2  (x  x)  f i 2 — дисперсия невзвешенная (простая); i 76 S2   (x i  x)2 f i  fi — дисперсия взвешенная.  Замечание. Дисперсию удобнее рассчитывать по формуле: S 2  x 2  x 2 , где x 2 – среднее квадрата, x 2 – квадрат средней. Дисперсия имеет большое значение в статистическом анализе. Однако её применение как меры вариации в ряде случаев бывает не совсем удобным, потому что размерность дисперсии равна квадрату размерности изучаемого признака. В таких случаях для измерения вариации признака вычисляют среднеквадратическое отклонение. Среднеквадратическое отклонение представляет собой корень квадратный из дисперсии и обозначается S: s  s 2 Среднеквадратическое отклонение - это обобщающая характеристика абсолютных размеров вариации признака в совокупности. Выражается оно в тех же единицах измерения, что и признак (в метрах, тоннах, процентах, гектарах и т.д.). Среднеквадратическое отклонение является мерилом надежности средней. Чем меньше среднеквадратическое отклонение, тем лучше средняя арифметическая отражает собой всю представляемую совокупность. Вычислению среднеквадратического отклонения предшествует расчет дисперсии. Основные свойства дисперсии. Уменьшение или увеличение весов (частот) варьирующего признака в определенное число раз дисперсии не изменяет.  Уменьшение или увеличение каждого значения признака на одну и ту же постоянную величину А дисперсии не изменяет.  Уменьшение или увеличение каждого значения признака в k раз соответственно  2  уменьшает или увеличивает дисперсию в k раз, а среднеквадратическое отклонение - в k раз. Дисперсия признака относительно произвольной величины всегда больше дисперсии относительно средней арифметической на квадрат разности между средней и произвольной величиной: S 2  S A2  ( x  A) 2 . Если А равна нулю, то приходим к следующему равенству: S 2  x 2  x 2 , т.е. дисперсия признака равна разности между средним квадратом значений признака и квадратом средней. Каждое свойство при расчете дисперсии может быть применено самостоятельно или в сочетании с другими. Элементы дисперсионного или факторного анализа. 2 Общая дисперсия S общ характеризует общую вариацию признака под влиянием всех условий, всех причин, вызывающих эту вариацию. Для определения влияния постоянного фактора на величину вариации пользуются аналитической группировкой.. Размеры систематической вариации определяются при помощи дисперсии групповых средних. 2 М Мееж жггррууппппооввааяя ддииссппееррссиияя s характеризует колеблемость групповых или частных средних ( хi ) около общей средней (х ) и исчисляется по формуле: s 2  (x  i  x ) 2 ni  ni где x i – средняя по каждой отдельной группе, или групповая средняя (х ) - средняя по всей совокупности; n - число единиц совокупности; 77 ni - частоты или веса. Таким образом, межгрупповая дисперсия характеризует систематическую вариацию, которая возникает под влиянием фактора признака, положенного в основу группировки. Эту 2 дисперсию называют факторной дисперсией S факт Для определения влияния случайных факторов и их роли в общей вариации определяют дисперсию в пределах каждой группы, т.е. внутригрупповую дисперсию, а затем среднюю из внутригрупповых дисперсий. Внутригрупповая дисперсия s 2j отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признакафактора, положенного в основание группировки. Она исчисляется следующим образом: Sj 2  (x  ij  x j ) 2 n ij  nij Средняя из внутригрупповых дисперсий характеризует случ айную вариацию, которая возникает под влиянием всех факторов, кроме фактора, положенного в основание группировки. Эту дисперсию называют остаточной дис2 персией S ост . Чтобы определить её, надо рассчитать вначале внутригрупповые дисперсии по каждой группе в отдельности, а затем среднюю из них: 2 S 2j  S ост . Между общей дисперсией, факторной и остаточной дисперсий существует соотношение, определяемое правилом сложения дисперсий. Согласно этому правилу общая дисперсия равна сумме факторной и остаточной дисперсий: 2 2 2 S общ  S факт  S ост Зная любые два вида дисперсий, можно определить или проверить правильность расчета третьего вида. Правило сложения дисперсий позволяет выявить зависимость результата от определяющих факторов с помощью соотношения межгрупповой дисперсии и общей дисперсии. Соотношение   2 2 S факт 2 S общ называется эмпирическим коэффициентом детерми- нации. Он показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки. Корень квадратный из эмпирического коэффициента детерминации носит название эмпирического корреляционного отношения:  2 S факт 2 S общ Это отношение характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Если   0 , то группировочный признак не оказывает влияния на результативный. Если   1 , то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю. Промежуточные значения оцениваются в зависимости от их близости к предельным значениям. 78 3. Показатели относительного рассеивания Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%. 1. Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней. Ko  R *100% x 2. Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины. Kd  d *100% x V  S *100% x 3. Коэффициент вариации. Учитывая, что среднеквадратическое отклонение дает обобщающую характеристику колеблемости всех вариантов совокупности, коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин. При этом исходят из того, что если V больше 40 %, то это говорит о большой колеблемости признака в изучаемой совокупности.  Вопросы для самоконтроля Дайте определение понятию «вариация». Какие виды вариации можете перечислить? Что понимается под систематической и случайной вариацией? Какие существуют показатели вариации? Для каких целей они применяются? Размах вариации. Порядок расчета среднего линейного отклонения. Понятие дисперсии признака. Свойства дисперсии и ее расчет. Что такое среднеквадратическое отклонение и каков порядок его вычисления? Что такое коэффициент вариации, для каких целей он применяется и как рассчитывается? 11. В чем сущность показателя дисперсия? 12. Свойства и правила сложения дисперсий. 13. Эмпирическое корреляционное отношение и порядок его интерпретации.  Литература 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 6 С.46-57 2. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.4, п.4.1. 79 Тема 4: «Статистическое изучение взаимосвязей: непараметрические оценки» Взмах крыла бабочки в Айове может привести к тайфуну в Индонезии. Эдвард Лоренц Я размышлял о чудесных взаимосвязях в мире, о том, что посреди этой центральноазиатской степи я кормил монгольскую козу швейцарским сыром; сыр был произведен, так сказать, ее сородичами, теперь великий круг молочных продуктов сомкнулся – все, так мне вдруг показалось, было друг другу родственно, близко, доверительно и всегда оставалось частью нерасторжимого целого, ... Крахт К. Карта мира План 1. Понятие и виды статистической связи 2. Непараметрические методы оценки связи. 2. 1. Коэффициенты оценки связи качественных признаков, представленных двумя градациями. 2.2. Коэффициенты оценки связи качественных признаков, представленных несколькими градациями. 2.3. Коэффициент корреляции знаков. 2.4. Ранговая корреляция.  Коэффициент ранговой корреляции Спирмена;  Коэффициент конкордации 2.5. Коэффициент Фехнера. 1. Понятие и виды статистической связи Все явления общественной жизни взаимосвязаны, взаимозависимы и взаимообусловлены. Статистика рассматривает экономический закон как существенную и устойчивую связь между определенными явлениями и процессами. Познавая связи, статистика познает законы. А их знание позволяет управлять общественным развитием. Основой изучения связей является качественный анализ. Задачи статистики состоят в выявлении связи, определении ее направления и тесноты (силы). Наиболее же общая задача – это прогнозирование и регулирование социально-экономических явлений на основе полученных представлений о связях между явлениями. Взаимосвязанные признаки подразделяются (1) на факторные признаки – те, которые влияют на изменение других процессов и (2) результативные – те, которые изменяются под воздействием других признаков. Виды и формы связей, различаемые в статистике. Функциональная связь (зависимость) между двумя переменными величинами характеризуется тем, что каждому значению одной из них соответствует вполне определенное значение другой. Например, между радиусом круга r и его площадью S существует функциональная зависимость, которая выражается формулой S  r 2 . Однако на практике часто встречаются и такие виды связей между величинами, которые нельзя отнести к функциональным. Для статистической связи характерно то, что одному и тому же значению факторного признака может соответствовать сколько угодно различных значений результативного признака. Например, урожайность пшеницы зависит от дозы вносимых удобрений, но если 80 различные хозяйства будут вносить одну и ту же дозу удобрений на гектар, урожайность у них будет разная. Здесь связь проявляется лишь при достаточно большом количестве наблюдений и лишь в форме средней величины. Она не является точной зависимостью одного признака от другого. Корреляционная связь является частным случаем статистической связи В статистике связи также классифицируются  по направлению. Если с увеличением одного показателя, второй также возрастает, то связь между ними является прямой или положительной. Например, с увеличением спроса на какой-либо товар, увеличивается его предложение. Если же с увеличением одного показателя, второй снижается, то связь между ними называется обратной или отрицательной. Так увеличение цены на товар приводит, как правило, к снижению спроса на него.  по степени их тесноты (по силе). Функциональная связь является полной, а статистическая – неполной и неточной связью.  по форме различают линейные и нелинейные связи. Линейные связи моделируются линейной функцией регрессии y  b0  b1 x . Нелинейные связи могут моделироваться полиномами разных степеней, показательными, логарифмическими и другими функциями. Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной. Но кроме перечисленных различают также непосредственные, косвенные и ложные связи. Собственно, суть каждой из них очевидна из названия. В первом случае факторы взаимодействуют между собой непосредственно. Для косвенной связи характерно участие какой-то третьей переменной, которая опосредует связь между изучаемыми признаками. Ложная связь – это связь, установленная формально и, как правило, подтвержденная только количественными оценками. Она не имеет под собой качественной основы или же бессмысленна. Пример ложной связи. Мерой связи между двумя количественными признаками является выборочный коэффициент парной корреляции: чем ближе он к 1, тем теснее связь между признаками. Но часто бывает, что высокий коэффициент корреляции не содержит никакой полезной информации. Например, на основе ежегодных данных за период с 1866 по 1911 гг. было обнаружено, что коэффициент корреляции между смертностью в Англии и Уэльсе и пропорцией браков, зарегистрированных в англиканской церкви, составил 0,95, т.е. между смертностью и числом зарегистрированных браков обнаружена очень тесная положительная связь. Естественно, что обнаруженная зависимость является формальной и не может интерпретироваться как причинная. Выявление, обнаружение и изучение объективно существующих связей между явлениями и различными показателями, характеризующими социально-экономические процессы, является важнейшей задачей всякого научного исследования. Статистическое исследование зависимостей позволяет вскрыть причинноследственные отношения между явлениями, чтобы выявить факторы (признаки), оказывающие существенное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения – это связь явлений и процессов, при которых изменение одного из них – причины – ведет к изменению другого – следствия. Особое значение при исследовании причинно-следственных связей имеет выявление временной последовательности: причина всегда должна предшествовать следствию. Между сложными группами причин и следствий возможны многозначные связи, в которых одна причина будет вызывать то одно, то другое следствие или одно следствие будет иметь несколько разных причин. Чем сложнее изучаемое явление, тем труднее выявить причинно-следственные связи между ними. Особенностью причинно-следственных связей в социально-экономических явлениях является их транзитивность (опосредованная зависимость). 81 Для изучения, измерения и моделирования взаимосвязей между явлениями статистикой применяются различные методы: метод сопоставления параллельных рядов; балансовый метод; графический метод; методы аналитических группировок; дисперсионный анализ; корреляционно-регрессионный анализ. 2. Непараметрические методы оценки связи Методы корреляционного и дисперсионного анализа не универсальны: их можно применять, если все изучаемые признаки являются количественными. При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий), поэтому они получили название параметрических методов. Между тем в статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметрических методов оценки связи. Рассмотрим некоторые из них. 2.1. Коэффициенты оценки связи качественных признаков, представленных двумя градациями. Для оценки тесноты зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков, используют коэффициент ассоциации Кас и коэффициент контингенции Ккон. Для определения этих коэффициентов создается расчетная таблица (таблица «четырех полей»), где статистическое сказуемое схематически представлено в следующем виде: Признаки Итого: A (да) A (нет) B (да) a ab b B (нет) c d cd Итого: ac n bd Здесь a, b, c, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков A и A и B и Коэффициент ассоциации K ас  ad  bc . ad  bc B ; n – общая сумма частот.  ла ) можно рассчитать по формуле (коэффициент Ю Коэффициент контингенции (тетрахорический показатель связи, предложен Пирсоном в 1901 году) рассчитывается по формуле: K ас  ad  bc (a  b)(c  d )(b  d )( a  c) Замечание. 1. Для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации. 2. Связь считается подтвержденной, если K ac  0,5 или K кон  0,3 3. Для оценки статистической значимости К ас и К кон используется t  статистика : 3.1. Проверяется нулевая гипотеза H 0 : К ас  0 на уровне значимости Для проверки гипотезы необходимо 1) вычислить tфакт  верности, где mKас К ас mKас . - фактическое (наблюдаемое, опытное) значение критерия досто- 1  K ас2  2 1 1 1 1    - статистическая ошибка; a b c d 82 2) найти табличное (критическое, стандартное) значение t  критерия Стьюдента : tтабл ( ; k  n  2)  отвергается, если 3) сделать вывод: гипотеза H 0 : К ас  0 на уровне значимости t факт  t табл 3.2. При проверке нулевой гипотезы H 0 : К кон  0 на уровне значимости значение критерия достоверности находится по формуле: tфакт  К кон   фактическое n2 2 1  K кон Пример 1. В одном из отделений Сбербанка России исследовалась связь между наличием вклада и семейным положением вкладчиков на 01.01.2002 г. результаты обследования характеризуются следующими данными: Семейное положение Число вкладчиков, чел. Одинокие Семейные Итого 400 ( a  b ) 1250 ( c  d ) 1650 Из них Имеющие сбережения 250 ( a ) 800 ( c ) 1050 ( a  c ) Не имеющие сбережения 150 ( b ) 450 ( d ) 600( b  d ) 250  450  800  150  7500   0,03 250  450  800  150 232500 250  450  800  150  7500    0,0133 400  1250  1050  600 561248,608 K aс  K кон Вывод: наличие или отсутствие сбережений в обследуемом отделении Сбербанка России не зависит от семейного положения потенциальных вкладчиков. a. Коэффициенты оценки связи качественных признаков, представленных несколькими градациями. Если необходимо оценить тесноту связи между альтернативными признаками, которые могут принимать любое число вариантов значений, применяется коэффициент взаимной сопряженности Пирсона ( C ). Для исследования такого рода связи первичную статистическую информацию располагают в форме (многопольной корреляционной) таблицы: Признаки Итого: C A B D n11 n12 n13 E n21 n22 n 23 F n31 n32 n33 Итого: n i1 n i2 n n n n 1j i3 2j 3j Число пар наблюдений Здесь n ij - частоты взаимного сочетания двух атрибутивных признаков. Коэффициент взаимной сопряженности или полихорический показатель связи, предложенный Пирсоном, определяется по формуле C  2 , 12 где  2 - показатель (взаимной) среднеквадратической сопряженности: 83 n xy2 n xy2 1   2 n x ny  n nx y ,  Замечание. 1. Коэффициент взаимной сопряженности Пирсона имеет один большой недостаток: его значение существенно зависит от количества вариант коррелируемых качественных признаков. 2. Коэффициент взаимной сопряженности изменяется от 0 до 1. 3. Нулевая гипотеза H 0 : К ас  0 на уровне значимости  отвергается, если 2 2 для принятого уровня значимости и числа степеней свободы.  факт  N   2   твбл 2 4. Применение критерия  основано на требовании: при общем числе наблюдений не менее 50 в таблице должно содержаться не менее 5 вариант. Несоблюдение этих требований не гарантирует правильных выводов на основании выборочных показателей. Этого недостатка лишен коэффициент взаимной сопряженности Чупрова А.А.: K  2 Ч 2 (k1  1)( k 2  1) , где k1 , k2 - число групп первого и второго признаков (по каждо- му из признаков). Пример 2. С помощью коэффициента взаимной сопряженности проанализируйте зависимость распределения сотрудников строительной фирмы ООО «Скат» по категориям от уровня их образования: Категории сотрудников руководители служащие рабочие Образование Итого Высшее 10 30 5 45 Неполное высшее 7 25 10 42 Среднее специальное 2 15 50 67 Среднее 1 10 25 36 Итого 20 80 90 190 1  10 2 7 2 2 2 12  1  30 2 25 2 15 2 10 2  1  5 2 10 2 50 2 25 2                 20  45 42 67 36  80  45 42 67 36  90  45 42 67 36  1   2  1,326,  2  0,326 , k1  4, k2  3 1  2  C KЧ  0,326  0,496 1,326 0,326  0,365 ( 4  1)( 3  1) Вывод: связь близка к умеренной. Пример 3. Приведены данные о распределении выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей. С помощью коэффициента взаимной сопряженности проанализируйте зависимость занятости детей от занятости родителей, или выясните, существует ли преемственность в профессии детей. 84 Занятия родителей В промышленности и строительстве 1. Промышленность и строительство 2. Сельское хозяйство 3. Сфера обслуживания 4. Сфера интеллектуального труда 1   2  1,264, KЧ  Число детей, занятых В сельВ сфере обском хослуживания зяйстве В сфере интеллектуального труда всего 40 5 7 39 91 34 29 13 12 88 16 6 15 19 56 24 5 9 72 110 114 45 44 142 345  2  0,264 , C  0,264  0,457 1,264 0,263756  0,2965 (4  1)( 4  1) b. Коэффициент корреляции знаков. В социальных исследованиях нередко встречаются случаи, когда коррелирующие признаки выражаются не числами, а знаками: наличие признака – знаком плюс, отсутствие – знаком минус. В таких случаях для измерения корреляции используется формула: P( XY )  P( X )  P(Y ) , P( X )  ( P(Y )  (1  P( X ))(1  P(Y )) где P( XY ) – число совпадений положительных знаков в общей серии испытаний, отне      ; сенное к их числу n , т.е. P( XY )  n  () x , P(Y )   () y – частости положительных знаков для каждого P( X )  n n Rxy  признака отдельно. Коэффициент корреляции знаков изменяется от 0 до 1. Чем сильнее связь между признаками, тем этот показатель ближе к единице. Пример 4. Выясняли зависимость между упрямством детей X и строгостью требований родителей Y . Под наблюдением находилось 15 учащихся и их родителей из разных семей. Результаты наблюдений приведены в таблице. Признаки Номера испытуемых 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 + + + + + + + X + + + + + + Y Rxy  P( XY )  P( X )  P(Y )  P( X )  ( P(Y )  (1  P( X ))(1  P(Y )) 5 7 6   15 15 15  75  42  33  0,6 7 6 8 9 42  72 3024    15 15 15 15 . 85 Число + 7 6 Вывод: обнаружена заметная сопряженность между признаками. 2.4. Ранговая корреляция. Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты Спирмена (  ) и Кендалла ( ) . Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками при условии упорядочения их значений или ранжировании по степени убывания или возрастания признака. 1. Выборочный коэффициент ранговой корреляции Спирмена (1904 год) рассчитывается по формуле:  x / y  1  6   d i2 n( n 2  1) , где d i2 – квадрат разности рангов; n – число наблюдений (число пар рангов). Замечание. 1. Коэффициент ранговой корреляции Спирмена принимает любые значения в интервале  1;1. 2. Для оценки статистической значимости  используется t  статистика : Проверяется нулевая гипотеза H 0 :   0 на уровне значимости Для проверки гипотезы необходимо 1) вычислить tфакт   x / y  . n2 1   x2/ yн 2) найти табличное (критическое, стандартное) значение t  критерия Стьюдента : tтабл ( ; k  n  2) 3) сделать вывод: гипотеза H 0 : К ас  0 на уровне значимости  отвергается, если t факт  t табл . 3. При совпадении значения признака у различных единиц им присваивается объединенный средний порядковый номер. Например, если у 5-й и 6-й единиц совокупности значения признаков одинаковы, обе получат ранг, равный (5 + 6) / 2 = 5,5. Пример 5. По данным группы предприятий одной из отраслей промышленности установить зависимость между величиной балансовой прибыли и объемом реализованной продукции. Объем реалиБалансовая зованной проСравнение Разность Предприятие прибыль, Ранжирование дукции, млрд. рангов рангов млн. руб. руб. x y x Rx y Ry Rx Ry di=Rx-Ry 1 1,8 20 1,3 1 20 1 2 1 1 2 2,3 75 1,8 2 75 2 3 3 0 3 8,6 42 2,3 3 42 3 10 2 8 4 1,3 80 3,5 4 80 4 1 4 -3 5 3,5 107 3,7 5 107 5 4 5 -1 6 3,8 125 3,8 6 125 6 6 6 0 7 4,5 140 4,5 7 140 7 7 7 0 8 5,8 175 5,8 8 175 8 8 8 0 9 3,7 200 6,5 9 200 9 5 9 -4 10 6,5 210 8,6 10 210 10 9 10 -1 x/ y  1  6  92  0,442 10(10 2  1) 86 di2 1 0 64 9 1 0 0 0 16 1 92 Вывод: между величиной балансовой прибыли и объемом реализованной продукции обнаружена связь, близкая к умеренной. Пример 6. По данным итогов торгов на биржевом рынке установить зависимость средней цены сделки от номинальной стоимости акции с помощью коэффициента Спирмена. СредНоминяя цеРазЭмиСравнение нал, тыс. на Ранжирование ность тент рангов руб. сделки, рангов тыс. руб x y x Rx y Ry Rx Ry di=Rx-Ry di2 1 1 2 1 3 2 1 3 1 2 4 2 1 6 1 3 4 2,5 3 5 -2 4 3 1 4 1 3 4 2,5 3 2,5 0,5 0,25 4 1 4 1 3 5,7 4 3 2,5 0,5 0,25 5 2,5 7,8 1 3 6 5 6 6 0 0 6 10 16 2,5 6 7,8 6 9 8 1 1 7 10 10,8 5 7 10,8 7 9 7 2 4 8 5 20 10 9 16 8 7 10 -3 9 9 10 16,4 10 9 16,4 9 9 9 0 0 10 1 5,7 10 9 20 10 3 4 -1 1 23,5 x/ y  1  6  23,5  0,8576 10(10 2  1) Эмитент (с лат.emittentis – выпускающий) - учреждение или предприятие, выпускающее ценные бумаги, банкноты или бумажные деньги. 2. Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент ранговой корреляции (коэффициент конкордации W ), который вычисляется по формуле: 12  S , m  (n 3  n) W 2 где m – количество факторов; n – число наблюдений; S – отклонение суммы квадратов рангов от средней квадратов рангов  Замечание. Нулевая 2  факт  гипотеза H0 : W  0 на уровне значимости  отвергается, если 12  S 2   твбл ( , k  n  1) для принятого уровня значимости и числа степеm  n  (n  1) ней свободы. Пример 7. Оценить тесноту связи между уставным капиталом, числом выставленных акций и числом занятых на предприятиях, выставивших акции на аукционы (2001 год) Предприятие 1 Уставный капитал, тыс. руб. Число выставленных акций Число занятых на предприятии x y z x Rx y Ry z Rx Ry Rz 29540 856 119 16050 1 467 1 119 9 7 1 Ранжирование Сравнение рангов Сумма строк Квадрат суммы 17 289 87 2 16050 930 125 17000 2 495 2 125 1 9 2 12 144 3 41020 1563 132 17510 3 616 3 132 10 10 3 23 529 4 23500 682 141 17950 4 661 4 141 6 5 4 15 225 5 26250 616 150 22640 5 682 5 150 7 3 5 15 225 6 17950 495 165 23500 6 815 6 165 4 2 6 12 144 7 28130 815 178 26250 7 856 7 178 8 6 7 21 441 8 17510 858 181 28130 8 858 8 181 3 8 8 19 361 9 17000 467 201 29540 9 930 9 201 2 1 9 12 144 10 22640 661 204 41020 10 1563 10 204 5 4 10 19 361 165 2863 2722,5 1652 S  2863   140,5 10 12  S 12  140,5 W 2  2 3  0,189 3 m  (n  n ) 3 (10  10) 12  140,5 2  факт   6,24 3  10  (10  1)  т2абл (0,05, k  9)  16,919 2  факт   т2абл Вывод: 1) в выборочной совокупности обнаружена слабая связь между рассматриваемыми признаками; 2) на уровне значимости   0,05 принимается нулевая гипотеза о статистической незначимости коэффициента конкордации. 2.5 Коэффициент Фехнера. Простейшим непараметрическим показателем тесноты связи между двумя количественными признаками является коэффициент Фехнера, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Данный коэффициент определяется по формуле K Ф  СН СН где С - количество совпадений знаков отклонений индивидуальных величин от их средней арифметической; Н - соответственно количество несовпадений. Коэффициент Фехнера может изменяться в пределах -1,0 Кф +1,0. Пример 8. По каждому из 10 предприятий известна совокупная выработка (тыс. руб.) и численность сотрудников: X , чел. Y, тыс. руб. 1 2,62 23 2 3,04 32 3 3,15 50 4 3,83 53 5 3,58 55 6 4,08 58 7 4,09 59 8 4,2 62 9 4,18 69 10 4,24 75 Используя коэффициент Фехнера, сделайте вывод о наличии или отсутствии связи между показателями. Решение 88 Для расчета коэффициента Фехнера K Ф  СН необходимо найти его знаки разностей СН (отклонений) каждого из показателей от их среднего значения, а затем подсчитать число совпадений (С) и несовпадений (Н) Расчёты выполним в таблице: Указать С (совпадение Разности Разности знаков) Y, тыс. руб. X , чел. yi  y xi  x или Н (несовпадение знаков) 1 2,62 23 -1,081 -30,6 С 2 3,04 32 -0,661 -21,6 С 3 3,15 50 -0,551 -3,6 С 4 3,83 53 0,129 -0,6 Н 5 3,58 55 -0,121 1,4 Н 6 4,08 58 0,379 4,4 С 7 4,09 59 0,389 5,4 С 8 4,2 62 0,499 8,4 С 9 4,18 69 0,479 15,4 С 10 4,24 75 0,539 21,4 С Сумма 37,01 536 Средняя 3,701 53,6 Анализ расчетов показывает, что число совпадении C  8 , а число несовпадений знаков разностей H  2 , следовательно, K Ф  82  0,6 , т.е. наблюдается умеренная положи10 тельная связь между показателя  Вопросы для самопроверки 1. В чем заключаются основные задачи изучения и измерения связи между явлениями? 2. Какая связь называется функциональной и в каких областях науки она наиболее широко распространена? 3. Какая связь называется корреляционной и в чем ее сущность? 4. Какие бывают виды связи по направлению? 5. Что такое парная связь? 6. Что представляет собой прямолинейная и криволинейная связь и как она выражается математически? 7. Какие методы применяются статистикой для установления измерения связи между явлениями? 8. Назовите непараметрические методы обнаружения связей между признаками. 9. На чем основан коэффициент корреляции знаков и как он исчисляется? 10. Как определяется коэффициент корреляции рангов? 11. Когда применяется коэффициент ассоциации и порядок его вычисления? 12. В каких случаях применяется коэффициент взаимной сопряженности и порядок его вычисления?  Литература 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 11 С.113-122 Тема 5: «Выборочный метод наблюдения» Идея выборочного метода использовалась в Древнем Египте и 89 античной Греции при изучении явлений хозяйственной жизни, а в Русском государстве XVII и XVIII вв. она применялась для определения величины всего урожая по пробным ужинам и умолотам . По материалам книги "Историк и математика" Б.Н. Миронов, З.В. Степанов План 1. Понятие выборочного метода. Задачи выборочного метода 2. Определение объёма выборки 3. Ошибки, возникающие при выборочном наблюдении, и их оценка 1. Понятие выборочного метода. Задачи выборочного метода Статистическое наблюдение можно организовать как сплошное, так и несплошное. Сплошное наблюдение предполагает обследование всех единиц изучаемой совокупности и связано с большими трудовыми и материальными затратами. Изучение лишь некоторой части единиц совокупности называется несплошным наблюдением. В статистической практике самым распространенным видом несплошного наблюдения является выборочное наблюдение. Выборочное наблюдение должно быть организовано таким образом, чтобы эта часть отобранных единиц в уменьшенном масштабе представляла (презентовала) всю изучаемую (или генеральную) совокупность. Определение. Часть единиц генеральной совокупности, подлежащая непосредственному наблюдению, называется выборочной совокупностью или выборкой. Система правил отбора единиц и способов характеристики изучаемой совокупности исследуемых единиц составляет содержание выборочного метода. Совокупность, из которой производится отбор, называется генеральной, и все ее обобщающие показатели — генеральными. Совокупность отобранных единиц называют выборочной совокупностью, и все ее обобщающие показатели — выборочными. Основная задача выборочного наблюдения состоит в том, чтобы на основе характеристик выборочной совокупности получить достоверные суждения о показателях генеральной совокупности. Таблица. Основные параметры генеральной и выборочной совокупностей 90 Имеется ряд причин, в силу которых, во многих случаях выборочному наблюдению отдается предпочтение перед сплошным наблюдением: • экономия времени и средств в результате сокращения объема работы; • сведение к минимуму порчи или уничтожения исследуемых объектов, так как сплошное исследование может привести к уничтожению генеральной совокупности (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность); • необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей); • достижение большой точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации. Преимущество выборочного наблюдения по сравнению со сплошным наблюдением можно реализовать, если оно организовано и проведено в строгом соответствии с научными принципами теории выборочного метода. Такими принципами являются обеспечение:  случайности (равной возможности попадания в выборку) отбора единиц и  достаточного числа единиц наблюдения. Соблюдение этих принципов позволяет получить объективную гарантию репрезентативности полученной выборочной совокупности. Понятие репрезентативности отобранной совокупности не следует понимать как ее представительство по всем признакам изучаемой совокупности, а только в отношении тех признаков, которые изучаются, или оказывают существенное влияние на формирование сводных обобщающих характеристик. 2. Определение объёма выборки Существуют пять основных способов организации выборочного наблюдения: 91 1. Простой случайный отбор, при котором 𝑛 объектов случайно извлекаются из генеральной совокупности 𝑁 объектов (например с помощью таблицы или датчика случайных чисел), причем каждая из возможных выборок имеют равную вероятность. Такие выборки называются собственно-случайными. 2. Простой отбор с помощью регулярной процедуры осуществляется с помощью механической составляющей (например, даты, дня недели, номера квартиры, буквы алфавита и др.) и полученные таким способом выборки называются механическими. 3. Стратифицированный отбор заключается в том, что генеральная совокупность объема 𝑁 подразделяется на подсовокупности или слои (страты) объема 𝑁1 , 𝑁2 , … , 𝑁𝑘 так что 𝑁1 + 𝑁2 + ⋯ + 𝑁𝑘 = 𝑁 . Страты представляют собой однородные объекты с точки зрения статистических характеристик (например, население делится на страты по возрастным группам или социальной принадлежности; предприятия — по отраслям). В этом случае выборки называются стратифицированными (иначе, расслоенными, типическими, районированными). 4. Методы серийного отбора используются для формирования серийных или гнездовых выборок. Они удобны в том случае, если необходимо обследовать сразу "блок" или серию объектов (например, партию товара, продукцию определенной серии или население при территориально-административном делении страны). Отбор серий можно осуществить собственно-случайным или механическим способом. При этом проводится сплошное обследование определенной партии товара, или целой территориальной единицы (жилого дома или квартала). 5. Комбинированный (ступенчатый) отбор может сочетать в себе сразу несколько способов отбора (например, стратифицированный и случайный или случайный и механический); такая выборка называется комбинированной. Виды и методы (способы) отбора По виду различаются индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе — качественно однородные группы (серии) единиц, а комбинированный отбор предполагает сочетание первого и второго видов. По методу отбора различают повторную и бесповторную выборку. Бесповторным называется отбор, при котором попавшая в выборку единица не возвращается в исходную совокупность и в дальнейшем выборе не участвует; при этом численность единиц генеральной совокупности 𝑁 сокращается в процессе отбора. При повторном отборе попавшая в выборку единица после регистрации возвращается в генеральную совокупность и таким образом сохраняет равную возможность наряду с другими единицами быть использованной в дальнейшей процедуре отбора; при этом численность единиц генеральной совокупности 𝑁 остается неизменной (метод в социально-экономических исследованиях применяется редко). Однако, при большом объёме генеральной совокупности 𝑁 (𝑁 → ∞) формулы для бесповторного отбора приближаются к аналогичным формулам для повторного отбора и практически чаще используются последние (𝑁 = 𝑐𝑜𝑛𝑠𝑡).Для проведения выборочного наблюдения возникает потребность в определении численности выборки, которая необходима для обеспечения точности расчёта генеральных параметров, таких как средняя и других. Таблица. Формулы объема 𝑛 выборки для разных видов выборочного наблюдения 92 3. Ошибки, возникающие при выборочном наблюдении, и их оценка Выборочный метод исследования генеральной совокупности неизбежно сопровождается ошибками – ошибками репрезентативности. Ошибки репрезентативности присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Они представляют собой расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при сплошном наблюдении, т. е. между величинами выборочных и соответствующих генеральных показателей. Для каждого конкретного выборочного наблюдения значение ошибки репрезентативности может быть определено по соответствующим формулам, которые зависят от вида, метода и способа формирования выборочной совокупности. Таблица. Ошибки выборочной средней 𝑚𝑥 и выборочной доли видов выборки 𝑚𝑝 для разных 93 Распространение выборочных результатов на генеральную совокупность Конечной целью выборочного наблюдения является характеристика генеральной совокупности. При малых объемах выборки эмпирические оценки параметров (𝑥 и 𝑤) могут существенно отклоняться от их истинных значений (𝜇 и 𝑝). Поэтому возникает необходимость установить границы, в пределах которых для выборочных значений параметров (𝑥 и 𝑤) лежат истинные значения (𝜇 и 𝑝). Доверительным интервалом какого-либо параметра 𝜃 генеральной совокупности называется случайная область значений этого параметра, которая с вероятностью близкой к 1 (надежностью) содержит истинное значение этого параметра. Предельная ошибка выборки ∆ позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы, которые равны: для средней 𝜇 = 𝑥 ± ∆𝑥 = 𝑥 ± 𝑡 ∙ 𝑚𝑥 для доли 𝑝 = 𝑤 ± ∆ 𝑤 = 𝑤 ± 𝑡 ∙ 𝑚𝑤 Нижняя граница доверительного интервала получена путем вычитания предельной ошибки из выборочного среднего (доли), а верхняя — путем ее добавления. Доверительный интервал для средней использует предельную ошибку выборки и для заданной доверительной вероятности 𝑃 определяется по формуле: 𝑥 − 𝑡 ∙ 𝑚𝑥 < 𝜇 < 𝑥 + 𝑡 ∙ 𝑚𝑥 для доли: 𝑤 − 𝑡 ∙ 𝑚𝑤 < 𝑝 < 𝑤 + 𝑡 ∙ 𝑚𝑤 При расчете доверительного интервала для трех стандартных доверительных вероятностей 𝑃 = 95%, 𝑃 = 99% и 𝑝 = 99,9% с числом степеней свободы 𝑘 = 𝑛 − 1 значение кратности ошибки 𝑡 выбирается по таблице Стьюдента. Если объем выборки достаточно велик, то соответствующие этим вероятностям значения 𝑡 равны: 1,96, 2,58 и 3,29. Таким образом, предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы. 94 При планировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки необходимо правильно оценить требуемый объем выборки. Этот объем может быть определен на основе допустимой ошибки при выборочном наблюдении исходя из заданной вероятности 𝑃 , гарантирующей допустимую величину уровня ошибки (с учетом способа организации наблюдения). Формулы для определения необходимой численности выборки 𝑛 легко получить непосредственно из формул предельной ошибки выборки. Так, из выражения для предельной ошибки  t 2  2  t n  непосредственно определяется объем выборки . 2 n Эта формула показывает, что с уменьшением предельной ошибки выборки Δ существенно увеличивается требуемый объем выборки , который пропорционален дисперсии и квадрату критерия Стьюдента . Практические примеры расчета Пример. Для оценки скорости расчета с кредиторами в банке проведена случайная выборка 10 платежных документов. Их значения оказались равными (в днях): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20. Необходимо с вероятностью 𝑃 = 0,954 определить предельную ошибку ∆𝑥 выборочной средней и доверительные интервалы среднего времени расчетов. Решение. Среднее значение вычисляется по формуле x  2 Дисперсия вычисляется по формуле s   x i  x n 1 x n i  12дн.  53дн. 2 Среднеквадратическое отклонение (погрешность)   s  7,3дн. Ошибка средней вычисляется по формуле: m x    2,3дн. n Численность генеральной совокупности 𝑁 неизвестна, и для 𝑃 = 0,954 кратность ошибки составляет t  2 . Предельную ошибку вычислим по формуле ∆𝑥 = 𝑡 ∙ 𝑚𝑥 = 2 ∙ 2,3 = 4,6 дней. Таким образом, истинное значение генерального параметра лежит в пределах 12 − 4,6 < 𝜇 < 12 + 4,6 (дн) или от 7,4 до16,6 дней. Из теории статистического оценивания полезно иметь в виду следующее: На практике вокруг выборочного значения строится такой интервал, который бы с заданной (достаточно высокой) вероятностью – доверительной вероятностью – "накрывал" бы истинное значение этого параметра в генеральной совокупности. Этот интервал в математической статистике называется доверительным интервалом . Доверительная вероятность P – это степень уверенности в том, что доверительный интервал действительно будет содержать истинное (неизвестное) значение параметра в генеральной совокупности. • Доверительная вероятность выражается процентом выборок данного объема, которые дают доверительные интервалы, содержащие значение в генеральной совокупности. • 95 Например, если доверительная вероятность P равна 0,90 или 90%, это значит, что 90 выборок из 100 (то есть 0,90 или 90%) дадут правильную оценку параметра в генеральной совокупности. • Очевидно, что степень уверенности (доверительная вероятность) зависит от величины интервала: чем шире интервал, тем выше уверенность , что в него попадет неизвестное значение для генеральной совокупности. • На практике для построения доверительного интервала берется, как минимум, удвоенная ошибка выборки, чтобы обеспечить уверенность не менее 95%.  Вопросы для самоконтроля 6. Чем отличается выборочное наблюдение от сплошного? 7. В чём состоит задача выборочного наблюдения? 8. Назовите преимущества и недостатки выборочного наблюдения. 9. Назовите основные способы организации выборочного наблюдения. 10. Дайте понятие бесповторной и повторной выборкам. 11. Какие вы знаете научные принципы теории выборочного метода? 12. Почему возникают ошибки репрезентативности и что они собой представляют? 13. Дайте понятие доверительной вероятности и доверительного интервала. 14. Как построить доверительный интервал для генеральной средней и доли средней? 15. Какие данные необходимы для вычисления необходимого объёма выборки?  Список литературы Основная литература  Литература 1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. 2. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Дополнительная литература 1. Батуева А. Д., Петецкая Е. П., Кокарев М. А. Статистика: учебное пособие. М., «Экзамен», 2008. 2. Елисеева И.И., Юзбашев М.М. Общая теория статистики: учебник. 4-е изд. доп. и перер. М., Финансы и статистика, 2000. 3. Ефимова М.Р., и др. Практикум по общей теории статистики: учебное пособие. М., Финансы и статистика, 2000. 4. Колесникова И. И., Круглякова Г. В. Статистика: учебное пособие. М., «Новое знание», 2007. 5. Мхитарян В.С.Статистика. М., «Мастерство», 2004. 6. Общая теория статистики. Методические указания и задачи. Под ред. Салина В.Н., Поповой А.А., Шпаковой Е.П., М.:ФА, 2000. 7. Общая теория статистики. Под ред. А.А. Спирина, О.Э. Башиной, М., "Финансы и статистика", 1996. 8. Просветов Г. И. Статистика: задачи и решения: учебно-практическое пособие. М., «Альфа-Пресс», 2008. 9. Практикум по теории статистики. Под ред. Р.А. Шмойловой, М., "Финансы и статистика", 2004. 10. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.– 480 с. Гл. 11 С.113-122 96 11. Сиденко А.В. и др. Статистика: Учебник.– М.: Издательство «Дело и Сервис», 2000.- 464 с. Гл. 9 С.67-86 Другие источники информации и средства обеспечения освоения дисциплины Важное значение при изучении дисциплины отдается наглядным пособиям, рекомендации отдельных Интернет сайтов, использованию электронных таблиц, а также различной периодической литературы. 1. 2. 3. 4. Периодические издания Вопросы статистики. Вопросы экономики. Российский экономический журнал. Экономист. Информационные сайты 1. www.gks.ru/ - Федеральная служба государственной статистики. 2. www.infostat.ru – Информационно-издательский центр «Статистика России» 3. www.gmcgks.ru - Главный межрегиональный центр обработки и распространения статистической информации Федеральной службы государственной статистики (ГМЦ Росстата) 4. gs.spylog.ru - Глобальная статистика 5. www.destat.de - сайт статистического ведомства Германии 6. unstats.un.org/unsd/ - United Nations, Statistics Division (UNSD) 7. www.weforum.org - World Economic Forum 8. www.euro.ru 9. www.ibk.ru 97

Содержание Предисловие Введение. Роль статистики, её задачи и организация

Related documents

Products

Support

Содержание Предисловие Введение. Роль статистики, её задачи и организация

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib