2. Статистическое наблюдение

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
ФГБОУ ВПО Уральский государственный лесотехнический
Университет
Институт экономики и управления
Кафедра менеджмента и внешнеэкономической деятельности
предприятия
Н.А.Комарова
Курс лекций по дисциплине
СТАТИСТИКА
Екатеринбург 2015
Содержание
ТЕОРИЯ СТАТИСТИКИ .................................................................................... 4
1. Предмет, метод и основные категории статистики как науки ................ 4
1.1. Понятие статистики ...................................................................................... 4
1.2. Основные категории статистики ................................................................. 4
1.3. Метод статистики ......................................................................................... 7
2. Статистическое наблюдение ........................................................................... 8
2.1. Понятие статистического наблюдения ....................................................... 8
2.2. Программно-методологические вопросы статистического
наблюдения .................................................................................................... 8
2.3. Формы, виды и способы статистического наблюдения ......................... 10
2.4. Точность наблюдения................................................................................. 12
3. Сводка и группировка статистических данных ....................................... 13
3.1. Понятие и виды сводки .............................................................................. 13
3.2. Понятие и виды группировок .................................................................... 13
3.3. Статистические ряды распределения ....................................................... 15
4. Абсолютные и относительные статистические показатели................... 16
4.1. Абсолютные показатели ............................................................................ 16
4.2. Относительные показатели ........................................................................ 16
Задачи по теме...................................................................................................... 18
5. Метод средних величин и вариационный анализ .................................... 20
5.1. Средние величины ...................................................................................... 20
5.2. Показатели вариации .................................................................................. 22
6. Выборочное наблюдение................................................................................ 25
6.1. Понятия, преимущества и научные принципы выборочного
наблюдения .................................................................................................. 25
6.2. Понятие генеральной и выборочной совокупности ................................ 26
6.3. Ошибки выборочного наблюдения ........................................................... 27
6.4.Методы, виды и способы отбора единиц из генеральной совокупности
....................................................................................................................... 28
6.5. Понятие малой выборки ............................................................................. 31
6.6. Распространение данных выборочного наблюдения на генеральную
совокупность ............................................................................................... 32
Задачи по теме...................................................................................................... 32
7. Индексы ............................................................................................................ 34
7.1. Понятие индексов и их классификация .................................................... 34
7.2.Индивидуальные и общие индексы. Агрегатный индекс как основная
форма общего индекса ............................................................................... 36
7.3. Средние индексы ........................................................................................ 40
7.4. Индексы переменного и постоянного состава, индекс структурных
сдвигов ......................................................................................................... 41
7.5. Цепные и базисные индексы ..................................................................... 43
Задачи по теме...................................................................................................... 44
8. Ряды динамики ................................................................................................ 48
8.1. Понятие рядов динамики, их виды и требования к построению ........... 48
8.2. Показатели ряда динамики ........................................................................ 49
8.3. Средние показатели ряда динамики ......................................................... 51
8.4. Методы выявления тенденции развития явления в ряду динамики ...... 52
8.5. Прогнозирование и экстраполяция в ряду динамики ............................. 53
8.6. Методы изучения сезонных колебаний .................................................... 55
Задачи по теме...................................................................................................... 56
9. Статистическое изучение взаимосвязей социально–экономических
явлений .................................................................................................................. 61
9.1. Виды и формы взаимосвязей между явлениями ..................................... 61
9.2. Методы измерения связей между количественными признаками ........ 62
9.3. Однофакторный линейный корреляционно-регрессионный анализ ..... 65
9.4. Многофакторный линейный корреляционно-регрессионный анализ... 68
9.5. Измерение тесноты связей между качественными (атрибутивными)
признаками .................................................................................................. 72
9.6. Непараметрические показатели связи ...................................................... 73
Задачи по теме...................................................................................................... 75
ТЕОРИЯ СТАТИСТИКИ
1. Предмет, метод и основные категории статистики как науки
1.1. Понятие статистики
Термин «статистика» происходит от латинского слова «status», которое
вошло в употребление в Германии в середине 18 века. Впервые статистику
как науку стал преподавать немецкий ученый профессор философии и права
Г.Ахенваль. Статистика связана со многими науками, которые изучают социально-экономические, биологические и иные процессы и явления.
Статистика – отрасль общественной науки, которая изучает количественную сторону качественно определенных массовых социальноэкономических явлений и процессов, их структуру и распределение, размещение в пространстве, движение во времени, выявляя действующие количественные зависимости, тенденции и закономерности в конкретных условиях
места и времени.
Статистическая наука включает:
общую теорию статистики – изложение общих правил сбора и обработки массовых данных;
теорию вероятностей – науку о свойствах генеральной совокупности
бесконечно большого объема;
математическую статистику, рассматривающую правила оценивания
параметров и свойств генеральной совокупности по данным выборки;
 статистику финансов;
социально-экономическую статистику и статистику населения.
Предмет статистики – это количественная сторона массовых социально-экономических явлений и процессов, которая изучается неразрывно с их
качественной стороной.
Отличие статистики от других общественных наук в том, что она обеспечивает количественно-качественную характеристику общественных явлений в конкретных условиях места и времени.
Задача статистического исследования состоит в получении обобщающих
показателей и выявлении закономерностей общественной жизни в конкретных условиях места и времени, которые проявляются лишь в большой массе
явлений через преодоление случайности, свойственной единичным элементам. Чтобы охарактеризовать массовое общественное явление или процесс в
целом, необходимо рассмотреть всю или очень большую массу относящихся
к ним отдельных явлений и процессов.
1.2. Основные категории статистики
Объектом изучения статистики являются статистические совокупности.
Статистическая совокупность – это множество единиц, обладающих
массовостью, однородностью, определенной целостностью, взаимозависимостью состояний и наличием вариации.
Совокупность называется однородной, если один или несколько изучаемых существенных признаков ее объектов являются общими для всех единиц. Совокупность оказывается однородной именно с точки зрения этих признаков.
Статистическая совокупность представляет собой реально существующее множество однородных элементов, обладающих общими признаками и
внутренней связью.
В качестве статистической совокупности могут рассматриваться,
например, совокупность жителей России по состоянию на 1 января 2013 г.,
совокупность студентов 3 курса УГЛТУ в 2012–2013 учебном году, совокупность основных фондов предприятия по состоянию на конец 2012 года и т.п.
Статистические совокупности имеют определенные свойства, носителями которых выступают единицы совокупности, обладающие определенными признаками.
Единица совокупности является первичным элементом статистической
совокупности. Например, житель России, студент, отдельные виды основных
фондов и т.п.
По характеру отображения свойств единиц совокупности (по форме выражения) признаки делятся на количественные и качественные (неколичественные, атрибутивные). Первые имеют числовое выражение (возраст человека, цена за единицу продукции и т.д.), а вторые отражают состояние
единицы совокупности (пол человека, отраслевая принадлежность предприятия и т.д.)
Количественные признаки делятся на дискретные и непрерывные.
Вариация – различия в значениях того или иного признака у отдельных
единиц, входящих в данную совокупность. Она возникает в результате того,
что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом
отдельном случае. Например, заработная плата каждого работника зависит от
его профессии, объема работы, уровня образования, стажа работы и т.д.
Дискретной (прерывной) вариацией признака называется такая, при
которой отдельные значения варианты отличаются на некоторую конечную
величину (отдельные значения варианты отличаются на единицу, например
численность занятых в экономике, основные фонды в натуральном выражении).
Вариация называется непрерывной, если отдельные значения признака
могут отличаться друг от друга на сколько угодно малую величину (стоимость продукции, материальных активов).
Качественные статистические признаки подразделяются на альтернативные и агрегатные.
Альтернативный признак – неколичественный признак, имеющий две
взаимоисключающие разновидности, принимающий только два значения.
Альтернативными признаками являются пол человека, место проживания
(город, село), ходовая система трактора (гусеничная или колесная).
Признаки также подразделяются на существенные (главные), выражающие содержательную сторону явлений, и несущественные (второстепенные).
Определенный порядок изменения явлений - это статистическая закономерность.
Статистическая закономерность проявляется в структуре, динамике и
взаимосвязях социально-экономических явлений.
Статистический показатель – это понятие (категория), отображающее количественные характеристики соотношения признаков общественных
явлений.
Статистический показатель - это количественная обобщающая
оценка свойств изучаемого явления, количественная характеристика качественно определенного социально-экономического явления. Этим он отличается от индивидуальных значений – признаков. Например, размер вклада в
банке конкретного человека – признак, а средний размер вклада граждан
страны – показатель.
Статистические показатели могут быть первичными и вторичными. Первичные показатели характеризуют либо общее число единиц совокупности
(общая численность студентов вуза), либо сумму значений какого-либо признака (объем реализованной продукции предприятия за год). Вторичные
(производные, расчетные) показатели выражаются средними и относительными величинами (средняя заработная плата по отрасли, производительность
труда работников предприятия).
Показатели, характеризующие сложный
комплекс социальноэкономических явлений и процессов, называют синтетическими (ВВП – валовой внутренний продукт, ВНД – валовой национальный доход).
В зависимости от объема и содержания объекта статистического обследования различают индивидуальные (характеризующие отдельные единицы
совокупности) и сводные (обобщающие) статистические показатели.
Все статистические показатели могут быть плановыми, отчетными и
прогнозными.
Например, по отношению к характерному свойству статистический показатель «объем реализованной продукции предприятия» классифицируется
как прямой.
1.3. Метод статистики
Особенность предмета статистики заключается в изучении массовых
варьирующих явлений, что и определяет специфику статистического метода.
Статистическая методология представляет собой совокупность общих
правил и специальных приёмов и методов статистического исследования.
В процессе исследования своего предмета статистика применяет специфические методы цифрового освещения явления, которые находят свое выражение в трех этапах (стадиях) статистического исследования
Статистический метод включает следующие этапы:
1. Сбор данных (статистическое наблюдение). Это массовое научно организованное наблюдение, с помощью которого получают первичную
информацию об отдельных единицах (фактах) изучаемого явления.
На этом этапе используется метод массовых наблюдений.
Статистическое наблюдение представляет исходный материал для
статистических обобщений.
2. Обобщение, представление. На этом этапе используется метод сводки
и группировки, который представляет собой разделение единиц совокупности на однородные группы и подгруппы, подсчет по ним общих
итогов и оформление полученных результатов в виде статистических
таблиц.
3. Анализ и интерпретация. Для этого используются методы анализа с
помощью обобщающих показателей. Проведение анализа позволяет
определить причинно-следственные связи изучаемых явлений и процессов, определить влияние и взаимодействия различных факторов,
оценить эффективность принимаемых управленческих решений, их
возможные экономические и социальные последствия.
Федеральная служба государственной статистики (Росстат, ранее
Госкомстат) является федеральным органом исполнительной власти, осуществляющим функции по формированию официальной статистической информации о социальном, экономическом, демографическом и экологическом
положении страны, а также функции по контролю и надзору в области государственной статистической деятельности на территории Российской Федерации.
Федеральная служба государственной статистики является Центральным учетно-статистическим органом Российской Федерации.
Руководство деятельностью Федеральной службы государственной
статистики России осуществляет Правительство РФ.
На основании Указа Президента РФ от 04.03.2009 № 314 Госкомстат
был преобразован в Росстат.
Система органов государственной статистики образована в соответствии с административно-территориальным делением страны.
Низовым органом Федеральной службы государственной статистики
РФ является городской отдел.
Деятельность территориальных органов Росстата характеризуют
следующие в утверждения: они осуществляют полномочия Росстата на определенной территории в соответствии со схемой размещения территориальных органов; действуют в соответствии с законодательством РФ, Положением о Федеральной службе государственной статистики и положением о территориальном органе.
Одной из основных задач Федеральной службы государственной статистики (Росстата) является представление официальной статистической информации различным пользователям.
Работник, для которого сбор статистических данных является профессиональной деятельностью, называется статистиком.
Центральным статистическим журналом в Российской Федерации является журнал вопросы статистики.
2. Статистическое наблюдение
2.1. Понятие статистического наблюдения
Первой стадией статистических исследований является статистическое
наблюдение – научно организованный сбор сведений об изучаемых социально-экономических процессах или явлениях.
Характерным для этой стадии является метод массовых наблюдений.
Это объясняется тем, что статистика изучает закономерности, которые выявляются через исследование многочисленных массовых явлений под действием закона больших чисел.
Задачей статистического наблюдения является сбор массовых данных
об изучаемых явлениях (процессах).
Основные черты статистического наблюдения
Массовость - наблюдение охватывает большое число случаев проявления исследуемого явления.
Достоверность - наблюдение обеспечивает соответствие первичных
данных исследования их фактическому уровню.
Систематичность - наблюдение проводится либо систематически, либо регулярно, либо непрерывно.
2.2. Программно-методологические вопросы статистического
наблюдения
К программно-методологическим вопросам статистического наблюдения
относятся:
 установление цели наблюдения;
 определение объекта и единицы наблюдения;
 разработка программы наблюдения;
 выбор вида и способа наблюдения.
Основной практической целью статистического наблюдения является
получение достоверной информации для выявления закономерностей развития явлений и процессов.
Объект наблюдения - статистическая совокупность, в которой протекают исследуемые явления. Объектом может быть совокупность физических
лиц (население страны, студенты вуза), физические единицы (жилые дома,
машины), юридические лица (предприятия, вузы).
Объект наблюдения – это исследуемая статистическая совокупность.
Она состоит из отдельных единиц.
Единица наблюдения представляет первичный элемент объекта статистического наблюдения. Этот элемент является носителем регистрируемых
при наблюдении признаков. Единица наблюдения представляет собой элемент совокупности, по которому собираются необходимые данные. Единицей совокупности может выступать человек, факт, предмет, процесс и т.д.
Единицу наблюдения следует отличать от отчетной единицы.
Отчетная единица - субъект, от которого поступают данные о единицах наблюдения.
Единица наблюдения и отчетная единица могут совпадать.
Всякое явление обладает множеством различных признаков. Собирать
информацию по всем признакам нецелесообразно, а часто и невозможно. Поэтому необходимо отобрать те признаки, которые являются существенными,
основными для характеристики объекта исходя из цели исследования. Для
определения состава регистрируемых признаков разрабатывают программу
наблюдения.
Программа наблюдения – это перечень признаков (или вопросов), подлежащих регистрации в процессе наблюдения. Чтобы составить правильно
программу наблюдения, исследователь должен ясно представить задачи обследования конкретного явления или процесса, определить состав используемых в анализе методов, необходимые статистические группировки и уже на
основе этого выявить те признаки, которые нужно определить при проведении работы. Обычно программа выражается в форме вопросов переписного
(опросного) листа.
Программа оформляется в виде документа, называемого статистическим
формуляром.
Статистический формуляр – это документ единого образца, содержащий программу и результаты наблюдения.
Выбор времени наблюдения заключается в установлении критического
момента и определение срока (периода) наблюдения.
Критический момент – это момент (конкретный день года, час дня),
по состоянию на который собирается информация. Он устанавливается с целью получения сопоставимых статистических данных.
Срок (период) наблюдения – это время, в течение которого происходит
заполнение статистических формуляров, т.е. период проведения массового
сбора данных.
2.3. Формы, виды и способы статистического наблюдения
Организационные
формы статистического наблюдения
1. Статистическая
отчетность
2. Специально организованное
наблюдение
3. Регистры
Виды статистического наблюдения
по времени
по охвату единиц
регистрации фактов
совокупности
1. Текущее (непре1. Сплошное
рывное)
2. Прерывное:
2. Несплошное:
а) периодическое;
а) выборочное;
б) единовременное.
б) основного массива;
в) монографическое.
Способы статистического наблюдения
1. Непосредственное
2. Опрос:
а) саморегистрации;
б) анкетный;
в) явочный;
г) корреспондентский;
д) экспедиционный.
3. Документальное
Формами статистического наблюдения являются отчетность, специально организованные наблюдения и регистры.
Отчетность – это основная форма статистического наблюдения, с помощью которой статистические органы в определенные сроки получают от
предприятий, учреждений и организаций необходимые данные в виде установленных в законном порядке отчетных документов.
Специально организованное наблюдение проводится с целью получения
сведений, отсутствующих в отчетности, или для проверки ее данных. Наиболее простым примером такого наблюдения является перепись. Российская
практическая статистика проводит переписи населения, материальных ресурсов, многолетних насаждений, неустановленного оборудования, строек незавершенного строительств, оборудования и др.
Регистровое наблюдение - это форма непрерывного статистического
наблюдения за долговременными процессами, имеющими фиксированное
начало, стадию развития и фиксированный конец. В практике статистики
различают регистры населения и регистры предприятий.
Статистическое наблюдение подразделяется на виды по времени регистрации данных и по степени охвата единиц наблюдения.
По времени регистрации наблюдения бывают текущие (непрерывные)
и прерывные (периодические и единовременные).
При текущем наблюдении явления фиксируются по мере их наступления (регистрация рождений, браков).
При периодических наблюдениях данные, отражающие изменения объекта, собираются в ходе нескольких обследований (перепись населения, проводимая раз в десять лет).
Единовременное обследование проводится один раз для регистрации
фактов.
По степени охвата единиц совокупности различают сплошное и несплошное наблюдение.
Сплошное наблюдение - обследование всех без исключения единиц совокупности.
Несплошное наблюдение - обследование части единиц совокупности.
Несплошное наблюдение подразделяется на монографическое, основного массива, выборочное.
Монографическое наблюдение - детальное изучение отдельных единиц
совокупности.
Метод основного массива - обследованию подвергаются наиболее
крупные единицы изучаемой совокупности, имеющие по основному (для
конкретного исследования) признаку наибольший удельный вес в совокупности.
Применяется несколько способов отбора при проведении выборочного
наблюдения: собственно-случайный, механический, типический, серийный,
комбинированный.
Собственно - случайное наблюдение - обследование части единиц совокупности, отобранных из всей совокупности в случайном порядке.
Механическая выборка применяется в тех случаях, когда генеральная
совокупность каким-нибудь образом упорядочена и обследуется каждая i-я
единица.
Типический отбор – это отбор, при котором генеральная совокупность
разбивается на качественно однородные типические группы, затем из каждой
группы при помощи собственно – случайной или механической выборки
проводится отбор единиц в выборочную совокупность.
Серийный отбор – это такой отбор, когда в случайном порядке отбираются не единицы, подлежащие обследованию, а группы единиц (серии, гнезда). Внутри отобранных серий обследованию подвергаются все единицы, т.е.
применяется сплошное наблюдение.
Преимуществами выборочного наблюдения по сравнению со сплошным наблюдением являются более низкие материальные затраты, снижение
трудовых затрат за счет уменьшения объема обработки первичной информации.
К способам статистического наблюдения относятся:
1. Непосредственное, при котором регистраторы сами устанавливают
факт, подлежащий регистрации и производят запись в формуляр
наблюдения;
2. Документальный основан на использовании в качестве источника
информации различного рода документов;
3. Опрос – это способ, при котором необходимые сведения получают со
слов респондента.
Применяют следующие виды опросов:
 экспедиционный (устный) способ. Это способ отбора информации, при
котором специально подготовленные регистраторы на основе опроса
заполняют переписные формуляры, одновременно контролируя правильность получаемых ответов;
 при саморегистрации формуляры заполняются самими респондентами;
 корреспондентский способ заключается в том, что необходимые сведения сообщает штат добровольных корреспондентов;
 анкетный способ предполагает сбор информации в виде анкет;
 при явочным способе сведения представляются в явочном порядке самими респондентами.
2.4. Точность наблюдения
Точность статистического наблюдения – это степень соответствия
величины какого-либо показателя, определенной по материалам статистического наблюдения, действительной его величине.
К видам контроля результатов статистического наблюдения относят
арифметический и логический контроль.
Контроль, основанный на использовании количественных связей между
значениями различных показателей, называется арифметическим.
Логическим называется контроль, который основывается на знании неколичественных взаимосвязей между показателями.
Расхождение между расчетным и действительным значением изучаемых величин называется ошибкой наблюдения.
Ошибки регистрации – это ошибки, возникающие при регистрации явлений вследствие неправильных, неточных сведений или невнимательности
регистраторов. Ошибки регистрации – это погрешности, которые возникают
независимо от вида наблюдения. Они бывают случайными и систематическими (тенденциозными).
Случайные ошибки – это непреднамеренные ошибки, возникшие как результат оговорок, описок, прочих погрешностей.
Систематические ошибки – это ошибки, которые всегда имеют одинаковую тенденцию либо к увеличению, либо к уменьшению значения показателей по каждой единице наблюдения, и поэтому величина показателя по совокупности в целом включает в себя накопленную ошибку (например, округление возраста).
Ошибка репрезентативности – это расхождение между выборочной
характеристикой и характеристикой генеральной совокупности. Они возникают потому, что отобранная и обследованная совокупность недостаточно
точно воспроизводит (репрезентирует) всю исходную совокупность в целом.
Виды ошибок репрезентативности
1. Систематические (возникают в результате нарушения научных принципов отбора единиц совокупности).
 преднамеренные;
 непреднамеренные.
2. Случайные (возникают в результате несплошного характера наблюдения).
Случайные ошибки репрезентативности возникают при недостаточно
равномерном представлении в выборочной совокупности различных категорий генеральной совокупности они могут быть статистически измерены.
 средняя (стандартная) ошибка выборки;
 предельная ошибка выборки.
3. Сводка и группировка статистических данных
3.1. Понятие и виды сводки
Особую стадию статистического исследования, в ходе которой систематизируются первичные материалы статистического наблюдения, называют
статистической сводкой.
Сводка - это комплекс последовательных операций по обобщению единичных фактов, образующих совокупность, для выявления типичных черт и
закономерностей, присущих явлению. Сводка – особая стадия статистического исследования, в ходе которой систематизируются первичные материалы
статистического наблюдения.
В зависимости от глубины обработки данных статистическая сводка
бывает простая и сложная.
Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения или общего объема изучаемого показателя.
Подсчет групповых и общих итогов по показателям анализируемой совокупности называется сложной сводкой.
По технике выполнения статистическая сводка бывает механизированная и ручная.
Механизированная сводка - это сводка, при которой все операции осуществляются с помощью компьютера.
При ручной сводке все операции осуществляются вручную.
По форме обработки материала статистическая сводка бывает централизованная и децентрализованная.
При централизованной сводке весь первичный материал поступает в одну организацию и подвергается в ней обработке от начала до конца.
При децентрализованной сводке обработка материала производится последовательными этапами. Отчеты предприятий и организаций сводятся статистическими органами субъектов РФ, а полученные итоги поступают в Росстат, где определяются итоговые показатели в целом по стране.
Указания о последовательности и сроках выполнения сводки содержатся
в плане статистической сводки.
3.2. Понятие и виды группировок
Статистическая группировка – это разделение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.
Основанием группировки в статистике является группировочный признак.
В качестве основания группировки необходимо использовать наиболее
существенные признаки, которые теоретически обоснованы и отражают
сущность изучаемых явлений в условиях поставленных целей и задач. В основание группировки могут быть положены как количественные, так и качественные признаки.
Статистические группировки можно классифицировать по следующим
признакам: по целям и задачам, числу группировочных признаков, упорядоченности исходных статистических данных.
В зависимости от числа положенных в основание группировки признаков различают простые и сложные группировки.
Если группы образуются по одному признаку, группировка называется
простой (распределение населения по полу).
Группировка по двум и более признакам называется сложной.
Комбинационные группировки строятся путем разбиения группы на
подгруппы в соответствии с дополнительными признаками.
Многомерные группировки формируются с помощью специальных алгоритмов.
Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода
времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. Для того чтобы привести
такие группировки к сопоставимому виду, используется метод вторичной
группировки, то есть этот метод состоит в перегруппировке единиц объекта
без обращения к первичным данным. Вторичная группировка – операция по
образованию новых групп на основе ранее построенной (первичной) группировки.
В зависимости от решаемых задач выделяют три вида группировок: типологические, структурные и аналитические.
Группировка, в которой качественно неоднородная совокупность делится на отдельные качественно однородные группы и на этой основе выявляются экономические типы явлений, называется типологической (группировка предприятий по формам собственности).
Группировка, которая предназначена для изучения состава однородной
совокупности по какому-либо варьирующему признаку или нескольким признакам, называется структурной (группировка населения по размеру
среднедушевого дохода).
Выявление закономерностей распределения единиц однородной совокупности по варьирующим значениям исследуемого признака называется
аналитической группировкой.
3.3. Статистические ряды распределения
Статистический ряд распределения – это упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.
Ряды распределения, являясь группировкой, могут быть образованы по
качественному (атрибутивному) и количественному (прерывному или непрерывному) признакам. В первом случае они называются атрибутивными, во
втором – вариационными.
В зависимости от характера вариации признака различают дискретные
и интервальные вариационные ряды.
Интервальный вариационный ряд распределения – ряд, который отражает непрерывную вариацию признака.
Любой вариационный ряд состоит из двух элементов: вариантов x и
частот f.
Варианты - это отдельные значения группировочного признака, положенного в основу ряда распределения.
Частоты – это числа, которые показывают, как часто встречаются те
или иные варианты в ряду распределения. Сумма всех частот определяет
численность всей совокупности. Частоты, выраженные в долях единицы или
в процентах к итогу, называются частостями.
При построении интервального вариационного ряда необходимо определить количество групп и величину интервала.
Если группировка проводится по количественному признаку, то оптимальное число групп n определяется по формуле Стерджесса:
n  1  3,322 lg N ,
где N - число единиц совокупности.
Получаем следующие соотношения:
N
15-24
25-44
45-89
90-179
180-359
360-719
n
5
6
7
8
9
10
Интервал группировки – это значения варьирующего признака, лежащие в определенных границах.
Интервалы группировки могут быть открытыми и закрытыми.
Интервал группировки, когда имеется и нижняя и верхняя граница,
называется закрытым, если имеется только одна из границ – открытым.
Величина равного интервала определяется по формуле:
d
xmax  xmin R
 ,
n
n
где xmax и xmin - наибольшее и наименьшее значения признака в совокупности;
R - размах вариации.
Удобнее всего ряды распределения анализировать при помощи их графического изображения. Для этого используются полигон, гистограмма и
кумулята.
4. Абсолютные и относительные статистические показатели
4.1. Абсолютные показатели
Показатели, выражающие размеры, объем, уровни социальноэкономических явлений и процессов, являются абсолютными величинами.
Абсолютная величина – это показатель размеров общественных явлений в конкретных условиях места и времени.
Абсолютные величины бывают общие (суммарные) и индивидуальные.
С точки зрения пространственной определенности абсолютные показатели делят на общие территориальные, региональные и локальные.
Абсолютные показатели являются всегда именованными числами, то
есть имеют какую-либо единицу измерения.
Абсолютные величины выражаются в: натуральных (тонны, штуки,
литры, килограммы и т.д.), стоимостных (денежных), трудовых (человекодни, человеко-часы) единицах измерения.
4.2. Относительные показатели
Относительная величина в статистике – это обобщающий показатель,
который представляет собой частное от деления одного абсолютного показателя на другой и дает числовую меру соотношения между ними.
Относительные статистические показатели, получаемые при сопоставлении абсолютных показателей, называются относительными показателями
первого порядка.
Основными единицами измерения для относительных величин являются
коэффициенты, проценты (%), промилле, продецимилле(‰0).
Виды относительных величин
1. Относительный показатель динамики ОПД. Характеризует изменение
показателя в отчетном периоде по сравнению с базисным.
Фактический показатель отчетного периода
ОПД 
.
Фактический показатель базисного периода
2. Относительный показатель планового задания ОППЗ.
По плану на отчетный период
.
ОПЗ 
Фактический показатель базисного периода
3. Относительный показатель выполнения плана ОПВП. Позволяет не только осуществлять планирование, но и сравнивать реально достигнутые результаты работы с намеченными ранее работами.
ОПВП 
Фактический показатель отчетного периода
.
По плану на отчетный период
Между этими относительными показателями существует взаимосвязь:
ОПД = ОППЗ × ОПВП.
4. Относительный показатель структуры ОПС. Характеризует отношение
отдельных частей к целому, дает возможность изучить состав совокупности. Расчет относительной величины структуры сводится к исчислению
удельных весов отдельных частей во всей статистической совокупности,
или к определению доли от целого, принимаемого за единицу.
Сумма удельных весов должна составлять 100%, так как удельные веса
приведены к общему основанию; сумма простых отношений должна быть
равна единице.
Показатель, характеризующий часть совокупности
.
ОПС 
Показатель, характеризующий всю совокупность
5. Относительный показатель координации ОПК. Характеризует соотношение отдельных частей совокупности между собой.
Размер одной части совокупности
.
ОПК 
Размер другой части этой же совокупности
Примерами относительных показателей координации в статистической
практике являются следующие: отношение численности безработных к численности занятых, отношение численности вспомогательных рабочих к численности основных рабочих, мужчин и женщин, городского и сельского
населения.
6. Относительный показатель интенсивности ОПИ. Всегда выражаются
именованными величинами.
ОПИ 
Абсолютная
величина
изучаемого
явления
Абсолютная величина, характериз ующая среду, в которой развивается явление
Для расчета показателей интенсивности в качестве базы сравнения часто выбирается население. В практике статистики применяют следующие
относительные показатели интенсивности: плотность населения, доходы
на душу населения, размер потребления различных видов продукции на душу
населения, производство валового внутреннего продукта в расчете на душу
населения страны.
7. Относительный показатель сравнения ОПСр. Характеризует соотношение двух одноименных показателей, относящихся к различным объектам
или территориям за один и тот же период времени.
ОПСр 
Размер величины изучаемого объекта
Размер одноименной величины другого объекта, принятого за базу сравнения
Задачи по теме
1. Доход от реализации продукции предприятия в базисном году составил
25 млн. руб. По плану отчётного года доход от реализации продукции должен был составить 35 млн. руб. Фактический выпуск продукции в отчетном
году составил 30 млн. руб.
Определить относительные показатели динамики, планового задания и
выполнения плана.
Решение:
1. Относительный показатель динамики ОПД.
Фактический показатель отчетного периода 30
ОПД 
 100  120%
Фактический показатель базисного периода 25
2. Относительный показатель планового задания ОППЗ.
35
По плану на отчетный период
ОПЗ 
 100  140%
Фактический показатель базисного периода 25
3. Относительный показатель выполнения плана ОПВП. Позволяет не только осуществлять планирование, но и сравнивать реально достигнутые результаты работы с намеченными ранее работами.
Фактический показатель отчетного периода 30

 100  85,7% .
По плану на отчетный период
35
140  85,7
 120%
Взаимосвязь: ОПД  ОППЗ  ОПВП 
100
ОПВП 
Плановым заданием на отчетный период предусматривалось увеличить доход от реализации на 40% (10 млн. руб.) по сравнению с базисным годом,
фактически увеличение составило только 20% (5 млн. руб.). План по доходу
от реализации недовыполнен на 14,3% (5 млн. руб.).
2. Относительный показатель выполнения плана производства продукции
составил 103%, при этом объем производства по сравнению с предшествующим периодом вырос на 5%. На сколько процентов планом предусматривалось увеличить объем производства?
Решение:
Воспользуемся формулой взаимосвязи:
ОПД  ОППЗ  ОПВП
ОПД
105
ОППЗ 

 100  101,9%
ОПВП 103
Плановым заданием предусматривалось увеличить объем производства на
1,9%.
3. Демографические показатели по Российской Федерации за 2009 год характеризуются данными (источник – Российский статистический ежегодник),
тыс.человек:
Показатель
Значение
Общая численность населения
141904,0
в том числе: – городское население
103690,4
– сельское население
38213,6
в том числе: – мужчины
65641,0
– женщины
76263,0
Определить: относительные показатели координации и структуры.
Решение:
1. Относительный показатель координации:
Размер одной части совокупности
ОПК 
Размер другой части этой же совокупности
Соотношение сельского и городского населения:
ОПК С / Г 
38213,6
 1000  369 ‰
103690,4
В Российской Федерации в 2009 году на 1000 городских жителей приходилось 369 сельских.
Аналогично находится соотношение женщин и мужчин.
2. Относительный показатель структуры:
Показатель, характеризующий часть совокупности
ОПС 
Показатель, характеризующий всю совокупность
Удельный вес городского и сельского населения в общей численности
населения:
103690,4
 100  73,1 %
141904
38213,6
ОПСС 
 100  26,9 %
141904
ОПС Г 
В Российской Федерации в 2009 году удельный вес городских жителей
составлял 73,1%, удельный вес сельских жителей – 26,9% в общей численности населения.
ОПС м + ОПСж  100 %
Аналогично находятся удельные веса мужчин и женщин в общей численности.
4. По данным задачи 3 определить относительный показатель интенсивности, характеризующий плотность населения, если территория Российской
Федерации составляет 17075,4 тыс.км2.
Решение:
ОПИ 
Абсолютная
величина
изучаемого
явления
Абсолютная величина, характериз ующая среду, в которой развивается явление
141904
ОПИ 
 8,3чел / км 2
17075,4
В 2009 году в РФ на 1км2 приходилось 8,3 человека.
5. Выпуск продукции по странам характеризуется следующими показателями: страна А – 170 тыс. тонн, страна B – 120 тыс. тонн, страна С – 200 тыс.
тонн. Определить относительные показатели сравнения.
Решение:
За базу сравнения примем страну В, т.к. в этой стране самый маленький
выпуск.
ОПСр 
Размер величины изучаемого объекта
Размер одноименной величины другого объекта, принятого за базу сравнения
170
 100  141,7%
120
200

 100  166,7%
120
ОПС А / В 
ОПС С / В
Выпуск продукции в стране А на 41,7%, в стране С на 66,7% больше чем в В.
5. Метод средних величин и вариационный анализ
5.1. Средние величины
Средняя величина - это обобщенная количественная характеристика
признака в статистической совокупности в конкретных условиях места и
времени, которая получена в расчете на единицу совокупности.
Средняя величина отражает то общее, что присуще всем единицам исследуемой совокупности.
В зависимости от возможности группировки данных степенные средние
бывают простые и взвешенные.
Виды средних величин
1. Средняя арифметическая:
 простая (невзвешенная):
 X i X1  X 2    X n
.
X

n
n
Используется в тех случаях, когда расчет осуществляется по несгруппированным данным;
 взвешенная:
X
 X i f i X 1 f1  X 2 f 2    X n f n

.
f1  f 2    f n
 fi
Используется для расчета по сгруппированным данным или вариационным рядам.
Свойства средней арифметической
1. При увеличении всех индивидуальных значений признака на произвольное число единиц (например, 5 единиц) средняя величина увеличится
на это же число единиц (5 единиц).
2. При увеличении всех индивидуальных значений признака, например
в 5 раз, средняя величина увеличится в это же число раз.
3. При уменьшении всех индивидуальных значений признака, например
на 5 единиц, средняя величина уменьшится на это же число единиц.
Расчет средней арифметической взвешенной по способу моментов основан на свойствах средней арифметической:
 Xi  X0

 fi 

d


X
 d  X0 .
 fi
В качестве условного ноля - X0 - выбирают середину одного из центральных интервалов, обладающего наибольшей частотой.
Этот способ используется только в рядах с равными интервалами.
2. Средняя гармоническая
 взвешенная:
 Wi
,
X
Wi

Xi
где Wi = Xifi .
Используется в тех случаях, когда не известны частоты, но они входят в
состав одного из известных показателей.
3. Средняя геометрическая:
 простая (невзвешенная):
X  n X  X   X .
1
2
n
Применяется при расчете средних темпов изменения явления во времени.
4. Средняя хронологическая):
 простая (невзвешенная). Используется для расчета в моментных равноотстоящих рядах.
1
1
X 1  X 2    X n  X n 1
2
X  2
.
n
 взвешенная. Используется для расчета в моментных рядах с неравными
интервалами.
x
( x1  x2 )  t1  ( x2  x3 )  t 2  ...  ( xn1  xn )  t n1
.
2  (t1  t 2  ...  t n1 )
Наряду с рассмотренными средними рассчитываются так называемые
структурные средние - мода, медиана, квартиль, дециль.
Структурные средние используются для изучения внутреннего строения
и структуры рядов распределения значений признака.
Мода Мо – это величина признака (варианта), которая чаще всего встречается в данной совокупности.
В вариационном дискретном ряду модой выступает варианта, имеющая
наибольшую частоту.
Мода в интервальном вариационном ряду с равными интервалами рассчитывается по формуле:
M О  X Mо 
 f Mo
d ( f Mo  f Mo1 )
,
 f Mo1    f Mo  f Mo1 
где fМо - частота модального интервала;
fМо-1 - частота интервала, предшествующего модальному;
fМо+1 - частота интервала, следующего за модальным;
d - величина модального интервала;
X Мо - нижняя граница модального интервала.
Модальный интервал - это интервал, имеющий наибольшую частоту.
Медиана – это варианта, которая находится в середине вариационного
ряда. Медиана делит ряд пополам, по обе стороны от нее находится одинаковое количество единиц совокупности.
Медиана в интервальном вариационном ряду с равными интервалами
рассчитывается по формуле:
d( 1  f i  S Me1 )
2
,
Me  X Me 
f Me
где d - величина медианного интервала;
fi - сумма всех частот;
SМе-1 - накопленная частота интервала, предшествующего медианному;
fМе - частота медианного интервала;
X Ме - нижняя граница медианного интервала.
Медианным интервалом называется первый интервал, накопленная частота которого больше или равна половине суммы всех частот.
SМе ≥ 0,5 fi
Квартиль - значение признака, делящее ранжированную совокупность
на четыре равновеликие части.
Дециль - значение признака, делящее ранжированную совокупность на
десять равных частей.
5.2. Показатели вариации
Вариация – это колеблемость, изменяемость величины признака у отдельных единиц совокупности. Это различие в значениях какого-либо признака у разных единиц совокупности в один и тот же период или момент
времени.
Основные показатели, характеризующие вариацию: размах, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение и коэффициент вариации.
К абсолютным показателям вариации относят размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсию.
Они позволяют оценить вариацию в единицах измерения исследуемой
совокупности.
1. Размах вариации R:
R = Xmax – Xmin .
2. Среднее линейное отклонение L. Это средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней. Это
именованная величина, выражается в единицах измерения признака.
В зависимости от исходных условий расчет ведется по формулам:
 простая средняя используется для несгруппированных данных:
 Xi  X
L
;
n
 взвешенная средняя используется для сгруппированных данных:
 Xi  X fi
.
L
 fi
3. Дисперсия σ2 - это средняя арифметическая квадратов отклонений каждого значения признака от общей средней.
Дисперсия признака может принимать только положительное значение.
Дисперсия постоянной величины равна нулю.
В зависимости от исходных данных она вычисляется по формулам:
 простая средняя используется для несгруппированных данных:
 
2
2
(Xi  X )
;
n
 взвешенная средняя используется для сгруппированных данных:
 
2
2
 ( X i  X ) fi
.
 fi
Свойства дисперсии
1. Если все значения признака уменьшить или увеличить на одну и ту
же постоянную величину А, то дисперсия от этого не изменится.
2. Если все значения признака уменьшить или увеличить в одно и то же
число раз (а раз), то дисперсия соответственно уменьшится или увеличится в а2 раз.
Расчет дисперсии по способу моментов основан на свойствах дисперсии. Используется только в интервальных вариационных рядах с равными
интервалами.
 Xi  X0 

 fi

d


2
 
 d 2  ( X  X 0 )2 .
f
 i
2
Расчет дисперсии по формуле:
 2  X 2  (X ) 2 ,
где X 2 - средняя из квадратов вариантов:
(X i ) 2 f i

2
;
X 
 fi
(X) 2 - квадрат средней арифметической:
2
  Xifi 
 .
(X)  
  fi 
2
Вариация признака обусловлена различными факторами.
Общая дисперсия измеряет вариацию по всей совокупности под влиянием всех факторов, обусловивших эту вариацию.
Межгрупповая дисперсия 2 характеризует систематическую вариацию
результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних xi от общей средней x .
 
2
2
(Xi  X ) f
f
где f - численность единиц в группе.
Внутригрупповая (частная) дисперсия  i2 отражает случайную вариацию, т.е. часть вариации, обусловленную влиянием неучтенных факторов и
не зависящую от признака-фактора, положенного в основание группировки.
Она равна среднему квадрату отклонений отдельных значений признака
внутри группы от средней арифметической этой группы.
На основании внутригрупповой дисперсии по каждой группе можно
определить среднюю из внутригрупповых дисперсий:
 i2 
 i f
f
2
По правилу сложения дисперсий общая дисперсия является суммой
межгрупповой и средней из внутригрупповых дисперсий.
 2   2   i2
4. Среднее квадратическое отклонение σ – это корень квадратный из дисперсии.
К относительным показателям вариации (показателям степени вариации) относят коэффициент вариации, коэффициент осцилляции.
5. Наилучшей характеристикой для сравнения вариации различных совокупностей служит коэффициент вариации V. Это отношение среднего квадратического отклонения к средней величине. Дает характеристику однородности совокупности.
V    100 .
X
В отличие от абсолютных значений вариации коэффициент вариации
измеряет колеблемость в относительном выражении, относительно среднего
уровня, что во многих случаях предпочтительнее. Характеризует степень однородности совокупности. Если коэффициент вариации не превышает 33%,
то совокупность по рассматриваемому признаку можно считать однородной.
Выяснение общего характера распределения предполагает оценку его
однородности, а также вычисление показателей ассиметрии. Для симметричных распределений частоты любых двух вариант, равноотстоящих в обе
стороны от центра распределения, равны между собой. Рассчитанные для таких распределений средняя, мода и медиана также равны.
Величина коэффициента ассиметрии может быть положительной и отрицательной. В первом случае речь идет о правосторонней ассиметрии, а во
втором о левосторонней.
Если коэффициент асимметрии выше 0,5 (независимо от знака), то
асимметрия считается значительной; если коэффициент меньше 0,25, то незначительной.
6. Выборочное наблюдение
6.1. Понятия, преимущества и научные принципы выборочного
наблюдения
Статистическое наблюдение – это планомерный, научно организованный сбор массовых данных о явлениях общественной жизни.
Статистическое наблюдение можно организовать как сплошное и несплошное. Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности явлений, несплошное – лишь ее часть. К несплошному наблюдению относится и выборочное наблюдение.
Выборочное наблюдение - это такое наблюдение, при котором статистическому наблюдению подвергаются не все единицы изучаемой совокупности, а лишь отобранные в определенном порядке.
Цель выборочного наблюдения состоит в том, чтобы по характеристикам
отобранной части единиц судить о характеристиках всей совокупности.
Основные причины, по которым во многих случаях выборочному наблюдению отдается предпочтение перед сплошным наблюдением, следующие.
Преимущества выборочного наблюдения:
 Достижение большей точности результатов обследования благодаря
сокращению ошибок регистрации (за счет работы более квалифицированных участников).
 Экономия трудовых, денежных средств и времени в результате сокращения объема работы.
 Возможность детального обследования каждой единицы наблюдения за
счет расширения программы наблюдения.
Преимущества выборочного наблюдения по сравнению со сплошным
можно обеспечить, если оно организовано и проведено в строгом соответствии с научными принципами выборочного наблюдения.
Научные принципы выборочного наблюдения:
 Обеспечение случайности отбора единиц (при отборе каждой из единиц изучаемой совокупности обеспечивается равная возможность попасть в выборку).
 Обеспечение достаточного числа отобранных единиц совокупности.
Соблюдение этих принципов позволяет получить совокупность единиц,
которая по интересующим исследователя признакам представляет всю изучаемую совокупность, т.е. является репрезентативной (представительной).
6.2. Понятие генеральной и выборочной совокупности
Генеральная совокупность (N) – это вся исходная изучаемая статистическая совокупность, из которой на основе отбора единиц или групп единиц
формируется совокупность выборочная.
Выборочная совокупность (n) – это совокупность отобранных единиц,
по которым собирается информация.
Основные понятия и характеристики выборочного наблюдения
Основное понятие выборочного
Характеристика
наблюдения
Отношение численности выборочной
Доля выборки
совокупности к численности генеральной совокупности:
k  n: N .
Среднее значение признака всей совоГенеральная средняя
купности – x .
Среднее значение признака у единиц,
Выборочная средняя
которые подверглись выборочному
наблюдению:
x
~
x
i
n
x f
или ~x   i i
f
i
Генеральная доля
Доля единиц, обладающих тем или
иным признаком в генеральной совокупности – p .
Выборочная доля
Доля единиц, обладающих тем или
иным признаком в выборочной совокупности:
w  m : n,
Генеральная дисперсия
Дисперсия количественного
признака в выборочной
совокупности
Дисперсия доли признака в
генеральной совокупности
Дисперсия доли признака в
выборочной совокупности
где m – численность единиц, обладающих определенным признаком в выборочной совокупности.
Дисперсия количественного признака
в генеральной совокупности –  x2

2
~
x
 (x

i
~
x )2
n
или 
2
~
x
(x  ~
x)


f
i
i
 p2  p  (1  p)
 w2  w  (1  w)
2
fi
6.3. Ошибки выборочного наблюдения
При проведении выборочного наблюдения нельзя даже теоретически получить абсолютно точные данные, как при сплошном обследовании. Обусловлено это тем, что наблюдению подвергается не вся совокупность, а только ее часть, поэтому при проведении выборочного наблюдения неизбежна
некоторая свойственная ему погрешность (ошибки).
Ошибки, свойственные выборочному наблюдению, называются ошибками репрезентативности.
Ошибка репрезентативности – это расхождение между выборочной
характеристикой и характеристикой генеральной совокупности. Они возникают потому, что отобранная и обследованная совокупность недостаточно
точно воспроизводит (репрезентирует) всю исходную совокупность в целом.
Виды ошибок репрезентативности
1. Систематические (возникают в результате нарушения научных принципов отбора единиц совокупности).
 преднамеренные;
 непредномеренные.
2. Случайные (возникают в результате несплошного характера наблюдения).
 средняя (стандартная) ошибка выборки;
 предельная ошибка выборки.
Теоретическим обоснованием появления случайных ошибок выборки
является теория вероятности и ее предельные теоремы.
Сущность предельных теорем состоит в том, что в массовых явлениях
совокупное влияние случайных причин на формирование закономерностей и
обобщающих характеристик будет сколько угодно малой величиной или
практически не зависит от случая.
Так как случайная ошибка выборки возникает в результате случайных
различий между границами выборочной и генеральной совокупностей, при
достаточно большом объеме выборки эта ошибка будет сколько угодно мала.
Этот вывод, опирающийся на доказательства предельных теорем, позволяет
предполагать, что характеристики выборочного наблюдения могут достаточно хорошо представлять характеристики генеральной совокупности.
Случайные ошибки могут быть доведены до незначительных размеров, а
главное, их размеры и пределы можно определить с достаточной точностью
на основании закона больших чисел.
Средняя ошибка выборки (µ) – это такое расхождение между средними
выборочной и генеральной совокупностями ( ~х  х ) , которое не превышает
 .
Средняя ошибка выборки зависит от:
 Объема выборки (чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки).
 Степени варьирования признака (чем меньше вариация признака, а
следовательно, и дисперсия, тем меньше ошибка выборки, и наоборот).
Формулы для определения величины средней ошибки выборки зависят
от методов и способов отбора.
Предельная ошибка выборки – это максимально возможное расхождение между средними выборочной и генеральной средних ( ~х  х ) , т.е. максимум ошибки при заданной вероятности ее появления.
О величине предельной ошибки можно судить с определенной вероятностью, на величину которой указывает коэффициент доверия t. Табличные
значения коэффициента следующие:
t
1,0
1,96
2,0
2,58
3,0
P(t)
0,683
0,950
0,954
0,990
0,997
Предельная ошибка выборки:
 ~x  t   ~x или  w  t   w ,
где ∆ – предельная ошибка выборки;
t – коэффициент доверия, зависящий от вероятности, с которой гарантируется предельная ошибка выборки
Чем больше пределы, в которых допускается возможная ошибка, тем с
большей вероятностью можно установить ее величину. Предельная ошибка
выборки позволяет определять предельные значения характеристик генеральной совокупности при заданной вероятности и их доверительные интервалы.
Чем больше вариация признака, тем при прочих равных условиях
ошибка выборки больше.
Например, при увеличении среднеквадратического отклонения в 2 раза
объем повторной случайной выборки увеличится в 4 раза, т.к. в формуле стоит дисперсия, т.е. квадрат среднеквадратического отклонения.
Определение необходимой численности выборки
При подготовке выборочного наблюдения с заранее заданным значением
допустимой ошибки выборки очень важно правильно определить объем
(численность) выборочной совокупности. Согласно одному из принципов
выборочного наблюдения объем выборки должен быть достаточным, чтобы
обеспечить репрезентативность выборки.
Формулы для определения необходимой численности выборки зависят
от методов и способов отбора.
6.4.Методы, виды и способы отбора единиц из генеральной совокупности
В теории выборочного наблюдения разработаны различные методы, способы и виды отбора единиц из генеральной совокупности.
Методы отбора
Повторный. Каждая единица, отобранная в случайном порядке, после
обследования возвращается в генеральную совокупность и в последующем
отборе может снова попасть в выборку. При таком отборе вероятность попасть в выборку для каждой единицы генеральной совокупности не меняется
независимо от числа отобранных единиц.
Бесповторный. Каждая единица, отобранная в случайном порядке, после обследования в генеральную совокупность не возвращается. Вероятность попасть в выборку для каждой единицы генеральной совокупности
увеличивается по мере производства отбора.
Так как бесповторный отбор охватывает все новые и новые совокупности, а повторный отбор на всем протяжении одну и ту же совокупность, бесповторный отбор дает более точные результаты, чем повторный.
Виды отбора
Индивидуальный. В выборочную совокупность отбираются отдельные
единицы генеральной совокупности.
Групповой. В выборочную совокупность отбираются качественно однородные группы или серии изучаемых единиц.
Комбинированный. Происходит сочетание первого и второго видов отбора.
Способы отбора
1. Собственно – случайный
2. Механический
3. Типический
4. Серийный
5. Комбинированный
Понятие собственно - случайного отбора
Собственно – случайный отбор – это отбор, при котором наблюдению
подвергается часть совокупности, отобранная из всей совокупности в случайном порядке.
Собственно – случайный отбор бывает повторным и бесповторным.
Основные формулы, используемые при собственно – случайном отборе
Основные формулы
Показатель
Повторная выборка Бесповторная выборка
Средняя ошибка
 ~x2
 ~x2
n
 ~x 
 ~x 
(1  )
выборки для средней
n
n
N
Средняя ошибка
w  (1  w)
w  (1  w)
n
w 
w 
(1  )
выборки для доли
n
n
N
Численность выборки
t 2   ~x2
t 2   ~x2  N
n
n
при определении сред2~x
N  2~x  t 2   ~x2
него размера признака
Численность выборки
t 2  w  (1  w)
t 2  w  (1  w)  N
n
n

при определении доли
2w
N  2w  t 2  w  (1  w)
признака
Понятие механического отбора
Механический отбор применяется в тех случаях, когда генеральная совокупность каким-нибудь образом упорядочена, т. е. имеется определенная
последовательность в расположении единиц (например, номера домов, списки избирателей).
При механическом отборе устанавливается шаг отсчета, т.е. расстояние
между отбираемыми единицами (N/n – величина, обратная доле выборки) и
начало отсчета – номер единицы, которая должна быть обследована первой.
Механический отбор всегда бывает бесповторный. При этом отборе
применяются те же формулы, что и при собственно – случайном бесповторном отборе.
Механический отбор имеет преимущество перед случайным отбором,
его не только легче организовать, но при нем единицы выборочной совокупности равномернее распределяются в генеральной совокупности.
Понятие типического отбора
Типический отбор – это отбор, при котором генеральная совокупность
разбивается на качественно однородные типические группы, затем из каждой
группы при помощи собственно – случайной или механической выборки
проводится отбор единиц в выборочную совокупность.
Из всех типических групп можно отбирать число единиц, пропорциональное и непропорциональное их численности. В зависимости от этого различают пропорциональный и непропорциональный типический отбор.
Типический отбор бывает повторным и бесповторным.
Разбивка на типические группы дает возможность избежать влияния
межгрупповой вариации на точность выборки. Так как в типическую выборку должны попасть представители всех групп, средняя ошибка типической
выборки зависит только от средней из внутригрупповых дисперсий  i2 , или
w  (1  w), а не от общей дисперсии.
Основные формулы, используемые при типическом отборе
Основные формулы
Показатель
Повторная выборка Бесповторная выборка
2
2
Средняя ошибка
i
i
n
 ~x 
 ~x 
(1  )
выборки для средней
n
n
N
Средняя ошибка
выборки для доли
Численность выборки
при определении среднего размера признака
Численность выборки
при определении доли
признака
w 
w  (1  w)
n
w 
2
2
t 2  i
n
2~x
n
t 2  w  (1  w)
2w
w  (1  w)
n
(1  )
n
N
n
n
t 2  i  N
2
N  2~x  t 2   i
t 2  w  (1  w)  N
N  2w  t 2  w  (1  w)
Понятие серийного отбора
Серийный отбор – это такой отбор, когда в случайном порядке отбираются не единицы, подлежащие обследованию, а группы единиц (серии,
гнезда). Внутри отобранных серий обследованию подвергаются все единицы,
т.е. применяется сплошное наблюдение.
Поскольку внутри серий обследуются все единицы, средняя ошибка выборки равновеликих серий зависит от величины только межгрупповой дисперсии -  ~х2 или  w2 .
Серийный отбор бывает повторным и бесповторным.
Основные формулы, используемые при серийном отборе
Основные формулы
Показатель
Повторная выборка Бесповторная выборка
Средняя ошибка
 ~x2
 ~х2
r




(1  )
~
~
x
x
выборки для средней
r
r
R
Средняя ошибка
выборки для доли
w 
 w2
w 
r
 w2
r
(1 
r
)
R
Численность выборки
t 2   ~x2
t 2   ~x2  R
n
n

при определении сред2~x
R  2~x  t 2   ~x2
него размера признака
Численность выборки
t 2   w2
t 2   w2  R
n

n

при определении доли
2w
N  2w  t 2  w  (1  w)
признака
Обозначения:
R – общее число серий;
r – число отобранных серий.
Межгрупповая дисперсия средней определяется по формуле:
 ~х2 
 ( ~х  ~x )
i
r
2
,
где ~xi  средняя i-й серии;
~
х  средняя по всей выборочной совокупности.
Межгрупповая дисперсия доли определяется по формуле:

2
w
 (w

i
r
 w) 2
,
где wi  доля признака i-й серии;
w – общая доля признака во всей выборочной совокупности.
6.5. Понятие малой выборки
Малая выборка – это несплошное статистическое обследование, численность единиц которого не превышает 30.
Для определенного способа отбора единиц величина стандартной ошибки зависит от объема выборки и степени колеблемости изучаемого признака
в генеральной совокупности. Чем меньше объем выборки, тем большую величину стандартной ошибки следует ожидать, а это снижает точность оценки
параметров генеральной совокупности.
Для оценки возможных пределов ошибки малой выборки применяется
отношение Стъюдента, определяемое по формуле:
t
~
xx
 М . В.
,
где  М .В.  величина среднего квадратического отклонения малой выборки,
которая определяется по формуле:
 М . В. 
2
n 1


n 1
.
Величина  вычисляется на основе данных выборочного наблюдения:

 (x
i
~
x )2
n
.
Таким образом, для теоретического распределения отношения Стъюдента t имеются величины, определяемые непосредственно по данным выборки.
Для отдельных значений t и n доверительную вероятность малой выборки
находят по специальным таблицам Стъюдента, которые приводятся в учебниках по математической статистике.
Предельная ошибка малой выборки определяется по формуле:
 М . В.  t   М . В.
Порядок расчета тот же, что и при больших выборках.
6.6. Распространение данных выборочного наблюдения на генеральную
совокупность
Конечной целью любого выборочного наблюдения является распространение его характеристик на генеральную совокупность.
Предельная ошибка выборки позволяет определить предельные значения
характеристик генеральной совокупности и их доверительные интервалы.
Формула для определения интервальной оценки генеральной совокупности:
~
х   ~x  х  ~
х   ~х
Таким образом, с заданной вероятностью можно утверждать, что значение генеральной средней можно ожидать в пределах от ~х   ~x до ~х   ~х .
Формула для определения интервальной оценки генеральной доли:
w  w  p  w  w .
Таким образом, с заданной вероятностью можно утверждать, что значение генеральной доли можно ожидать в пределах от w   w до w   w .
Задачи по теме
1. На предприятии с целью изучения средней производительности труда было проведено 15%-ное выборочное обследование рабочих собственнослучайным способом методом бесповторного отбора. В результате обследования получены следующие данные.
Группы рабочих по
Число рабочих, чел.
производительности труда, тыс. руб.
до 100
100-120
120-140
140-160
более 160
60
60
90
50
40
300
Определить с вероятностью Px=95,4% для всех рабочих пределы, в которых находятся:
1. Средняя производительность труда.
2. Удельный вес рабочих с производительностью труда выше 140 тыс. руб.
Решение:
1. Генеральная средняя находится в пределах: ~х   ~x  х  ~х   ~х .
Для решения задачи необходимо сначала определить среднюю производительность труда и дисперсию для выборочной совокупности.
Т.к. по условию дан интервальный равноотстоящий вариационный ряд
распределения, то расчет этих показателей проводится по взвешенным формулам.
Cоставим дополнительную таблицу, в которой проведем промежуточные
расчеты.
xi  f i
fi
xi
( xi  ~
x )2  fi
90
110
130
150
170
60
5400
82140
60
6600
17340
90
11700
810
50
7500
26450
40
6800
73960
300
38000
200700
Определим среднюю производительность труда по формуле средней
x f
38000
 127 тыс.руб.
арифметической взвешенной: ~x   i i 
fi
300
Дисперсия количественного признака в выборочной совокупности:

2
~
x
(x  ~
x)


f
i
i
2
fi

200700
 669
300
Средняя ошибка выборки для средней:
 ~x2
669
(1  0,15)  1,4 тыс.руб.
n
300
Предельная ошибка выборки:  ~x  t   ~x  2  1,4  2,8 тыс.руб.
 ~x 
(1 
n
)
N
Интервальная оценка генеральной совокупности:
127  2,8  х  127  2,8
124,2  х  129,8
Таким образом, с заданной вероятностью можно утверждать, что значение генеральной средней можно ожидать в пределах от 124,2 тыс.руб. до
129,8 тыс.руб.
2. Генеральная доля находится в пределах: w   w  p  w   w .
Численность рабочих, обладающих заданным признаком в выборочной
совокупности (производительностью труда выше 140 тыс. руб.) – m = 90 человек.
Выборочная доля, т.е. доля единиц, обладающих заданным признаком
(производительностью труда выше 140 тыс. руб.) в выборочной совокупности: w 
m 90

 0,3 или 30%.
n 300
Средняя ошибка выборки для доли:
w  (1  w)
n
0,3  (1  0,3)
(1  ) 
(1  0,15)  0,024 или 2,4%.
n
N
300
Предельная ошибка выборки:  w  t   w  2  2,4  4,8%
w 
Интервальная оценка генеральной совокупности:
30  4,8  p  30  4,8
25,2  p  34,8
Таким образом, с заданной вероятностью можно утверждать, что значение генеральной доли можно ожидать в пределах от 25,2% до 34,8%.
2. Планируется выборочным методом обследовать работников предприятия с
целью анализа средней производительности труда. Определить, какова
должна быть численность выборки, чтобы с вероятностью 99,7% при собственно-случайном бесповторном отборе гарантировать предельный размер
ошибки 10 тыс.рублей. Среднее квадратическое отклонение - 25 тыс. руб.
Общая численность работников – 2000 человек.
Решение:
Численность выборки при определении среднего размера признака:
t 2   ~x2  N
n
N  2~x  t 2   ~x2
При вероятности 99,7% t =3.
t 2   ~x2  N
3 2  25 2  2000
n

 55
N  2~x  t 2   ~x2 2000  10 2  32  25 2
Для обеспечения заданной точности необходимо обследовать 55 человек.
7. Индексы
7.1. Понятие индексов и их классификация
Индексы относятся к важнейшим обобщающим показателям статистики.
Индекс – это относительный показатель, характеризующий изменение
величины какого-либо явления во времени в пространстве или по сравнению
с любым эталоном (нормативом, планом, прогнозом и т.д.).
Основные задачи индексного метода:
 Оценка динамики обобщающих показателей, характеризующих сложные, непосредственно несоизмеримые совокупности
 Анализ влияния отдельных факторов на изменение результативных
обобщающих показателей
 Анализ влияния структурных сдвигов на изменение средних показателей однородной совокупности
 Оценка территориальных, в том числе международных, сравнений
Индексный метод широко применяется в статистике развитых стран для
анализа рынка ценных бумаг. Одним из самых известных обобщенных показателей рынка ценных бумаг является сводный индекс Доу-Джонса, который
рассчитывается по акциям 30 крупнейших промышленных корпораций, 20
транспортных и 15 коммунальных.
Классификация индексов
1. По степени охвата
1. Индивидуальные. Служат для характеристики изменения отдельных
элементов сложного явления, например изменения объема производства отдельных видов продукции.
2. Общие (сводные). Служат для измерения динамики сложного явления,
составные части которого непосредственно несоизмеримы
2. По базе сравнения
1.Динамические
 цепные
 базисные
2. Индексы выполнения плана
3. Территориальные
3. По виду весов
1. С постоянными весами
 Отчетного периода
 Базисного периода
2. С переменными весами
4. По форме построения
1. Агрегатные
2. Средние взвешенные
 гармонические
 арифметические
5. По составу явлений
1. Переменного состава
2. Постоянного (фиксированного) состава
3. Структурных сдвигов
6. В зависимости от индексируемого показателя
1. Количественных (объемных) показателей. К индексам количественных
показателей относят показатели, характеризующие физические размеры явления, например, производство продукции в натуральном выражении, численность работающих, объем промышленно-производственных фондов.
2. Качественных показателей
7. В зависимости от объекта исследования
 себестоимости
 физического объема
 цен
 производительности труда и т.д.
Условные обозначения, используемые в теории индексного метода
Условное
Расшифровка
обозначение
p
Цена за единицу товара (услуги)
q
Количество (объем) какого – либо продукта (товара) в
натуральном выражении (физический объем)
pq
Общая стоимость продукции данного вида (товарооборот)
Себестоимость единицы продукции (изделия)
z
zq
Общая себестоимость продукции данного вида (денежные
затраты на ее производство)
Общие затраты времени на производство продукции или
T
общая численность работников
q
Производство продукции данного вида за единицу времени
w
или
T
(выработка продукции на одного работника), т.е. произвоpq
дительность труда в натуральном или стоимостном выраw
T
жении
Подстрочный символ показателя текущего (отчетного) пе1
риода
Подстрочный символ показателя предшествующего (базис0
ного) периода
7.2.Индивидуальные и общие индексы. Агрегатный индекс как основная
форма общего индекса
Индивидуальный индекс ( i ) характеризует изменение только одного
элемента совокупности.
В общем виде индивидуальный индекс можно представить формулой:
ia 
a1
 100 ,
a0
где a1 и a0 – анализируемый показатель соответственно в отчетном и базисном периоде.
Формулы вычисления индивидуальных индексов
Индекс
Формула
q1
Индекс физического объема (количества) продукции
iq 
Индекс цен
Индекс стоимости продукции
q0
p
ip  1
p0
pq
i pq  1 1
p0 q0
Индекс себестоимости единицы продукции
Индекс затрат на производство продукции
Индекс производительности труда (по количеству или
стоимости продукции, произведенной в единицу времени)
Индекс общих затрат времени или общей численности
работников
Взаимосвязь индексов
iz 
z1
z0
z1q1
z 0 q0
w
iw  1
w0
Т
iТ  1
Т0
i pq  i p  iq
i zq 
i zq  i z  i q
iw  iT  iq
Общий индекс ( I ) характеризует изменение всех единиц, образующих
статистическую совокупность.
Формы общих индексов:
1. Агрегатные
2. Средние взвешенные
 гармонические
 арифметические
Исходной формой выражения сводного индекса агрегатная форма.
Основные функции агрегатных индексов:
 Синтетическая. В индексе обобщаются (агрегируются) непосредственно несоизмеримые явления.
 Аналитическая. Посредством индексного метода измеряется влияние
отдельных факторов на совокупное изменение изучаемого показателя.
Числитель и знаменатель агрегатного индекса представляют собой сумму произведений двух величин, одна из которых меняется (индексируемая
величина), а другая остается неизменной в числителе и знаменателе (вес индекса).
Индексируемая величина – признак, изменение которого характеризует
индекс.
Вес индекса – величина, тесно связанная с индексируемой величиной и
служащая для целей соизмерения индексируемых величин.
При выборе весов руководствуются следующим правилом – умножая
индексируемую величину на вес индекса необходимо получить показатель,
имеющий экономический смысл, характеризующий общие размеры исследуемого явления. Например, если индексируемая величина - цена (p), то в качестве веса индекса следует выбрать количество продукции (q), т.к. произведение этих величин (pq) представляет собой стоимость продукции.
Выбор периода фиксации веса зависит от характера объекта исследования.
Общий агрегатный индекс количественных показателей взвешивается
по весам базисного периода. Количественные показатели характеризуют объем явления. Например, к ним относятся: q – количество какого-либо товара в
натуральном выражении (физический объем), T – общие затраты времени на
производство продукции или общая численность работников, S – посевная
площадь.
В общем виде агрегатный индекс количественного показателя можно
представить формулой:
Ia 
 ab
 ab
1 0
 100 ,
0 0
где b0 – вес индекса в базисном периоде.
Общий агрегатный индекс качественных показателей взвешивается по
весам отчетного периода. Качественные показатели характеризуют уровень
явления в расчете на единицу совокупности. Например, к ним относятся: p –
цена за единицу товара, z – себестоимость единицы продукции, w – производительность труда в единицу времени.
В общем виде агрегатный индекс качественного показателя можно представить формулой:
Ia 
 ab
 ab
1 1
 100 ,
0 1
где b1 – вес индекса в отчетном периоде.
Основные формулы вычисления общих индексов
Что показываЧто
ет разность
Индекс
Формула расчета
показывает
числителя и
индекс
знаменателя
Во сколько раз На сколько деИндекс
 q1 p0 ,
Iq 
возросла (умень- нежных единиц
физиче q0 p0
ского
где  q1 p0 – условная шилась) стоимость изменилась стопродукции в от- имость продукобъема
величина,
показываючетном периоде по ции в результате
продукции
щая какой была бы сравнению с ба- роста
(уменьстоимость продукции в зисным периодом шения) ее физитекущем периоде при в результате изме- ческого объема,
условии
сохранения нения физического т.е. изменения
цен
на
базисном объема ее произ- объема произуровне;
водства
водства продук q0 p0 – стоимость
ции
продукции предшествующего периода.
Влияние цен на На сколько деИндекс
П
 p1q1 ,
Ip 
стоимость товаров, нежных единиц
цен
 p0q1
произведенных в изменилась стоПааше (по где
p1q1 – стоимость

отчетном периоде имость продукотчетпродукции
отчетного
(во сколько раз ции в результате
ным
периода.
возросла (умень- роста
(снижевесам)
шилась) стоимость ния) цен или на
Индекс
цен
Ласпейреса (по
базисным
весам)
Индекс
цен
Фишера
Индекс
стоимости продукции
л
Ip 
pq
p q
1 0
0
,
0
где  p1q0 – условная
величина, показывающая, какой была бы
стоимость продукции
предшествующего периода при условии цен
на уровне отчетного.
продукции в отчетном периоде по
сравнению с базисным периодом
в результате изменения цен).
Влияние, изменения цен на стоимость количества
товаров произведенных в базисном
периоде.
Ip 
I pq 
pq
p q
1 1
0
0
или
П
I pq  I p  I q
Индекс
 z1q1 ,
Iz 
себесто z0 q1
имости
продукции где
 z1q1 – затраты на
производство продукции (издержки производства) отчетного периода;
 z0 q1 – затраты на
производство той же
П
Ip Ip
сколько товары
в отчетном периоде стали дороже (дешевле),
чем в базисном
периоде.
На сколько денежных единиц
товары в базисном периоде
стали дороже
(дешевле) из за
изменения цен
на них в отчетном периоде.
л
Во сколько раз
возросла (уменьшилась) стоимость
продукции в отчетном периоде по
сравнению с базисным периодом
за счет изменения
цен на товары и
объемов их производства или реализации.
Во сколько раз изменились издержки производства
продукции в отчетном периоде по
сравнению с базисным периодом
в результате изменения себестоимости продукции.
На сколько денежных единиц
увеличилась
(уменьшилась)
стоимость продукции в текущем периоде по
сравнению с базисным периодом за счет изменения цен на
товары и объемов их производства или реализации.
На сколько денежных единиц
изменились издержки производства в результате роста
(уменьшения)
себестоимости
продукции.
продукции при условии, что себестоимость
продукции остается на
уровне базисного периода.
Индекс
физического
объема
продукции,
взвешенный по себестоимости
продукции
Индекс
издержек
производства
(затрат
на производство)
q z
q z
Iq 
1 0
,
0 0
где  q0 z0 – затраты на
производство продукции (издержки производства) базисного периода.
I zq 
z q
z q
1 1
0
0
или
I zq  I z  I q
Во сколько раз изменились издержки производства
продукции в отчетном периоде по
сравнению с базисным периодом
в результате роста
(уменьшения) объема ее производства.
Во сколько раз
возросли (уменьшились) издержки
производства продукции в отчетном
периоде по сравнению с базисным
периодом в результате изменения себестоимости
продукции и объема ее производства.
На сколько денежных единиц
изменились издержки производства продукции в результате
роста
(уменьшения) объема
ее производства.
На сколько денежных единиц
увеличились
(уменьшились)
издержки производства продукции в текущем периоде по
сравнению с базисным периодом за счет изменения себестоимости
и
объема ее производства.
7.3. Средние индексы
Средний индекс – это индекс, вычисленный как средняя величина из индивидуальных индексов.
Средний взвешенный индекс получают путем преобразования агрегатного индекса и должен быть тождественен ему. При исчислении средних индексов используются две формы средних: арифметическая и гармоническая.
Схема вычисления средних индексов
ИндивиПроизводные
Агрегатный
Индекс дуальный
индивидуаль- Средний индекс
индекс
индекс
ных индексов
Цен
ip 
p1
p0
Пааше:
I pП 
pq
p q
p1  i p  p 0
Арифметический:
I pП 
1 1
0 1
i  p q
p q
p
0 1
0 1
p1
ip
p0 
Гармонический:
I pП 
pq
pq
 i
1 1
1 1
p
Лайспереса:
I pл 
pq
p q
p1  i p  p 0
I pл 
1 0
0
Арифметический:
0
i  p q
p q
p
0
0
p1
ip
p0 
0
0
Гармонический:
I pл 
pq
pq
 i
1 0
1 0
Физического
объема
iq 
q1
q0
Ip 
q p
q p
p
1
0
0
0
q1  iq  q0
Арифметический:
Iq 
i  q p
q p
q
0
0
q0 
q1
iq
0
0
Гармонический:
Iq 
p q
p q
 i
0 1
0 1
q
Себестоимости
iz 
z1
z0
Iz 
z q
z q
1 1
z1  i z  z 0
Арифметический:
Iz 
0 1
i  z q
z q
z
0 1
0 1
z0 
z1
iz
Гармонический:
Iz 
z q
zq
 i
1 1
1 1
Производительности
труда
iw 
w1
w0
Iw 
w T
w T
1 1
z
w1  iw  w0
Арифметический:
Iw 
0 1
i  w T
w T
w
0 1
0 1
w0 
w1
iw
Гармонический:
Iw 
w T
wT
 i
1 1
1 1
w
7.4. Индексы переменного и постоянного состава, индекс структурных
сдвигов
Если любой качественный индексируемый показатель (себестоимость,
цену, производительность труда и т.д.) обозначить через a, а его веса – через
b, то динамику среднего показателя (средней себестоимости, средней цены,
средней производительности труда и т.д.) можно отразить как за счет изменения обоих факторов (a и b), так и за счет каждого фактора в отдельности.
Например, средняя производительность труда на предприятии может
возрасти за счет ее повышения у рабочих отдельных специальностей и увеличения удельного веса рабочих с более высокой производительностью труда в общей численности рабочих.
Совместное действие указанных факторов на общее изменение динамики среднего уровня явления, а также роль каждого фактора в отдельности в
общей динамике средней выявляются в статистике при помощи системы взаимосвязанных индексов: индекса переменного состава, индекса постоянного
(фиксированного) состава и индекса структурных сдвигов.
Индекс переменного состава - это индекс, выражающий соотношение
средних уровней изучаемого явления, относящихся к разным периодам времени
Индекс переменного состава разбивается на два индекса-сомножителя:
индекс постоянного (фиксированного) состава и индекс структурных сдвигов.
Индекс переменного состава характеризует изменение среднего уровня
признака за счет одновременного влияния двух факторов. Индекс переменного состава отражает изменение не только индексируемой величины (a), но
структуры совокупности (весов) - b):
I пс 
a1
a0

a b : a b
b b
1 1
0 0
1
0
 I фс  I сс .
Динамику средней величины за счет изменения только самой индексируемой величины при одной и той же фиксированной структуре совокупности характеризует индекс постоянного (фиксированного) состава:
I фс 
a b : a b
b b
1 1
0 1
1
1

a b
a b
1 1
.
0 1
Индекс фиксированного состава аналогичен агрегатному индексу.
Влияние только структурных изменений, под которыми понимается изменение доли отдельных единиц совокупности в общей их численности при
неизменном уровне индексируемой величины характеризует индекс структурных сдвигов:
I сс 
a b : a b
b b
0 1
0 0
1
0
.
Если в индексах средних уровней в качестве весов используются удельные веса единиц совокупности в общей численности совокупности (показатели доли d  b :  b ), то система индексов может быть записана в следующем
виде:
I пс 
a d
a d
1 1
0
0
; I фс 
a d
a d
1 1
0
1
; I сс 
a d
a d
0 1
0
0
.
Абсолютный прирост (уменьшение) среднего уровня признака в целом
по совокупности за счет всех факторов находится как разность числителя и
знаменателя индекса переменного состава:
a  a1  a0 
a b  a b
b b
1 1
0 0
1
0
или a   a1d1   a0 d 0 .
Абсолютный прирост (уменьшение) среднего уровня признака в целом
по совокупности за счет отдельных факторов рассчитывается как разность
числителей и знаменателей индексов постоянного состава и структурных
сдвигов:
1. За счет изменения значений изучаемого признака у отдельных единиц
совокупности:
a ( a ) 
a b  a b  a b  a b


b b
1 1
0 1
1
1
1 1
0 1
или a ( a )   a1d1   a0 d1 .
2. За счет структурных изменений:
a ( d ) 
a b  a b
b
b
0 1
0 0
1
0
или a ( d )   a0 d1   a0 d 0 .
В общем виде:
a  a (a )  a (d )
7.5. Цепные и базисные индексы
В ряде случаев для анализа социально-экономических явлений применяется система индексов.
Если показатели каждого периода последовательно сравниваются с показателями одного периода, принятого за базу сравнения, то индексы, с помощью которых происходит такое сравнение, называются базисными.
Если показатели каждого периода последовательно сравниваются с показателями непосредственно предшествующего периода, то индексы называются цепными.
Цепные и базисные индексы могут быть как индивидуальными, так и
общими. Различают общие базисные и цепные индексы с постоянными и переменными весами.
Система индексов
Индекс
Базисные индексы
Цепные индексы
Индивидуальные индексы
q1 q 2 q3
q1 q 2 q3
Индекс физического
; ;
; ;
и т.д.
и т.д.
объема
q0 q0 q0
q0 q1 q 2
p1 p 2 p3
p1 p2 p3
Индекс цен
; ;
; ;
и т.д.
и т.д.
p0 p0 p0
Цепные индексы получаются из базисных путем деления данного базисного
индекса
на
p0 p1 p2
Произведение последовательных цепных индексов дает базисный
индекс последнего пери-
предыдущий:
ода:
q1 q 2 q3 q3
 
 .
q0 q1 q 2 q0
q 2 q1 q 2
.
:

q0 q0 q1
Общие индексы с постоянными весами
Индекс физического
 q1 p0 ;  q2 p0 ;  q3 p0
 q1 p0 ;  q2 p0 ;  q3 p0
объема
 q0 p0  q0 p0  q0 p0
 q0 p0  q1 p0  q2 p0
и т.д.
Индекс цен
и т.д.
p q ;p q ;p q
p q p q p q
1 1
2 1
3 1
0 1
0 1
0 1
и т.д.
Отношение базисного
индекса отчетного периода к базисному индексу
предшествующего периода дает цепной индекс
отчетного периода:
q
q
2
p0
0
p0
q p
:
q p
1
0
0
0
q p

q p
2
0
1
0
.
p q ;p q ;p q
p q pq p q
1 1
2 1
3 1
0 1
1 1
2 1
и т.д.
Базисные индексы можно получить, перемножив
последовательно
цепные индексы, начиная с первого:
q p   q p
q p q p
1
0
0
0
2
1
0
0

q
q
2
p0
0
p0
.
Общие индексы с переменными весами
Индекс физического
 q1 p0 ;  q2 p1 ;  q3 p2
 q1 p0 ;  q2 p1 ;  q3 p1
объема
 q0 p0  q0 p1  q0 p2
 q0 p0  q1 p1  q2 p2
и т.д.
Индекс цен
p q ;p q ;p q
p q p q p q
и т.д.
1 1
2
2
3 3
0 1
0
2
0
3
p q ;p q ;p q
p q pq p q
1 1
2
2
3
2
0 1
1 2
2
3
и т.д.
и т.д.
Для индексов с переменными весами переход от
цепных индексов к базисным (и наоборот) невозможен.
Задачи по теме
1. По условным данным о затратах на производство продукции определить:
1. Общие индексы: а) суммы затрат на производство, б) себестоимости
единицы продукции, в) физического объема;
2. Абсолютное изменение общих затрат на производство в текущем периоде по сравнению с плановым в целом, а также за счет изменения: а)
себестоимости единицы, б) объема ее производства.
Показать взаимосвязь показателей.
Изделие Изменение себесто- Общие затраты на производство, тыс. руб.
имости единицы
по плану
фактически
z
q
продукции, %
z1q1
0 0
1
–3
30
34
–5
+1
---
2
3
45
13
88
Решение:
1. а) Индекс затрат на производство: I zq 
39
19
92
 z q  92 100  104,5%.
 z q 88
 z q . Т.к. по условию
I 
z q
1 1
0
б) Индекс себестоимости продукции:
0
1 1
z
не
0 1
известна себестоимость единицы продукции по плану - z 0 , но дано изменение
себестоимости единицы продукции (зная которое можно определить индивидуальный индекс), воспользуемся формулой среднего гармонического индекса: I z 
z q
zq
 i
1 1
1 1
z

92
92
 100   100  96,8% .
34
39
19
95


0,97 0,95 1,01
в) Индекс физического объема продукции, взвешенный по себестоимости продукции: I q 
q z
q z
1 0
0 0

95
 100  108% .
88
Общее увеличение затрат на производство составило 4,5% в результате
изменения как себестоимости продукции, так и объема ее производства.
В результате изменения себестоимости продукции издержки производства в отчетном периоде по сравнению с плановым снизились на 3,2%.
В результате изменения объема производства общие затраты в отчетном
периоде по сравнению с плановым увеличились на 8,0%.
Взаимосвязь индексов: I zq  I z  I q 
96,8  108
 104,5% .
100
2. Разность числителя и знаменателя индекса затрат на производство показывает, на сколько денежных единиц изменились издержки производства
продукции в текущем периоде по сравнению с плановым за счет изменения и
себестоимости продукции, и объема ее производства.
zq   z1q1  z0 q0  92  88  4тыс.руб.
а) Разность числителя и знаменателя индекса себестоимости продукции
показывает, на сколько денежных единиц изменились издержки производства в результате изменения только себестоимости продукции.
zq( z)   z1q1  z 0 q1  92  95  3тыс.руб.
б) Разность числителя и знаменателя индекса физического объема продукции показывает на сколько денежных единиц изменились общие издержки производства в результате изменения только объема производства.
zq(q)   q1 z0  q0 z0  95  88  7тыс.руб.
Общее изменение затрат можно определить также как сумму влияния
отдельных факторов: zq  zq ( z )  zq (q)  3  7  4тыс.руб.
2. По условным данным о производстве продукции определить:
1. Индивидуальные индексы цен.
2. Общие индексы цен: а) агрегатный, б) среднегармонический, в) переменного, фиксированного состава, структурных сдвигов.
3. Абсолютное изменение средней цены в целом по совокупности за счет
влияния отдельных факторов.
Показать взаимосвязь показателей.
Изделие
Цена за единицу продукции,
Стоимость продукции,
тыс.руб.
тыс.руб.
базисный
отчетный
базисный
отчетный
период
период
период
период
1
2
3
p0
p1
p0 q0
p1q1
4,0
6,0
1,4
---
5,0
5,0
1,2
---
800
360
1120
2280
1200
250
780
2230
Решение:
Для проведения расчетов составим дополнительную таблицу.
Изделие
Количество
Стоимость продукции,
Индивидуальпродукции, шт.
реализованной
ный индекс
цен, %
базисный отчетный в отчетном периоде по
базисным ценам,
период
период
ip
q0
тыс.руб.
q1
p0 q1
1
2
3
200
60
800
1060
240
50
650
940
960
300
910
2170
1. Индивидуальный индекс цен i p 
125,0
83,3
85,7
---
p1
 100 рассчитывается по каждому
p0
виду продукции. Данные расчетов занесены в таблицу. Цены по первому виду продукции возросли на 25%, по второму и третьему снизились
соответственно на 16,7% и 14,3%.
2. Общие индексы цен:
а) Агрегатный индекс определим по формуле Паше:
I pП 
pq
p q
1 1

0 1
2230
 100  102,8% .
2170
б) Среднегармонический индекс получен преображением агрегатного,
поэтому равен с ним количественно и совпадает по смыслу:
I pП 
pq
pq
 i
1 1
1 1
p

2230
 100  102,8% .
1200 250
780


1,25 0,833 0,857
в) Индекс переменного состава:
Ip
пс

p q :p q
q q
1 1
0
1
2230 2280

 100  110,3% .
940 1060

0
0
Индекс фиксированного состава аналогичен агрегатному индексу:
Ip
фс
pq :p q
q q

1 1
0 1
1
1
сс
p q :p q
q q
0 1
0
1
0
0
Взаимосвязь индексов: I пс  I фс
pq
p q
1 1
 102,8% .
0 1
Индекс структурных сдвигов:
Ip 

2170 2280

 100  107,3% .
940 1060
102,8  107,3
 I сс 
 110,3% .
100

3. Абсолютное изменение средней цены находится как разность числителя и знаменателя индекса переменного состава:
 P  P1  P0 
p q p q
q
q
1 1
0
1
0
0

2230 2280

 0,222 тыс.руб.
940 1060
Это изменение складывается под влиянием двух факторов:
а) Изменения цен на отдельные товары (разность числителя и знаменателя индекса фиксированного состава):
 P( p) 
p q p q
q
q
1 1
0 1
1
1

2230 2170

 0,064 тыс.руб.
940
940
б) Изменения структуры продукции (разность числителя и знаменателя
индекса структурных сдвигов):
 P (q ) 
p q p q
q
q
0 1
1
0
0
0

2170 2280

 0,158 тыс.руб.
940 1060
Общее абсолютное изменение средней цены можно определить также
как сумму влияния отдельных факторов:
 P   P( p)   P(q)  0,064  0,158  0,222 тыс.руб.
Средний уровень цен по группе товаров увеличился на 222 рубля
(10,3%) за счет одновременного влияния двух факторов – цен на отдельные
виды продукции и структуры продаваемых изделий.
Средняя цена увеличилась на 64 рубля (2,8%) за счет изменения только
самой индексируемой величины – цены при одной и той же фиксированной
структуре продукции.
Влияние только структурных изменений, под которыми понимается изменение доли отдельных видов продукции в общей их численности при
неизменном уровне цен на эти виды продукции привело к росту средней цены на 158 рублей (7,3%).
3. Определить индекс физического объема производства, если общие затраты
времени на производство продукции снизились на 8%, а выработка продукции увеличилась на 2%.
Решение:
Из формулы выработки w 
q  T w.
q
выразим физический объем производства
T
Индекс физического объема равен произведению индексов состав-
ляющих его показателей iq  iT  iw 
92  102
 93,8% . Физический объем произ100
водства снизился на 6,2%.
8. Ряды динамики
8.1. Понятие рядов динамики, их виды и требования к построению
Для характеристики и анализа различных социально-экономических явлений за некоторый период времени применяют показатели и методы, характеризующие эти процессы во времени (динамике).
Ряд динамики – это ряд последовательно расположенных статистических показателей (в хронологическом порядке), изменение которого показывает определенную тенденцию развития изучаемого явления.
В каждом ряду динамики имеются два основных элемента: время (t) и уровень ряда (y).
Виды рядов динамики
1. В зависимости от показателя времени:
 моментные (на определённую дату – например, начало или конец месяца, квартала, года). Отдельные уровни моментного ряда динамики
абсолютных величин содержат элементы повторного счета.
 интервальные (за определённый период - за сутки, месяц, год)
2. По форме представления (способу выражения уровней):
 абсолютных величин
 относительных величин
 средних величин
3. По расстоянию между временем:
 равноотстоящие
 неравноотстоящие
4. В зависимости от наличия основной тенденции изучаемого процесса:
 стационарные
 нестационарные
При построении динамических рядов необходимо соблюдать определенные правила (требования).
Важнейшим условием правильного построения ряда динамики является
сопоставимость всех входящих в него уровней. Данное условие решается либо в процессе сбора и обработки данных, либо путем их пересчета.
Требования к сопоставимости уровней ряда динамики
 Однородность по экономическому содержанию
 Одинаковость территориальных границ
 Единые методологии учета или расчета показателей




Одинаковая полнота охвата различных частей явления
Единые единицы измерения
Одинаковый круг охватываемых объектов
Равенство периодов учета
Если имеются уровни ряда, которые исчислены по разной методике или
в неодинаковых границах, то такой ряд динамики приводят к сопоставимому
виду с помощью так называемого метода смыкания рядов. Под смыканием
рядов понимают соединение в один более длинный динамический ряд (или
нескольких) рядов динамики, уровни которых исчислены по разной методике
или по неодинаковым границам территорий. Необходимое условие смыкания
– наличие за один период данных, рассчитанных по разной методике (или в
неодинаковых границах).
Первая методика смыкания ряда предполагает расчет коэффициентов
перехода из старых границ в новые (или наоборот) или старой методики в
новую.
Другая методика заключается в том, что уровни года, в котором происходили изменения (как до, так и после изменений), принимают за 100%, а
остальные уровни ряда пересчитывают в процентах по отношению к этим
уровням соответственно. В результате получают сомкнутый ряд.
Если оценка показателей проводится по разным административным территориям с различными методиками расчёта или по различным ценам, то такой ряд приводят к единому основанию, т.е. к одному и тому же периоду или
моменту времени, уровень которого принимается за базу сравнения, а все
остальные выражаются в процентах по отношению к нему.
8.2. Показатели ряда динамики
Одно из важнейших направлений анализа рядов динамики - изучение
особенностей развития явления за отдельные периоды. С этой целью для динамических рядов рассчитывают ряд абсолютных и относительных показателей.
Существует два метода анализа в рядах динамики – базисный и цепной.
При расчете показателей базисным методом каждый уровень ряда сравнивается с одним и тем же базисным уровнем (как правило, это первый уровень ряда).
При расчете показателей цепным методом каждый уровень ряда сравнивается с предыдущим.
Расчет абсолютных и относительных показателей ряда динамики
Название
Содержание и методика расчета
Разность между двумя уровнями ряда динамики. Имеет
Абсолютный
ту же размерность, что и уровни самого ряда динамики.
прирост
Характеризует абсолютную скорость изменения показателя.
Абсолютные приросты могут быть цепными и базисными.
Цепной абсолютный прирост:
y ц  y i  y i 1 ,
где yi – текущий уровень ряда (отчётный период);
yi-1 – предыдущий уровень ряда (период).
Базисный абсолютный прирост:
y Б  yi  y 0 ,
где y0 – базисный уровень ряда.
Относительный показатель, характеризующий интенсивТемп
(коэффициент) ность изменения уровня ряда. Темпы роста могут рассчитываться как цепные (с предшествующим уровнем ряда),
роста
так и базисные (с одним и тем же уровнем y0, выбранным
за базу сравнения).
Коэффициент роста показывает, во сколько раз увеличивается уровень ряда динамики по сравнению с базисным
(предыдущим) периодом. Темпы и коэффициенты роста
отличаются формой выражения. Темпы роста измеряются
в процентах, коэффициенты роста – в разах.
Цепной темп роста:
yi
 100 .
yi 1
ц
Тр 
Базисный темп роста:
Б
Тр 
Темп
прироста
yi
 100 .
y0
Характеризует относительную скорость изменения уровня ряда в единицу времени. Темпы прироста могут быть
цепными и базисными.
Цепной темп прироста:
ц
Т пр 
y ц
ц
ц
 100 или Т пр  Т р  100 .
yi 1
Базисный темп прироста:
Б
Т пр 
y Б
Б
Б
 100 или Т пр  Т р  100 .
y0
Определяется только по цепным темпам прироста, как
Абсолютное
значение
1% сотая часть от предыдущего уровня ряда:
y
прироста
y ц
А(%) 
 i 1 .
ц
Т пр
100
При росте уровней ряда темпы роста могут иметь тенденцию к сокращению (уменьшению) или иметь незначительные отклонения. Абсолютное значение одного процента при этом всегда будет расти.
Между цепными и базисными показателями существуют взаимосвязи:
 сумма последовательных цепных абсолютных приростов равна базисному, т.е. общему приросту за весь период.
 произведение всех последовательных цепных коэффициентов роста
равно конечному базисному коэффициенту роста за весь период;
 частное от деления последующего базисного коэффициента роста на
предыдущий равно соответствующему цепному коэффициенту роста.
8.3. Средние показатели ряда динамики
Средние показатели дают обобщающую характеристику динамики исследуемого явления.
Средние значения определяются в зависимости вида ряда динамики.
Расчет средних показателей
Показатель
Содержание показателя и методика расчета
Формула для расчета выбирается в зависимости от
Средний уровень
вида ряда динамики.
ряда
Для интервального ряда с равными интервалами –
формула средняя арифметическая простая:
y

yi
n
,
где n - число уровней ряда динамики.
Для интервального ряда с неравными интервалами –
формула средняя арифметическая взвешенная:
y

yi  ti
ti
.
Для моментного ряда с равными интервалами –
формула средняя хронологическая простая:
y1  y 2  ...  y n1  12 y n
.
y
n 1
1
2
Для моментного ряда с неравными интервалами –
формула средняя хронологическая взвешенная:
y
Средний
абсолютный
прирост
( y1  y 2 )  t1  ( y 2  y3 )  t 2  ...  ( y n1  y n )  t n1
.
2  (t1  t 2  ...  t n1 )
Может определяться двумя способами:
 по формуле:
y 
y n  y1
,
n 1
где y1 – первый уровень ряда динамики;
yn – последний уровень ряда динамики.
 по формуле средней арифметической простой:
 y
y 
m
ц
,
где m – число цепных абсолютных приростов.
Характеризует абсолютную скорость развития явления во времени и даёт возможность определить,
насколько в среднем за единицу времени должен
Средний темп
роста
увеличиться (уменьшиться) уровень ряда, чтобы, отправляясь от начального уровня за данное число периодов, достигнуть конечного уровня.
Может определяться двумя способами:
 по цепным коэффициентам роста как средняя
геометрическая:
Т р  m 1 K цр1  K цр 2  ...  K цр m  100 ,
где m – число цепных коэффициентов роста.
 по формуле:
Т р  n1
Средний темп
прироста
yn
 100 .
y1
Средний темп роста показывает, во сколько раз в
среднем за единицу времени изменился уровень динамического ряда.
Определяется по формуле:
Т пр  Т р  100 .
8.4. Методы выявления тенденции развития явления в ряду динамики
Тренд – это основная (достаточно устойчивая) тенденция развития явления в ряду динамики.
Для выявления общей тенденции в рядах динамики используют специальные методы.
Методы механического выравнивания
1. Метод укрупнения интервалов – переход от первоначальных значений динамического ряда к ряду с большими временными промежутками.
Так, месячные значения укрупняют в квартальные, квартальные – в годовые,
годовые - по пятилеткам и т.д. При этом проводится простое суммирование
величин, а также расчет средних уровней за укрупнённый период.
В результате более четкого проявляется общая тенденция развития явления. Однако она не учитывает изменения внутри укрупнённых интервалов.
2. Метод скользящей средней – расчёт средних уровней динамического
ряда по укрупнённым интервалам путём последовательного смещения начала
отсчёта на один временной период.
Выбор интервала сглаживания зависит от условия, например, для нечётного ряда, состоящего из 15 уровней, применяют трёх-, пяти-, семичленную
скользящую среднюю (но не более половины ряда).
Метод аналитического выравнивания
Аналитическое выравнивание дает количественную модель, выражающую основную тенденцию изменения уровней во времени.
Общая тенденция развития рассчитывается как функция времени:
yˆ t  f (t ) .
Выбор адекватной математической функции, которая лучше отображает
тренд должен быть основан на теоретическом анализе, выявляющем характер
развития явления.
Примером математической модели являются:
 линейная функция – yˆ t  a0  a1t
 показательная функция – yˆ t  a0  a1t
1
 гипербола – yˆ t  a 0  a1
t
где a 0 , a1 – параметры уравнения;
t – время (порядковый номер периода или момента времени).
Например, при выравнивании ряда динамики по прямой оценка параметров уравнения осуществляется методом наименьших квадратов. Метод
заключается в минимизации суммы квадратов отклонений эмпирических
(фактических) значений результативного признака от теоретических, полученных по выбранному уравнению.
Для этого решается система нормальных уравнений:
a0 n  a1  t   y

2
a0  t  a1  t   yt
Расчет параметров значительно упрощается, если за начало отсчета времени (t=0) принять центральный интервал (момент). Если число членов ряда
нечетное, то t = …-4, -3, -2, -1, 0, 1, 2, 3, 4… Если число членов ряда четное,
то t = …-5, -3, -1, 1, 3, 5… При этом  t  0 и система уравнений примет вид:
a0 n   y

2
a1  t   yt
y
Выразим из первого уравнения a 0   .
n
yt
Из второго уравнения a1   2 .
t
Найденные параметры необходимо подставить в уравнение прямой
yˆ t  a0  a1t , которое в результате будет представлять собой трендовую модель
искомой функции.
8.5. Прогнозирование и экстраполяция в ряду динамики
Статистические методы занимают важное место в системе методов прогнозирования.
Базу для прогнозирования создают выявление и характеристика трендов
и моделей взаимосвязей. Применение прогнозирования предполагает, что закономерность развития, действующая в прошлом (внутри ряда динамики),
сохранится и в прогнозируемом будущем, то есть прогноз основан на экстраполяции.
Для характеристики показателей ряда динамики применяют методы, которые позволяют осуществить прогноз, найти недостающие компоненты ряда.
Метод
Характеристика
Ретрополяция Нахождение по имеющимся данным за определённый
период значений в начале динамического ряда
Интерполяция Расчет по имеющимся данным за определённый период
некоторых недостающих значений внутри этого периода
Экстраполяция Нахождение уровней за пределами изучаемого ряда, то
есть продление ряда на основе выявленной закономерности изменения уровней в изучаемый отрезок времени
Выделяют следующие методы экстраполяции: среднего абсолютного
прироста, среднего темпа роста и экстраполяцию на основе аналитического
выравнивания.
Прогнозирование по среднему абсолютному приросту может быть выполнено в случае, если общую тенденцию можно считать линейной, т.е. метод основан на предположении о равномерном изменении уровней (под равномерностью понимается стабильность абсолютных приростов).
Экстраполяцию можно выполнить по формуле:
yˆ i k  yi  y  k ,
где yˆ i  k – прогнозируемый уровень;
yi – последний уровень анализируемого ряда;
 y – средний абсолютный прирост;
k – срок прогноза.
Прогнозирование по среднему темпу роста может быть выполнено в
случае, если общая тенденция ряда характеризуется показательной кривой.
Экстраполяцию можно выполнить по формуле:
k
yˆ i  k  yi  К р ,
где К р – средний коэффициент роста.
Экстраполяция на основе аналитического выравнивания является
наиболее точным методом прогнозирования.
Зная уравнение для теоретических уровней и подставляя в него значения
t за пределами исследованного ряда, рассчитывают вероятностные значения.
yˆi  k  a0  a1t
На практике результат экстраполяции прогнозируемых явлений обычно
получают не точечными (дискретными), а интервальными оценками.
Для определения границ интервалов используют формулу:
yˆ t  t S yˆ t ,
где t – коэффициент доверия по распределению Стьюдента;
S yˆ t 
(y
i
 yˆ t ) 2
( n  m)
– остаточное среднее квадратическое отклонение от тренда,
скорректированное по числу степеней свободы (n-m);
n – число уровней ряда динамики;
m – число параметров адекватной модели тренда (для уравнения прямой
m=2).
Вероятностные границы интервала прогнозируемого явления:
yˆ t  t S yˆ t  yi k  yˆ t  t S yˆ t .
8.6. Методы изучения сезонных колебаний
В широком понимании к сезонным относят все явления, которые обнаруживают в своем развитии отчетливо выраженную закономерность внутригодовых изменений, т.е. более или менее устойчиво повторяющиеся из года в
год колебания уровней. Они являются результатом влияния природноклиматических условий, общих экономических факторов и других многочисленных и разнообразных факторов. Сезонные колебания наблюдаются в различных отраслях экономики: при производстве и переработке большинства
сельскохозяйственных продуктов, в строительстве, транспорте, торговле и
т.д.
Сезонные колебания отрицательно влияют на результаты производственной деятельности, вызывая нарушения ритмичности производства.
Комплексное регулирование сезонных изменений должно основываться на
исследовании сезонных колебаний.
Сезонные колебания характеризуются специальными показателями, которые называются индексами сезонности I S . Совокупность этих показателей отражает сезонную волну. При анализе сезонности для выявления устойчивой сезонной волны, на которой не отражались бы случайные условия одного года, используют данные не менее чем трех лет.
При исчислении индексов применяют разные методы, выбор которых
зависит от характера общей тенденции ряда динамики.
Если ряд динамики не имеет ярко выраженной тенденции развития, то
индексы сезонности исчисляют непосредственно по эмпирическим данным
без их предварительного выравнивания. Для расчёта индексов сезонности
необходимо иметь данные по периодам не менее чем за 3 года. Сущность метода заключается в определении средних по периодам y i и для всего анализируемого ряда y . По этим данным находят индекс сезонности:
IS 
yi
 100 ,
yi
где y i – средний уровень для каждого месяца (минимум за три года);
y – среднемесячный уровень для всего ряда.
Для наглядного представления сезонной волны исчисленные индексы
сезонности изображают на графике.
Когда уровень проявляет тенденцию к росту или снижению, то отклонения от постоянного среднего уровня могут исказить сезонные колебания. В
таких случаях фактические данные сопоставляют с данными, полученными
аналитическим выравниванием.
Задачи по теме
1. По условным данным о выпуске продукции провести анализ ряда динамики. Данные расчетов представим в таблице.
Условные
данные
Год
Выпуск
продукции,
тыс.шт.
Расчеты
Абсолютный
прирост,
тыс.шт.
базисный
цепной
y Б
y Ц
Темп
роста,%
базисный
Тр
Б
цепной
Тр
Абсолютное
значение
1% прицепроста,
ной
тыс. шт.
Темп
прироста,%
базисный
Ц
Т пр
Б
Т пр
Ц
А(%)
20
–
–
–
–
–
–
–
22
+2
+2
110,0
110,0
+10
+10
0,20
26
+6
+4
130,0
118,2
+30
+18,2
0,22
28
+8
+2
140,0
107,7
+40
+7,7
0,26
30
+10
+2
150,0
107,1
+50
+7,1
0,28
126
–
+10
–
–
–
–
–
Решение:
Расчетные данные по базисным и цепным показателям абсолютного
прироста, темпа роста, темпа прироста, абсолютного значения 1% прироста
представлены в таблице.
Базисный абсолютный прирост: y Б  yi  y 0 .
y Б 20072006  22  20  2 ,
y Б 20082006  26  20  6 и т.д.
Цепной абсолютный прирост: y Ц  y i  y 0 .
y Ц 20072006  22  20  2 ,
y Ц 20082007  26  22  4 и т.д.
2006
2007
2008
2009
2010
yi
 100 .
y0
22
Б
Т р 2007 / 2006 
 100  110,0 ,
20
26
Б
Т р 2008/ 2006 
 100  130,0 и т.д.
20
y
Цепной темп роста: Т р ц  i  100 .
yi 1
22
ц
Т р 2007 / 2006 
 100  110,0 ,
20
Базисный темп роста: Т р Б 
Тр
ц
2008 / 2007
26
 100  118,2 и т.д.
22
Б
 Т р  100 .

Базисный темп прироста: Т пр Б
Б
Т пр
Т пр
2007 / 2006
Б
2008/ 2006
 110  100  10 ,
 130  100  30 и т.д.
Цепной темп прироста: Т пр ц  Т р ц  100 .
Т пр
Т пр
ц
 110  100  10 ,
2007 / 2006
 118,2  100  18,2 и т.д.
ц
2008/ 2007
Абсолютное значение одного процента прироста: А(%) 
yi 1
.
100
20
 0,20 ,
100
22

 0,22 и т.д.
100
А(%) 2007 / 2006 
А(%) 2008/ 2007
В соответствии с классификацией по условию дан интервальный равноотстоящий ряд динамики абсолютных величин.
Для расчета среднего уровня ряда воспользуемся формулой средней
арифметической простой.
y

yi
n

126
 25,2 тыс.шт.
5
Средний выпуск продукции составляет 25,2 тыс.шт. в год.
Средний абсолютный прирост определим двумя способами:
 по формуле:
y 
y n  y1 30  20

 2,5 тыс.шт.
n 1
5 1
 по формуле средней арифметической простой:
y 
 y
m
ц

 10
 2,5 тыс.шт.
4
В среднем ежегодно выпуск продукции увеличивался на 2,5 тыс.шт.
Средний темп роста определим двумя способами:
 по цепным коэффициентам роста как средняя геометрическая:
Т р  m 1 K цр 1  K цр 2  ...  K цр m  100  51 1,1  1,182  1,077  1,071  100  110,7%
 по формуле:
Т р  n1
yn
30
 100  51
 100  110,7%
y1
20
Средний темп прироста: Т пр  Т р  100  110,7  100  10,7%
С 2006 по 2010 гг. выпуск продукции увеличивался в среднем на 10,7% в
год.
2. По условию задачи 1 выровнять ряд по уравнению прямой. Определить с
вероятностью 95,4% возможные пределы, в которых может находиться выпуск продукции в 2011 году.
Решение:
Результаты расчетов представлены в таблице.
yi
ŷt
y i  yˆ t
yi  t
t2
( y i  yˆ t ) 2
Год
t
2006
20
–2
4
–40
20,0
0
0
2007
22
–1
1
–22
22,6
–0,6
0,36
2008
26
0
0
0
25,2
0,8
0,64
2009
28
+1
1
28
27,8
0,2
0,04
2010
30
+2
4
60
30,4
–0,4
0,16
Итого
126
0
10
26
126
0
1,2
Для выравнивания данного ряда используем линейную трендовую модель – уравнение прямой: yˆ t  a0  a1  t . В нашем примере n=5 – нечетное число.
Определим параметры a 0 и a1 .
a0 
 y  126  25,2 ;
n
5
a1 
 yt  26  2,6 .
 t 10
2
Найденные параметры необходимо подставить в уравнение прямой
yˆ t  a0  a1  t , которое в результате будет представлять собой трендовую модель искомой функции:
yˆ t  25,2  2,6  t .
Подставляя в данное уравнение последовательно значения t , находим
выровненные уровни ŷt .
Значения уровней выровненного ряда найдены верно, т.к.
 yi =  yˆ t  126 .
Значение t за пределами исследуемого ряда равно t 2011  3 . Предполагаемый выпуск продукции в 2011 году составит yˆ 2011  25,2  2,6  (3)  33 тыс.шт.
Результат экстраполяции прогнозируемых явлений обычно получают не
точечными (дискретными), а интервальными оценками.
Для определения границ интервалов воспользуемся формулой:
yˆ t  t S yˆ t ,
Коэффициент доверия t = 2, т.к. вероятность Px = 95,4%.
Остаточное среднее квадратическое отклонение от тренда, скорректированное по числу степеней свободы (n-m):
S yˆ t 
(y
i
 yˆ t ) 2
( n  m)

1,2
 0,63
(5  2)
Вероятностные границы интервала прогнозируемого явления:
yˆ t  t S yˆ t  yi k  yˆ t  t S yˆ t
33  2  0,63  y2011  33  2  0,63
31,74  y2011  34,26
С вероятностью 95,4% можно предположить, что выпуск продукции в
2011 году будет не менее 31,74 тыс.шт., но и не более 34,26 тыс.шт.
3. По одному из промышленных объединений имеются данные о произведенной продукции в старом составе (3 предприятия) и в новом составе (4
предприятия).
Показатель
Год
2005 2006 2007 2008 2009 2010
Стоимость продукции, млн.руб.
- в старом составе
20,0 19,9 21,2 22,4
–
–
- в новом составе
–
–
–
28,3 30,1 30,0
Сомкнутый сопоставимый ряд аб- 25,2 25,1 26,7 28,3 30,1 30,0
солютных величин, млн.руб.
Сомкнутый сопоставимый ряд от- 89,3 88,8 94,6 100,0 106,4 106,0
носительных величин, %
Решение:
Показатели за 2008-2010 гг. несопоставимы с показателями за 2005-2007
гг., т.к. исчислены в неодинаковых границах. Приведем данные к сопоставимому виду с помощью метода смыкания рядов. Для этого используем две методики.
По первой методике сомкнем ряд с помощью коэффициента перехода из
старых границ в новые.
К пер 
28,3
 1,26
22,4
Пересчитаем показатели за 2008-2010 гг.:
y 2005  20,0  1,26  25,2 и т.д.
По другой методике уровень 2008 года, в котором произошли изменения, примем за 100%, а остальные уровни ряда пересчитаем в процентах по
отношению к этому уровню.
Т Р 2005 
20,0
 100  89,3 и т.д.
22,4
4. По данным о численности персонала на определенные даты определить
среднюю списочную численность персонала.
С 1 по 15 апреля работали 20 человек, с 16 по 25 апреля – 27 человек, с
26 по 30 апреля – 30 человек.
Решение:
В соответствии с классификацией по условию дан интервальный ряд с
неравными интервалами.
Для расчета среднего уровня ряда воспользуемся формулой средней
арифметической взвешенной.
y

yi  t i
ti

20  15  27  10  30  5
 24 .
30
Средняя списочная численность работников в апреле составила 24 человека.
5. По данным об остатках вкладов в банке определить средние месячные
остатки вкладов за 2 квартал.
1 апреля – 22 млн.руб.
1 мая – 28 млн.руб.
1 июня – 30 млн.руб.
1 июля – 32 млн.руб.
Решение:
В соответствии с классификацией по условию дан моментный ряд с равными интервалами.
Для расчета среднего уровня ряда воспользуемся формулой средней
хронологической простой:
y
1
2
y1  y 2  ...  y n1  12 y n 12 22  28  30  12 32

 28
n 1
3
.
Среднемесячные остатки вкладов во 2квартале составили 28 млн.руб.
6. В марте по сравнению с февралем цены возросли на 8%, в апреле по сравнению с мартом на 11%. Определить: на сколько процентов возросли цены в
апреле по сравнению с февралем; среднемесячный темп прироста цен с февраля по апрель.
Решение:
1. По условию можно определить цепные темпы роста.
Тр
Тр
ц
ц
м/ф
а/ м
 8  100  108%
 11  100  111%
Между цепными и базисными показателями существует следующая взаимосвязь: произведение всех последовательных цепных коэффициентов роста равно конечному базисному коэффициенту роста за весь период.
Т рБ апр / фев р  К цр м арт/ фев р  К цр апр / м арт  100  1,08  1,11  100  119,9%
В апреле по сравнению с февралем цены возросли на 19,9 процентов.
2.Средний темп прироста: Т р  m 1 K цр1  K цр 2  ...  K цр m  100  n K pБ  100
Т р  2 K цр март/ февр  K цр апр / март  100  2 K pБ апр / февр  100  2 1,199  100  109,5%
7. По данным об остатках оборотных средств определить средние месячные
остатки за год.
1 января – 80 тыс.руб.
1 мая – 20 тыс.руб.
1 октября – 110 тыс.руб.
1 января – 60 тыс.руб.
Решение:
В соответствии с классификацией по условию дан моментный ряд с неравными интервалами.
Для расчета среднего уровня ряда воспользуемся формулой средней
хронологической взвешенной:
( y1  y 2 )  t1  ( y 2  y3 )  t 2  ...  ( y n1  y n )  t n1
.
2  (t1  t 2  ...  t n1 )
(80  20)  4  (20  110)  5  (110  60)  3
y
 65 .
2  (4  5  3)
y
Среднегодовые остатки оборотных средств составили 65 тыс.руб.
9. Статистическое изучение взаимосвязей социально–экономических
явлений
9.1. Виды и формы взаимосвязей между явлениями
Общественная жизнь состоит из большого количества сложных явлений,
которые формируются под влиянием многочисленных, разнообразных и взаимосвязанных факторов. Понять и изучить какое либо явление можно, исследуя его во взаимосвязи с окружающими признаками.
В статистике различают факторные и результативные признаки.
Факторные признаки (x) – это признаки, обуславливающие изменения
других, связанных с ними признаков.
Результативные признаки (у) – это признаки, меняющиеся под действием факторных признаков.
Между явлениями и их признаками различают два вида связей: функциональные и стохастические, каждая из которых имеет свои особенности.
Частным случаем стохастической связи является корреляционная связь.
Особенности функциональной связи:
 определенному значению величины факторного признака соответствует
только одно значение результативного признака;
 она обычно выражается формулами, что в большей степени присуще
точным наукам (математике, физике)
 функциональная зависимость с одинаковой силой проявляется у всех
единиц совокупности;
 она является полной и точной, так как обычно известны перечень всех
факторов и механизм их воздействия на результативный признак в виде
уравнения.
Особенности корреляционной связи:
 средняя величина результативного признака меняется под влиянием изменения факторных признаков (ряд из которых может быть неизвестен);
 разнообразие факторов, их взаимосвязи и противоречивые действия вызывают широкое варьирование результативного признака;
 корреляционные связи обнаруживаются не в единичных случаях, а в
массе и требуют для своего исследования массовых наблюдений;
 связь между признаками-факторами и результативным признаком неполная, а проявляется лишь в общем, среднем.
В зависимости от направления действия функциональные и корреляционные связи делят на прямые и обратные; по аналитическому выражению
(по форме) - на прямолинейные (линейные) и криволинейные (нелинейные).
При прямых связях с увеличением (уменьшением) значений факторного
признака происходит увеличение (уменьшение) результативного признака.
При обратных связях – с увеличением (уменьшением) значений факторного признака происходит уменьшение (увеличение) результативного
признака.
Под формой связи понимают тенденцию, которая проявляется в изменении результативного признака в связи с изменением признака-фактора. Она
может быть выражена различными математическими функциями.
При прямолинейных связях с возрастанием величины факторного признака происходит равномерное возрастание (или убывание) величин результативного признака (выражают уравнением прямой линии).
При криволинейных связях – с возрастанием величины факторного признака возрастание (или убывание) результативного признака происходит неравномерно или направление его изменения меняется на обратное (выражаются уравнениями кривых линий: гиперболой, параболой, др.).
Корреляционные связи в зависимости от количества признаков, включенных в модель, делятся на парные и множественные.
Если оценивается связь между одним признаком-фактором и результативным признаком (при абстрагировании влияния других), то такая связь
называется однофакторной (парной).
Многофакторные (множественные) – это связи между несколькими
факторными признаками и результативным признаком (факторы действуют
комплексно, т.е. одновременно и во взаимосвязи).
9.2. Методы измерения связей между количественными признаками
Для изучения связи между количественно-варьирующими признаками
используются следующие методы:
1. Метод сопоставления двух параллельных рядов;
2. Метод аналитических группировок;
3. Графический метод (корреляционного поля);
4. Табличный метод (корреляционной таблицы);
5. Корреляционно-регрессионый анализ.
1. Метод сопоставления двух параллельных рядов
Сущность метода сопоставления двух параллельных рядов заключается
в сопоставлении значении факторного и результативного признаков. Для
этого значения факторных признаков располагают в возрастающем или убывающем порядке. Параллельно записывают значения результативных при-
знаков. Путем сопоставления расположенных таким образом рядов значений
выявляют существование связи и ее направление.
Коэффициент Фехнера (коэффициент корреляции знаков) основан на
степени согласованности направлений отклонений индивидуальных значении факторного и результативного признаков от соответствующих средних
величин. Для расчета этого показателя исчисляют средние значения факторного и результативного признаков (по арифметической простой), а затем
проставляют знаки отклонений для значений взаимосвязанных пар признаков: если фактическое значение признака больше средней величины, то ставится знак «+», если меньше - то знак «-»).
Коэффициент Фехнера определяется по формуле:
СН
Кф 
СН ,
где С – количество совпадений знаков;
Н – количество несовпадений знаков.
Коэффициент Фехнера может принимать любые значения в пределах от
–1 до +1. Если Кф=1, то это значит, что знаки всех отклонений совпадают.
Если знаки всех отклонений разные, то Кф = -1, это дает возможность предположить наличие обратной связи. Этот показатель позволяет уловить
направление связи, но не учитывать точно ее величину.
2. Метод аналитических группировок
Чтобы выявить зависимость с помощью метода аналитических группировок, нужно произвести группировку единиц совокупности по факторному признаку и для каждой группы вычислить среднее значение результативного признака. Сопоставляя затем изменения результативного признака по
мере изменения факторного, можно выявить направление, характер и тесноту
связи между ними с помощью эмпирического корреляционного отношения.
3. Графический метод
Связь между признаками можно увидеть, при помощи графического
метода. Для этого, на оси абсцисс откладывают значения факторного признака (x), на оси ординат – значения результативного признака (y). Нанеся на
графике точки, соответствующие значениям x и y, можно получить корреляционное поле, благодаря которому по характеру расположения точек можно
судить о направлении и силе связи. Если точки беспорядочно разбросаны по
всему полю, это говорит об отсутствии зависимости между двумя признаками. Если они концентрируются вокруг оси, идущей от нижнего левого угла в
верхний правый, то имеется прямая зависимость между варьирующими признаками. Если точки концентрируются вокруг оси, идущей от верхнего левого угла в нижний правый, то существует обратная зависимость.
4. Табличный метод
Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков. Факторный признак x, располагают в строках, а результативный признак y – в столбцах таблицы. Числа,
расположенные на пересечении строк и столбцов таблицы, означают частоту
повторения данного сочетания значения x и y. Корреляционная таблица дает
возможность выдвинуть предположение о наличии или отсутствии связи, а
также выяснить ее направление. Если частоты расположены на диагонали из
левого верхнего угла в правый нижний угол, то можно предположить наличие прямой корреляционной зависимости между признаками. Если же частоты расположены по диагонали справа налево, то предполагают наличие обратной связи между признаками.
5. Корреляционно-регрессионный анализ
Рассмотренные выше методы являются качественными методами установления связи. Метод корреляционного и регрессионного анализа дает количественную оценку, показывает направление и силу связи.
Корреляционно-регрессионый анализ предполагает установление аналитической формы связи (регрессионный анализ) и количественное измерение тесноты, направления связи (корреляционный анализ).
По количеству включаемых факторов модели могут быть однофакторными - парная регрессия и многофакторными (два и более факторов) – множественная регрессия.
Корреляционный метод имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной
связи).
Чаще всего для характеристики регрессии используют следующие типы
функций.
Типы функций, используемых для характеристики регрессии,
и методика их определения
Функция
Методика расчета
Парная регрессия:
Линейная связь
yˆ x  a0  a1 x,
Множественная регрессия:
yˆ1, 2,3,.... n  a0  a1 x1  a2 x2  ....  an xn
Параболическая
связь
Парная регрессия:
yˆ x  a0  a1 x  a2 x 2
Множественная регрессия:
2
2
2
yˆ1, 2,3,.... n  a0  a1 x1  a2 x2  ....  an xn
Гиперболическая
связь
Показательная
функция
Парная регрессия:
yˆ x  a0  a1
1
x
Множественная регрессия:
a
a
a
a
yˆ1, 2,3,... n  a0  1  2  3  ...  n
x1 x2 x3
xn
Парная регрессия:
x
yˆ x  a0 a1 ,
Множественная регрессия:
yˆ1, 2,3,.... n  e a0  a1x1  a2 x2 ....  an xn
Степенная функция
Парная регрессия:
yˆ x  a0 X a1 ,
Множественная регрессия:
yˆ1, 2,3,.... n  a0 x1a1  x2a2  x3a3  ....  xnan
Оценка параметров уровней регрессии (а0, а1, а2,… ,аn) осуществляется
методом наименьших квадратов. Метод заключается в минимизации суммы
квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии.
Каждый коэффициент регрессии показывает, на сколько в среднем изменится величина результативного признака в случае изменения факторного на
единицу при фиксированном положении остальных факторов.
9.3. Однофакторный линейный корреляционно-регрессионный анализ
При равномерном развитии явления основная тенденция выражается линейной функцией.
Уравнение однофакторной (парной) линейной регрессии имеет вид:
yˆ  a0  a1 x ,
где ŷ – теоретические значения результативного признака, полученные по
уравнению регрессии;
а 0 , а1 – параметры (коэффициенты) уравнения регрессии.
Коэффициент парной линейной регрессии а1 имеет смысл показателя
силы связи между вариацией факторного признака x и вариацией результативного признака y. Он показывает среднее значение изменения результативного признака y при изменении факторного признака x на одну единицу его
измерения, т.е. вариацию y, приходящуюся на единицу вариации x. Знак а1
указывает направление этого изменения.
Параметры уравнения а0 и а1 находят методом наименьших квадратов.
Для этого решается система нормальных уравнений:
na0  a1  x   y

2
a0  x  a1  x   xy
Параметры уравнения парной линейной регрессии:
a1 
xy  x  y
x2  x
2
;
a0  y  a1 x .
Определив значения а0, а1 и подставив их в уравнение связи yˆ  a0  a1 x ,
находим значения ŷ , зависящие только от заданного значения x.
Для практического использования модели регрессии очень важна их
адекватность, т.е. соответствие фактическим статистическим данным.
Значимость коэффициентов регрессии определяется с помощью
t-критерия Стьюдента.
Для параметра а0:
n2
t a0  a0
.
 ост
Для параметра а1:
t a1  a1
n2
 ост
 x,
где n – объем выборки;
n – 2 – число степеней свободы;
 ост 

( y  yˆ ) 2
– среднее квадратическое отклонение результативного
n
признака y от выровненных значений ŷ ;
x 
x
n
2
x
 – среднее квадратическое отклонение факторного при
 n 


2
знака x от общей средней x .
Вычисленные значения tрасч сравниваются с критическими tтабл, которые
определяются по таблице Стьюдента с учетом принятого уровня значимости
α и числом степеней свободы вариации ν.
Уровень значимости применительно к проверке статистических гипотез
– это вероятность, с которой может быть опровергнута гипотеза о том или
ином законе распределения. Например, доверительной вероятности 0,95 соответствует 5%-ный уровень значимости, т.е. α=0,05.
Число степеней свободы вариации представляет собой число свободно
(неограниченно) варьирующих элементов совокупности ν=n-k-1 (k – число
факторных признаков в уравнении).
Параметр модели принимается значимым, если tрасч> tтабл.
Для интерпретации параметра а1 используют коэффициент эластичности. Он показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по формуле:
Э  а1
x
.
y
Проверка адекватности регрессионной модели дополняется корреляционным анализом. Для этого определяют тесноту корреляционной связи
между переменными x и y.
В случае наличия линейной и нелинейной зависимости между двумя
признаками для измерения тесноты связи применяют корреляционное отношение. Различают эмпирическое и теоретическое корреляционное отношение.
Эмпирическое корреляционное отношение ηэ:
2
.
2
э 
где δ2 - межгрупповая дисперсия, характеризующая вариацию результативного признака, обусловленную группировочным признаком;
2
σ – общая дисперсия результативного признака.
Теоретическое корреляционное отношение η используется для измерения тесноты связи при линейной и криволинейной зависимостях между результативным и факторным признаком. При криволинейных связях теоретическое корреляционное отношение называют индексом корреляции R.
Определяется по формуле:
 ( y  yˆ ) , или
  1
 ( y  y)
 ( yˆ  y) .

 ( y  y)
2
2
2
2
Показатель изменяется в пределах от 0 до 1. Интерпретация значений
коэффициента такова:
 0,1 - 0,3 – связь слабая;
 0,3 - 0,5 – связь умеренная;
 0,5 - 0,7 – заметная;
 0,7 - 0,9 – тесная;
 0,9 - 1,0 – связь весьма тесная.
Если он равен нулю, то связи между признаками x и y нет. Чем он ближе
к 1, тем связь между признаками теснее.
Подкоренное выражение корреляционного отношения представляет собой коэффициент детерминации. Он показывает долю вариации результативного признака под влиянием вариации признака-фактора.
В случае наличия между двумя признаками линейной зависимости для
изучения связи между ними используется линейный коэффициент корреляции. Он определяется по формуле:
xy  x  y
r
,
 x  y
или
r
 x y
 xy  n

 x   
 y 
 x  
y 

n 
n

2
2
2

2

.


Между коэффициентом корреляции и коэффициентом регрессии существует зависимость, выражаемая формулой:
r  a1
x
,
y
где  x – среднеквадратическое отклонение соответствующего статистически
существенного факторного признака;
а1 – параметр (коэффициент) уравнения регрессии.
Линейный коэффициент корреляции изменяется в пределах от -1 до +1 и
выражает характер связи:
 r = ±1– связь функциональная;
 r = 0 – связь отсутствует;
 0<r<1 – связь прямая (значение коэффициента регрессии а1 положительное);
 -1<r<0 – связь обратная (значение а1 – отрицательное).
Чем ближе значение коэффициента корреляции по абсолютной величине
к единице, тем теснее связь между признаками.
Квадрат линейного коэффициента корреляции называется линейным коэффициентом детерминации r2. Его числовое значение заключено в пределах от 0 до 1.
Сравнение значений η и r используется для оценки формы связи. Эти
значения совпадают только при наличии прямолинейной связи. Если разность η2 и r2 не превышает 0,1, то гипотезу о прямолинейной форме связи
можно считать подтвержденной.
Для оценки значимости коэффициента корреляции используют tкритерий Стьюдента. При линейной однофакторной связи его можно рассчитать по формуле:
t расч  r
n2
,
1 r2
где n-2 – число степеней свободы.
Вычисленные значения сравниваются с tтабл, которые определяются по
таблице Стьюдента. Если tрасч> tтабл, то это свидетельствует о значимости коэффициента корреляции и существенности связи между двумя признаками.
После проверки адекватности, установления точности и надежности построенной модели (уравнения регрессии) ее необходимо проанализировать.
9.4. Многофакторный линейный корреляционно-регрессионный анализ
Задачей такого анализа является построение уравнения множественной
регрессии и нахождение его параметров а0, а1, ..., аn. Параметры уравнения
находят по способу наименьших квадратов. Затем с помощью корреляционного анализа осуществляют проверку адекватности полученной модели.
Уравнение множественной линейной двухфакторной регрессии:
yˆ X1 X 2  a0  a1 x1  a2 x2 .
где ŷ X X 2 – расчетные значения результативного признака, полученные по
уравнению регрессии;
1
x1 , x 2 – независимые переменные (факторные признаки);
а 0 , а1 , а 2 – параметры (коэффициенты) уравнения регрессии.
Уравнение множественной регрессии с n-факторами:
yˆ X1 X 2 ... Xn  a0  a1 x1  a2 x2  ....  an xn .
Для измерения тесноты связи между двумя из рассматриваемых переменных (без учета их взаимодействия с другими переменными) применяются
парные коэффициенты корреляции. Методика расчета и их интерпретация
аналогичны методике расчета линейного коэффициента корреляции в случае
однофакторной связи.
Если связь между признаками криволинейная, парный коэффициент
корреляции дает заниженную оценку. Тогда рассчитывается корреляционное
отношение, которое является в некотором смысле универсальным, поскольку
применяется как при линейной, так и при нелинейной формах зависимостей.
При линейной форме зависимости между двумя признаками значение
теоретического корреляционного отношения совпадает со значением линейного коэффициента корреляции r = R .
Парные коэффициенты корреляции можно рассчитать по формулам:
ryx1 
x1 y  x1  y
;
 X1   y
ryx2 
x2 y  x2  y
;
 X2   y
rx1 x2 
x1 x 2  x1  x 2
.
 X1   X 2
Однако в реальных условиях все переменные, как правило, взаимосвязаны. Теснота этой связи определяется частными коэффициентами корреляции, которые характеризуют степень влияния одного из факторов при условии, что остальные независимые переменные закреплены на постоянном
уровне. В зависимости от количества переменных, влияние которых исключается, частные коэффициенты могут быть различного порядка: при исключении влияния одной переменной получаем частный коэффициент корреляции первого порядка; при исключении двух переменных – второго порядка и
т.д.
Частный коэффициент корреляции первого порядка между признаками
x1 и y при исключении влияния признака x 2 вычисляют по формуле:
ryx1  ryx2  rx1x2
ryx1 ( x2 ) 
.
2
2
(1  r yx2 )(1  r x1x2 )
Зависимость y от x 2 при исключении влияния x1 :
ryx2  ryx1  rx1x2
ryx2 ( x1 ) 
.
(1  r 2 yx1 )(1  r 2 x1x2 )
Взаимосвязь факторных признаков при устранении влияния результативного признака:
rx1x2  ryx1  ryx2
rx1x2 ( y ) 
.
2
2
(1  r yx1 )(1  r yx2 )
Показателем тесноты связи, устанавливаемой между результативным и
двумя факторными признаками, является совокупный коэффициент множественной корреляции:
R yx1x2 
r 2 yx1  r 2 yx2  2ryx1 ryx2 rx1x2
,
1  r 2 x1x2
где r – парные коэффициенты корреляции между признаками.
Множественный коэффициент корреляции измеряет одновременное влияние факторных признаков на результативный. Его значение находится в
пределах от 0 до 1. Чем ближе значение коэффициента к единице, тем теснее
связь между признаками.
Совокупный коэффициент множественной детерминации R2 показывает, какая доля вариации изучаемого результативного признака объясняется влиянием факторов, включенных в уравнение множественной регрессии.
Представляет собой подкоренное выражение совокупного коэффициента
множественной корреляции.
Изменяется в пределах от 0 до 100 и характеризует, на сколько процентов изменение результативного признака зависит от выбранных в модель
факторных признаков. Остальные проценты (до 100) показывают влияние
других, не учтенных в модели признаков.
Проверку значимости уравнения множественной регрессии проводят
на основе вычисления F-критерия Фишера:
F
 2y n  m

,
 ост 2 m  1
где m – число параметров в уравнении регрессии.
Полученное значение критерия Fрасч сравнивают с критическим (табличным) для принятого уровня значимости 0,05 и чисел степеней свободы
 1  m  1 и  2  n  m . Если Fрасч> Fтабл, то данное уравнение регрессии статистически значимо, т.е. доля вариации, обусловленная регрессией, превышает
случайную ошибку. Принято считать, что уравнение регрессии пригодно для
практического использования в том случае, если Fрасч> Fтабл не менее чем в 4
раза.
Для оценки значимости коэффициентов регрессии при линейной зависимости y от двух факторов x1 и x 2 используют используют t-критерий Стьюдента при n-m-1 степенях свободы:
t a1 
a1 x1 1  r 2 x1x2  n  m  1
y 1 R
2
yx1x2
;
t a2 
a2 x2 1  r 2 x1x2  n  m  1
y 1 R
2
.
yx1x2
Существенность совокупного коэффициента корреляции определяют
по формуле:
R yx1x2 n  m  1
t R yx1x2 
.
1  R 2 yx1x2
Значения a1, a2, R yx1x2 берутся по модулю. Вычисленные значения t сравниваются с tтабл, которые определяются по таблице Стьюдента. Если tрасч>
tтабл, тогда a1, a2, R yx1x2 признаются значимыми (существенными).
Если в уравнении все коэффициенты регрессии значимы, то данное
уравнение признают окончательным и применяют в качестве модели изучаемого показателя для последующего анализа.
Однако на основе коэффициентов регрессии нельзя сказать, какой из
факторных признаков оказывает наибольшее влияние на результативный
признак, так как коэффициенты регрессии между собой не сопоставимы, поскольку они измерены разными единицами.
Различия в единицах измерения факторов устраняют с помощью частных коэффициентов эластичности:
Эi  аi
xi
yi
,
где а i – коэффициент регрессии при i-м факторе;
x i – среднее значение i-го фактора;
yi – среднее значение изучаемого показателя.
Частные коэффициенты эластичности показывают, на сколько процентов
в среднем изменяется анализируемый показатель с изменением на 1% каждого фактора при фиксированном положении других факторов.
Для определения факторов, в развитии которых заложены наиболее
крупные резервы улучшения изучаемого показателя, необходимо учесть различия в степени варьирования вошедших в уравнение факторов. Для этого
используют бета-коэффициенты βi:
 i  аi
Xi
,
y
где  X i – среднее квадратическое отклонение i-го фактора;
 y – среднее квадратическое отклонение изучаемого показателя.
β-коэффициент показывает, на какую часто среднего квадратического
отклонения изменяется результативный признак с изменением соответствующего факторного признака на величину его среднего квадратического отклонения.
Дельта коэффициенты ∆i показывают, какова доля вклада анализируемого фактора в суммарное влияние всех отобранных факторов.
i 
 i ri
R2
.
После проверки адекватности построенной модели, установления значимости факторов и существенности совокупного коэффициента корреляции ее
необходимо проанализировать.
9.5. Измерение тесноты связей между качественными (атрибутивными)
признаками
Методы взаимной сопряженности позволяют изучить связь между качественными признаками.
Методика расчета и содержание показателей взаимной сопряженности
Показатель
Методика расчета и содержание показателя
Применяется для измерения тесноты связи между варьиКоэффициент
рованием двух атрибутивных признаков, когда это варьвзаимной
сопряженности ирование образует несколько (три и более) групп и
определяется по формуле:
Чупрова
Kч 
2
n
k1  1  k2  1 ,
 k k
2 
1
2


f
ij
2
   
 1
 1 1 fi  f j 

 ,
где f i , f j – частоты в i–й строке j–го столбца;
n – число наблюдений;
k1 – число групп по строкам;
k 2 – число групп по столбцам.
Коэффициент изменяется от 0 до 1. Чем он ближе к 1,
тем теснее связь между атрибутивными признаками.
Коэффициент
2
Kп 
взаимной
2  n
сопряженности
Коэффициент изменяется от 0 до 1. Чем он ближе к 1,
Пирсона
тем теснее связь между атрибутивными признаками.
Применяется для определения тесноты связи двух качеКоэффициент
ственных признаков, состоящих из двух групп.
ассоциации
Подгруппы
Группы
Всего
1
2
А
a
b
a+b
Б
c
d
c+d
Итого
а+c
b+d
а+b+c+d
ad bc
,
ad bc
где a,b,c,d – частоты “таблицы четырех полей”.
Изменяется от -1 до +1. Чем ближе этот показатель к 1
или -1, тем сильнее связаны между собой изучаемые
признаки. Связь считается подтвержденной, если Ка≥0,5.
Как и коэффициент ассоциации применяется для определения тесноты связи двух качественных признаков,
состоящих из двух групп.
Коэффициент контингенции всегда меньше коэффициента ассоциации.
ad bc
Kk 
.
a  b  a  c   d  b  d  c 
Изменяется от – до 1 + 1. Чем ближе к 1 или – 1, тем
сильнее связаны изучаемые признаки. Связь считается
подтвержденной, если Кк≥0,3.
Коэффициент позволяет изучить связь между качественным альтернативным и количественным варьирующим признаками и определяется по формуле
Y 2  Y 1 pq
r

,

Z
Ka 
Коэффициент
контингенции
Биссериальный
коэффициент
корреляции
где Y 2 , Y 1 – средние значения признака в группах;
  – среднее квадратическое отклонение фактических
значений признака от среднего уровня;
p – доля первой группы в совокупности;
q – доля второй группы;
Z – табличные значения Z-распределения в зависимости от p.
9.6. Непараметрические показатели связи
Основой непараметрических методов изучения взаимосвязи между социально-экономическими явлениями и процессами является принцип нумерации значений исследуемых признаков.
Ранжирование – это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения.
Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Если значения имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые
определяют. Данные ранги называют связными.
Показатель
Коэффициент
Спирмена
(коэффициент
корреляции
рангов)
Ранговые коэффициенты связи
Методика расчета и содержание показателя
Применяется для анализа связи двух значений (x и y)
и учитывает согласованность рангов, т.е. номеров, которые занимают единицы совокупности по каждому
из этих признаков, определяется по формуле:
6d2
 1
n  n2  1 ,
2
2
где  d   Rx  Ry  – сумма квадратов разности
рангов x и y;
n – число наблюдений.
Коэффициент Спирмена изменяется от +1 (полная
корреляция рангов, в этом случае  d 2  0 ) до -1
(полная обратная корреляция рангов, в этом случае
6d2
 2).
n  n2  1
6d2
 1, корреляция рангов отПри ρ=0, когда
n  n2  1
сутствует.
Значимость коэффициента корреляции рангов Спирмена проверяется на основе t-критерия Стьюдента по
формуле:
n2
tp   
1 2 .






Значение коэффициента корреляции считается статистически существенным, если t p t табл  ,  n  2 .
Расчет осуществляется по формуле:
Ранговый
коэффициент кор2S


,
реляции
n  n  1
Кендалла
где S = P + Q.
Коэффициент корреляции рангов Кендалла изменяется в пределах от -1 до +1 и равен нулю при отсутствии связи между рядами рангов.
Используется для оценки тесноты связи между неМножественный
коэффициент ран- сколькими признаками (3 и более) при использовании
ранговой корреляции и определяется по формуле:
говой
корреляции
12  S


(коэффициент
m2  n3  n ,


конкордации)
где m - число факторов, между которыми изучается
связь;
n - число наблюдений.
S – отклонение суммы квадратов рангов от средней квадратов рангов.
Коэффициент изменяется в пределах то 0 до 1 и характеризует степень тесноты связи, но уже при значении 0,5 можно говорить о тесной связи между вариацией изучаемых признаков.
Значимость коэффициента конкордации проверяется
на основе  2 -критерия Пирсона:
12  S
2 
m  n  n  1
Если фактическое значение  2 больше табличного
значения при вероятности α=0,05 и числе степеней
свободы υ=n-1, то это подтверждает значимость коэффициента конкордации.
Задачи по теме
1. Пример однофакторного линейного корреляционно-регрессионного анализа.
10 рабочих одной бригады заняты производством одноименных изделий.
Данные ранжированы по стажу их работы. Оценить зависимость производительности труда от стажа работы.
Исходные данные
Стаж работы, лет Дневная выработка рабочего, шт.
Номер рабочего
x
y
4
1
4
6
2
5
3
3
6
1
4
7
2
5
7
7
6
8
9
7
8
10
8
9
8
9
10
5
10
9
Итого
55
73
Среднее значение
5,5
7,3
Решение:
Стаж работы выбираем в качестве факторного признака x. Производительность труда – результативный признак y. Сопоставление данных параллельных рядов признаков x и y показывает, что с возрастанием факторного
признака – стажа работы, растет, хотя и не всегда, результативный признак –
производительность труда. Следовательно, между x и y существует прямая
зависимость.
Прямолинейная связь может быть выражена уравнением однофакторной
(парной) линейной регрессии:
yˆ  a0  a1 x .
Расчетные значения
2
2
yˆ  y
x
y
xy
ŷ
( yˆ  y) 2
y y
( y  y ) 2 yˆ  y ( yˆ  y ) 2
1
16
4
4,6
-3,3
10,89 -2,7
7,29
-0,6
4
25
10
5,2
-2,3
5,29
-2,1
4,41
-0,2
9
36
18
5,8
-1,3
1,69
-1,5
2,25
0,2
16
49
28
6,4
-0,3
0,09
-0,9
0,81
0,6
25
49
35
7,0
-0,3
0,09
-0,3
0,09
0,0
36
64
48
7,6
0,7
0,49
0,3
0,09
0,4
49
64
56
8,2
0,7
0,49
0,9
0,81
-0,2
64
81
72
8,8
1,7
2,89
1,5
2,25
0,2
81
100
90
9,4
2,7
7,29
2,1
4,41
0,6
100
81
90
10,0
1,7
2,89
2,7
7,29
-1,0
385 565 451
73
–
32,10
–
29,70
–
38,5 56,5 45,1
–
–
–
–
–
–
Параметры уравнения парной линейной регрессии а0 и а1:
45,1  (5,5  7,3)
 0,6 ;
38,5  (5,5) 2
x2  x
Уравнение регрессии: yˆ  4,0  0,6 x .
a1 
xy  x  y
2

0,36
0,04
0,04
0,36
0,00
0,16
0,04
0,04
0,36
1,00
2,40
–
a0  y  a1 x  7,3  (0,6  5,5)  4,0 .
Это уравнение характеризует зависимость среднего уровня выработки
рабочих бригады от стажа работы. Определим расчетные данные ŷ , подставив в уравнение регрессии фактические данные x. При этом  y   yˆ (возможно небольшое отклонение вследствие округления расчетов).
В рассмотренном уравнении yˆ  4,0  0,6x , характеризующем зависимость
выработки y от стажа работы x, параметр а1>0. Следовательно, с возрастанием стажа выработка также увеличивается.
Из уравнения следует, что возрастание на 1 год стажа рабочего приводит
к увеличению его дневной выработки в среднем на 0,6 изделия (параметр а1).
Коэффициент эластичности вычислим по формуле:
Э  а1
x
5,5
 0,6 
 0,45 .
7,3
y
Это означает, что с возрастанием стажа работы на 1% следует ожидать
повышения производительности труда в среднем на 0,45%.
Значимость коэффициентов регрессии определяется с помощью
t-критерия Стьюдента.
Средние квадратические отклонения:

 ост 
x
x 
( y  yˆ ) 2
n
2
n
x
 

 n 


2

2,4
 0,49 ;
10
2
385  55 
    2,87 .
10  10 
Расчетные значения t-критерия Стьюдента:
n2
10  2
t a0  a0
 4,0 
 23,1;
 ост
0,49
n2
t a1  a1
 ост
 x  0,6 
10 - 2
 2,87  9,94,
0,49
где n =10 – объем выборки;
ν = n – 2 = 8 – число степеней свободы.
По таблице распределения Стьюдента для ν = 8 находим критическое
значение t-критерия. При α=0,05 tтабл=2,306.
Т.к. tрасч> tтабл, оба параметра модели а0 и а1 принимаются значимыми.
Определим тесноту корреляционной связи между переменными x и y.
Теоретическое корреляционное отношение η рассчитаем двумя способами:
 ( y  yˆ )
  1
 ( y  y)
 ( yˆ  y)

 ( y  y)
2
2
 1
2
2
2,4
 0,925  0,962 ;
32,1
29,7
 0,925  0,962 .
32,1

Значение показателя находится в пределах 0,9 – 1,0 , значит связь между
признаками весьма тесная.
Коэффициент детерминации равен 0,925. Это значит, что 92,5% общей
вариации выработки в изучаемой бригаде обусловлено влиянием вариации
факторного признака – стажа работы рабочих. И только 7,5% общей вариации нельзя объяснить изменением стажа работы.
Линейный коэффициент корреляции определим по формуле:
r
 x y
 xy  n

 x   
 y 
 x  
y 

n 
n

2
2
2

2





55  73
10
 0,962
2

(55)  
(73) 2 
.
385 
 565 

10
10



451 
Т.к. линейный коэффициент корреляции имеет положительное значение,
значит свазь между признаками прямая.
Значение показателя находится в пределах 0,9 – 1,0 , значит связь между
признаками весьма тесная.
Т.к. значения η и r совпадают можно говорить о наличии прямолинейной
связи.
Для оценки значимости коэффициента корреляции используем tкритерий Стьюдента:
t расч  r
n2
10  2
 0,962 
 9,93 .
2
1  0,925
1 r
По таблице распределения Стьюдента для ν = 8 находим критическое
значение t-критерия. При α=0,05 tтабл=2,306.
Т.к. tрасч> tтабл, то это свидетельствует о значимости коэффициента корреляции и существенности связи между выработкой и стажем работы.
2. Провести ранжирование студентов по данным об их успеваемости.
Номер студента
Балл
Ранг
1
3
5
2
4
3
3
5
1
4
4
3
5
4
3
Итого:
15
--15
Решение:
В нашем примере 1 ранг у 3-го студента, 5 ранг – у 1-го.
Второй, четвертый и пятый студенты имеют одинаковый балл – 4.
Если значения имеют одинаковую количественную оценку, то ранг всех
этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяют. Данные ранги называют связными.
Их ранг определяем как среднюю арифметическую из номеров, которые
определяем: (2+3+4)/3=3.
Сумма номеров по условию и всех рангов обязательно должна быть равна.
3. Имеются следующие данные: a1  0,12; x  17,41; y  3,19 .Определить коэффициент корреляции.
Решение:
Для измерения тесноты корреляционной связи между признаками при
линейной форме связи применяется линейный коэффициент корреляции, который можно вычислить по формуле:
r  a1
x
17,41
 0,12
 0,66
y
3,19
Т.к. линейный коэффициент корреляции имеет положительное значение,
значит свазь между признаками прямая.
Значение показателя находится в пределах 0,5 – 0,7 значит связь между
признаками заметная.
Download