Тема Сводка и группировка статистических данных

advertisement
Тема
Сводка и группировка статистических
данных
ПЛАН
1
Понятие о статистической сводке
2
Методологические вопросы статистических группировок, их значение в
экономическом исследовании
3
Задачи статистических группировок, их виды
4
Образование групп и интервалов группировки
5
Статистические ряды распределения
1
Понятие о статистической сводке
Получаемая в процессе статистического наблюдения информация об
отдельных единицах совокупности характеризует их с различных сторон.
Обобщающую характеристику в целом можно получить, систематизируя и
обобщая полученную информацию, а также из сводки, в процессе которой
осуществляется научная обработка собранного материала. В результате
чего полученные данные превращаются в упорядоченную систему
статистических показателей, дающих возможность оценить в целом
деятельность предприятий, выявить типичные черты и закономерности
их развития.
Таким
единичных
образом,
статистическая
факторов,
позволяющая
сводка
–
перейти
систематизация
к
обобщающим
показателям и осуществлять анализ и прогнозирование изучаемых
явлений и процессов.
Статистические сводки различаются по ряду признаков
По глубине обработки данных сводка может быть простой и
сложной.
Простая,
представляет
общие
итоги,
без
какой-либо
систематизации собранного материала, т. е. размер изучаемого явления.
Сложная–представляет комплекс операций, включающих группировку
1
единиц наблюдения, подсчет итогов по каждой группе и по всему объекту
и представление результатов группировки и сводки в виде статистических
таблиц. Сводка
может быть вспомогательной, если содержащаяся
информация используется для дальнейших расчетов. Но сводка, т. е. сбор
и итоговое их обобщение, может иметь и самостоятельное значение.
Ценность сводки велика, поскольку итоговые данные по основным
показателям могут быть получены быстро и служить основой для принятия
определенных решений. Особенно это важно в условиях рыночной
экономики, когда постоянно изменяется спрос и предложение.
По форме обработки данных статистическая
сводка может быть
централизованной и децентрализованной.
При централизованной сводке все данные сосредотачиваются в
одной организации, где и подвергаются обработке и анализу. Обычно
используется
для
проведения
единовременных
статистических
обследований.
При
децентрализованной
осуществляется
снизу
сводке
доверху,
обобщение
подвергаясь
на
материала
каждом
этапе
соответствующей обработке. Как правило, при работе со статистической
отчетностью.
По технике исполнения сводка может быть компьютерной и ручной.
Статистическая сводка предполагает:
1-систематизацию и группировку цифровых данных,
2-подсчет соответствующих итогов
3-представление результатов в виде таблиц, графиков.
Вся
работа
по
статистической
сводке
исходной
информации
подразделяется на следующие этапы:
1- формулировка задачи сводки;
2- формирование групп и величины интервала ;
3- проверка полноты и качества собранного материала, подсчет
итогов и исчисление необходимых показателей.
2
В
условиях
изменения
форм
хозяйствования
принципиально
меняются приемы осуществления сводки статистической информации:
-1- Сокращается общегосударственная отчетность, а объём данных,
связанных
с
рынком
возрастает.
Следовательно,
происходит
упорядочение способов получения сводки.
-2- Развиваются выборочное обследование, единовременные учеты.
-3- Для координации регулирующих целей централизованная форма
сводки также будет меняться.
-4- Методы и формы статистической отчетности предполагается
дифференцировать с обязательным условием сводимости применительно
к различным социальным типам предприятий (арендные, акционерные,
кооперативные и т. д.).
2
Методологические вопросы статистических группировок,
их значение в экономическом исследовании
Сводка
не
ограничивается
подведением
итогов.
Чаще
всего
информация на этой стадии систематизируется, образуются отдельные
статистические
совокупности,
т.
е.
осуществляется
статистическая
группировка.
Группировка – это процесс образования однородных групп на
основе расчленения статистической совокупности на части или
объединение
изучаемых
единиц
в
частные
совокупности
по
существенным для них признакам. Таким образом, статистические
группировки образуются или при разделении совокупности на части или
при объединении их в группы.
Располагая
группировку
по
информацией
одному
по
или
совокупности
нескольким
можно
осуществить
признакам
(объему
товарооборота, численности работающих, величине основных фондов и
др.).
3
Признаки,
по
которым
производится
группировка,
называются
группировочными признаками или основанием группировки.
Особым
видом
группировок
являются
классификации.
Классификация представляет собой классы и группы, выступает в роли
статистического
стандарта.
Классификация
–
это
узаконенная
группировка.
Пример:
классификация производимой продукции;
классификация по труду, профессиям;
классификация деклараций доходов;
классификация типов покупателей.
Одно из требований группировки состоит в том, что образуемые
группы должны быть реальными.
Задачи статистических группировок, их виды
3
Принято выделять следующие основные задачи:
-
образование социально-экономических типов явлений;
-
изучение строения и структуры изучаемых явлений.
Для решения этих задач применяют типологические, структурные и
аналитические группировки. Следует отметить, что эти группировки
имеют некоторую условность, т. к. на практике могут
применяться в
комплексе.
Типологические
группировки
широко
применяются
в
экономических, социальных и других исследованиях. Типологическая
группировка представляет собой распределение единиц наблюдения
качественно неоднородной совокупности по социально-экономическим
типам, классам, однородным группам. Именно в идентификации и
выделении социально-экономических типов явлений, позволяющих
проследить зарождение, развитие и отмирание их, состоит основная
4
задача типологических группировок. (Распределение совокупности предприятий
по формам собственности; отраслям экономики; размеру бизнеса).
При
этом
очень
важно
правильно
установить
интервал
группировки, на основе которого количественно различаются одни
группы от других, намечаются границы выделения их нового качества.
Структурная группировка характеризует структуру совокупности по
какому-либо одному признаку. Выделенные типы явлений с помощью
типологической группировки могут изучаться с точки зрения их структуры
и состава. С помощью структурных группировок изучается состав
товарооборота по товарным группам, торговая сеть – по специализации,
работники торговли по профессиям, возрасту, образованию и т.д.
Структурные группировки, кроме того, позволяют оценить процесс
концентрации.
На практике структурная группировка с комплексным решением задач
встречается довольно часто. Однако нередко применяется другой вид
группировки. Так, для изучения явления, а также связи между отдельными
признаками явления используются аналитические группировки.
С их помощью определяют наличие связи между признаками и её
направление. Аналитические группировки характеризуют взаимосвязь
между двумя и более признаками, из которых один рассматривается как
результат, другой (другие) – как фактор (факторы). Связь между
признаками называется прямой, если с ростом значений факторного
признака увеличиваются значения результативного признака, обратной Деление на три вида носит условный характер, так как группировка
может
быть
показывать
универсальной,
структуру
т.е.
совокупности
одновременно
и
отражать
выделяя
типы,
закономерности
изменения значений признака в зависимости от другого.
Виды группировок по числу группировочных признаков:
 простая – (один признак)
 сложная-( два и более признаков); (комбинационная, многомерная)
5
Образование групп по двум и более признакам (2-4), взятым в
определенном сочетании, называется комбинационной группировкой.
Многомерная - любое число признаков свыше четырех.
Принцип построения комбинационной группировки заключается в том,
что сначала группы формируется по одному признаку, затем они делятся
на подгруппы по другому признаку, а эти, в свою очередь, делятся по
третьему и т.д. При этом группировочных признаки принято располагать,
начиная с атрибутивного, в определенной последовательности, исходя из
логики взаимосвязи показателей.
Применение
сложных
группировок
обусловлено
многообразием
экономических явлений, а также необходимостью их всестороннего
изучения.
Но
увеличение
числа
группировочных
признаков
ограничивается уменьшением наглядности, что снижает эффективность
использования статистической информации.
Виды группировок по упорядоченности исходных данных:
*- первичная, *- вторичная
4
Образование групп и интервалов группировки
Построение статистических группировок предполагает решение ряда
основных задач:
* необходимо выбрать группировочный признак,
* затем определить число групп, на которые нужно разбить изучаемую
совокупность,
* зафиксировать границы интервалов группировки.
Все многообразие признаков, на основе которых могут производиться
статистические группировки, можно классифицировать:
По
форме
*=
атрибутивными
образование,
выражения
(не
группировочные
имеющие
признаки
количественного
национальность
6
могут
быть
значения:
пол)
*= количественными (т. е. признаками,
принимающими различные
цифровые характеристики).
При
этом
количественные
признаки
могут
быть
дискретными
(прерывным), т. е. выражаются только целыми числами (число домов,
человек) и непрерывными (т. е. как целые, так и дробные значения
(себестоимость,
сумма
продовольственных
товаров)).
Дискретными
называются признаки, отличающиеся на единицу своего измерения.
По характеру колеблимости, группировочный признаки могут быть
альтернативными (товар качественный или нет, пол женский или мужской).
Статистике признаки делятся на факторные – воздействующие на
другие признаки, и результативные – испытывающие на себе влияние
других.
Следующим важным шагом после определения группировочного
признака является распределение единиц совокупности по группам. Здесь
встает вопрос о количестве групп и величине интервала, которые
между собой взаимосвязаны.
Число
групп
зависит
от
задач
исследования,
численности
совокупности, степени вариации признака. Единицы совокупности
могут быть разбиты по одному и тому же признаку на разное число групп.
Пример: если производят группировку населения по возрасту, чтобы определить
трудовые ресурсы, все население делят на три группы: моложе трудоспособного
возраста, трудоспособное и население старше трудоспособного. Для анализа
продолжительности жизни выделяют пятилетние группы.
При небольшом объеме совокупности не следует образовывать
большое число групп, т. к. они будут малочисленными. И, следовательно,
показатели не будут представительными и не позволят получить
адекватную характеристику явлений.
Число групп зависит в первую очередь от степени колеблемости
группировочного признака: чем больше колеблемость, тем больше
следует образовать групп; чем больше групп, тем точнее можно
воспроизвести характер исследуемого объекта. Но следует помнить, что
7
слишком большое число групп затрудняет выявление закономерностей.
Поэтому в каждом конкретном случае при определении числа групп
следует еще учитывать особенности объекта и цель исследования.
Оптимальная
наполняемость
интервалов
является
важным
критерием правильности группировки.
В зависимости от степени колеблемости группировочного признака,
характера распределения статистической совокупности устанавливаются
интервалы равные и неравные.
При равенстве интервалов существует формула, предложенная
американским ученым Стерджессом, с помощью которой можно наметить
число групп n при известной численности совокупности N:
n = 1 + 3,322 lg N
n = 1 + 1,44 ln N
n – число групп;
N – число единиц совокупности.
Расчет по формуле Стерджесса дает хорошие результаты, если
совокупность состоит из большого числа единиц и их распределение
близко к нормальному.
Однако
может
оказаться,
что
сформированы
“пустые”
или
малочисленные группы. “Пустые” – т. е. в них не попала не одна единица
совокупности. Это говорит о том, что группировка сформирована
неправильно.
После определения числа групп следует определить интервалы
группировки. Интервал – это значения варьирующего признака, лежащие
в определенных границах.
Зная
размах
колеблемости
значений
изучаемого
признака
и
намеченное число групп, величина равного интервала i определяется по
формуле:
h
R
n
или
h
X max  X min
n
8
R –
размах вариации;
X max , X min - максимальное и минимальное значение в совокупности.
Полученную величину округляют. Она является шагом интервала.
Правила округления таковы:
1.
Если величина интервала, рассчитанная по формуле
h
R
n
равна
величине, имеющей один знак до запятой 0,76; 3,581; 2,1, то полученные значения
округляют до десятых. Следовательно, шагом интервала будут значения 0,8; 3,6; 2,1.
2.
Когда рассчитанная величина интервала имеет две значащие цифры до
запятой и несколько знаков после запятой, то это значение надо округлить до целого
числа. Пример: 12,785 надо округлить до 13 (целое число).
3.
В случае, когда рассчитанная величина интервала представляет собой,
трехзначное, четырехзначное и т.д. число, эту величину необходимо округлить до
ближайшего числа, кратного 100 или 50, Пример 249 округлить до 250; 376 до 400.
Таким образом, каждый интервал имеет свою величину, верхнюю и
нижнюю границы или одну из них.
Нижняя граница интервала
- наименьшее значение признака в
интервале, а верхняя граница – наибольшее значение признака в нем.
Разность между верхней и нижней границами интервала – величина
интервала (интервальная разность).
Интервальные группировки в зависимости от их величины бывают
равные и неравные. В большинстве случаев применяются неравные
интервалы (товарооборот в палатках, мелких и крупных магазинах), т. к.
разница (в несколько тысяч) для одних существенна, а для других нет.
При определении величины интервала важное значение имеет точное
установление границ, которые в большинстве случаев обозначаются “от”
и “до”.
Пример: число рабочих 1-3 , 4-7 , 8-11 человек.
В практике, при непрерывно изменяющимся признаке, одно и то же
число служит верхней и нижней границами двух смежных групп.
Пример: производительность труда до 50 тыс. руб. , 50-80 , 80-110 , 110-140 ,
свыше 140 тыс. руб.
9
Этот вопрос решается двояко:
1-“включительно”
2-“исключительно”.
В первом случае работник с производительностью труда 50 тыс. руб.
включается в первую группу, во втором – во вторую группу. В практике
наиболее часто встречается принцип “исключительно”.
Рассмотрим пример (Р.А. Шмойлова). Произведем группировку с равными
интервалами. Максимальная стоимость основных фондов равна 2040 тыс. руб., а
минимальное значение 290 тыс. руб. Совокупность состоит из 80 единиц.
1. Определим n.
n = 1+3,322 lg N = 7
2. Находим R.
R = 2040-290 = 1750 тыс. руб.
3. Находим h.
h = 1750/7 = 250 тыс. руб.
Построим интервалы групп.
Группа
1
от
290
до
540
до 540
2
540
790
540 - 790
3
790
1040
790 -1040
4
1040
1290
5
1290
1540
1290 - 1540
6
1540
1790
1540 - 1790
7
1790
2040
1790 и более
или
1040 - 1290
В первом варианте у всех групп имеются закрытые интервалы. Во
втором – первая и последняя группы – это группы с открытыми
интервалами.
Закрытые – интервалы, у которых обозначены обе границы.
Открытые – интервалы, у которых указана только одна граница:
верхняя – у первого, нижняя – у последнего.
Ширина открытого интервала
смежного
Неравные
принимается равной ширине
с
интервалы
ним
применяются
10
в
статистике,
интервала.
когда
значения
признака
варьируют
неравномерно
и
в
значительных
размерах
(большинство социально-экономических явлений).
Неравные интервалы могут быть прогрессивно возрастающие или
убывающие в арифметической или геометрической прогрессии.
Величина интервалов изменяющихся
*
в арифметической прогрессии
hi 1  hi   ;
*
в геометрической прогрессии:
hi 1  hi  q
 - константа – число, которое будет положительным при прогрессивно
возрастающих интервалах и отрицательным при прогрессивно убывающих интервалах;
q - константа – положительное число, которое при прогрессивно возрастающих
интервалах будет больше 1, а при прогрессивно убывающих – меньше 1.
Пример. Построим группы по показателям выручки от реализации. Строить
равные интервалы нецелесообразно. Следовательно, строим группы с неравными
интервалами.
500 – 800
800 – 1300
1300 – 2000
2000 – 2900
Величина последующего интервала больше предыдущего на 200, т.е. увеличение
в арифметической прогрессии.
Специализированные интервалы, – когда для выделения из
совокупности одних и тех же типов по одному и тому же признаку для
явлений находящихся в различных условиях.
Пример. Среднесписочная численность 75 – 100 человек. В строительной
промышленности это группа малых предприятий, в непроизводственной сфере –
крупных.
Произвольные интервалы (ни прогрессивно возрастающие, ни
прогрессивно убывающие).
11
Пример. Количество м 2 на 1 человека:
до 5
5–6
7–8
9 – 12 и т.д.
Группировка с произвольными интервалами может быть построена с
помощью коэффициента вариации, определяемого по формуле:
V 
X

 100
После определения группировочного признака и границ групп строится
ряд распределения.
5
Статистические ряды распределения
Результаты
сводки
и
группировки
материалов
статистического
наблюдения оформляются в виде статистических рядов распределения и
таблиц.
Статистические
ряды
распределения
представляют
собой
упорядоченное расположение единиц изучаемой совокупности на
группы по группировочному признаку.
Ряды распределения, образованные по качественному признаку,
называют атрибутивными. При группировке по количественному признаку
получаются вариационные ряды.
Вариационные ряды по способу построения бывают дискретными
(прерывными) и интервальными (непрерывными).
Вариационные ряды состоят из двух элементов: варианты и частоты
(частости).
Варианта – отдельное значение варьирующего признака. Частоты –
численность отдельных вариант. Частоты, выраженные в долях единиц
или в процентах к итогу, называются частостями.
12
Группы семей, проживающих в
квартирах с числом комнат
Число
всего,
тыс. ед.
4064
12399
7659
832
24954
1
2
3
4 и более
Всего
семей
в % к итогу
16,3
49,7
30,7
3,3
100,0
1 колонка – варианты дискретного вариационного ряда.
2 колонка – частоты вариационного ряда.
3 колонка – частости.
Одним из важнейших требований, предъявляемых статистическим
рядам распределения, является обеспечение сравниваемости их во
времени и пространстве.
Наглядное
представление
о
характере
изменения
частот
вариационного ряда дают полигон и гистограмма.
Полигон используется для изображения дискретных вариационных
рядов.
По
оси
абсцисс
откладываются
ранжированные
варьирующего признака, а по оси ординат – частоты.
Группы квартир по
числу комнат
1
2
3
4
5
Всего
13
Число квартир,
ед.
10
35
30
15
5
95
значения
Получаем полигон частот. Иногда крайние точки соединяют с
абсциссой. Получается многоугольник. На оси ординат могут наноситься
частости.
Гистограмма
применяется
для
изображения
интервального
вариационного ряда. На оси абсцисс откладывают величину интервалов, а
частоты изображают прямоугольниками. Высота столбиков в случае
равных интервалов должна быть пропорциональна частотам.
Группы семей по
размерам жилой
площади на
1
2
человека, м
3–5
5–7
7–9
9 – 11
11 – 13
Число семей с
данной
площадью
f
10
20
40
30
15
Накопленное
число семей
(-) S
10
30
70
100
115
Гистограмма может быть преобразована в полигон распределения, если
найти середины сторон прямоугольника и затем эти точки соединить
прямыми линиями.
При построении гистограммы распределения вариационного ряда с
неравными интервалами по оси ординат наносят не частоты, а плотность
распределения признака. Это делают для того, чтобы устранить
влияние величины интервала и получить возможность сравнивать
частоты.
14
Плотность распределения – это частота, рассчитанная на единицу
ширины интервала, т. е. сколько единиц в каждой группе приходится на
единицу величины интервала.
Группы
предприятий по
числу занятых,
чел.
А
до 20
20 - 80
80 - 150
Для
Число
предприятий
f
Величина
интервала, чел.
h
Плотность
распределения,
ед.
1
15
27
35
2
20
60
70
3=1/2
0,75
0,45
0,50
графического
изображения
вариационного
ряда
может
использоваться кумулятивная кривая. С ее помощью изображают ряд
накопленных частот. Накопленные частоты показывают, сколько единиц
совокупности имеют значение признака не более чем рассматриваемое
значение. На оси абсцисс откладывают варианты, а по оси ординат –
накопленные частоты.
Рисунок-
Кумулятивное
распределение
семей
по
размеру
жилой
площади,м
Изображение в виде кумуляты эффективно, если частоты выражены в
долях или процентах.
Если оси поменять местами, то получим огиву, изображающую
процесс концентрации.
15
Другой способ определения числа групп основан на применении среднего квадратического отклонения
величина интервала равна 0,5

, то совокупность разбивается на 12 групп, если величина интервала равна
совокупность делится на 9 и 6 групп.
Если совокупность разбивается на 12 групп, то интервалы групп строятся следующим образом.
от
Где
Х
Х 
хi


Х
-3,0
Х
-2,5
Х
-2,0
Х
-1,5
Х
-1,0
Х
-0,5






до
Х
-2,5
Х
-2,0
Х
-1,5
Х
-1,0
Х
Х
-0,5





от
до
Х
Х
+0,5
Х
+1,0
Х
+1,5
Х
+2,0
Х
+2,5





- среднее значение признака, которое определяется по формуле:
хi
n
- i значение варьирующего признака;
- среднее квадратическое отклонение, которое определяется по формуле:

( хi  x) 2
n
.
В случае, когда число групп равно 6 получим следующие интервалы групп:
о
т



Х
-3
Х
Х
д


Х
-2
-2
Х
-
-
Х
Х
о


Х
+
Х
+2
16



Х
+
Х
+2
Х
+3
Х
+0,5
Х
+1,0
Х
+1,5
Х
+2,0
Х
+2,5
Х
+3,0






2
3

. Если
и
, то
 
Download