Lek_2

advertisement
Статистическая сводка и
группировка данных
1
Сводка – это особая стадия
статистического исследования, в
ходе которой систематизируются
первичные материалы
статистического наблюдения.
Сводка – это комплекс
последовательных операций по
обобщению конкретных
единичных фактов, образующих
совокупность, для выявления
типичных черт и закономерностей,
присущих изучаемому явлению в
целом.
По глубине обработки
материала
• Простой сводкой – называется операция по
подсчету общих итогов по совокупности
единиц наблюдения.
• Сложная сводка – представляет собой
комплекс операций, включающих
группировку единиц наблюдения, подсчет
итогов по каждой группе и по всему объекту и
представление результатов группировки и
сводки в виде статистических таблиц.
По форме обработки
материала сводка бывает:
 Централизованная - когда весь первичный
материал поступает в одну организацию,
подвергается в ней обработке от начала до
конца;
 Децентрализованная - когда отчеты
предприятий сводятся статистическими
органами субъектов РФ, а полученные итоги
поступают в Федеральную службу статистики
РФ и там определяются итоговые показатели в
целом по народному хозяйству страны.
Метод группировки
Группировкой называется разделение
множества единиц изучаемой
совокупности на группы по
определенным существенным для них
признакам.
Статистические группировки по
целям исследования:
1. Типологическая группировка – это разделение
исследуемой совокупности на классы, социальноэкономические типы, однородные группы единиц в
соответствии с правилами научной группировки.
Состав населения Российской Федерации в 2010 г.
Категория населения
Численность населения,
тыс. чел.
Городское
103 705
Сельское
38 209
Всего
141 914
Рассматривая данные этой таблицы можно
определить, что 73,1% населения России составляют
горожане.
Статистические группировки по
целям исследования:
2. Структурными называют группировки,
в которых происходит разделение
однородной совокупности на группы,
характеризующие ее структуру по какомулибо варьирующему признаку.
Пример:
Структурная группировка
Распределение населения по величине
среднедушевых денежных доходов, за 2009 г.
Размер среднедушевого
денежного дохода, руб. в
месяц
Численность населения,
%
До 2000
1,0
2000-4000
6,5
4000-6000
10,3
6000-8000
11,1
8000-10000
10,4
10000-15000
20,4
15000-25000
21,8
Свыше 25000
18,5
ИТОГО
100
Статистические группировки по
целям исследования:
3. Аналитическая (факторная)
группировка выявляет взаимосвязи между
изучаемыми признаками.
Выделяют факторный и результативный
признак.
Факторными
называются
признаки,
оказывающие влияние на изменение
результативных признаков.
Результативными называются признаки,
изменяющиеся под влиянием факторных.
Пример:
Аналитическая группировка
Группировка зависимости суммы кредитов,
выданных коммерческими банками,
от размера процентной ставки
Группы
банков по
величине
процентной
ставки, %
Число банков
11-15
Сумма выданных кредитов,
млн. руб.
Всего
В среднем на
один банк
7
168,1
24,0
15-19
13
200,5
15,4
19-23
7
54,4
7,8
23-27
3
6,8
2,3
ИТОГО
30
429,8
14,3
Этапы построения
статистической группировки:
1. Определение группировочного
признака.
2. Определение числа групп, на которые
нужно разбить исследуемую
совокупность.
3. Расчет ширины (величины) интервала
группировки.
4. Представление результатов
группировки в табличной форме.
Определение
группировочного признака
Группировочным признаком называется признак,
по которому проводится разбиение единиц
n
1 3,322
lg N Его часто
совокупности на
отдельные
группы.
называют основанием группировки.
В основание группировки могут быть положены
как количественные, так и атрибутивные
(качественные) признаки.
Определение числа групп
• Если группировка строится по атрибутивному
признаку, то число групп, как правило, будет
столько, сколько имеется градаций, видов
состояний у этого признака.
• Если группировка проводится по
количественному признаку, то число групп можно
определить математически путем использования
формулы Стерджесса:
n  1  3,322  lg N
• где n – число групп
N – число единиц совокупности
Определение величины
интервала
Интервал – это значение варьирующего признака, лежащее в
определенных пределах.
• Нижней границей интервала называется наименьшее
значение признака в интервале.
• Верхней границей интервала называется наибольшее
значение признака в интервале.
• Величина интервала представляет собой разность между
верхней и нижней границами интервала.
• Интервал, имеющий и верхнюю и нижнюю границу
является закрытым интервалом.
• Если у интервала имеется только одна граница: верхняя – у
первого и нижняя – у последнего, то интервал называется
открытым.
Определение величины
интервала
• Величина равного интервала:
h
X max  X min
n
• h – величина интервала;
• X max , X min - максимальное и минимальное значение признака в
совокупности;
• n – число групп
• Величина неравного интервала
изменяющегося в
арифметической прогрессии
hi 1  hi  a
изменяющегося в
геометрической прогрессии
hi 1  hi  q
a – константа, имеющая для прогрессивно-возрастающих интервалов знак «+»,
а для прогрессивно-убывающих интервалов знак «-».
q – константа, имеющая для прогрессивно-убывающих интервалов q<1, для
прогрессивно-возрастающих интервалов q>1.
Пример группировки
с закрытыми интервалами
Группы
банков по
величине
процентной
ставки, %
Число
банков
11-15
Сумма выданных кредитов,
млн. руб.
Всего
В среднем на
один банк
7
168,1
24,0
15-19
13
200,5
15,4
19-23
7
54,4
7,8
23-27
3
6,8
2,3
ИТОГО
30
429,8
14,3
Пример группировки
с открытыми интервалами
Ряд распределения
Ряд распределения – это простейшая
группировка, в которой каждая группа
характеризуется только частотой.
Различают атрибутивные и
вариационные ряды распределения
АТРИБУТИВНЫЕ
(построенные по
качественному признаку)
ВАРИАЦИОННЫЕ
(построенные по
количественному признаку)
интервальные
дискретные
Пример атрибутивного
ряда распределения
Состав населения Российской Федерации в 2010 г.
Категория
населения
Численность
населения,
тыс. чел.
Удельный вес во
всей численности,
% к итогу
Городское
103 705
73,1
Сельское
38 209
26,9
Всего
141 914
100
Вариационный
ряда распределения
Вариационный ряд состоит из двух элементов:
вариантов и частот.
• Вариантами называются отдельные значения признака.
• Варианты признака обозначаются через хi.
• Частоты показывают, как часто встречаются те или иные
значения признака в изучаемой совокупности и обозначаются
через fi .
• Сумма всех частот определяет численность совокупности, ее
объем.
• Частостями называются частоты выражены в долях единиц
или в процентах к итогу, тогда соответственно сумма
частостей будет равна 1 или 100%.
Дискретный вариационный ряд
Дискретный вариационный ряд характеризует
распределение единиц совокупности по дискретному
признаку, принимающему только целые числа.
Пример дискретного вариационного ряда
Распределение студентов в соответствии с оценкой,
полученной в сессию
Балл (оценка),
Число студентов,
fi
Удельный вес в общей
численности студентов, %
5
34
29,8
4
37
32,5
3
33
28,9
2
10
8,8
ИТОГО
114
100
хi
Интервальный
вариационный ряд
Интервальный вариационный ряд – это ряд
распределения, в котором группировочный признак
задан интервальными значениями.
Пример интервального вариационного ряда
Распределение коммерческих банков по величине процентной ставке
Группы банков
по процентной
ставке, %
Количество
банков, шт.
11-15
6
15-19
4
19-23
3
23-27
2
ИТОГО
15
fi
Интервальный
вариационный ряд
Интервальный вариационный ряд – это ряд
распределения, в котором группировочный признак
задан интервальными значениями.
Пример интервального вариационного ряда
Распределение коммерческих банков по величине процентной ставке
Группы банков
по процентной
ставке, %
Количество
банков, шт.
fi
Удельный
вес,
% к итогу
11-15
6
40
15-19
4
27
19-23
3
20
23-27
2
13
ИТОГО
15
100
Интервальный
вариационный ряд
Интервальный вариационный ряд – это ряд
распределения, в котором группировочный признак
задан интервальными значениями.
Пример интервального вариационного ряда
Распределение коммерческих банков по величине процентной ставке
!!!!
хi
Группы банков
по процентной
ставке, %
Количество
банков, шт.
fi
Удельный
вес,
% к итогу
11-15
6
40
15-19
4
27
19-23
3
20
23-27
2
13
ИТОГО
15
100
хi
- в интервальном вариационном ряду - это середина интервала
Интервальный
вариационный ряд
Интервальный вариационный ряд – это ряд
распределения, в котором группировочный признак
задан интервальными значениями.
Пример интервального вариационного ряда
Распределение коммерческих банков по величине процентной ставке
!!!!
хi
Группы банков
по процентной
ставке, %
Количество
банков, шт.
хi
fi
Удельный
вес,
% к итогу
11-15
6
40
13
15-19
4
27
17
19-23
3
20
21
23-27
2
13
25
ИТОГО
15
100
-
- в интервальном вариационном ряду - это середина интервала
Средние
величины
28
Средняя величина - это
обобщающая количественная
характеристика совокупности по
изучаемому признаку в конкретных
условиях места и времени.
ИСХОДНОЕ СООТНОШЕНИЕ СРЕДНЕЙ
(ЛОГИЧЕСКАЯ ФОРМУЛА СРЕДНЕЙ):
ИСС  X 
Суммарное значение или объем осредняемого признака
Число единиц или объем совокупности
Пример:
Расчет средней заработной платы
работников предприятия.
Что будет в числителе и знаменателе
ИСС?
Виды средних
Средняя арифметическая простая
x

x
i
n
Средняя арифметическая взвешенная
(рассчитывается по сгруппированным данным)
xf

x
f
i i
i
Пример:
Производительность труда каждого из
5-и рабочих
составляет: 50, 46, 58, 42, 44 изделий за смену. Определить
среднюю производительность труда одного рабочего.
Пример:
Производительность труда каждого из
5-и рабочих
составляет: 50, 46, 58, 42, 44 изделий за смену. Определить
среднюю производительность труда одного рабочего.
В этом случае решение имеет следующий вид:
 x 50  46  58  42  44
x

 48
n
5
Пример:
Распределение сотрудников предприятия по возрасту
Возраст, лет
Число
сотрудников,
чел.
хi
xi  f i
До 25
6
20
120
25-35
15
30
450
35-45
58
40
2320
45-55
12
50
600
55-65
7
60
420
Более 65
2
70
140
ИТОГО
100
-
4050
fi
Средний возраст сотрудников
на данном предприятии
составляет 40,5 лет
x f

x
f
i
i
i
4050

 40,5
100
Средняя величина по способу
моментов (от условного нуля)
xi  A
 ( h )  fi
x
h A
 fi
индивидуальные
значения
признака в совокупности;
f i - частота;
h - величина интервала;
А - середина интервала, обладающего
наибольшей частотой
xi -
Пример:
Распределение сотрудников предприятия по возрасту
Возраст,
лет
Число
сотрудник
ов, чел.
хi
До 25
6
20
-2
-12
25-35
15
30
-1
-15
35-45
58
40
0
0
45-55
12
50
1
12
55-65
7
60
2
14
Более 65
2
70
3
6
ИТОГО
100
-
-
5
(
fi
А =40; h =10
xi  A
)
h
(
xi  A
)  fi
h
xi  A
 ( h )  fi
5
x
h A 
 10  40  40,5
100
 fi
СПАСИБО ЗА
ВНИМАНИЕ
37
Download