Раздел 1. Теория статистики

advertisement
Раздел 1. Теория статистики
Практикум 3. Средние и показатели вариации
Оглавление
Методические указания ......................................................................... 1
Задания................................................................................................... 8
Методические указания
Методика расчета средней величины зависят от поставленной
цели исследования, от вида и взаимосвязи изучаемых признаков, а
также от характера исходных данных.
Средние величины делятся на основные две категории:
1. Степенные средние;
2. Структурные средние.
В составе степенных средних большое распространение
получила средняя арифметическая величина:




х1  х 2  ...  х n  x1  x 2  ... x n  n x .

Х
х1  х 2  ...  х n  x i

;
n
n
где х – индивидуальные значения признака; n - число единиц
совокупности. Приведенная формула есть формула средней
арифметической простой (невзвешенной). Расчет по этой формуле
проводится в том случае, если индивидуальные значения признака не
повторяются или встречаются одинаковое число раз, то есть можно
сказать имеют одинаковый вес.
Однако в исходных данных, особенно при использовании
совокупностей большого объема, одни и те же значения признака
повторяются. В этом случае данные представляют в сгруппированном
виде, когда для каждого значения осредняемого признака сообщается
частота его повторения, то есть предварительно составляется ряд
распределения. Допустим, варьирующим признаком является срок
функционирование банка, который соответствует периоду времени,
прошедшему с момента регистрации в Центральном банке.
Таблица 1
Группировка коммерческих банков по количеству лет деятельности
Период
деятельности
банков, лет
Число
банков
Общий
период
функционирова
ния банков, лет
хi
fi
xi f i
6
1
6
10
12
итого
4
2
7
40
24
70
вариантов признака на число единиц, соответствующих этому
варианту, т.е. на их частоты: х1 f1  х 2 f 2  ...  х n f n .
Поскольку должно выполняться равенство:
f
1


 f 2  ...  f n x  f1 x1  f 2 x 2  ...  f n x n ,
средняя определяется по формуле средней взвешенной:

xi f i
x f  x 2 f 2  ... x n f n
x 1 1

f  f  ... f
f ;
1
2
n


i
В нашем примере средний срок деятельности банков равен:

x
x f
f
i
i
i

70
 10 лет .
7
В отдельных случаях веса могут быть представлены в виде
относительных величин структуры (в процентах или долях единицы).
Тогда формула средней арифметической взвешенной будет иметь
вид:
x
где d 
f
f
 xd ,
d
- доля каждой группы в общем числе единиц
совокупности (частость).
Если частоты выражены в долях (коэффициентах), то

d 1 и
xi  d i .
формула средней арифметической упрощается: x 
Так, в приведенном выше примере количество банков разного
срока службы соответственно составляет 14,3% (0,143); 57,1%
(0,571); 28,6% (0,286) от их общего числа. Средний срок деятельности
банка составит:
6*0,143+10*0,571+12*0,286=10 лет.
При помощи средних обобщаются не только абсолютные, но и
относительные величины. Отличия в расчете в этом случае отражают
особенности построения средних на основе значений первичных
признаков и вторичных признаков.
Порядок расчета и форма средней зависит от взаимосвязи
изучаемых признаков и от того, какими данными для расчета мы
располагаем.
Средние первичных признаков определяются
по формуле
простой
средней
путем
деления
итогового
подсчета
по
характеризуемому признаку на перечневой подсчет, т.е. числитель
такого отношения представляет собой общую сумму значений
осредняемого признака у всех единиц совокупности, а знаменатель –
общее число единиц изучаемой совокупности.
Базой расчета средних значений вторичного признака является
исходное соотношение признаков, определяющих логическую
формулу осредняемого вторичного признака. Рассмотрим пример. В
таблице 2 представлены данные о работе двух организаций:
Таблица 2
Выпуск продукции
Организации
1
2
По плану,
тыс. руб.
Фактически,
тыс. руб.
Процент
выполнения
плана
Ф
6300
9090
В
105,0
101,0
П
6000
9000
Фактическая
выработка
продукции на
одного
рабочего
тыс.руб.
Т
3,9
4,5
Требуется определить средние значения всех представленных в
таблице признаков.
В рассматриваемом примере единицей совокупности является
одно предприятие, поэтому среди представленных в таблице
признаков первичными являются плановый и фактический объем
выпускаемой продукции. Следовательно, для расчета средней
величины каждого из этих признаков требуется применить форму
простой средней, а для остальных признаков таблицы используется
формула средней взвешенной величины.
П
6000  9000
 7500тыс. руб.
2
n

 Фi  6300  9090  7695тыс. руб.
Ф
n
2

Фi  6300  9090  15390 100  102,6% .
В
 Пi 6000  9000 1500

П
i


Т
Ф
Ч
i
;
i
Для определения средней выработки одного рабочего
необходимо предварительно вычислить численность рабочих,
занятых на каждом предприятии. В соответствии с исходными
Фi
. Проведя необходимую
Тi
подстановку, получим следующее выражение искомой средней,
которое соответствует форме средней гармонической взвешенной.
данными это возможно по формуле Ч i 

Т
Ф
Ч
i
i

Ф
Ф
Т
i
.
i
i
Подставив в формулу числовые значения получаем:

6300  9090
15390
15390тыс. руб.
Т


 4,2тыс. руб.
6300 9090 1615  2020
3635чел.

3,9
4,5
Вычисление моды и медианы производится в зависимости от
того, имеем ли мы несгруппированные или сгруппированные данные.
Рассмотрим
определение
моды
и
медианы
по
несгруппированным данным.
Предположим, что 9 строительных организаций
имеют
следующий объем кредиторской задолженности:
34,4 34,3 34,4 34,5 34,3 34,3 34,6 34,2 34,6.
Мода отражает наиболее распространенный вариант значений
признака. Так как чаще всего встречается организации с величиной
кредиторской задолженности 34,3 тыс. руб., то эта величина и будет
модальной.
Для
определения
медианы
необходимо
построить
упорядоченный (ранжированный) ряд:
34,2 34,3 34,3 34,3 34,4 34,4 34,5 34,6 34,6.
Медиана делит упорядоченный ряд на две равные по числу
единиц части так, что у половины единиц значение признака меньше
медианы, а у другой половины - больше ее. При нечетном числе
единиц совокупности порядковый номер медианы равен:
N me 
n 1
;
2
где n - число единиц совокупности.
В нашем примере номер медианы равен 5; медиана равна 34,4
тыс. руб. (то есть одна половина организаций имеет дебиторскую
задолженность менее 34,4 тыс. руб., а другая - более 34,4 тыс. руб.).
Рассмотрим определение моды и медианы по сгруппированным
данным (по рядам распределения). Предположим, имеется
следующий дискретный ряд распределения.
Таблица 3
Группировка предприятий региона по уровню рентабельности активов
Рентабельность
активов, %
1
Число
предприятий
2
Накопленная
частота
3
17
18
19
20
21
всего
4
8
17
12
9
50
4
12
29
41
50
-
Определение моды по данным дискретного ряда распределения
не составляет большого труда – наибольшую частоту (17
предприятий) имеет величина рентабельности 19%, следовательно,
она и является модальной.
Для определения медианного значения находят номер
медианной единицы ряда:
N me 
n 1
;
2
где n – объем совокупности.
В нашем случае номер медианного значения признака 25,5.
Полученное дробное значение указывает, что точная середина
находится между 25 и 26 предприятиями. Необходимо определить, в
какой группе находятся предприятия с этими порядковыми номерами.
Это можно сделать, рассчитав накопленные частоты (графа 3 табл. 3).
Очевидно, что предприятия с этими номерами находятся в третьей
группе (4+8+17=29) и, следовательно, медианой является уровень
рентабельности 19 %.
В отличие от дискретных рядов распределения определение
моды и медианы по интервальным рядам требует проведения
дополнительных расчетов.
Рассмотрим пример о распределении кредитных организаций
по величине активов.
Таблица 4
Группировка кредитных организаций региона по величине активов
Активы, млн. руб.
105-115
115-125
125-135
135-145
145-155
155-165
165-175
итого
Число кредитных
организаций
4
9
21
49
28
18
11
140
Накопленная частота
4
13
34
83
111
129
140
-
Интервал с границами 135-145 в данном распределении будет
модальным, так как он имеет наибольшую частоту. Определим моду:
M 0  135  10 
491  21
 140 .71 млн. руб.
49  21  49  28 
Для
определения
медианного
интервала
необходимо
определять накопленную частоту каждого последующего интервала
до тех пор, пока она не превысит ½ суммы накопленных частот.
Мы определили, что медианным является интервал с границами
135-145 . Проведем расчет медианы:
140
 34
2
М е  135  10 
 142 .35 млн. руб.
49
Продолжим
рассмотренный
пример
распределения
коммерческих банков по объему активов. В таблице 5 представлен
расчет данных, которые необходимы для определения показателей
степени вариации и характеристик формы распределения.
Таблица 5
Активы, млн.
руб.
105-115
115-125
125-135
135-145
145-155
155-165
165-175
Итого
f
x
xf
xx
xx f
(x  x) 2 f
(x  x)3 f
(x  x) 4 f
4
9
21
49
28
18
11
140
110
120
130
140
150
160
170
-
440
1080
2730
6860
4200
2880
1870
20080
33.3
23.3
13.3
3.3
6.7
16.7
26.7
-
133.2
209.7
279.3
161.7
187.6
300.6
293.7
1565.8
4435.58
4886.01
3714.69
533.61
1256.92
5020.02
7841.79
27688.6
147704.1
113844.0
49405.38
1760.91
8421.36
83834.33
209375.80
614345.88
4918570
2652566
657091.5
5811.013
56423.14
1400033.0
5590334
15280829
Как видно из формул, для расчета показателей вариации на
основе интервального ряда необходимо использовать середину
интервала
и
предварительно
изучаемого признака.
определить
среднюю
величину
 xf  20080  143,3млн. руб.
140
f
 x  x f  1565.8  11,15 млн. руб.

140
f
x
d
i

2
 ( x х )

f
i
2
fi
. ;  2  27688 .6  197 .77 ;
140
i
i

 ( xi  x ) 2 f i

f
3
 (x  x)

f
4
 (x  x)

f
i
As 
i
3
4
f
f


614346 .0
 4.39 ;
140
15280829
 109 .15 ;
140
3
 4,39 / 2780,65  0,0016;
3
 As 
6(140  1)
 0,2;
(140  1)(140  3)
As
 As
Ex 
 Ex 
 14,06 млн. руб.
i
 0,008;
4
 3  2,997.
4
24  140(140  2)(140  3)
 0,4;
(140  1) 2 (140  3)(140  5)
| Ex | / Ех  7,493.
На
основе
рассчитанных
обобщающих
характеристик
статистической совокупности коммерческих банков можно сделать
следующие выводы: средний объем активов кредитной организации
составляет 143,3 млн. рублей, а показатели вариации: среднее
линейное отклонение – 11,15 млн. рублей; среднее квадратическое
отклонение- 14,06 млн. руб., тогда коэффициент вариации равен

9,81%{ / x 100} ,
является
следовательно,
однородной
несущественный
по
изучаемая
объему
характер,
совокупность
активов;
распределение
банков
асимметрия
имеет
является
более
плосковершинным, чем нормальное, отклонение от нормального
распределения по показателю эксцесса является существенным.
Для измерения вариации альтернативного признака, которым
свойственны лишь два противоположных варианта, рассчитывается
так называемая дисперсия доли. Доля единиц (частость), обладающих
данным
признаком,
обычно
обозначается
p;
доля
единиц
не
обладающих данным признаком, обозначается q .
Допустим, при обследовании 1000 коммерческих банков 800 из
них являются универсальными. Определите дисперсию и среднее
квадратическое отклонение доли универсальных банков.
Решение:
В нашем примере доля единиц, обладающих изучаемым
признаком, т.е. доля универсальных банков, равна: p=800:1000=0,8
или 80%. Следовательно, 20% банков не обладали изучаемым
признаком.
Следовательно, дисперсия доли универсальных банков равна
 p2  p  q  0,8  0,2  0,16
Среднее квадратическое отклонение:
 p   p 2  0,16  0,4.
Задания
Задача 1
Имеются данные о реализации продукции предприятиями
региона за отчетный год.
Предприятие №1
Предприятие №2
В %% к
уровню прошлого
года
В %% к
запланированном
у уровню
Всего
реализовано за
отчетный год,
млн. руб.
В %% к
уровню прошлого
года
В %% к
запланированному
уровню
Всего
реализовано за
отчетный год,
млн. руб.
Вариант
1
2
3
4
130
115
125
140
105
102
103
110
120
112
119
120
135
120
127
142
102
116
120
115
121
130
115
116
5
6
139
141
116
112
118
115
137
140
103
106
126
119
7
8
128
135
120
100
121
110
130
137
110
113
125
131
9
111
115
118
113
130
119
Требуется:
По данным Вашего варианта задания определить средние по
совокупности предприятий значение всех показателей таблицы.
Задача 2
В результате обследования размера каждого пятого вклада от
населения в
Сбербанке на конец года были получены следующие данные
Размер вклада, руб.
до 3000
3000 - 5000
5000 - 7000
7000-9000
9000 и выше
Число вкладов
60
90
160
50
40
Требуется:
1. Определить .средний размер вклада и показатели вариации.
2. Построить график распределения.
3. Сделать выводы.
Задача 3
По субъектам Федерации
федерального округа получены
следующие данные о структуре банковской системы.
Субъект
Федерации
1
2
3
4
5
6
7
8
9
10
Количество
кредитных
организаций
Количество
филиалов
региональных
кредитных
организаций
4
8
12
2
4
1
6
2
4
43
Количество
филиалов
кредитных
организаций из
других регионов
0
11
6
2
2
2
11
2
0
31
27
20
26
40
26
22
29
17
13
86
Требуется:
1. По каждому показателю таблицы определить моду и
медиану.
2. Сделать выводы.
Задача 4
Распределение муниципальных образований области по вводу в
действие жилых домов характеризуется следующими данными:
Темп роста за первое
полугодие, %
Число
муниципальны
х образований
До 60
60-70
70-80
80-90
90 и более
4
2
3
10
9
Требуется:
1. Построить график распределения.
2. Определить моду и медиану.
Задача 5
По данным выборочного обследования получено следующее
распределение работников по размеру заработной платы.
Среднемесячная заработная плата
одного работника, рублей
Число
работников
до 2000
16
2000-2300
22
2500 - 3000
30
3000 - 3500
15
3500-4000
9
4000 и выше
8
Итого
Рассчитайте:
1. Среднюю заработную плату одного работника.
2. Показатели вариации и формы распределения.
3. Построить график.
100
Download