3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ

advertisement
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Лабораторная работа № 1
СРЕДНИЕ ВЕЛИЧИНЫ
Цель работы: изучить средние и структурные средние величины и научиться применять
их при решении конкретных задач.
Содержание домашней подготовки
1. Познакомиться с теоретическим материалом.
2. Изучить исходные данные.
Содержание работы в лаборатории и порядок ее выполнения
1. Использовать программу Average, выполнив следующие операции: а) зайти в сеть;
б) зайти в Windows; в) на диске Р найти папку Average; г) запустить файл Average.exe.
2. Выполнить задачи теста.
3. Рассчитать (по таблице, исходные данные) на ЭВМ средние величины, проверить
правило мажорантности.
4. Рассчитать моду, медиану, квартили.
5. По данным расчета построить гистограмму и показать на ней средние величины,
моду, медиану и квартили.
6. Составить отчет и ответить на контрольные вопросы.
1 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Общие положения
Сущность и значение средних показателей
Наиболее распространенной формой статистических показателей, используемой в
социально-экономических исследованиях, является средняя величина, представляющая
собой обобщенную количественную характеристику признака в статистической
совокупности в конкретных условиях места и времени.
Этот показатель: 1) выражает типичные черты; 2) дает обобщенную характеристику
однотипных явлений по одному из основных признаков; 3) отражает уровень признака,
отнесенный к единице совокупности.
Широкое применение средних объясняется тем, что они имеют ряд положительных
свойств, делающих их незаменимыми в анализе явлений и процессов общественной
жизни. Важное свойство средней величины заключается в том, что она отражает то
общее, что присуще всем единицам исследуемой совокупности. Значения признака
отдельных единиц совокупности могут колебаться под действием основных и случайных
факторов. Сущность средней заключается в том, что в ней взаимопогашаются
отклонения значений признака отдельных единиц совокупности и учитываются
получаемые изменения. Это позволяет средней отражать типичный уровень признака и
абстрагироваться от индивидуальных особенностей, присущих отдельным единицам.
Часто метод средних используется в сочетании с методом группировок.
2 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Определяющее свойство средней
Средняя, являясь обобщенной характеристикой всей статистической совокупности,
должна ориентироваться на определенную величину, связанную со всеми единицами
этой совокупности. Эту величину можно представить в виде функции: F(x1,x2,x3,...,xm).
Так как данная величина в большинстве случаев отражает реальную экономическую
категорию, ее называют определяющим показателем. Если в выражении все величины
x1,x2,...,xm заменить их средней величиной *, то значение функции должно остаться
прежним: F(x1,x2,x3,...,xm)= F(*,*,*,...,*).
Исходя из данного равенства и определяется средняя. Определить среднюю можно
часто через исходное соотношение средней (ИСС).
ИСС = (суммарное значение или объем усредненного признака)/(число единиц или
объем совокупности).
Однако от того, в каком виде представлены исходные данные для расчета, зависит,
каким именно образом будет реализовываться ИСС. В каждом конкретном случае для
реализации исходных соотношений потребуется одна из следующих форм средней
величины:
1) средняя гармоническая;
2) средняя геометрическая;
3) средняя арифметическая;
3 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
4) средняя хронологическая;
5) средняя степенная.
Понятие степенной средней
Все указанные выше виды средних величин принадлежат к общему типу степенных
средних. Различаются они лишь показателем. Степенная средняя степени k есть
корень k-й степени на число индивидуальных значений:
k )/m.
При k= -1 получаем гармоническую среднюю,
k=0 - геометрическую,
k=1 - арифметическую,
k=2 - квадратическую.
Чем выше показатели степени k, тем больше значения средней величины (если
индивидуальные значения признака варьируют).
Итак, имеем следующее соотношение, которое называется правилом мажорантности: Xг
4 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
арм<=
X
геом<=
X
ариф<=
X
квадр
.
Простые средние величины
а) Средняя гармоническая величина
Если при условии задачи необходимо, чтобы неизменной оставалась при усреднении
сумма величин, обратных индивидуальным значениям признака, то средняя величина
является гармонической:
i ).
Средняя гармоническая применяется, если исходные веса не заданы, а входят в
сомножитель одного из имеющихся показателей.
б) Средняя геометрическая
Если при замене индивидуальных величин признака на среднюю величину необходимо
сохранить неизменным произведение индивидуальных величин, то следует применять
геометрическую среднюю величину:
5 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
i
.
В частности, средняя геометрическая используется для расчета среднего цепного темпа
роста по формуле:
i /y i-1 ).
в) Средняя арифметическая
Средняя арифметическая величина - такое среднее значение признака, при вычислении
которого общий объем признака совокупности сохраняется неизменным. При ее
вычислении объем признака мысленно распределяется поровну между единицами
совокупности. Средняя арифметическая простая:
i /m),
где - средняя величина, n- численность совокупности.
Для интервального ряда берется середина интервала.
Свойства средней арифметической величины:
1. Сумма отклонений индивидуальных значений признака от его среднего значения
равна нулю.
6 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
2. Если каждое индивидуальное значение признака умножить или разделить на
постоянное число, то и средняя увеличится или уменьшится во столько же раз.
3. Если к каждому индивидуальному значению признака прибавить или отнять
постоянное число, то и средняя величина возрастет или уменьшится на столько же.
4. Если значение средней взвешенной умножить или разделить на постоянное число,
средняя величина не изменится.
5. Сумма квадратов отклонений индивидуальных значений признака от средней
арифметической меньше, чем от любого другого числа.
г) Средняя хронологическая величина
Если данные представлены не за какой-либо период, а по состоянию на дату, то для
расчета средней величины используется средняя хронологическая, то есть средняя
вычисленная по смежным уровням моментного ряда:
x=(x1/2+x2+...+xm/2)/(m-1),
где m - число уровней.
При расчете средних величин отдельные значения усредняемого признака могут
повторяться. Тогда расчет средней производится по сгруппированным данным или
вариационным рядам, которые могут быть дискретными или интервальными.
Взвешенные средние величины
а) Средняя взвешенная степенная
7 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
= (( z *f)/ ()) 1/z ,
где x - варианта (для интервального ряда берется середина интервала), f - частота
повторения данного варианта.
б) Средняя взвешенная гармоническая
/. в) Средняя взвешенная геометрическая
f
.
г) Средняя взвешенная квадратическая
2 *f)/)
.
д) Средняя взвешенная арифметическая
i *f i
)/i ,
где x - вариации повторения признака, f - частота повторения данного варианта.
8 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Правила выбора средней
1. Средняя арифметическая используется, если известны численные значения
знаменателя формулы, а значения числителя могут быть получены произведением.
2. Средняя гармоническая используется, если известны численные значения числителя
формулы, а значения знаменателя могут быть получены как частные от деления
показателя.
3. Средняя геометрическая применяется, если надо найти значение признака,
качественно равноудаленного от максимального и минимального значений, в том числе
темпы роста.
4. Средняя квадратическая применяется для измерения вариации признаков
совокупности, что обусловлено 5-м свойством средней арифметической.
5. Средняя хронологическая используется, если данные представлены не за
какой-либо период, а по состоянию на дату.
Структурные характеристики вариационного ряда распределения
Мода (Мо) - представляет собой значение изучаемого признака, повторяющееся с
наибольшей частотой.
Медиана (Ме) - значение признака, приходящееся на середину ранжированной
совокупности. Главное свойство медианы: сумма абсолютных отклонений значений
признака от медианы меньше, чем от любой другой величины:
å|xi-Me|=min.
9 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Определение моды и медианы по не сгруппированным данным: если ранжированный ряд
включает четное число единиц, то медиана определяется как средняя из двух
центральных значений. Если мода отражает типичный, наиболее распространенный
вариант значения признака, то медиана выполняет функцию средней для
неоднородной, не подчиняющейся нормальному закону распределения совокупности.
Определение моды и медианы по несгруппированным данным: сначала находят номер
медианной единицы ряда NMe=(n+1)/2, где n - объем совокупности.
Mo=x0+h*(fMo-f Mo -1)/(( fMo-fMo-1)+( fMo-fMo+1)) ,
где x0 - нижняя граница модального интервала;
h - величина модального интервала;
fMo - частота модального интервала;
f Mo -1 - частота предшествующего модальному интервалу;
fMo+1 - частота следующего за модальным интервалом.
Модальным называется интервал, имеющий наибольшую частоту.
Медиана вычисляется по формуле:
10 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Me = x0 + h*0,5(Me – 2*S)/fMe ,
где x - нижняя граница медианного интервала;
h - величина медианного интервала;
S - накопленная частота интервала, предшествующего медианному;
fMe - частота медианного интервала.
Медианным называется первый интервал, накопленная частота которого превышает
половину общей суммы частот.
Модой является значение варианты, имеющей наибольшую частоту повторения.
Медиана - это значение первой варианты, накопленная частота которой превышает
половину всех накопленных частот.
Квантили. Квантиль - значение признака, который делит ряд на равные части.
Математическое определение: квантиль - значение xq случайной величины X ,
удовлетворяющее условию
F(xq) = q F(x) = p(X < x).
В зависимости от q квантили делятся на :
n медиана - величина варьирующего признака, делящего совокупность на 2 равные
части (q=0,5);
11 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
n квартиль (q=0,25) - делит ряд по сумме частот на 4 равные части (второй квартиль
равен медиане, а первый - Q1 и третий - Q3 исчисляются аналогично расчету медианы,
только вместо медианного интервала берется для Q1 интервал, в котором находится
варианта, отсекающая 1/4 численности частот, а для Q3 - варианта, отсекающая 3/4
численности частот);
n квинтель (q=0,2), т.е делит ряд на 8 равных частей;
n дециль (q=0,1), т.е. делит ряд на 10 равных частей;
n процентиль (q=0,01) , т.е. делит ряд на 100 равных частей.
Общая формула квантиля:
,
где i – номер квантиля,
h – величина интервала,
XQi - нижняя граница интервала,
- накопленная частота интервала, предшествующего квантильному интервалу,
12 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
- частота квантильного интервала.
Например, квантили используются для расчета показателей дифференциации доходов
населения, по данным выборочных опросов получают интервальный ряд распределения
населения по среднему душевому доходу. Частость - процент населения, попадающий в
интервал.
Содержание отчета
1. Результаты расчета средней.
2. Результаты расчета структурных средних.
3. Гистограмма полученных результатов с их анализом.
Исходные данные
Группировка рабочих по размеру заработной платы
Группа рабочих по размеру з.п., у.е.
Число рабочих
100-110
13 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
5
110-120
7
120-130
13
130-140
24
140-150
29
150-160
38
14 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
160-170
45
170-180
52
180-190
65
Окончание таблицы
190-200
78
200-210
15 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
83
210-220
95
220-230
103
230-240
110
240-250
115
250-260
16 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
117
260-270
129
270-280
130
280-290
148
290-300
150
300-310
154
17 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
310-320
160
320-330
150
330-340
145
340-350
139
350-360
125
18 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
360-370
121
370-380
103
380-390
96
390-400
81
400-410
78
19 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
410-420
62
420-430
53
430-440
46
440-450
36
450-460
31
460-470
20 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
25
470-480
21
480-490
18
490-500
13
500-510
11
510-520
21 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
10
520-530
9
530-540
7
540-550
5
Сумма:
3235
Для вариантов 2-6 дополнить таблицу следующим образом:
К
каждому элементу 1-го столбца прибавить (к-1)*10, где к-вариант.
22 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
К
каждому элементу 2-го столбца
Первый
прибавить (к-1),
где к – вариант.
вариант использует таблицу без изменений.
Контрольные вопросы
1. 1. Перечислить свойства средней арифметической.
2. Как рассчитывается и что показывает мода?
3. Как рассчитывается и что показывает медиана?
4. Где и как применяются квантили?
Библиографический список
23 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
1.
2.
3.
4.
1. Альбом наглядных пособий по общей теории статистики. М.; 1991. 173 c.
2. Елисеева И.И. Общая теория статистики. М.: Банки и биржи, 1991. 367 с.
3. Рябушкин Т.В. Общая теория статистики. М.: Знание,1981. 153 с.
4. Теория статистики/ Под ред. Н.В. Шмолова. М.: Статистика, 1996. 380 с.
Лабораторная работа № 2
ПОКАЗАТЕЛИ ВАРИАЦИИ
Цель работы: изучение вариации признаков и показателей вариаций, а также их применение для решения конкретных задач.
Содержание домашней подготовки
1. Познакомиться с теоретическим материалом.
2. Изучить исходные данные.
Содержание работы в лаборатории и порядок ее выполнения
24 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
1. Запустить программу Var ( файл var. exe ) для дальнейшего выполнения работы.
2. Выполнить задачи теста.
3. Рассчитать показатели вариации, асимметрии и эксцесса. В качестве исходных данных использовать данные таблицы 1. Построить гистограмму и отложить на графике значения показателей вариации.
4. Рассчитать межгрупповую общую и среднюю из внутригрупповых дисперсии для аналитической группировки, используя данные таблицы. Рассчитать эмпирическое корреляционное отношение и коэффициент детерминации, построить график.
5. Проанализировать и сделать выводы о зависимости результативного и факторного признаков.
6. Составить отчеты и ответить на контрольные вопросы.
Общие положения
Показатели вариации
Изучение вариации в статистике и социально–экономических исследованиях имеет большое значение, так как величина вариации признака в статистической совокупности характеризует ее однородность.
В статистической практике для изучения и измерения вариации 25 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
используются различные абсолютные и относительные показатели (меры) вариаций в зависимости от поставленных перед исследователем задач. К абсолютным показателям относятся размах вариации, среднее линейное отклонение, средний квадрат отклонений (дисперсия), среднее квадратическое отклонение, квартильное отклонение. Изучение вариации признаков общественных явлений находится в прямой связи с группировками, в частности с рядами распределения.
Абсолютные показатели
1) Размах вариации (R) является наиболее простым измерителем вариаций признака. Он представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности:
R = XMAX -XMIN ,
где XMAX - наибольшее значение варьирующего признака;
XMIN - наименьшее значение признака.
Безусловным достоинством этого показателя является простота расчета. Однако размах вариации зависит от величины только крайних значений признака, поэтому область его применения ограничена достаточно однородными совокупностями. В частности, на практике он находит применение в предупредительном контроле качества продукции.
С целью более точной характеристики вариации признакопоказатель основывается на учете колеблемости всех значений признака. Поскольку средняя арифметическая является обобщающей характеристикой свойств совокупности, большинство показателей вариации основано на рассмотрении отклонений значений признака отдельных единиц совокупности от этой величины. К таким показателям относятся среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, представляющие собой среднюю арифметическую из отклонений индивидуальных значений признака от средней арифметической.
26 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
2) Среднее линейное отклонение ( ) представляет собой среднюю величину
из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения:
- невзвешенное среднее линейное отклонение;
- взвешенное среднее линейное отклонение,
где Xi - i-й вариант признака, - вес i-го варианта, m - объем совокупности.
Все эти показатели имеют ту же размерность, что и признак, для которого они вычисляются.
3) Дисперсия ( или D) представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины (s). Дисперсия вычисляется по формулам простой невзвешенной и взвешенной соответственно:
и .
Дисперсия обладает рядом свойств, некоторые из них позволяют упростить ее вычисления: 1) дисперсия постоянной величины равна нулю; 2) если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится; 3) если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.
4) Среднее квадратическое отклонение(s) представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от 27 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
их средней:
- невзвешенное,
- взвешенное.
Среднее квадратическое отклонение - величина именованная, имеет размерность усредняемого признака. Дисперсия и среднее квадратическое отклонение – наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятностей, служащих фундаментом математической статистики.
При расчете показателей вариации по интервальным рядам распределения необходимо сначала определить середины интервалов, а затем вести дальнейшие расчеты, рассматривая ряд середин интервалов как дискретный ряд распределения.
5) Квартильное отклонение (q). Для характеристики вариации признаков в совокупности можно применить так называемое квартильное отклонение. Этот показатель также можно применить вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений
q = (Q3 – Q1) / 2.
Квартиль представляет собой значение признака, делящее ранжированную совокупность на 4 равновеликие части. Различают квартиль нижний Q1, отделяющий ¼ часть совокупности с наименьшими значениями признака, и квартиль верхний Q
3
, отсекающий ¼ часть с наибольшими значениями признака. Средним 28 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
квартилем Q
2
является медиана.
Для расчета квартилей по интервальному вариационному ряду используют формулы:
,
где-нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25 %),
-нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75 %),
- накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль,
- то же самое для верхнего квартиля,
- частота интервала, содержащего нижний квартиль,
- частота интервала, содержащего верхний квартиль.
29 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Так как на квартильное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднительно или невозможно. В частности, этот показатель может быть рекомендован для рядов распределения с открытыми интервалами.
Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Эти показатели вычисляются как отношения абсолютных к средней арифметической. Выражаются они в % и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному).
Относительные показатели
Различают следующие относительные показатели вариации:
1) коэффициент осцилляции
;
2) относительное линейное отклонение
;
3) коэффициент вариации
;
30 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
4) относительное квартильное отклонение
.
Наиболее часто применяемый показатель относительной колеблемости –
коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности.
Показатели асимметрии и эксцесса
Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса.
Для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель AS:
,
где - средняя арифметическая ряда распределения,
MO – мода,
s - среднее квадратическое отклонение.
При нормальном распределении , следовательно, коэффициент асимметрии равен 0. Величина показателя асимметрии может быть положительной и отрицательной. Положительная величина показателя асимметрии указывает на 31 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая, рис.1). При левосторонней асимметрии наоборот (рис.2) (в этом случае показатель асимметрии имеет отрицательный знак).
Коэффициент асимметрии может изменяться от –3 до +3.
В практических расчетах часто в качестве показателя асимметрии применяется отношение центрального момента 3-го порядка к среднему квадратическому отклонению данного ряда в кубе, т.е.
.
Это дает возможность определить не только величину асимметрии, но и проверить наличие асимметрии в генеральной совокупности. Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной. Асимметрия меньше 0,25 - незначительная.
Для распределений может быть также рассчитан показатель эксцесса
(островершинности):
.
32 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Рис. 1. Правосторонняя асимметрия
Рис.
2. Левосторонняя асимметрия
33 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
34 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Ниже представлены на рис.3 два распределения: одно – островершинное
(величина эксцесса положительная), второе – плосковершинное (величина эксцесса отрицательная).
Рис. 3. Островершинное и
плосковершинное распределения
x
х
Ряды распределения с положительным (1) и отрицательным (2) эксцессом
Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении и показатель эксцесса равен 0.
x
35 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
f
f
Показатели вариаций для сгруппированных данных
Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.
Если рассчитать дисперсию признака по всей изучаемой совокупности, т.е. общую дисперсию, то полученный показатель будет характеризовать вариацию признака как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности. Если же поставить дальнейшую задачу – выделить в составе общей дисперсии ту ее часть, которая обусловлена влиянием какого-либо определенного фактора, то следует разбить изучаемую совокупность на группы, положив в основу группировки интересующий нас фактор. Затем нужно изучить раздельно вариацию признака внутри однородных в отношении данного фактора групп и изменения в величине признака от группы к группе. Выполнение такой группировки позволяет разложить общую дисперсию признака на две дисперсии, одна из которых будет характеризовать часть вариации, обусловленную влиянием фактора, положенного в основу группировки, а вторая – вариацию, происходящую под влиянием прочих факторов (кроме
фактора, положенного в основу группировки).
36 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловливающих эту вариацию:
.
Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака – фактора, положенного в основание группировки. Она рассчитывается по формуле:
,
где k – число групп; m j – число единиц в j – й группе; - частная средняя по j –
й группе; - общая средняя по совокупности единиц.
Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящей под влиянием неучтенных факторов и не зависящей от признака – фактора, положенного в основание группировки: .
Средняя из внутригрупповых дисперсий
Существует закон, связывающий три вида дисперсий. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:
.
37 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Следовательно, зная любые 2 вида дисперсий, можно определить или проверить правильность расчета 3-го вида.
На основании правила сложения дисперсий можно определить показатель тесноты связи между группировочным (факторным) и результативным признаками. Он называется эмпирическим корреляционным отношением, обозначается и .
Иногда используется коэффициент детерминации:
.
Если результативный и факторный признаки не связаны, то h®0 и h 2®0 , в противном случае h®1 и h
2
®1.
Содержание отчета
1. Результаты расчета средней.
2. Результаты расчета показателей вариации, их графическое изображение на
гистограмме.
3. Результаты расчета показателей асимметрии и эксцесса.
4. Результаты расчета дисперсий различных видов.
5. Результаты расчета корреляционного отношения и коэффициента детерминации,
их графическое изображение.
Исходные данные
Таблица 1. Распределение рабочих по заработной плате
38 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Зарплата, у.е.
Количество рабочих, чел.
40 – 50
50 – 60
60 – 70
70 – 80
80 – 90
90 – 100
100 – 110
110 – 120
120 – 130
130 – 140
39 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
5
10
13
15
19
16
14
10
5
3
Прибавьте к каждому значению частоты табл. номер своего варианта и введите эти значения частот.
40 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Таблица 2. Зависимость производительности труда от времени суток
Время суток, ч
Производительность труда, шт./ч
1
5
3
10
5
15
41 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
7
20
9
23
11
20
13
18
15
18
17
42 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
15
19
10
20
8
24
4
Прибавьте к значениям 1-й колонки табл. 2 (кроме последнего – его оставить 24)
число, полученное путем целочисленного деления номера вашего варианта на 2,
причем полученные после прибавления числа не должны повторяться. К значениям 2-й колонки прибавьте номер варианта и осуществите ввод.
Контрольные вопросы
43 / 44
3264 СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
1. Что представляет собой вариация признака, и в чем состоит значение ее изучения?
2. Какие показатели вариации находят наиболее широкое применение?
3. Изобразите различные виды кривых распределения при положительных и отрицательных значениях показателей асимметрии и эксцесса.
4. Что характеризует межгрупповая дисперсия?
5. Что характеризует внутригрупповая дисперсия?
6. Напишите формулу для расчета средней из внутригрупповых дисперсий.
7. Какие коэффициенты используются для оценки зависимостей между результативным и факторным признаками?
Библиографический список
1. Практикум по теории статистики: Учебное пособие /Под ред. И.Н. Шмойловой. М.:
Финансы и статистика, 1998. 344 с.
2. Статистика: Курс лекций/ Под ред. В.Г. Ионина. Новосибирск: Изд-во НГАЭиУ;
М.:ИНФРА-М, 2000. 567 с.
44 / 44
Download