тема 3.средние величины и показатели вариации

advertisement
РАЗДЕЛ 1. ТЕОРИЯ СТАТИСТИКИ
ТЕМА 3.СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ
Цель: сформировать представление о средних величинах и
показателях вариации как о взаимосвязанных показателях,
отражающих основные особенности предмета статистики –
однородность и варьирование единиц совокупности в разрезе
изучаемой закономерности.
Задачи: рассмотреть основные формы средних величин и виды
показателей вариации, раскрыть содержание, условия применения и
методику их расчета.
РАЗДЕЛ 1. ТЕОРИЯ СТАТИСТИКИ ......................................................... 1
ТЕМА 3.СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ .............. 1
3.1. Сущность и значение средней величины. Формы средних
величин ................................................................................................... 1
3.2. Средняя арифметическая, её математические свойства ............. 2
3.3. Простая и взвешенная средняя. Основные правила применения
средних величин .................................................................................... 4
3.4. Структурные средние ...................................................................... 4
3.5. Вариация, методы ее изучения ...................................................... 5
3.6. Вариационный ряд, правила его построения, графическое
изображение ........................................................................................... 5
3.7. Показатели размера и интенсивности вариации........................... 6
3.8. Структурные характеристики распределения ............................... 8
3.9. Показатели эксцесса и асимметрии ............................................... 9
3.10. Правило сложения дисперсий .................................................... 10
Выводы ................................................................................................. 11
Вопросы для самопроверки ................................................................. 12
Библиография ...................................................................................... 12
3.1. Сущность и значение средней величины. Формы средних
величин
Средняя
величина
представляет
собой
обобщенную
характеристику уровня значений признака, которая получена в
расчете на единицу совокупности. В отличие от относительной
величины, которая является мерой соотношения показателей,
средняя величина является мерой признака на единицу совокупности.
Средние величины делятся на основные две категории: степенные
средние; структурные средние.
Форма, вид и методика расчета средней величины зависят от
поставленной цели исследования, от вида и взаимосвязи изучаемых
1
признаков, а также от характера исходных данных. Наиболее
известный
и
распространенный
вид
средней
–
средняя
арифметическая
величина.
Средняя
гармоническая
часто
рассматривается как величина обратная средней арифметической.
Средняя квадратическая широко используется при расчете
показателей вариации, средняя геометрическая ─ в анализе
динамики. Средняя, являясь характеристикой всей совокупности,
должна ориентироваться на итоговый, так называемый определяющий
показатель, связанный со всеми единицами этой совокупности.
Например, при расчете средних затрат на единицу продукции таким
показателем является объем затрат на всю продукцию; при расчете
средней заработной платы определяющий показатель-это фонд
заработной платы; для средней выработки одного рабочего таким
определяющим
показателем
является
объем
продукции,
произведенной всеми рабочими.
При замене индивидуальных значений признака их средней
величиной определяющий показатель должен сохранять свое
значение. Если при замене индивидуальных значений признака
необходимо сохранить без изменения общий объем признака, то
применяется средняя арифметическая; чтобы неизменной оставалась
итоговая величина, обратная индивидуальным значениям признака,
используется гармоническая средняя. Если необходимо сохранить
неизменной сумму квадратов исходных величин, то применяется
средняя квадратическая величина. Если сохраняется неизменным
произведение исходных значений признака, то применяется средняя
геометрическая. Правило мажорности средних величин:
3.2. Средняя арифметическая, её математические свойства
Средней арифметической является такой вид средней величины,
при расчете которой общий объем признака по совокупности единиц
сохраняется неизменным. При расчете средней арифметической
‹‹определяющий показатель›› можно представить алгебраически в
виде слагаемых:
Учитывая, что определяющий показатель должен оставаться без
изменения при замене всех его исходных значений их средней
величиной, запишем равенство:
Средняя величина определяется по формуле:
2
Средняя арифметическая простая (невзвешенная) равна сумме
отдельных значений признака, деленной на число этих значений. Этот
вид средней применяется для первичных (объемных) признаков в тех
случаях, когда данные не сгруппированы. В совокупностях, в которых
одни и те же значения признака многократно повторяются, проводится
группировка данных, объем совокупности определяется не путем
суммирования отдельных значений признака, а путем перемножения
(взвешивания) вариантов признака на число единиц, соответствующих
этому варианту, т. е. на их частоты: х1 f1  х 2 f 2  ...  х n f n .
Поскольку должно выполняться равенство:
,
средняя определяется по формуле средней взвешенной:
В отдельных случаях веса могут быть представлены в виде
относительных величин структуры (в процентах или долях единицы).
Тогда формула средней арифметической взвешенной будет иметь
вид:
xd
x 
,
d


где
d 
f
f
─ доля каждой группы в общем числе единиц
совокупности (частость).
Если частоты выражены в долях (коэффициентах), то

d 1 и
xi  d i .
формула средней арифметической упрощается: x 
При использовании средней арифметической необходимо учитывать
ее математические свойства:
1. Сумма отклонений отдельных значений признака от средней
арифметической равна нулю.
2. Сумма квадратов отклонений значений признака от средней
меньше сумм квадратов отклонений от любой произвольной
величины А.
3. Если от каждого значения признака отнять или к каждому
значению признака прибавить одно какое-либо число А, то
3
4.
5.
6.
новая средняя соответственно уменьшается или увеличивается
на то же самое число.
Произведение средней на сумму частот всегда равно сумме
произведений вариантов на частоты.
Если каждое значение признака разделить или умножить на
одно какое-либо число А, то новая средняя соответственно
уменьшится или увеличится во столько же раз.
Если, используя взвешенную среднюю, умножить или разделить
веса на постоянное число, то средняя величина не изменится.
3.3. Простая и взвешенная средняя. Основные правила
применения средних величин
При помощи средних обобщаются не только абсолютные, но и
относительные величины. Отличия в расчете в этом случае отражают
особенности построения средних на основе значений первичных
признаков и вторичных признаков.
Базой расчета средних значений вторичного признака является
относительная величина, отражающая логическую формулу этого
вторичного признака. Далее вычисляется частное от деления
суммарных значений объемных признаков числителя и знаменателя
относительной величины. В случае, когда один из итоговых
показателей неизвестен, расчет средней производится на основе
исходных данных о значении осредняемого вторичного признака у
каждой отдельной единицы совокупности и связанного с ним признака
– веса. Таким образом, средняя величина вторичного признака имеет
вид средней взвешенной. Для каждого показателя, используемого в
экономическом анализе, можно составить только одно исходное
соотношение для расчета средней. Если, например, требуется
рассчитать средний размер вклада в банке, то исходным будет
соотношение суммы вкладов и числа вкладов.
Если же необходимо определить среднюю процентную ставку по
кредитам, выданным на один и тот же срок, то потребуется
следующее исходное соотношение: общая сумма выплат по
процентам (из расчета за год, тыс. руб.)/общая сумма
предоставленных кредитов (тыс. руб.)
Для расчета средней заработной платы работников предприятия
необходимо общий фонд заработной платы разделить на число
работников.
3.4. Структурные средние
Наиболее часто используемыми в экономической практике
структурными средними являются мода и медиана. Мода
представляет собой значение изучаемого признака, повторяющееся с
наибольшей частотой. Медианой называется значение признака,
4
приходящееся на середину ранжированной (упорядоченной)
совокупности.
Вычисление моды и медианы производится различно, в
зависимости от того, имеем ли мы несгруппированные или
сгруппированные данные.
Моду и медиану можно рассматривать как порядковые
характеристики значения признака у единицы совокупности,
занимающей особое место в ряду распределения. Каждая из этих
средних величин соответствует конкретному значению признака в
отличие от средний арифметической величины, полученной
расчетным путем.
Средняя арифметическая так же, как мода и медиана,
именованная величина, но не совпадает (за редким исключением) по
своей величине ни с одним значением признака у единиц
совокупности. Средняя арифметическая часто используется как
показатель центра распределения, положительные и отрицательные
отклонения от которого индивидуальных значений признака в сумме
взаимно погашаются. Медиана отражает значение признака, сумма
отклонений от которого является наименьшей величиной. Мода
является величиной, вокруг которой группируется наибольшее
количество единиц совокупности.
3.5. Вариация, методы ее изучения
Статистическая совокупность по определению включает
однокачественные в разрезе изучаемой закономерности и
одновременно варьирующие единицы. В ряде случаев ряды
распределения, построенные по одному и тому же признаку, могут при
одной и той же величине среднего уровня признака иметь разную
степень вариации этого признака.
Вариацией называется различие индивидуальных значений
признака у изучаемой совокупности единиц.
Вариация отражает особенности условий формирования и
развития явлений. От размера вариации зависит типичность и
надежность средних величин. Статистический анализ вариации тесно
связан с группировками, и в частности, с рядами распределения.
Изучение вариации включает несколько этапов: построение
вариационного ряда, оценка размера и интенсивности вариации,
характеристика структуры и формы распределения.
3.6. Вариационный ряд, правила его построения, графическое
изображение
Вариационный ряд характеризует распределение единиц
совокупности по значениям количественного признака. Вариационные
ряды, как и статистические признаки, подразделяются на дискретные
и интервальные. Вариационный ряд оформляется в виде таблицы, где
5
в первой графе указываются варианты (интервалы) значений
признака, а в следующих графах частота (частость).
Способы построения вариационного ряда для дискретных и
непрерывных признаков различны. Число групп в дискретном
вариационном ряду определяется числом реально существующих
значений варьирующего признака. Примером дискретного ряда с
небольшим числом вариантов может служить полученное по итогам
переписи населения 2002 г. распределение частных домохозяйств по
размеру.
Если дискретная вариация проявляется в широких пределах, то,
как и при непрерывной вариации, строятся интервальные
вариационные ряды. При группировке единиц однокачественной
совокупности возможно использовать равные интервалы.
Если вариационный ряд представлен неравными интервалами,
то частоты в отдельных интервалах непосредственно не сопоставимы,
т. к. зависят от ширины интервала. Для сравнения частот в разных
интервалах рассчитываются показатели абсолютной и относительной
плотности распределения.
Абсолютная плотность h
– это отношение частоты к величине
~

интервала, а относительная плотность h – это отношение частости к
величине интервала. Графическое изображение дискретного
вариационного ряда распределения в виде ломаной линии
называется полигоном (многоугольником) распределения.
Интервальный вариационный ряд графически изображают, как
правило, в форме столбиковой диаграммы, которую называют
гистограммой
распределения.
Графическое
изображение
вариационного ряда отражает особенности и общий характер
распределения, позволяет судить о близости распределения к
определенному
типу,
закону.
Преобразованной
формой
вариационного ряда является ряд накопленных частот, графическое
изображение которого называется кумулятой.
3.7. Показатели размера и интенсивности вариации
Для измерения степени вариации единиц совокупности по
изучаемому признаку используются абсолютные и относительные
показатели вариации.
К абсолютным характеристикам вариации относятся следующие:
размах вариации R; среднее линейное отклонение d; дисперсия
и
среднее квадратическое отклонение
Относительные характеристики вариации рассчитываются как
отношение абсолютных показателей степени вариации к среднему
уровню изучаемого признака:
6
-


относительный размах вариации: K  R x *100
- относительное линейное отклонение:
K  (d x) *100 ;
- коэффициент вариации:   ( x ) *100 .
Размах вариации (R) представляет собой разность между
наибольшей
наименьшей
вариантами признака. Этот
показатель представляет интерес в тех случаях, когда важно знать
пределы вариации признака, например, пределы вариации
процентных ставок по кредитам и депозитам кредитных организаций
одного и того же региона. Другой пример: при анализе
инвестиционных проектов в условиях риска из двух проектов тот
считается более рискованным, у которого размах вариации
экспертной
оценки
ожидаемого
эффекта
выше.
Однако
характеристика степени вариации при помощи размаха вариации
является недостаточной, т. к. величина этого показателя зависит от
величины только двух крайних вариантов признака.
Для обобщения всех различий значений признака в изучаемой
совокупности используются показатели среднего линейного и
среднего квадратического отклонения, которые имеют те же единицы
измерения, что и варианты признака, и его средняя величина. Порядок
расчета этих показателей различен для несгруппированных и
сгруппированных данных.
Среднее линейное отклонение d – это средняя арифметическая
из абсолютных отклонений варианта признака от средней
арифметической величины. Среднее квадратическое отклонение
является абсолютной мерой вариации и представляет собой корень
квадратный из дисперсии. Смысловое содержание среднего
квадратического отклонения такое же, как и среднего линейного
отклонения: чем меньше его величина, тем однороднее совокупность
и тем, следовательно, типичнее средняя величина. Дисперсией
называется средний квадрат отклонений значений признака от их
средней величины.
Для измерения вариации альтернативного признака, которым
свойственны лишь два противоположных варианта, рассчитывается
так называемая дисперсия доли. Количественно вариация
альтернативного признака проявляется в значении 0 у единиц
совокупности, которые им не обладают, или в значении 1 у единиц,
обладающих этим признаком. Доля единиц (частость), обладающих
данным признаком, обычно обозначается p; доля единиц не
обладающих данным признаком, обозначается q.
Тогда дисперсия альтернативного признака (или дисперсия
доли) равна произведению доли на дополняющее эту долю до
единицы число.
7
Дисперсия и среднее квадратическое отклонение являются
наиболее распространенными показателями степени вариации, и
используются при расчетах, связанных с организацией выборочного
наблюдения, при оценке полученных на основе выборки
статистических показателей, для построения показателей тесноты
корреляционной связи, в дисперсионном анализе. В условиях
нормального распределения существует следующая зависимость
между величиной
среднего квадратического
отклонения и
количеством наблюдений:
В пределах
располагается 0,683 количества наблюдений.
В пределах
В пределах
располагается 0,954 количества наблюдений.
располагается 0,997 количества наблюдений
Отклонение
можно считать максимально возможным. Это
положение называется "правилом трех сигм".
В симметричных распределениях среднее квадратическое
отклонение составляет приблизительно 1,25 среднего линейного
отклонения. Это соотношение может быть использовано для
приближенного расчета среднего квадратического отклонения, исходя
из уже вычисленного значения среднего линейного отклонения. При
таких расчетах следует учитывать и полученные согласно правилу
‹‹трех сигм›› следующие соотношения:
1
  ( X max  X min ) ,
6
т. к. в нормальном распределении в размахе
‹‹укладывается››
.
Если распределение заведомо асимметричное, то
вариации
1
  ( X max  X min ) .
5
3.8. Структурные характеристики распределения
Для отражения особенностей структуры распределения признака
в совокупности используют квантили распределения.
Квантиль – это варианты признака, занимающие в
упорядоченном
(ранжированном)
ряду
единиц
совокупности
определенное место (каждое четвертое, каждое пятое, каждое шестое
и т.д.). В результате квантили делят ряд распределения на равные (по
числу единиц) части: квартили – на четыре; квинтили – на пять;
секстили – на шесть; децили – на десять; перцентили – на сто частей.
Значение квантилей для сгруппированных данных определяются по
накопленным частотам. Наиболее широко используются децили и
квартили ряда распределения.
8
Первая дециль D1 – это такое значение признака, что 0,1 (или
10%) единиц совокупности имеют значение признака, меньше, чем
, а 0,9 (90%) имеют значения признака больше, чем
. Вторая
дециль ( D2 ) – это такое значение признака, что 0,2 (или 20%) единиц
совокупности имеют значение признака, меньше, чем
, а 0,8 (80%)
имеют значения признака больше, чем D2 . Аналогично определяют
D3 , D4 , D5 , D6 , D7 , D8 , D9 .
Первая квартиль Q1 определяет такое значение признака, что
одна ¼ единиц совокупности имеет значения признака меньше, чем
Q1 , а ¾ – значения больше чем Q1 . Вторая квартиль Q2 равна медиане.
Третья квартиль Q3 определяет такое значение признака, что ¾
единиц совокупности имеют значения признака меньше, чем Q3 , а ¼
больше чем Q3 . Величина крайних квартилей для интервального ряда
распределения может быть получена по формулам:
Q1  x0Q
1
1
 iQ1  4
 f S
3
4
f S
Q3  x0Q3  iQ3
Q1 1
;
f Q1
f Q3
Q3 1
,
где x0 – нижняя граница интервала, в котором находятся первая и
третья квартиль;
S Q1 – суммы частот (частостей), накопленных в интервалах,
предшествующих интервалам, в которых находятся первая и третья
квартиль;
f Q – частота интервала, в котором находятся первая и третья
квартиль.
3.9. Показатели эксцесса и асимметрии
Форма распределения отражает характер последовательного
изменения частот. Для характеристики формы распределения
используют показатель симметричности распределения частот коэффициент асимметрии, и показатель эксцесса, который отражает
крутизну (островершинность) этого распределения. Расчету значений
этих показателей предшествует вычисление так называемых
моментов распределения. Моментом распределения называется
средняя арифметическая тех или иных степеней отклонений
индивидуальных значений признака от определенной исходной
9
величины. В зависимости от того, что принимается за исходную
величину A , различают три вида моментов: начальные при
;
центральные при
; условные, когда A - произвольная
величина [m], не равная x и отличная от 0.
Коэффициент ассиметрии представляет собой нормированный
центральный момент третьего порядка, т. е. отношение центрального
момента третьего порядка к кубу среднего квадратического
отклонения. Показатель островершинности распределения – эксцесс
( Ex ) ,
рассчитывается для умеренно асимметричных распределений.
Наиболее
точным
является
показатель,
использующий
4
нормированный центральный момент четвертого порядка
. В
4
нормальном распределении это отношение равно 3
,
поэтому формула расчета эксцесса как показателя отклонения от
нормального распределения следующая:
.
3.10. Правило сложения дисперсий
 y2
2
может быть разложена на две составные части: 1) межгрупповую  y
Правило сложения дисперсий гласит, что общая дисперсия
и 2)среднюю из внутригрупповых дисперсий  yв.г. . Общая дисперсия
отражает вариацию результативного признака, сложившуюся под
воздействием всей совокупности причин и условий, определяющих его
изменение. Она равна среднему квадрату отклонений отдельных
значений результативного признака от его средней величины.
Межгрупповая дисперсия характеризует ту часть общей дисперсии,
которая обусловлена делением совокупности на группы, т. е. отражает
различия в величине изучаемого признака, которые возникают под
влиянием одного условия – это вариация признака, положенного в
основу группировки. Она равна среднему квадрату отклонений
2
групповых средних
от общей средней
. Средняя из
внутригрупповых дисперсий характеризует остаточную вариацию,
которая происходит под влиянием других, не связанных с
группировкой факторов. Вычисляется она как средняя из
внутригрупповых дисперсий
 k2
:
10

2
yв . г .

2

 kf
f
,
где
– дисперсия в отдельных группах;
f – численность отдельной группы.
Дисперсия в отдельных группах вычисляется по формуле:
 k2 

( yi  y k ) 2
f
.
Выводы
Средняя величина будет отражать типичный уровень признака в
данной совокупности единиц, когда она рассчитана по качественно
однородной совокупности. В этой связи метод средних используется в
сочетании с методом группировок. Каждая средняя характеризует
изучаемую совокупность по какому-то одному признаку. Для принятия
практических решений, как правило, необходима характеристика
совокупности по нескольким признакам. В этом случае используется
система средних величин. Наиболее часто используемыми в
экономической практике структурными средними являются мода и
медиана. Мода отражает наиболее распространенный вариант
значений признака. Медиана практически выполняет функции средней
для неоднородной совокупности, а также в тех случаях, когда имеют
место резкие различия между максимальным и минимальным
значениями изучаемого признака.
Соотношение моды, медианы и средней арифметической
указывает на характер распределения признака в совокупности,

позволяет оценить его асимметрию. Если M 0  M e  X , то имеет место

правосторонняя асимметрия, при X  M e  M 0 следует сделать вывод о
левосторонней асимметрии ряда. Для того чтобы судить о типичности
средней для данной совокупности, ее следует дополнить
показателями, характеризующими вариацию величины изучаемого
признака. Совокупность считается количественно однородной, если
коэффициент вариации не превышает 33%. Вариация признака
определяется различными факторами. Если данные представлены в
виде аналитической группировки, то можно вычислить три показателя
дисперсии: общую дисперсию, межгрупповую дисперсию и среднюю из
внутригрупповых дисперсий. Указанные дисперсии взаимосвязаны
между собой равенством, которое отражает правило сложения
дисперсий: величина общей дисперсии равна сумме межгрупповой
дисперсии и средней из внутригрупповой дисперсий. Правило
11
сложения дисперсий используется при определении степени точности
типической выборки и при измерении тесноты связи изучаемого
результативного признака с признаками-факторами.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
Вопросы для самопроверки
Какова роль средних величин в обобщении данных
статистического наблюдения?
Какие условия определяют выбор формы средней?
Каковы основные свойства средней арифметической?
Как
вычисляется
средняя
арифметическая
по
сгруппированным данным?
Какие задачи решают структурные средние?
В чем состоят особенности расчета медианы на основе
дискретных и интервальных рядов динамика?
Как определить моду на основе несгруппированных данных и
на основе вариационных рядов распределения?
Что такое размах вариации; в чем его особенности как
показателя вариации?
Какие показатели являются абсолютными характеристиками
степени вариации?
В чем состоят особенности расчета показателей вариации по
сгруппированным данным?
Какое
аналитическое
значение
имеет
коэффициент
вариации?
Что представляет собой дисперсия альтернативного
признака?
Какие показатели относятся к квантилям распределения?
Что представляет собой правило сложения дисперсий?
Как определяется внутригрупповая дисперсия?
Что характеризует межгрупповая дисперсия, формула ее
расчета?
Библиография
1.
Елисеева И.И., Юзбашев М.М. Общая теория статистики:
Учебник/ Под ред. И.И. Елисеевой. – 5-е изд., перераб. и доп. – М.:
Финансы и статистика, 2004.
2.
Статистика: Учебник/ Под ред. В. С. Мхитаряна. – М.:
Экономист, 2005.
3.
Статистика для менеджеров с использованием Microsoft
Excel/ Д. М. Левин, Д. Стефан, Т. С. Кребиль, М. Л. Беренсон. ─ 4-е
изд.: Пер. с англ. – М.: Издательский дом «Вильямс», 2004.
4.
Практикум по теории статистики: Учеб. пособие/ Под ред.
проф. Р.А. Шмойловой. – М:. Финансы и статистика, 2004.
12
Download