Uploaded by Vi Meikshan

Астафьев Михалев04

advertisement
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
СИБИРСКИМ ГОСУДАРСТВЕННЫЙ УНИВЕРСИ 1h I
ФИЗИЧЕСКОЙ КУЛЬТУРЫ И СПОРТА
Н.В. А с т а ф ь е в
В.И. М и х а л ё в
Н.Г, Б е з м е л ь н и ц ы н
ттвтт^л ко - стдтистичесюд а
АНАЛИЗ КОЛИЧЕСТВЕННЫХ ДАННЫХ
ФИЗКУЛЫУРНО-ПЕДАГОГИЧЕСКИХ
ИССЛЕДОВАНИЙ СРЕДСТВАМИ
Microsoft ® Excel
Омск 2004
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
СИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФИЗИЧЕСКОЙ КУЛЬТУРЫ И СПОРТА
Н.В. АСТАФЬЕВ, В.И. МИХАЛЕВ, Н.Г.БЕЗМЕЛЬНИЦЫН
МАТЕМАТИКО-СТАТИСТИЧЕСКИЙ АНАЛИЗ
КОЛИЧЕСТВЕННЫХ ДАННЫХ
ФИЗКУЛЬТУРНО-ПЕДАГОГИЧЕСКИХ
ИССЛЕДОВАНИЙ
СРЕДСТВАМИ Microsoft ® Excel
Омск 2004
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Астафьев, Н.В. Математико-статистический анализ количественных данных
физкультурно-педагогических исследований средствами Microsoft ® Excel :
учебное пособие / Н.В. Астафьев, В.И. Михалев, Н.Г. Безмельницын. - Омск,
2004,- 60с.
В учебном пособии на примерах из практики описывается порядок использования компьютерной программы Excel 2002, а именно Пакета анализа и Мастера
функций (категории Статистические) для математико-статистического анализа
количественных данных, полученных в ходе физкультурно-педагогических исследований.
Учебное пособие может быть использовано при подготовке курсовых и выпускных квалификационных работ студентами физкультурных вузов, обучающихся специальности высшего профессионального образования 022300 - Физическая культура и спорт (направление «Гуманитарные науки»), студентами факультетов физического воспитания педагогических вузов, обучающихся специальности высшего профессионального образования 033100 - Физическая культура (направление «Образование и педагогика»).
Некоторые разделы учебного пособия могут быть использованы для математико-статистического анализа данных, полученных аспирантами и соискателями ученой степени в результате диссертационных исследований по научной
специальности 13.00.04. - Теория и методика физического воспитания, спортивной тренировки, оздоровительной и адаптивной физической культуры, а также
по другим педагогическим научным специальностям.
Рецензенты:
Г.И. Попов - заведующий кафедрой естественно-научных дисциплин и информационных технологий Российского государственного университета физической культуры, спорта и туризма, доктор педагогических наук, профессор;
В.Н. Попков - доктор педагогических наук, профессор Сибирского государственного университета физической культуры и спорта, ученый секретарь диссертационного совета Д.311.001.01.;
A.П. Косоротов - начальник кафедры управления и информационных технологий в деятельности органов внутренних дел Омской академии МВД России,
кандидат технических наук, доцент, подполковник милиции;
B.А. Терсков - начальник кафедры информатики и математики Сибирского
юридического института МВД России, доктор технических наук, профессор,
полковник милиции.
-
Рекомендовано Учебно-методическом объединением по образованию
в области физической культуры и спорта в качестве учебного пособия
ысших учебных заведений, обучающихся
:ти 022300 - Физическая культура и спорт
[ый университет физической культуры и спорта, 2004
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВВЕДЕНИЕ
В учебном пособии описывается порядок использования в физкультурно-педагогических исследованиях компьютерной программы Excel
2002, а именно Пакета анализа и Мастера функций (категории Статистические). Пользователи учебного пособия могут самостоятельно при
помощи ПЭВМ производить первичную математико-статистическую обработку эмпирических данных, выраженных в виде количественных признаков, а так же проверять выдвинутые гипотезы с помощью методов вариационной статистики.
В первичную математико-статистическую обработку эмпирических
данных входят следующие операции: графическое представление ряда
распределения; определение числовых характеристик выборки; проверка
выборки на соответствие нормальному распределению и создание выборки
из генеральной совокупности; определение среднестатистических показателей генеральной совокупности.
Для оценивания изучаемого признака используются: подсчет количества наблюдений в заданном интервале; разработка перцентильной шкалы
и определение величины изучаемого показателя для отбора вариант по заданному перцентилю.
Для проверки гипотез о равенстве средних двух выборок используется
Т-критерий Стьюдента, о равенстве дисперсий двух выборок - F-критерий
Фишера.
Для установления наличия связи между изучаемыми признаками
строится корреляционное поле (диаграмма рассеяния) и линия тренда; для
определения величины установленной связи рассчитывается коэффициент
корреляции. С целью описания математической зависимости между изучаемыми признаками рассчитывается уравнение регрессии.
Для проверки выдвинутых гипотез описаны три вида дисперсионного
анализа.
В учебном пособии не раскрывается суть производимых математикостатистических расчетов. В связи с этим обстоятельством пользователям
учебного пособия рекомендуется изучить содержание учебных и учебнометодических пособий по основам математической статистики для физкультурных образовательных учреждений, список которых представлен в
конце учебного пособия.
Каждый из перечисленных в учебном пособии методов вариационной
статистики прокомментирован примером из физкультурно-педагогических
исследований.
3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УСТАНОВКА ПАКЕТА АНАЛИЗА
Проведение физкультурно-педагогических исследований не обходится
без применения методов математической статистики, с помощью которых
подтверждаются либо опровергаются выдвинутые исследователями гипотезы.
Среди исследователей в личном пользовании широкое распространение получили персональные электронные вычислительные машины
(ПЭВМ). Одной из распространенных программ является Microsoft Office
2002. В пакет программ Microsoft Office 2002 входит программа Excel
2002. Программа Excel 2002 предназначена для решения различных практических и научных задач математическими методами, в том числе и методами математической статистики 1 . Методы математической статистики
Excel 2002 сгруппированы в Пакете анализа. Функциями математической
статистики можно пользоваться в Мастере функций категории Статистические.
Владение Пакетом анализа и Мастером функций категории Статистические программы Excel 2002 позволит самостоятельно производить математико-статистические расчеты и проверять выдвинутые гипотезы, как
начинающим, так и профессиональным исследователям.
Для того чтобы установить в ПЭВМ статистические программы, необходимо в меню Сервис выбрать команду Надстройки и загрузить Пакет
анализа (рис. 1).
Надстройки
JLlJSl
Доступные надстройки:
[Г Analysis ToolPak - VBA
I Мастер подстановок
Г" Мастер суммирования
R D _ _ _
Пересчет в евро
Г Поиск решения
Помощник по Интернету
ОК
Отмена
Обаор...
Автоматизация...
рЛакет анализа
Содержит функции и интерфейсы для анализа
научных и финансовых данных
Рис. 1. Диалоговое окно, используемое для установки
статистических программ Пакет анализа
1
Многие описанные в учебном пособии функции имеются и в ранних версиях программы Excel.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1. ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РЯДА РАСПРЕДЕЛЕНИЯ
Дня повышения наглядности эмпирических распределений используется их графическое представление. Наиболее распространенными способами графического представления являются гистограмма, полигон частот и
полигон накопленных частот (кумулята).
Графическое представление распределений непрерывно варьирующихся признаков позволяет получить гистограмму, которая состоит из
примыкающих друг к другу прямоугольников.
Пример. 110 курсантов второго курса юридического института МВД
России были протестированы в тесте «подтягивание на перекладине». Выявить наиболее часто повторяемый интервал данных - наиболее вероятные
результаты тестирования.
С целью изучения частот распределения данных изучаемой выборки в
заданные исследователем интервалы необходимо в меню Сервис выбрать
команду Анализ данных и инструмент анализа Гистограмма (рис. 2).
Порядок заполнения элементов диалогового окна «Гистограмма»
Входной интервал - указать ссылку на диапазон ячеек, содержащих
анализируемые данные.
Интервал карманов (необязательный) - ввести диапазон ячеек и набор
граничных значений, определяющих отрезки (карманы). Граничные значения должны быть введены в возрастающем порядке. Excel 2002 вычислит
количество данных, расположенных внутри отрезка. При этом учитываются значения на нижней границе отрезка и не учитываются значения на
верхней границе.
Если диапазон отрезков не был введен пользователем, то Excel 2002
автоматически создаст набор отрезков, равномерно распределенных между
минимальным и максимальным значениями данных.
Метки - если первая строка или первый столбец входного интервала
содержит заголовки, то следует установить флажок. Если заголовки не были введены, то Excel 2002 автоматически создаст названия данных итоговой таблицы результатов статистических расчетов.
Выходной интервал - определяет место расположения итоговой таблицы результатов статистических расчетов (левую верхнюю ячейку). В
случае возможного наложения таблицы результатов статистических расчетов на исходные данные будет выведено соответствующее сообщение на
экран.
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Анали» данных
' jiftiSM
Инструменты анализа
Ш:
Однофакторный дисперсионный анализ
Д в у х ф а к т о р н ы й дисперсионный анализ с повторениями
Д в у х ф а к т о р н ы й дисперсионный анализ без повторений
Корреляция
Ковариация
Ц х
ок
Отмена
Справка
Описательная статистика
Экспоненциальное сглаживание
Д в у х в ы б о р о ч н ы й F-тест д л я дисперсии
Анализ Ф у р ь е
Гистограмма
Гистогрлиил
-входные данные-
Входной интервал:
|Подтягиванис!$Р$
Интервал карманов:
I
Ot(
3
R Метки
-Параметры вывода
Отмена
^правка
—
С Выходной интервал:
С Новьй рабочий лист:
С Новая рабочая книга
Г~ Оарето (отсортированная гистограмма)
Ф Интегральный процент
W Вывод графика
Рис. 2. Диалоговые окна для использования инструмента
анализа Гистограмма
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
Парето (отсортированная диаграмма) - чтобы представить данные в
порядке убывания частоты, следует установить флажок. Если флажок снят,
итоговые данные будут представлены в порядке возрастания отрезков.
Интегральный процент - для расчета интегральных процентных отношений гистограммы следует установить флажок.
Вывод графика - для создания диаграммы следует установить флажок.
6
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Результаты выполнения статистических расчетов Excel 2002 отобразит
на новом рабочем листе в виде таблицы (табл. 1) и рисунка (рис. З 2 ).
Таблица 1
Результаты статистических расчетов при использовании
инструмента анализа Гистограмма
Карман
0
2
4
6
8
10
12
14
16
18
Еще
Частота
1
0
0
1
1
21
37
31
16
1
1
Интегральный %
,91%
,91%
,91%
1,82%
2,73%
21,82%
55,45%
83,64%
98,18%
99,09%
100,00%
- Интеграл
кый%
о
10
12
14
16
18
Еще
Рис. 3. Гистограмма распределения результатов тестирования курсантов
в тесте «подтягивание на перекладине»
2
Гистограмма, которую в виде итога отобразил Excel 2002, нами
подвергнута редакции.
7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Итоговая таблица результатов статистических расчетов при использовании инструмента анализа Гистограмма содержит три столбца: Карман
(границы шкалы оценок), Частота (количество курсантов, уровень успеваемости которых находится между самой нижней границей и текущей
границей), Интегральный % (интегральные частоты).
Вывод. В тесте «подтягивание на перекладине» наиболее часто повторяемым является интервал данных от 12 до 14. Мода содержится в указанном интервале и равна 13 (см. табл. 2).
2. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ВЫБОРКИ
Вариационные ряды и графики эмпирических распределений дают наглядное представление о том, как варьируется признак в выборочной совокупности. Но для полной характеристики выборки их недостаточно.
Числовые характеристики выборки дают количественное представление об эмпирических данных и позволяют их сравнивать между собой.
Практическое значение имеют характеристики положения, рассеяния и
асимметрии эмпирических распределений.
При проведении физкультурно-педагогических исследований изучению подлежит генеральная совокупность - наиболее общая совокупность
объектов, объединяемых одним признаком. Генеральная совокупность не
может быть изучена (измерена) в полном объеме. В связи с этим обстоятельством при проведении исследований изучается только представительная (репрезентативная) часть генеральной совокупности - выборочная совокупность (выборка).
С целью первичной статистической обработки данных исследования
используется инструмент анализа Описательная статистика. Описательная статистика служит для создания одномерного статистического отчета,
содержащего информацию о центральной тенденции и изменчивости
входных данных.
Пример. Среди 110 курсантов первого курса юридического института
МВД России проведен тест «подтягивание на перекладине». Требуется
провести первичную статистическую обработку данных исследования.
Для проведения первичной статистической обработки данных необходимо в меню Сервис выбрать команду Анализ данных и инструмент анализа Описательная статистика (рис. 4).
8
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
'.'ni»: лте nt млч стэтпстигэ
Экспоненциальное сглаживание
Двухеыборочный F-тест для дисперсии
Анализ Фурье
Гистограмма
Описательная статистика
гбходные данныеВходной интервал:
|$0$2:$0$П2
Группирование:
<• по столбцам
iJ
по строкам
ШГ J±*l|
]
ок
Отмена
^правка
Метки в первой строке
|
-Параметры вывода
С Выходной интервал:
<•" Новый рабочий лист:
С" Новая рабочая книга
Р
Итоговая статистика
95
Уровень надежности:
%
| 7 К-ый наименьший:
V? К-ый наибольший:
Рис. 4. Диалоговые окна для использования инструмента анализа
Описательная статистика
Порядок заполнения элементов диалогового окна «Описательная статистика»
Входной интервал - определяет входной интервал анализируемых
данных. Данные могут быть расположены по строкам или столбцам.
Группирование - определяет порядок расположение данных во входном интервале. В зависимости от порядка расположения данных следует
установить переключатель в положение По столбцам или По строкам.
Метки в первой строке/Метки в первом столбце.
9
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Установить переключатель в положение Метки в первой строке, если выбраны По столбцам и первая строка во входном интервале содержит
названия столбцов. Установите переключатель в положение Метки в первом столбце, если выбраны По строкам и заголовки строк находятся в
первом столбце входного интервала. Если входной интервал не содержит
подписей, то необходимые заголовки в выходном интервале Excel 2002
создаст автоматически.
Уровень надежности — определяет уровень надежности. Если в итоговую таблицу результатов статистических расчетов необходимо включить
сведения об уровне надежности исследований, то следует установить флажок и ввести требуемое значение надежности.
Например, значение 95% вычисляет уровень надежности среднего со
значимостью 0,05.
К-ый наибольший - если в итоговую таблицу результатов статистических расчетов необходимо включить строку для k-го наибольшего значения входного интервала, то следует установить флажок. В соответствующее окно необходимо ввести число к. Если к равно 1, зта строка будет содержать максимум из набора данных.
К-ый наименьший - если в итоговую таблицу результатов статистических расчетов необходимо включить строку для k-го наименьшего значения входного интервала, то следует установить флажок. В соответствующее окно необходимо ввести число к. Если к равно 1, эта строка будет
содержать минимум из набора данных.
Параметры вывода - выводит два столбца сведений для каждого набора данных. Левый столбец содержит метки статистических данных; правый столбец содержит статистические данные.
Выходной интервал - определяет место расположения итоговой таблицы результатов статистических расчетов (левую верхнюю ячейку). В
случае возможного наложения таблицы результатов статистических расчетов на исходные данные будет выведено соответствующее сообщение на
экран.
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
10
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Итоговая статистика - если в итоговой таблице результатов статистических расчетов необходимо получить по одному полю для каждого из
следующих видов статистических данных: Среднее, Стандартная ошибка
(среднего), Медиана, Мода, Стандартное отклонение, Дисперсия выборки,
Эксцесс, Асимметричность, Интервал, Минимум, Максимум, Сумма, Счет,
Наибольшее, Наименьшее, Уровень надежности, то следует установить
флажок.
Результаты выполнения статистических расчетов Excel 2002 отобразит на новом рабочем листе в виде таблицы (табл. 2).
Таблица 2
Результаты статистических расчетов при использовании
инструмента анализа Описательная статистика
Статистический
параметр
Среднее
Стандартная ошибка
Медиана
Мода
Стандартное отклонение
Дисперсия выборки
Эксцесс
Асимметричность
Интервал
Минимум
Максимум
Сумма
Счет
Наибольший (1)
Наименьший (1)
Уровень надежности (95,0%)
Значение
12,09
0,23
12
13
2,42
5,88
5,70
-0,92
20
0
20
1330
110
20
0
0,46
Условные
обозначения 3
X
ш
Me
Мо
стх
Dx
Ex
As
R
Xmin
Xmax
Sx
n
T
Инструмент анализа Описательная статистика позволяет рассчитывать среднее арифметическое значение выборочной совокупности
(среднее - X), стандартную ошибку (ошибка репрезентативности - т ) , медиану (Me), моду (Мо), стандартное отклонение (стх), дисперсию выборки
(Dx), эксцесс (Ех), асимметричность (асимметрия - As), минимальное зна3
Столбец «Условные обозначения» в итоговой таблице результатов статистических расчетов при использовании инструмента анализа Описательная
статистика представлен нами.
11
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
чение (минимум - Xmin), максимальное значение (максимум - Хшах), интервал (размах вариации - разница между максимальным и минимальным
значениями - R), сумму всех вариант (сумма - £ х ) , количество наблюдений
(счет - п), уровень надежности (показатель избранной доверительной вероятности - Т).
2.1. Положение ряда распределения
Среднее арифметическое значение (среднее) одна из основных характеристик выборки. Представляет собой такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю (с учетом знака отклонения). Среднее арифметическое принято обозначать буквой X с символом усреднения - чертой над буквой X.
В рассматриваемом нами примере среднее арифметическое значение
(среднее) составляет 12,09.
Медианой (Me) называется такое значение признака, когда одна половина значений данных меньше ее, а вторая половина - больше.
В рассматриваемом нами примере медиана показывает, что в группе
испытуемых одна половина курсантов показала результат в подтягивании
на перекладине более чем 12, а другая менее.
Мода (Мо) представляет собой значение признака, встречающееся в
выборке наиболее часто.
В рассматриваемом нами примере наиболее часто встречающимся результатом в тесте «подтягивание на перекладине» является значение 13.
Среднее арифметическое значение (среднее), медиана (Me) и мода
(Мо) совпадают (равны по значению) только в том случае, когда распределение унимодальное (с одним максимумом) и симметричное, т.е. распределение является нормальным.
2.2. Колеблемость (рассеяние) признака
Размах вариации (R) вычисляется как разность между максимальной
(Хтах) и минимальной (Xmin) вариантами выборки.
В рассматриваемом нами примере расчетная величина размаха вариации составляет 20.
Дисперсия и стандартное отклонение являются важнейшими характеристиками рассеивания.
Дисперсией называется средний квадрат отклонения значения признака от среднего арифметического. Дисперсия, вычисляемая по выборочным
данным, называется выборочной дисперсией (Dx).
Стандартным отклонением (или средним квадратическим отклонением) называется положительный корень квадратный из дисперсии (ах).
12
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В рассматриваемом нами примере расчетная величина дисперсии составляет 5,88, а стандартное отклонение - 2,42.
Коэффициентом вариации является относительная мера рассеивания
признака (Vx). Коэффициент вариации используется как показатель однородности выборочных наблюдений, а так же для сравнения изменчивости
признаков, имеющих различные единицы измерения.
Коэффициент вариации определяется по следующей формуле: Стандартное отклонение (стх) : среднее арифметическое X х 100%. Считается,
что если коэффициент вариации не превышает 10%, то выборку можно
считать однородной, т.е. сформированной из одной генеральной совокупности.
Коэффициент вариации можно использовать как относительную величину меры рассеивания только в тех случаях, когда значения признака измерены в шкале с абсолютным нулем.
В рассматриваемом нами примере расчетная величина коэффициента
вариации составляет 2,42 : 12,09 х 100% = 20,1%. Результаты расчетов показали, что коэффициент вариации превышает 10%. Данное обстоятельство позволяет сделать предположение о том, что изучаемая выборка является неоднородной.
3. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
3.1. Проверка выборки на соответствие нормальному
распределению
Одним из непрерывных распределений, имеющим основополагающую
роль в математической статистике, является нормальное, или Гауссово,
распределение. Нормальное распределение является самым важным в статистике, т.к. обладает рядом благоприятных математических свойств, во
многом обеспечивающих его широкое применение.
Коэффициенты асимметрии и эксцесса нормального распределения
равны нулю. Допустимым коэффициентом асимметрии считаются значения, не превышающие величину в 0,5. Допустимым коэффициентом эксцесса считаются значения, не превышающие величину в 1,0.
В рассматриваемом нами примере расчетная величина коэффициента
асимметрии, рассчитанная при использовании Описательной статистики,
составляет -0,92, величина коэффициента эксцесса составляет 5,70. Таким
образом, изучаемая выборка не имеет нормального распределения.
Весьма приблизительным способом проверки предположения о соответствии выборки нормальному распределению является определение того, превышает ли среднее арифметическое значение выборочной совокупности (среднего) трехкратную величину стандартного отклонения.
13
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В рассматриваемом нами примере среднее арифметическое выборочной совокупности составляет 12,09, что превышает трехкратную величину
стандартного отклонения 7,27 (3 х 2,42). Данное обстоятельство подтверждает предположение о том, что изучаемая выборка не имеет нормального
распределения.
3.2. Создание выборки из генеральной совокупности
Если совокупность слишком велика, то для обработки или построения
диаграммы можно использовать представительную выборку, т.е. искусственно уменьшить количество наблюдений.
В некоторых случаях имеется необходимость в создании выборки из
генеральной совокупности, рассматривая имеющуюся выборку (входной
интервал) как генеральную совокупность. Для этого используется инструмент анализа Выборка.
Следует аккуратно использовать этот инструмент анализа, т.к. полученные в результате расчета «удобные» результаты могут не отражать наблюдаемую действительность.
Пример. Курсанты первого курса юридического института МВД России в количестве 30 человек, отобранных для обучения дополнительной
специализации «служебно-боевая подготовка», были подвергнуты тестированию в подтягивании на перекладине и показали следующие результаты: 12, 14, 20, 12, 17, 13, 12, 16, 17, 18, 16, 14, 15, 15, 15, 16, 13, 15, 17, 16,
15, 15, 16, 13, 16, 17, 16, 15, 14, 16. Необходимо создать выборку, которая
имела бы нормальное распределение с тем же количеством наблюдений 30.
Порядок работы с Excel 2002 следующий. В меню Сервис выбрать
команду Анализ данных и инструмент анализа Выборка (рис. 5).
Инструменты анализа
Описательная статистика
Экспоненциальное сглаживание
Двухвыборочный F-тест д л я дисперсии
Анализ Ф у р ь е
Гистограмма
Скользящее среднее
Генерация случайных чисел
Ранг и персентиль
Регрессия
Выборка
14
ок
Отмена
Справка " |
Id
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
(-Входные дане
Входной интервал:
|$В$2:$В$31
R Метки
-Метод выборки
ок
Отмена
Справка |
С Периодический
Период:
(• Случайный
Число выборок:
[зо~
[-Параметры вывода
С Выходной интервал:
С Новый рабочий лист:
С Новая рабочая книга
Рис. 5. Диалоговые окна для использования инструмента анализа Выборка
с указанием того же количества наблюдений, что и во вводимой выборке
Порядок заполнения элементов диалогового окна «Выборка»
Входной интервал - определяет интервал анализируемых данных.
Данные могут быть расположены по строкам или столбцам.
Метки - если первая строка входного интервала содержит названия
столбцов, то следует установить флажок. Если входной интервал не содержит меток, то заголовки в итоговой таблице результатов статистических расчетов будут созданы автоматически.
Метод выборки - чтобы задать необходимый диапазон выборки следует установить переключатель в положение Периодический или Случайный.
Период - ввести интервал, в соответствии с которым будет произведена выборка. Входное значение, номер которого совпадает с номером, заданным в поле периода, и каждое последующее с номером, кратным периоду, будет скопировано в выходной столбец. Процесс создания выборки
прекратится при достижении конца входного диапазона.
Число выборок - ввести число случайных значений, которые необходимо разместить в итоговой таблице результатов статистических расчетов.
Позиция каждой переменной, извлекаемой из входного интервала анализируемых данных, выбирается случайно, и поэтому любое значение может
быть выбрано более одного раза.
Выходной интервал - определяет место расположения итоговой таблицы результатов статистических расчетов (левую верхнюю ячейку). В
случае возможного наложения таблицы результатов статистических расчетов на исходные данные будет выведено соответствующее сообщение на
экран.
15
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
Результаты выполнения статистических расчетов Excel 2002 отобразит на новом рабочем листе в виде столбца, содержащего измененные
данные при том же количестве наблюдений - 30: 16, 17, 13, 16, 14, 16, 20,
15, 15, 15, 13, 17, 15, 16, 17, 13, 16, 17, 13, 15, 17, 16, 16, 13, 12, 16, 17, 13,
16, 18.
Если, с целью проверки, провести первичную статистическую обработку новой выборки на предмет оценки нормальности распределения с
использованием инструмента анализа Описательная статистика, то можно убедиться в том, что выборка имеет нормальное распределение - Эксцесс стал равен значению 0,07, а Асимметричность 0,04 (табл. 3).
Результаты выполнения статистических расчетов Excel 2002 отобразит на новом рабочем листе в виде таблицы (табл. 3).
Таблица 3
Результаты статистических расчетов при использовании
инструмента анализа Описательная статистика
Среднее
Стандартная ошибка
Медиана
Мода
Стандартное отклонение
Дисперсия выборки
Эксцесс
Асимметричность
Интервал
Минимум
Максимум
Сумма
Счет
Наибольший (1)
Наименьший (1)
Уровень надежности
(95,0%)
16
15,43
0,33
16
16
1,81
3,29
0,07
0,04
8
12
20
463
30
20
12
0,68
,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4. ОПРЕДЕЛЕНИЕ СРЕДНЕСТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ
ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ
Определение среднестатистических показателей генеральной совокупности осуществляется посредством использования Мастера функций
ДОВЕРИТ категории Статистические. Функция ДОВЕРИТ возвращает
доверительный интервал для среднего генеральной совокупности. Средняя
арифметическая генеральной совокупности находится в соответствии с
нижней и верхней доверительными границами.
Порядок работы с Excel 2002 следующий. В меню Мастер функций
выбрать функцию ДОВЕРИТ категории Статистические (рис. 6).
Порядок заполнения параметров диалогового окна функции
ДОВЕРИТ.
Альфа - установить требуемый уровень надежности. Уровень надежности равняется 100 х (1 - альфа) процентам. Другими словами, значение
альфа, равное 0,05, означает 95-процентный уровень надежности.
Если предположить, что альфа равняется 0,05, то нужно определить
ту часть стандартной нормальной кривой, которая равняется (1 - альфа),
или 95 процентам. Это значение равно ± 1,96.
_?J_x
Мастер функций шаг 1 из 2
Поиск функции:
Введите краткое описание действия, которое нужно
выполнить, и нажмите кнопку "Найти"
I
3
Категория:|Статистические
Выберите функцию:
Найти
и
ГДММАРДСП
ГИПЕРГЕОМЕТ
ДИСП
ДИСПА
ДИСПР
.ИСПРА
м
ДОВЕРИТ(альфа;станд_откл;размер)
Возвращает доверительный интервал для среднего генеральной
совокупности.
Справка по этой функции
ОК
Отмена
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Аргумен(ы функции
-Uxl
-ДОВЕРИТ-
"31" 0.05
Альфа |0,05
31-0,2312332
С т а н д _ о т к л 10,2312332
Размер 132:631
31- «
• 0,130830015
Возвращает доверите/ъный интервал для среднего генеральной совокупности.
Размер размер выборки.
Значение; 0,130830015
.[
ОК
~|
Отмену
Рис. 6. Диалоговые окна для использования Мастера функций ДОВЕРИТ
категории Статистические
Станд откл - установить стандартное отклонение генеральной совокупности для входного интервала анализируемых данных (воспользоваться ранее полученными данными, см. табл. 2).
Размер - определяет входной интервал анализируемых данных.
Выводы. В рассматриваемом нами примере значение доверительного интервала для среднего значение генеральной совокупности составляет
0,13. Нижняя доверительная граница среднего арифметического значения
генеральной совокупности составляет 11,96 (12,09 - 0,13), верхняя доверительная граница составляет 12,22 (12,09 + 0,13). Таким образом, расчеты
показали, что средняя арифметическая генеральной совокупности изучаемого параметра находится в интервале 11,96 - 12,22. Сокращение расчетных чисел до целых показывает, что среднее арифметическое выборочной
совокупности (среднее), верхняя и нижняя доверительные границы генеральной совокупности практически равны. Данное обстоятельство позволяет сделать вывод о том, что результаты исследования статистически достоверны.
5. ПОДСЧЕТ КОЛИЧЕСТВА НАБЛЮДЕНИЙ В ЗАДАННОМ
ИНТЕРВАЛЕ
В практике общего и профессионального физкультурного образования очень часто возникает необходимость анализа результатов тестирования физических качеств, проведенного по заданной шкале. Педагогуисследователю необходимо подсчитать, какое количество тестируемых по18
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
лучили оценки «неудовлетворительно», «удовлетворительно», «хорошо»,
«отлично».
Решение подобных задач осуществляется посредством использования Мастера функций ЧАСТОТА категории Статистические. Функция
ЧАСТОТА вычисляет частоту появления значений в интервале значений и
возвращает массив цифр. Поскольку функция ЧАСТОТА возвращает массив, то она должна задаваться в качестве формулы массива.
Пример. Для 111 курсантов второго курса юридического института
МВД России проведен зачет в тесте «подтягивание на перекладине». Требуется проанализировать результаты тестирования курсантов, определив
какое количество из них получили оценки «неудовлетворительно», «удовлетворительно», «хорошо», «отлично».
Порядок работы с Excel 2002 следующий. В меню Мастер функций
выбрать функцию ЧАСТОТА категории Статистические (рис. 7).
1Ш]
vlaciep ф у н к ц и й - шаг 1 и> 2
Поиск функции:
Введите краткое описание действия, которое нужно
выполнить, и нажмите кнопку "Найти"
3
Категория: [Статистические
Выберите функцию:
Цайти
ФТЕСТ
ХИ20БР
ХИ2РАСЛ
ХИ2ТЕСТ
ЧАСТОТА
ЭКСПРАСП
|ЭКСЦЕСС
J
ЧАСТОТА(массив_данных;массив_интервалов)
Вычисляет распределение значений по интервалам и возвращает
вертикальный массив, содержащий на один элемент больше, чем
массив интервалов.
Справка по этой функции
ОК
19
Отмена
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
jjxj
Массив .данных (сПсПТ
Мкпя
м т т е р м м я | D3 05
"31- <I2:I4:13;16:10:W
3J-<10:12:H>
- {24:38:31:18}
Вь^иепяет распределение
по жтараалан и возвращает вертжал*«Л яассие, содержащий на один
зленент бо/ьше, чем массив ютервалов.
Массив интервалов массив ттарвалоа пт ссылка на »<терввж*, в которых
rpvT¥»wwTtji эмачемия из пассива AaftR
Рис. 7. Диалоговые окна для использования Мастера функций
ЧАСТОТА категории Статистические
Порядок заполнения параметров диалогового окна функции ЧАСТОТА
ЧАСТОТА (массив_данных;массив_интервалов)
Массив_данных — массив или ссылка на множество данных, для которых вычисляются частоты. Если массив_данных не содержит значений,
то функция ЧАСТОТА возвращает массив нулей.
Массив_интервалов — массив или ссылка на множество интервалов, в
которые группируются значения аргумента массив данных. Если массив_интервалов не содержит значений, то функция ЧАСТОТА возвращает
количество элементов в аргументе массив_данных.
Примечания:
ЧАСТОТА вводится как формула массива после выделения интервала
смежных ячеек, в которые нужно вернуть полученный массив распределения.
Количество элементов в возвращаемом массиве на единицу больше
числа элементов в массиве массив_интервалов. Дополнительный элемент в
возвращаемом массиве содержит количество значений больших, чем максимальное значение в интервалах. Например, при подсчете трех диапазонов значений (интервалов), введенных в три ячейки, убедитесь в том, что
функция ЧАСТОТА возвращает значения в четырех ячейках. Дополнительная ячейка возвращает число значений в массив_данных больших, чем
значение границы третьего интервала.
ЧАСТОТА игнорирует пустые ячейки и тексты.
Формулы, которые возвращают массивы, должны быть введены как
формулы массива.
Выводы. При аналзе результатов тестирования курсантов в тесте
«подтягивание на перекладине» получены следующие данные: оценку
20
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
«неудовлетворительно» (до 10 раз) получили 24 курсанта (21,6%); оценку
«удовлетворительно» (от 11 до 12 раз) получили 38 курсантов (34,2%);
оценку «хорошо» (от 13 до 14 раз) получил 31 курсант (27,9%); оценку
«отлично» (более 14 раз) получили 18 курсантов (16,2%).
Количество неудовлетворительных оценок составило 21,6%, что значительно превысило критическую для закона нормального распределения
величину - 10%. В связи с этим работу преподавателя по воспитанию у
курсантов изучаемого физического качества следует признать неудовлетворительной.
6. РАЗРАБОТКА ПЕРСЕНТИЛЬНОЙ ШКАЛЫ И ОПРЕДЕЛЕНИЕ
ВЕЛИЧИНЫ ИЗУЧАЕМОГО ПОКАЗАТЕЛЯ ДЛЯ ОТБОРА
ПО ЗАДАННОМУ ПЕРСЕНТИЛЮ
6.1. Разработка персентильной шкалы
В практике физкультурно-педагогических исследований результаты
тестирования могут быть оценены по персентильной шкале. Оценивание
этим способом можно выполнить при помощи инструмента анализа Ранг и
персентиль. Инструмент анализа Ранг и персентиль позволяет изучить
относительное взаиморасположение значений в наборе данных. Итоговая
таблица содержит порядковый и процентный ранги для каждого значения
в наборе данных.
Пример. Для 30 курсантов второго курса юридического института
МВД России проведен тест «подтягивание на перекладине». Требуется
оценить результаты тестирования курсантов по персентильной шкале.
Порядок работы с Excel 2002 следующий. В меню Сервис выбрать команду Анализ данных и инструмент анализа Ранг и персентиль (рис. 8).
21
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ранг и персентиль
(-Входные данныеВходной интервал:
Группирование:
|$В$2:$В$31
Ш
(• по столбцам
С по строкам
OK
Отмена
^правка
Ф Метки в первой строке
-Параметры вывода
31
С Выходной интервал;
Новый рабочий лист;
С Новая рабочая книга
Рис. 8. Диалоговые окна для использования инструмента анализа
Ранг и персентиль
Порядок заполнения элементов диалогового окна «Ранг и персентиль»
Входной интервал - определяет входной интервал анализируемых
данных. Данные могут быть расположены по строкам или столбцам.
Группирование - определяет порядок расположения данных во входном интервале. В зависимости от порядка расположения данных следует
установить переключатель в положение По столбцам или По строкам.
Метки в первой строке/Метки в первом столбце. Установить переключатель в положение Метки в первой строке, если выбраны По столбцам и первая строка во входном интервале содержит названия столбцов.
Установите переключатель в положение Метки в первом столбце, если
выбраны По строкам и заголовки строк находятся в первом столбце входного интервала. Если входной интервал не содержит подписей, то необходимые заголовки в выходном интервале Excel 2002 создаст автоматически.
Выходной интервал - определяет место расположения итоговой таблицы результатов статистических расчетов (левую верхнюю ячейку). В
случае возможного наложения таблицы результатов статистических расчетов на исходные данные будет выведено соответствующее сообщение на
экран.
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
22
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Результаты выполнения статистических расчетов Excel 2002 отобразит
на новом рабочем листе в виде таблицы (табл. 4).
Таблица 4
Результаты статистических расчетов при использовании
инструмента анализа Ранг и персентиль
Точка
2
9
4
8
18
25
7
10
15
19
22
24
26
29
Значение
20
18
17
17
17
17
16
16
16
16
16
16
16
16
Ранг
1
2
3
3
3
3
7
7
7
7
7
7
7
7
Процент
100,0%
96,5%
82,7%
82,7%
82,7%
82,7%
55,1%
55,1%
55,1%
55,1%
55,1%
55,1%
55,1%
55,1%
Точка
12
13
14
17
20
21
27
1
11
28
5
16
23
3
6
Значение
15
15
15
15
15
15
15
14
14
14
13
13
13
12
12
Ранг
15
15
15
15
15
15
15
22
22
22
25
25
25
28
28
Процент
31,0%
31,0%
31,0%
31,0%
31,0%
31,0%
31,0%
20,6%
20,6%
20,6%
10,3%
10,3%
10,3%
,0%
,0%
Кроме инструмента анализа Ранг и персентиль пакета Анализ данных для вычисления ранга числа может быть использован Мастер функций РАНГ категории Статистические.
Мастер функций РАНГ возвращает ранг числа в списке чисел. Ранг
числа - это его величина относительно других значений в списке. Если
список отсортировать, то ранг числа будет его позицией.
Пример. Для приведенных в таблице 4 данных требуется определить
ранг значения 14. Ранг числа определить в порядке убывания. В этом случае порядок равен 0 (нулю) или опущен.
Порядок работы с Excel 2002 следующий. В меню Мастер функций
выбрать функцию РАНГ категории Статистические (рис. 9).
23
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Maciep функций - шаг 1 и» 2
^ ? { х|
Поиск функции:
Введите краткое описание действия, которое нужно
выполнить, и нажмите кнопку "Найти"
Категория:[Статистические
Найти
J
Выберите функцию:
ПЕРЕСТ
ПЕРСЕНТИЛЬ
ПИРСОН
ПРЕДСКАЗ
ПРОЦЕНТРАНГ
ПУАССОН
РАНГ
Л
П|
РАНГ(число;ссылка;порядок)
Возвращает ранг числа в списке чисел: его порядковй номер
относительно других чисел в списке.
Справка по этой
Отмена
ОК
ФУНКЦИИ
и=днг
,
Число | н
аГ
ai
ai
Ссылка |J3:J31
Порядок|о
-22
Возвращает ранг числа в списке чисел: его порядковй номер относительно других чисел в списке.
Число число, для которого определяется ранг.
Справка по зтой Функции
ОК
Значение:22
|
Отмена |
Рис. 9. Диалоговые окна для использования Мастера функций РАНГ
категории Статистические
Порядок заполнения параметров диалогового окна функции РАНГ
РАНГ (число;ссылка;порядок)
Число — число, для которого определяется ранг.
Ссылка — массив или ссылка на список чисел. Нечисловые значения в
ссылке игнорируются.
Порядок — число, определяющее способ упорядочения.
Если порядок равен 0 (нулю) или опущен, то Excel 2002 определяет
ранг числа так, как если бы ссылка была списком, отсортированным в порядке убывания.
24
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если порядок — любое ненулевое число, то Excel 2002 определяет
ранг числа так, как если бы ссылка была списком, отсортированным в порядке возрастания.
Примечание.РАНГ присваивает повторяющимся числам одинаковый
ранг. При этом наличие повторяющихся чисел влияет на ранг последующих чисел. Например, если в списке целых чисел дважды встречается число 10, имеющее ранг 5, число 11 будет иметь ранг 7 (ни одно из чисел не
будет иметь ранг 6).
Вывод. Ранг числа 14 в приведенном выше списке равен 22, что соответствует данным, приведенным в таблице 4.
6.2. Определение величины изучаемого показателя
для отбора по заданному персентилю
С целью отбора определенного количества спортсменов (в процентах)
величине заданного персентиля используется Мастер функций ПЕРСЕНТИЛЬ категории Статистические.
При помощи Мастера функций ПЕРСЕНТИЛЬ можно определить величину изучаемого показателя для заданного персентиля. Мастер функций
ПЕРСЕНТИЛЬ возвращает k-ую персентиль для значений из интервала.
Эта функция используется для определения порога приемлемости. Например, можно принять решение экзаменовать только тех кандидатов, которые набрали баллов более чем 80-ая персентиль.
Пример. Требуется отобрать 20% лучших курсантов из 111 тестируемых в тесте «подтягивание на перекладине». Величина задаваемого персентиля составляет 0,8. Определить результат в тесте, которому соответствует персентиль 0,8.
Порядок работы с Excel 2002 следующий. В меню Мастер функций
выбрать функцию ПЕРСЕНТИЛЬ категории Статистические (рис. 10).
Порядок заполнения параметров диалогового окна функции
ПЕРСЕНТИЛЬ
ПЕРСЕНТИЛЬ (массив;к)
Массив — массив или интервал данных с численными значениями,
который определяет относительное положение.
к — значение персентили в интервале от 0 до 1 включительно.
Примечания:
Если массив пуст или содержит более 8191 точек данных, то функция
ПЕРСЕНТИЛЬ возвращает значение ошибки #ЧИСЛО!.
Если к не является числом, то функция ПЕРСЕНТИЛЬ возвращает
значение ошибки #ЗНАЧ!.
25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если к < 0 или к > 1, то функция ПЕРСЕНТИЛЬ возвращает значение
ошибки #ЧИСЛО!.
Мастер функций - шаг 1 и> 2
Г'
.и*]
Поиск функции:
краткое описание действия, которое нужно
(Введите
выполнить, и нажмите кнопку "Найти"
Категория: [Статистические
Найти
1
Выберите функцию:
НОРМРАСП
НОРМСТОБР
НОРМСТРДСП
ОТРБИНОМРАСП
ОТРЕЗОК
ПЕРЕСТ
ПЕРСЕНТИЛЬ
a_J
П|
ПЕРСЕНТИЛЬ(массив;Ю
Возвращает k-ую персентиль для значений диапазона,
Справка по этой сЬункиии
OK
I
Отмена
iJ-<12:11:13:16110:9:!
31-0.6
Массив С1:С111
Возвращает к-уга персентиль для значений диапазона.
К значение персентиля в интервале от 0 до 1 включительно.
ОК | Отиена
V M B " "Я ЭТОЙ ФуМ№№
Рис. 10. Диалоговые окна для использования Мастера функций
ПЕРСЕНТИЛЬ категории Статистические
Если к не кратно 1/(п - 1), то функция ПЕРСЕНТИЛЬ производит интерполяцию для определения значения k-ой персентили.
Выводы. Восьмидесятой персентили из заданного массива (111 значений) соответствует результат в тесте «подтягивание на перекладине» 13.
В число 20% сильнейших курсантов в тесте «подтягивание на перекладине» попадают те курсанты, которые показали результат 13 и более.
26
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7. ПРОВЕРКА ГИПОТЕЗ О РАВЕНСТВЕ СРЕДНИХ
И О РАВЕНСТВЕ ДИСПЕРСИЙ ДВУХ ВЫБОРОК
7.1. Проверка гипотезы о равенстве средних двух выборок
при помощи t-теста Стьюдента
Для проверки гипотез о равенстве средних для двух выборок различных генеральных совокупностей используется t-тест Стьюдента. Этот вид
статистического анализа имеет три разновидности.
Парный двухвыборочный t-тест для средних. Парный двухвыборочный t-тест Стьюдента используется для проверки гипотезы о различии
средних для двух выборок. В этом тесте не предполагается равенство дисперсий генеральных совокупностей, из которых выбраны данные. Парный
тест используется, когда имеется естественная парность наблюдений в выборках, например, когда генеральная совокупность тестируется дважды до и после эксперимента.
Двухвыборочный t-тест с одинаковыми дисперсиями. Двухвыборочный t-тест Стьюдента служит для проверки гипотезы о равенстве средних для двух выборок. Этот тест предполагает равенство дисперсий генеральных совокупностей и обычно называется гомоскедастическим tтестом.
Двухвыборочный t-тест с различными дисперсиями. Двухвыборочный t-тест Стьюдента используется для проверки гипотезы о равенстве
средних для двух выборок данных из разных генеральных совокупностей.
Этот тест предполагает неравенство дисперсий генеральных совокупностей и называется гетероскедастическим t-тестом. Если тестируется одна и
та же генеральная совокупность, необходимо использовать парный тест.
Пример. Для 111 курсантов второго курса юридического вуза МВД
России и группы курсантов из 30 человек этого же курса, отобранных для
факультативного обучения дополнительной специализации «служебнобоевая подготовка», проведен тест «подтягивание на перекладине». Требуется проверить гипотезу о неравенстве средних двух выборок, т.е. подтвердить -предположение о том, что курсанты принадлежат к различным
квалификационным группам.
Порядок работы с Excel 2002 следующий. В меню Сервис выбрать
команду Анализ данных и инструмент анализа Двухвыборочный t-тест с
различными дисперсиями (рис. 11).
27
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Гистограмма
Скользящее среднее
Генерация случайных чисел
Ранг и персентиль
Регрессия
Выборка
Парный двухвыборочный t-тест для средних
хвыборочный t-тест с одинаковыми диспер
Отмена
Справка
|Двухвыборочный г-тест для средних
J j x j
Двухвыоорочный t-тест с ра .личными дисперсиями
[-Входные данныеИнтервал переменной 1;
|Ш2:Ш31
Интервал переменной £;
|$С$2;$С$112
^Т
ОК
Отмена
^правка
Гипотетическая средняя разность;
Г " Метки
Альфа; |0,05
-Параметры вывода
С Выходной интервал;
(• Новый рабочий диет;
Новая рабочая книга
Рис. 11. Диалоговые окна для использования инструмента анализа
Двухвыборочный t-тест с различными дисперсиями
Порядок заполнения элементов диалогового окна «Двухвыборочный t-тест с различными дисперсиями»
Интервал переменной 1 - ввести ссылку на первый диапазон анализируемых данных. Диапазон должен состоять из одного столбца или одной
строки.
Интервал переменной 2 - ввести ссылку на второй диапазон анализируемых данных. Диапазон должен состоять из одного столбца или одной
строки.
Гипотетическая средняя разность - ввести число, равное предполагаемой разности средних. Значение 0 (ноль) указывает, что средние принимаются равными.
Метки - если первая строка входного интервала содержит названия
столбцов, то следует установить флажок. Если входной интервал не содержит меток, то заголовки в итоговой таблице результатов статистических расчетов будут созданы автоматически.
28
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Альфа - установить требуемый уровень надежности. Уровень надежности равняется 100 х (1 - альфа) процентам. Другими словами, значение
альфа, равное 0,05, означает 95-процентный уровень надежности.
Выходной интервал - определяет место расположения итоговой таблицы результатов статистических расчетов (левую верхнюю ячейку). В
случае возможного наложения таблицы результатов статистических расчетов на исходные данные будет выведено соответствующее сообщение на
экран.
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
Результаты выполнения статистических расчетов Excel 2002 отобразит
на новом рабочем листе в виде таблицы (табл. 5).
Таблица 5
Результаты статистических расчетов при использовании инструмента
анализа Двухвыборочный t-тест с различными дисперсиями
Среднее
Дисперсия
Наблюдения
Гипотетическая разность средних
df
t-статистика
P(T<=t) одностороннее
t критическое одностороннее
P(T<=t) двухстороннее
t критическое двухстороннее
ИнструктоКурсанты
ры
15Д
12,1
3,4
5,8
30
111
0
59
7,6
1.15146Е-10
1,7
2,30292Е-10
2,0
Вывод. В результате проведенных статистических расчетов подтвердилась гипотеза о неравенстве средних двух выборок (Ро < 0,05). Об
этом свидетельствует то обстоятельство, что t-статистика (7,63) больше,
чем t критическое двухстороннее (2,00). Курсанты, отобранные для обучения дополнительной специализации «служебно-боевая подготовка», обладают статистически достоверно более высоким уровнем физической подготовленности в тесте «подтягивание на перекладине», чем их однокурсники.
29
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7.2. Проверка гипотезы о равенстве дисперсий
двух выборок при помощи F-теста
Для сравнения дисперсий двух генеральных совокупностей применяется инструмент анализа Двухвыборочный F-тест для дисперсии.
Двухвыборочный F-тест для дисперсии применяется в случаях необходимости сравнения выборок по фактору рассеивания, т.е. оценивается
сравнительная характеристика выборок на стабильность. Соблюдение закона нормального распределения необязательно.
Пример. Для 111 курсантов второго курса юридического вуза МВД
России и группы курсантов из 30 человек этого же курса, отобранных для
факультативного обучения дополнительной специализации «служебнобоевая подготовка», проведен тест «подтягивание на перекладине». Требуется проверить гипотезу о неравенстве дисперсий двух выборок, т.е. подтвердить предположение о том, что курсанты, обучающиеся дополнительной специализации «служебно-боевая подготовка», имеют более однородный уровень подготовленности, чем остальные курсанты.
Порядок работы с Excel 2002 следующий. В меню Сервис выбрать
команду Анализ данных и инструмент анализа Двухвыборочный F-тест
для дисперсии (рис. 12).
Порядок заполнения элементов диалогового окна «Двухвыборочный F-тест для дисперсии»
Интервал переменной 1 - ввести ссылку на первый диапазон анализируемых данных. Диапазон должен состоять из одного столбца или одной
строки.
Интервал переменной 2 - ввести ссылку на второй диапазон анализируемых данных. Диапазон должен состоять из одного столбца или одной
строки.
Анализ данных
Инструменты анализа
Однофакторный дисперсионный анализ
Двухфакторный дисперсионный анализ с повторениями
Двухфакторный дисперсионный анализ без повторений
Корреляция
Ковариация
Описательная статистика
Экспоненциальное сглаживание
личный F-тест для дисперсии
Анализ Фурье
Гистограмма
I
30
OK
Отмена
Справка
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Двухвыоорочный F-ieci для дисперсии
гВходные дан(
Интервал переменной 1:
Интервал переменной 2:
ок
$2:$Б$31
|$С$2:$С$112
_?J_X
Ш-.
51
Отмена
Справка
Г " Метки
Альфа: |0,05
-Параметры вывода
С Выходной интервал:
(• Новый рабочий лист:
С Новая рабочая книга
Рис. 12. Диалоговые окна для использования инструмента анализа
Двухвыборочный F-тест для дисперсии
Гипотетическая средняя разность - ввести число, равное предполагаемой разности средних. Значение 0 (ноль) указывает, что средние принимаются равными.
Метки - если первая строка входного интервала содержит названия
столбцов, то следует установить флажок. Если входной интервал не содержит меток, то заголовки в итоговой таблице результатов статистических расчетов будут созданы автоматически.
Альфа - установить требуемый уровень надежности. Уровень надежности равняется 100 * (1 - альфа) процентам. Другими словами, значение
альфа, равное 0,05, означает 95-процентный уровень надежности.
Выходной интервал - определяет место расположения итоговой таблицы результатов статистических расчетов (левую верхнюю ячейку). В
случае возможного наложения таблицы результатов статистических расчетов на исходные данные будет выведено соответствующее сообщение на
экран.
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
Результаты выполнения статистических расчетов Excel 2002 отобразит
на новом рабочем листе в виде таблицы (табл. 6).
31
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 6
Результаты статистических расчетов при использовании
инструмента анализа Двухвыборочный F-тест д л я дисперсии
Инструкторы
15,2
3,4
30
29
0,58
0,05
0,59
Среднее
Дисперсия
Наблюдения
df
F
P(F<=f) одностороннее
F критическое одностороннее
Курсанты
12,1
5,8
111
110
Вывод. При надежности 95% граничное значение критерия F составляет 0,584. Поскольку F < F критическое одностороннее (0,584 <
0,587), то различия между группами являются статистически недостоверными, т.е. по результатам тестирования в подтягивании на перекладине исследуемые группы не различаются.
8. КОРРЕЛЯЦИОННОЕ ПОЛЕ И ЛИНИЯ ТРЕНДА,
КОРРЕЛЯЦИЯ, РЕГРЕССИЯ
В физкультурно-педагогических исследованиях часто возникает вопрос о взаимной связи отдельных признаков. Например, как зависит спортивный результат от уровня того или иного вида подготовленности спортсмена (физической, технической и др.)? Насколько точно по результатам
выполнения некоторого набора тестов можно судить о потенциальных
возможностях спортсмена в конкретном виде спорта? Во всех подобных
случаях внимание исследователя привлекает зависимость между различными величинами, описывающая интересующие его признаки.
В некоторых случаях значение одной величины однозначно определяет значение другой. В этих случаях имеет место функциональная зависимость между величинами.
Например, средняя скорость v на отрезке L дистанции функционально
связана со временем Г на этом отрезке (v = 1. 7).
Однако исследователя чаще интересует такие зависимости, когда при
фиксированном значении одной величины другая величина имеет некоторую свободу и может принимать различные значения. Так, у разных спорт32
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
сменов средняя скорость на фиксированном отрезке дистанции будет различной. Если одну величину рассматривать как независимую (контролируемую), а вторую — как зависимую от первой, то зависимая величина ведет себя как случайная и ее можно описать некоторым вероятностным распределением - корреляцией и регрессией.
8.1. Корреляционное поле и линия тренда
Корреляционное поле (диаграмма рассеяния) - графическое представление эмпирических данных. Для каждого значения Xi независимой
переменной в прямоугольной системе координат наносятся значение Yi.
Графическое представление эмпирических данных в виде корреляционного поля позволяет исследователю выбрать линию тренда, а значит, и
наилучшую регрессионную модель для описания зависимости между изучаемыми признаками.
Пример. В зависимости от длины легкоатлетической дистанции среднедистанционная частота сердечных сокращений легкоатлетов изменяется
следующим образом:
Дистанция,
м
ЧСС, уд.
мин.
400
800
1000
3000
5000
10000
20000
42195
226
224
215
205
198
196
185
182
Построить корреляционное поле и линию тренда.
Для того чтобы представить экспериментальные данные в виде корреляционного поля и выбрать линию тренда, а значит, и наилучшую регрессионную модель, целесообразно воспользоваться Мастером диаграмм
Excel 2002 Точечная. Далее, используя в Мастере диаграмм опцию Добавить линию тренда, следует активизировать диалоговое окно Линия
тренда (рис. 13). В диалоговом окне Линия тренда выбрать Тип линии
тренда Степенная, т.к. в данном случае этот тип линии тренда наиболее
точно описывает зависимость между длиной дистанции и среднедистанционной ЧСС.
33
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пиния i p e i w i
Тип
Rj-U-Si
| Параметры |
-Построение линии тренда (аппроксимация и сглаживание)-
к -
И
1
Ш и
Степенная
./7 Тс
••.V
1Линейная
I»
Э
фильтрация
х
Экспоненциальная
Построен на ряде:
d
OK
I
Отмена
|
Рис. 13. Диалоговое окно Линия тренда
Результаты построения корреляционного поля и линии тренда, которые характеризуют зависимость среднедистанционной ЧСС от длины дистанции, представлены на рисунке 14.
250
X
X
200
а
*
100
50
о
О
5000
10000
15000
20000
25000
30000
35000
40000
45000
Длина дистанции, м
Рис. 14. Зависимость среднедистанционной частоты сердечных
сокращений от длины соревновательной дистанции
Вывод. Построение корреляционного поля показало, что точки
группируются вдоль кривой, которая близка к кривой, описывающей степенную функцию.
34
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
По внешнему виду корреляционного поля можно сказать следующее:
если точки рассеяны хаотично, то связь между признаками отсутствует;
если точки группируются вдоль какой-либо линии, то связь есть и она тем
теснее, чем ближе они группируются. Величину связи характеризует коэффициент корреляции.
8.2. Корреляция
Корреляция - это вид взаимосвязи среднего значения результативного признака (Y) от изменений факторного признака (X).
Корреляционный анализ позволяет установить, ассоциированы ли
выборки по величине, то есть большие значения из одной выборки связаны
с большими значениями другой выборки (положительная корреляция) или,
наоборот, малые значения одной выборки связаны с большими значениями
другой выборки (отрицательная корреляция), или данные двух выборок
никак не связаны (нулевая корреляция). Величина коэффициента корреляции указывает на меру линейной связи между двумя переменными.
Для количественной оценки взаимосвязи двух выборок используется
инструмент анализа Корреляция. Коэффициент корреляции представляет
собой отношение ковариации двух выборок к произведению стандартных
отклонений ковариации.
Пример. 110 курсантов второго курса вуза МВД России были протестированы в двух тестах: «Челночный бег 3 х 10 м» и «Бег на 100 м».
Определить, существует ли взаимосвязь между тестами, т.е. характеризуют
ли эти тесты одно и то же физическое качество, либо тесты характеризуют
различные физические качества.
Порядок работы с Excel 2002 следующий. В меню Сервис выбрать
команду Анализ данных и инструмент анализа Корреляция (рис. 15).
Анали> данных
-ZJ.X
| Инструменты анализа
Однофакторный дисперсионный анализ
Двухфакторный дисперсионный анализ с повторениями
Двухфакторный дисперсионный анализ без повторений
Корреляция
Ковариация
Описательная статистика
Экспоненциальное сглаживание
Двухвыборочный F-тест для дисперсии
Анализ Фурье
Гистограмма
35
OK
Отмена
I
Справка |
jJ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Корреляция
Ц х
т
гВходные данныеВходной интервал:
|$Ы$1 :$0$112
Группирование:
f* по столбцам
3
ок
Отмена
С по срокам
^правка
Иетки е первой строке
[-Параметры вывода
С Выходной интервал:
|$G$9
3J
(• Новый рабочий лист:
С Новая рабочая книга
Рис. 15. Диалоговые окна для использования
инструмента анализа Корреляция
Порядок заполнения элементов диалогового окна «Корреляция»
Входной интервал - ввести ссылку на диапазон анализируемых данных. Ссылка должна состоять не менее чем из двух смежных диапазонов
данных, которые могут быть расположены по строкам или столбцам.
Группирование - определяет порядок расположения данных во входном интервале. В зависимости от порядка расположения данных следует
установить переключатель в положение По столбцам или По строкам.
Метки в первой строке/Метки в первом столбце.
Установить переключатель в положение Метки в первой строке, если
выбраны По столбцам и первая строка во входном интервале содержит названия столбцов. Установите переключатель в положение Метки в первом
столбце, если выбраны По строкам и заголовки строк находятся в первом
столбце входного интервала. Если входной интервал не содержит подписей, необходимые заголовки в выходном интервале Excel 2002 создаст автоматически.
Выходной интервал - определяет место расположения итоговой таблицы результатов статистических расчетов (левую верхнюю ячейку). Поскольку коэффициент корреляции двух наборов данных не зависит от последовательности их обработки, то выходная область занимает только половину предназначенного для нее места. Ячейки выходного диапазона,
имеющие совпадающие координаты строк и столбцов, содержат значение
1, так как каждая строка или столбец во входном диапазоне полностью
коррелирует с самим собой.
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
36
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
Результаты выполнения статистических расчетов Excel 2002 отобразит
на новом рабочем листе в виде таблицы - корреляционной матрицы (табл. 7).
Таблица 7
Результаты статистических расчетов при использовании
инструмента анализа Корреляция
Бег 100 м
Челночный бег
Бег 100 м
1
-0,13787
Челночный
бег
1
Вывод. Результаты статистического анализа показали, что коэффициент корреляции результатов в тестах «Бег на 100м» и «Челночный бег 3 х
10 м» составляет 0,14. Коэффициент корреляции является низким и статистически недостоверным (Ро > 0,05). В связи с этим можно сделать вывод
о том, что изучаемые тесты характеризуют различные физические качества.
Для вычисления коэффициента корреляции между двумя выборками
кроме инструмента анализа Корреляция, входящего в пакет Анализ данных, может быть использован Мастер функций категории Статистические аргументы функций KOPPEJI и ПИРСОН.
Мастер функций КОРРЕЛ возвращает коэффициент корреляции между интервалами ячеек массив 1 и массив2. Коэффициент корреляции используется для определения наличия взаимосвязи между двумя явлениями.
Порядок заполнения параметров диалогового окна функции КОРРЕЛ
КОРРЕЛ (массив1;массив2)
Массив 1 — это ячейка интервала значений.
Массив2 — это второй интервал ячеек со значениями.
Примечания.
Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
Если аргумент, который является массивом или ссылкой, содержит
текст, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.
Если массив 1 и массив2 имеют различное количество точек данных,
то функция КОРРЕЛ возвращает значение ошибки #Н/Д.
37
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если массив 1 либо массив2 пуст или если о (стандартное отклонение)
их значений равно нулю, то функция КОРРЕЛ возвращает значение ошибки ОДЕЛ/О!.
Мастер функций ПИРСОН возвращает коэффициент корреляции
Пирсона г, безразмерный индекс в интервале от -1,0 до 1,0 включительно,
который отражает степень линейной зависимости между двумя множествами данных.
Порядок заполнения параметров диалогового окна функции ПИРСОН
ПИРСОН (массив1;массив2)
Массив 1 — множество независимых значений.
Массив2 — множество зависимых значений.
Примечания.
Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
Если аргумент, который является массивом или ссылкой, содержит
тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.
Если массив 1 или массив2 пуст или они содержат различное число точек данных, то функция ПИРСОН возвращает значение ошибки #Н/Д.
8.3. Регрессия
При расчете коэффициента корреляции определяется степень тесноты
связи между двумя варьирующими признаками. При этом не определяется
то, как количественно изменится величина зависимой переменной при изменении независимой переменной на одну единицу ее размерности. Изменение количественных характеристик зависимой переменной при изменении независимой переменной на одну единицу ее размерности можно изучить при помощи регрессионного анализа.
Регрессия - это зависимость среднего значения (математического
ожидания) случайной величины Y от х. При этом принято говорить «регрессия Y на х». Независимая величина х не обязательно может быть случайной, поэтому обозначается строчной буквой. Прописные буквы используются обычно для обозначения случайных величин.
Регрессионный анализ устанавливает формы зависимости между
случайной величиной Y и значениями одной или нескольких переменных
величин, причем значения последних считаются точно заданными. Такая
зависимость обычно определяется некоторой математической моделью
(уравнением регрессии), содержащей несколько неизвестных параметров.
38
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В пакете программ Анализ данных имеется инструмент анализа Регрессия. С помощью метода наименьших квадратов осуществляется расчет
формулы, описывающей зависимость изучаемых переменных. Инструмент
анализа Регрессия может быть использован для изучения воздействия на
зависимую переменную значений одной или более (до 16) независимых
переменных.
Пример. Группа стрелков из боевого оружия (специализация «автомат»), состоящая из курсантов юридического института МВД России, была
протестирована в трех тестах: 1-й тест - «Изготовка к стрельбе из положения «лежа», проверка изготовки, один выстрел - 10 циклов»; 2-й тест «Изготовка к стрельбе из положения «с колена», проверка изготовки, один
выстрел - 10 циклов»; 3-й тест - «Изготовка к стрельбе из положения
«стоя», проверка изготовки, два выстрела - 15 циклов». Кроме этого была
проведена контрольная тренировка в стрельбе из автомата Калашникова по
условиям упражнения АК-3. Результаты тестирования и контрольной тренировки представлены в таблице 8.
Таблица 8
Результаты тестирования и контрольной тренировки группы стрелков
из боевого оружия
Ф.И.
И-в А.
Ф-н И.
Г-к Е.
Х-в Р.
Р-в И.
П-н Р.
Б-вД.
О-в Е.
Т-нИ
З-вЗ.
С-вБ.
1-й тест
95
91
95
95
95
92
98
89
97
94
88
Количество очков
2-й тест 3-й тест
91
161
171
89
148
88
150
72
86
119
111
61
165
95
139
78
87
146
85
148
64
129
АК-3
254
246
246
245
245
244
243
243
229
228
192
Рассчитать уравнение регрессии, при помощи которого по трем тестам
можно было бы прогнозировать результаты выступления курсантов в соревнованиях по стрельбе из автомата Калашникова в упражнении АК-3.
Порядок работы с Excel 2002 следующий. В меню Сервис выбрать
команду Анализ данных и инструмент анализа Регрессия (рис. 16).
39
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
[Анали> данных
.шш
-2Jj<
| Инструменты анализа
Ковариация
Описательная статистика
Экспоненциальное сглаживание
Двухвыборочный F-тест для дисперсии
Анализ Фурье
Гистограмма
Скользящее среднее
Генерация случайных чисел
OK
J
Отмена
|
Справка
|
-
Ранощрсентиль^
H B H H d L_
Pei рессия
_?J_X
гВходные данные Входной интервал V:
|$F$16:$F$27
^
Входной интервал X:
|$С$1б:$Е$27
5J
Р Метки
Г" Константа - ноль
OK
Отмена
Справка |
Уровень надежности:
•Параметры вывода
(* Выходной интервал:
|$С$30
С новый рабочий лист:
С новая рабочая книга
[-Остатки Г~ Остатки
Г" График остатков
Г" С1амдартизованные остатки Г" График подбора
1мальная вероятностьГрафик нормальной вероятности
Рис. 16. Диалоговые окна для использования инструмента анализа
Регрессия
Порядок заполнения элементов диалогового окна «Регрессия»
Входной интервал Y - ввести ссылку на диапазон анализируемых зависимых данных. Диапазон должен состоять из одного столбца.
Входной интервал X - ввести ссылку на диапазон независимых данных, подлежащих анализу. Excel 2002 располагает независимые переменные этого диапазона слева направо в порядке возрастания. Максимальное
число входных диапазонов равно 16.
Метки - если первая строка входного интервала содержит названия
столбцов, то следует установить флажок. Если входной интервал не содержит меток, то заголовки в итоговой таблице результатов статистических расчетов будут созданы автоматически.
40
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Уровень надежности - установить требуемый уровень надежности.
По умолчанию Excel 2002 устанавливает уровень надежности 95%.
Константа - ноль - чтобы линия регрессии прошла через начало координат необходимо установить флажок.
Выходной интервал - ввести ссылку на левую верхнюю ячейку выходного диапазона. Отведите не менее семи столбцов для итогового диапазона, который будет включать в себя: результаты дисперсионного анализа,
коэффициенты регрессии, стандартную погрешность вычисления Y, среднеквадратичные отклонения, число наблюдений, стандартные погрешности для коэффициентов.
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
Остатки - чтобы включить остатки в выходной диапазон, необходимо
установить флажок.
Стандартизированные остатки - чтобы включить стандартизированные остатки в выходной диапазон, необходимо установить флажок.
График остатков - чтобы построить диаграмму остатков для каждой
независимой переменной, необходимо установить флажок.
График подбора - чтобы построить диаграммы наблюдаемых и предсказанных значений для каждой независимой переменной, необходимо установить флажок.
График нормальной вероятности - чтобы построить диаграмму нормальной вероятности, необходимо установить флажок.
Результаты выполнения статистических расчетов Excel 2002 отобразит
в виде нескольких таблиц (табл. 9).
Таблица 9
Результаты статистических расчетов при использовании
инструмента анализа Регрессия
Регрессионная статистика
Множественный R
R-квадрат
Нормированный Rквадрат
Стандартная ошибка
Наблюдения
41
0,51
0,26
-0,06
17,41
11
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Дисперсионный анализ
Регрессия
df
3
Остаток
7
Итого
10
СтанКоэффи- дартная
циенты ошибка
Yпересечение
XI, лежа
Х2, колено
ХЗ, стоя
55
741,3
2122,
9
2864,
2
MS
247,1
F
0,81
Значимость
F
0,52
303,3
tстатистика
РЗначение
Нижние
95%
ВерхВерхние
Нижние
ние
95%
95,0% 95,0%
67,377
189,387
0,356
0,732
-380,5
515,20
-380,5
515,21
1,448
2,268
0,638
0,544
-3,916
6,811
-3,916
6,811
0,460
-0,018
0,857
0,426
0,537
-0,041
0,608
0,968
-1,566
-1,025
2,486
0,990
-1,566
-1,025
2,486
0,990
/
Вывод вероятности
Персентиль
4,5
13,6
22,7
31,8
40,9
50,0
59,1
68,2
77,3
86,4
95,5
АК-3
192
228
229
243
243
244
245
245
246
246
254
Примечание: в итоговой таблице дисперсионного анализа обозначены: источник вариации Регрессия - факторная дисперсия; источник вариации Остаток - остаточная дисперсия; Итого - общая дисперсия; символами обозначены: df - число степеней свободы; 5 5 - сумма квадратов; MS 42
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
дисперсия; F- Ф - критерий расчетный; F значимость - табличное значение.
Выводы. Регрессионная статистика показала, что множественный коэффициент корреляции {множественный R) составляет 0,5087; коэффициент детерминации (R-квадрат) составляет 0,2588; стандартная ошибка
уравнения регрессии составляет 17,415. Полученные статистические данные можно считать статистически достоверными т.к. дисперсионный анализ показал, что F > F значимость (0,8148 > 0,5252).
Во втором столбце таблицы выходных данных представлены: Yпересечение (67,377) и Коэффициенты для каждого теста (в стрельбе из
положений «лежа» - X I , «с колена» - Х2, «стоя» - ХЗ), при помощи которых было составлено следующее уравнение регрессии:
Y = 67,377 + 1,448 х XI + 0,460 х Х2 - 0,018 х ХЗ
Для каждого Коэффициента в таблице представлены Стандартная
ошибка, t-статистика и Р-Значение, которое варьирует в пределах от
0,544 (для теста X I ) до 0,968 (для теста ХЗ).
Пример использования уравнения регрессии для прогноза спортивного результата в упражнении АК-3. По результатам тестирования
стрелок показал следующие результаты: 1-й тест (XI) - «Изготовка к
стрельбе из положения «лежа», проверка изготовки, один выстрел - 10
циклов» - 98 очков; 2-й тест (Х2) - «Изготовка к стрельбе из положения «с
колена», проверка изготовки, один выстрел - 10 циклов» - 89 очков; 3-й
тест (ХЗ) - «Изготовка к стрельбе из положения «стоя», проверка изготовки, два выстрела - 15 циклов» - 150 очков.
Сделать прогноз результата в стрельбе из автомата Калашникова по
условиям упражнения АК-3.
Подставив в уравнение регрессии значения результатов тестирования,
получим предполагаемый результат спортсмена в упражнении АК-3:
Y = 67,377 + 1,448 х 98 + 0,460 х 89 - 0,018 х 150 = 247,5
Вывод. Предполагаемый результат спортсмена в упражнении АК-3
составляет 247 очков.
В Мастере функций категории Статистические имеются функции,
при помощи которых можно выбрать другую регрессионную модель, более
точно описывающую зависимость между изучаемыми признаками.
Функция ЛГРФПРИБЛ вычисляет экспоненциальную кривую, аппроксимирующую данные, и возвращает массив значений, описывающий
43
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
эту кривую. Поскольку данная функция возвращает массив значений, она
должна вводиться как формула массива.
Уравнение кривой имеет вид:
у = Ь*т Л х или
у = (Ь*(т1 Л х1)*(т2 Л х2)*_) (в случае нескольких значений х),
где зависимые значения у являются функцией независимых значений
х. Значения m являются основанием, возводимым в степень х, а значения b
постоянны; у, х и ш могут быть векторами. Функция ЛГРФПРИБЛ возвращает массив {mn;mn-l;...;ml;b}.
Функция ЛИНЕЙН рассчитывает статистику для ряда с применением
метода наименьших квадратов, чтобы вычислить прямую линию, которая наилучшим образом аппроксимирует имеющиеся данные. Функция
возвращает массив, который описывает полученную прямую. Поскольку
возвращается массив значений, то функция должна задаваться в виде формулы массива.
Уравнение для прямой линии имеет следующий вид:
у = mx + b или
у = m l x l + ш2х2 + ... + b (в случае нескольких диапазонов значений х),
где зависимое значение у - функция независимого значения х, значения т - коэффициенты, соответствующие каждой независимой переменной х, a b - постоянная; у, х и ш могут быть векторами. Функция ЛИНЕЙН
возвращает массив {mn;mn-l;...;ml;b}.
9. ДИСПЕРСИОННЫЙ АНАЛИЗ 4
Дисперсионный анализ - это статистический метод, при помощи которого можно установить влияние одного признака на другой. Дисперсионный анализ имеет преимущество перед корреляционным, т.к. при помощи его можно учесть влияние признака, не имеющего количественного выражения.
Признак, подлежащий исследованию, называется результативным R.
Он испытывает на себе влияние факторного признака F, структура которого подразделяется на ряд подгрупп - градаций фактора. Для исследования
зависимости результативного признака от факторного избирается специальная выборка, называемая дисперсионным комплексом с общим числом
элементов N.
4
В данном разделе пособия использованы примеры из методической разработки Суслакова Б.А. Применение дисперсионного анализа в
спортивных исследованиях. - М., 1982. - 39с.
44
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При помощи дисперсионного анализа можно оценить вариацию исследуемого признака как состоящую из вариации от фактора и от случайных причин, а также установить характер зависимости результативного
признака от факторного.
Как правило, в практическом использовании градации факторного
признака различаются между собой количественно, в качественном же отношении они представляют собой однозначную характеристику. Например, при оценке влияния возрастного развития детей на какой-либо показатель дисперсионный комплекс представляется как состоящий из результативного признака (исследуемый показатель) и факторного признака
(возраст детей). При этом возраст детей целесообразно разделить по категориям в соответствии с принятой классификацией. Возрастные категории
будут представлять градации фактора.
Если задачи усложняются и факторный признак меняет свою структуру в качественном отношении, то рассматриваются дисперсионный анализ
двух-, трех- и т.д. многофакторных комплексов.
9.1. Однофакторный дисперсионный анализ
Однофакторный дисперсионный анализ для количественного результативного признака бесповторной выборки (в Пакете анализа этот метод
называется Однофакторный дисперсионный анализ) используется для
проверки гипотезы о равенстве средних значений двух или более выборок,
принадлежащих к одной генеральной совокупности.
Пример. У спортсменов-мужчин трех специализаций: легкая атлетика
(спринт и прыжки в длину), конькобежный спорт, футбол и группы не занимающихся спортом, имеющих примерно одинаковый рост (174 см), а
спортсмены - примерно одинаковую квалификацию (1 разряд - KMC), зарегистрирован морфологический признак «обхват бедра».
Определить различаются ли спортсмены различных специализаций и
мужчин, не занимающихся спортом, по морфологическому признаку «обхват бедра».
Легкоатлеты
51 55,5 59,5 57,3 54,5 53,5 54,8 56
Конькобежцы
59 62 56,8 58 59,5 50,5 56,8 58,8 60,8
Футболисты
58 54,6 58,6 60 56 57,5 57,5 54 61
Не занимающие49,7 51,5 53,5 52,2 50,5 49,3 53 52 53 51 46 51 50,2;
ся спортом
Порядок работы с Excel 2002 следующий. В меню Сервис выбрать
команду Анализ данных и инструмент анализа Однофакторный дисперсионный анализ (рис. 17).
45
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
?J_x
Инструменты анализа
Однофакторный дисперсионный анализ
Двухфакторный дисперсионный анализ с повторениями
Двухфакторный дисперсионный анализ без повторений
Корреляция
Ковариация
Описательная статистика
Экспоненциальное сглаживание
Двухвыборочный F-тест для дисперсии
Анализ Фурье
Гистограмма
Отмена
^правка
jj
№
Однофакторный дисперсионный анали,
[-Входные данные—
Входной интервал:
Грутирование:
|$С$5:$Р$8
31
С по столбцам
(* по строкам
ок
Отмена
Справка
Ф Метки в первом столбце
Альфа; Jo,05
-Параметры вывода
(• Выходной интервал:
|$С$И
31
С Новый рабочий лист:
С Новая рабочая книга
Рис. 17. Диалоговые окна для использования инструмента анализа
Однофакторный дисперсионный анализ
Порядок заполнения элементов диалогового окна «Однофакторный дисперсионный анализ»
Входной интервал - ввести ссылку на диапазон анализируемых данных. Ссылка должна состоять не менее чем из двух смежных диапазонов
данных, которые могут быть расположены по строкам или столбцам.
Группирование - определяет порядок расположения данных во входном интервале. В зависимости от порядка расположения данных следует
установить переключатель в положение По столбцам или По строкам.
Метки в первой строке/Метки в первом столбце.
Установить переключатель в положение Метки в первой строке, если
выбраны По столбцам и первая строка во входном интервале содержит названия столбцов. Установите переключатель в положение Метки в первом
столбце, если выбраны По строкам и заголовки строк находятся в первом
столбце входного интервала. Если входной интервал не содержит подпи46
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
сей, то необходимые заголовки в выходном интервале Excel 2002 создаст
автоматически.
Альфа - установить требуемый уровень надежности. Уровень надежности равняется 100 х (1 - альфа) процентам. Значение альфа, равное 0,05,
означает 95-процентный уровень надежности.
Выходной интервал - определяет место расположения итоговой таблицы результатов статистических расчетов (левую верхнюю ячейку). В
случае возможного наложения таблицы результатов статистических расчетов на исходные данные будет выведено соответствующее сообщение на
экран.
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
Результаты выполнения статистических расчетов Excel 2002 отобразит
в виде нескольких таблиц (табл. 10).
Таблица 10
Результат статистических расчетов при использовании инструмента
анализа Однофакторный дисперсионный анализ
Группы
Легкоатлеты
Конькобежцы
Футболисты
Не занимающиеся
спортом
Источник
вариации
Между группами
Внутри групп
Итого
SS
343,92
222,71
566,63
Счет
8
9
9
Сумма
442,10
522,20
517,20
Среднее
55,26
58,02
57,47
13
663,20
51,02
df
3
35
38
4,02
F
РЗначение
F критическое
18,02
3,05Е-07
2,87
MS
114,64
6,36
Дисперсия
6,40
10,86
5,36
1
Примечание: в итоговой таблице дисперсионного анализа обозначены: источник вариации Между группами - дисперсия фактора «Спортивная специализация»; источник вариации Внутри групп - остаточная
дисперсия; Итого - общая дисперсия; символами обозначены: SS - сумма
47
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
квадратов; df - число степеней свободы; MS - дисперсия; F - Ф-критерий
расчетный; F критическое - табличное значение.
Влияние изучаемого фактора рассчитывается по следующей формуле:
цфакт = SS между группами : SS итого х 100%, что составляет
дфакт = 343,92 : 566,63 х 100% = 60,7%
Влияние неучтенных факторов рассчитывается по следующей формуле:
g = SS внутри групп : SS итого х 100%, что составляет
g = 222,71 : 566,63 х 100% = 39,3%
Расчеты показали, что F критическое
18,02).
< F между группами (2,87 <
Выводы. По морфологическому признаку «обхват бедра» исследуемые группы различаются статистически достоверно (Ро < 0,05). Изучаемый морфологический признак «обхват бедра» на 60,7% определяется видом физкультурно-спортивной деятельности занимающихся.
9.2. Двухфакторный дисперсионный анализ с повторениями
В практике физкультурно-педагогических исследований на результат
наблюдений, как правило, действует не один, а несколько факторов. При
изучении влияния на интегральный показатель двух факторов используется двухфакторный дисперсионный анализ. При необходимости сравнения
дисперсий нескольких равных по количеству выборок для каждой группы
данных (факторов и (или) их градаций) целесообразно использовать инструмент Пакета анализа Excel 2002 Двухфакторный дисперсионный
анализ с повторениями.
Пример. Определить, в какой мере на результат в лыжной гонке на 10
км влияет профиль лыжных трасс, метеорологические условия, а также совместное влияние перечисленных факторов. С этой целью 24 лыжникагонщика, имеющие одинаковую спортивную квалификацию (1-й спортивный разряд), были разделены на 6 групп по 4 человека в каждой. Для 6
групп лыжников были проведены соревнования в различных условиях.
Метеорологические условия определялись температурой снега и влажностью воздуха. Сложность лыжных трасс определялась суммой перепадов
высот. Первый фактор - «Метеоусловия» - имеет две градации (два уровня): хорошие метеоусловия и плохие метеоусловия. Второй фактор «Профиль трассы» - имеет три градации (три уровня): 1 - легкий, 2 - средний, 3 - сложный. Входной интервал имеет следующую форму.
48
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Хорошие
1 метеоусловия
Профиль 1
37,5
38,11
34,12
35,41
Профиль 2
38,05
38,14
36,08
36,51
Профиль 3
37,48
39,31
35,02
37,04
Плохие
метеоусловия
39
39,28
37,42
38,07
39,31
39,11
37,27
39,13
38,07
40,05
37,28
38,06
Порядок работы с Excel 2002 следующий. В меню Сервис выбрать
команду Анализ данных и инструмент анализа Двухфакторный дисперсионный анализ с повторениями (рис. 18).
Анали жданных
Инструменты анализа
Однофакторный дисперсионный анализ
[Однос
>акторныи дисперсионный анализ с повторениями
Двухфакторный дисперсионный анализ без повторений
Корреляция
Ковариация
Описательная статистика
Экспоненциальное сглаживание
Двухвыборочный F-тест для дисперсии
Анализ Фурье
Гистограмма
49
OK
Отмена
Справка
j J
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рис. 18. Диалоговые окна для использования инструмента анализа
Двухфакторный дисперсионный анализ с повторениями
Порядок заполнения элементов диалогового окна «Двухфакторный дисперсионный анализ с повторениями»
Входной интервал - ввести ссылку на диапазон анализируемых данных. Ссылка должна состоять не менее чем из двух смежных диапазонов
данных, которые могут быть расположены по строкам или столбцам. В
нашем примере имеются восемь смежных диапазонов данных, которые
расположены в двух столбцах.
Число строк на выборку - ввести число строк, содержащихся в одной выборке. Поскольку каждая строка представляет повторение данных,
каждая выборка должна содержать одно и то же количество строк. В нашем примере число строк (количество наблюдений), содержащихся в одной выборке (в группе исследуемых спортсменов), составляет 3.
Альфа - установить требуемый уровень надежности. Уровень надежности равняется 100 х* (1 - альфа) процентам. Значение альфа, равное 0,05,
означает 95-процентный уровень надежности.
Выходной интервал - определяет место расположения итоговой таблицы результатов статистических расчетов (левую верхнюю ячейку). В случае возможного наложения таблицы результатов статистических расчетов
на исходные данные будет выведено соответствующее сообщение на экран.
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
50
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Результаты выполнения статистических расчетов Excel 2002 отобразит в виде нескольких таблиц (табл. 11).
Таблица 11
Результаты статистических расчетов при использовании инструмента
анализа Двухфакторный дисперсионный анализ с повторениями
ИТОГИ
Профиль 1
Счет
Сумма
Среднее
Дисперсия
Профиль 2
Счет
Сумма
Среднее
Дисперсия
Профиль 3
Счет
Сумма
Среднее
Дисперсия
Итого
Счет
Сумма
Среднее
Дисперсия
Хорошие
метеоусловия
Плохие
метеоусловия
Итого
4
145,14
36,29
3,42
4
153,77
38,44
0,73
8
298,91
37,36
з,и
4
148,78
37,20
1,11
4
154,82
38,71
0,92
8
303,60
37,95
1,52
4
148,85
37,21
3,10
4
153,46
38,37
1,40
8
302,31
37,79
2,31
12
442,77
36,90
2,29
12
462,05
38,50
0,86
Дисперсионный анализ
Источник
вариации
Выборка
Столбцы
Взаимодействие
Внутри
SS
1,47
15,49
1,04
32,07
df
2
1
2
18
Итого
50,06
23
MS
0,73
15,49
0,52
1,78
51
F
0,41
8,69
0,29
РЗначение
0,67
0,01
0,75
F критическое
3,55
4,41
3,55
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Примечание: в итоговой таблице дисперсионного анализа обозначены: источник вариации Выборка - фактор «Профиль трасс»; источник вариации Столбцы - фактор «Метеоусловия»; Взаимодействие - совместное
влияние факторов «Профиль трасс» и «Метеоусловия»; Внутри - остаточная вариация, Итого - общая дисперсия; символами обозначены:
сумма квадратов; df - число степеней свободы; MS - дисперсия; F - Фкритерий расчетный; F критическое — табличное значение.
Влияние фактора «Метеоусловия» рассчитывается по следующей
формуле:
gl = 5 5 столбцы : 5 5 итого х 100%, что составляет
0 1 = 15,49 : 50,06 х 100% = 30,94%
Расчеты показали, что F критическое < F столбцы (4,41 < 8,69), что
свидетельствует о статистической достоверности полученных результатов.
Влияние фактора «Профиль трасс» рассчитывается по следующей
формуле:
i]2 = 5 5 выборка : 5 5 итого х 100%, что составляет
ц2 = 1,47 : 50,06 х 100% = 2,94%
Расчеты показали, что F критическое < F выборка (0,41 < 3,55), что
свидетельствует о статистической достоверности полученных результатов.
Совместное влияние факторов «Профиль трасс» и «Метеоусловия»
рассчитывается по следующей формуле:
г) 1,2 = 5 5 взаимодействие : 5 5 итого х 100%, что составляет
г) 1,2 = 1,04 : 50,06 х 100% = 2,08%
Расчеты показали, что F критическое > F взаимодействие (3,55 > 0,29),
что свидетельствует о статистической недостоверности полученных результатов.
Выводы. Результат спортсменов-лыжников квалификации 1 спортивного разряда в лыжной гонке на 10 км на 30,94% определяется фактором
«Метеоусловия» и на 2,94% - фактором «Профиль трасс». Совместное
влияние факторов «Профиль трасс» и «Метеоусловия» на результат лыжной гонки оказалось статистически недостоверным.
9.3. Двухфакторный дисперсионный анализ без повторений
Для проверки гипотезы о том, что средние значения двух или нескольких выборок одинаковы (выборки принадлежат одной и той же генераль52
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ной совокупности) используется Двухфакторный дисперсионный анализ без повторений.
Этот метод можно использовать в тестах сравнения двух средних, таких как t-критерий.
Пример. Мальчики (8 человек), принятые в ДЮСШ на отделение
спортивной гимнастики, через месяц проходили испытания в контрольном
упражнении «подтягивание на перекладине». В процессе испытаний все
они улучшили результаты в тесте. Необходимо проверить, что улучшения
являются статистически достоверными.
Список
спортсменов
П-в К.
И-вЕ.
С-в Н.
Б-н Г.
С-в С.
Г-н П.
Е-в Д.
М-в Е.
1
испытание
4
7
6
5
8
5
8
6
Количество раз
2
3
испытание
испытание
1
14
16
10
17
10
12
8
15
12 " '
13
9
13
11
14
И
Порядок работы с Excel 2002 следующий. В меню Сервис выбрать
команду Анализ данных и инструмент анализа Двухфакторный дисперсионный анализ без повторений (рис. 19).
Л х
I
Однофакторный дисперсионный анализ
Двухфакторный дисперсионный анализ с повторениями
'.экторный дисперсионный анализ ьез пивторении
Корреляция
Ковариация
Описательная статистика
Экспоненциальное сглаживание
Двухвыборочный F-тест для дисперсии
Анализ Фурье
Гистограмма
53
Отмена
Справка
d
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Днухфлктпрный дисперсионный анали> не > п о в ю р е н и й
(-Входные данныеВходной интервал:
|$AN$4:$AQ$12
ок
Отмена
Метки
Альфа: | о , 0 5
Справка
-Параметры вывода
(* Выходной интервал:
5 J
LUxi
|$AQ$15
С Новый рабочий лист:
~Б1
С Новая рабочая книга
Рис. 19. Диалоговые окна для использования инструмента анализа
Двухфакторный дисперсионный анализ без повторений
Порядок заполнения элементов диалогового окна «Двухфакторный дисперсионный анализ без повторений»
Входной интервал - ввести ссылку на диапазон анализируемых данных. Ссылка должна состоять не менее чем из двух смежных диапазонов
данных, которые могут быть расположены по строкам или столбцам.
Метки - если первая строка входного интервала содержит названия
столбцов, то следует установить флажок. Если входной интервал не содержит меток, то заголовки в итоговой таблице результатов статистических расчетов будут созданы автоматически.
Альфа - установить требуемый уровень надежности. Уровень надежности равняется 100 х (1 - альфа) процентам. Значени альфа, равное 0,05,
означает 95-процентный уровень надежности.
Выходной интервал - определяет место расположения итоговой таблицы результатов статистических расчетов (левую верхнюю ячейку). В
случае возможного наложения таблицы результатов статистических расчетов на исходные данные будет выведено соответствующее сообщение на
экран.
Новый рабочий лист - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов на новом рабочем листе,
то следует ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Новая рабочая книга - если есть необходимость в размещении итоговой таблицы результатов статистических расчетов в новой книге, то следует установить флажок.
Результаты выполнения статистических расчетов Excel 2002 отобразит
в виде двух таблиц (табл. 12).
54
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 12
Результаты статистических расчетов при использовании инструмента
анализа Двухфакторный дисперсионный анализ без повторений
ИТОГИ
П-в И.
1
И-в С.
С-в Г.
Б-н Е.
С-в Р.
Г-н В.
Е-в П.
М-в Л.
J испытание
2 испытание
3 испытание
Счет
3
з
3
3
3
3
3
3
8
8
8
Сумма
25
33
33
25
35
27
32
31
49
78
114
Среднее
8,33
11
И
8,33
11,67
9
10,67
10,33
6,13
9,75
14,25
Дисперсия
26,33
21
31
12,33
12,33
16
6,33
16,33
2,13
2,79
2,79
Дисперсионный анализ
Источник
вариации
Строки
Столбцы
Погрешность
Итого
SS
35,63
265,08
df
1
2
MS
5,09
132,54
18,25
318,96
14
23
1,30
F
3,90
101,68
РЗначение
0
0
F критическое
2,76
3,74
Примечание: в итоговой таблице дисперсионного анализа обозначены: источник вариации Строки - внутригрупповая дисперсия; источник
вариации Столбцы - межгрупповая дисперсия; источник вариации Погрешность - дисперсия взаимодействия; источник вариации Итого - Общая дисперсия; символами обозначены: SS - сумма квадратов; df - число
степеней свободы; MS - дисперсия; F - Ф-критерий расчетный; F критическое - табличное значение.
Влияние неучтенных факторов рассчитывается по следующей формуле:
I] = (MS строки - MS погрешность): MS строки, что составляет
g = (5,09 - 1,30): 5,09 = 0,745
Влияние неучтенных факторов, выраженное в процентах, рассчитывается при помощи возведения полученной величины в квадрат и умножения
на 100%.
0,745 Л 2 х 100% = 55,5%.
55
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Влияние изучаемого фактора (учебно-тренировочного процесса на результат в подтягивании на перекладине) рассчитывается по следующей
формуле:
г)факт = 100% - о
Офакт = 100% - 55,5% = 44,5%.
Расчеты показали, что F критическое
3,74 <101,68).
< F расчетное
(2,76 < 3,90 и
Выводы. Группа мальчиков, занимающихся в ДЮСШ спортивной
гимнастикой, достоверно улучшила результат в тесте «подтягивание на
перекладине», т.к. F критическое < Fрасчетное (3,74 < 101,68).
Влияние тренировочного процесса на результат в тесте «подтягивание
на перекладине» составляет 44,5%. Влияние неучтенных факторов составляет 55,5%.
Предположение о влиянии однородности группы на результат в тесте
«подтягивание на перекладине» принимается, т.к. F критическое < F
расчетное (2,76 < 3,90).
56
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
1. Баранова З.М. Методические разработки о применении корреляционного анализа в спорте / З.М.Баранова, Б.А.Суслаков, А.Н.Петросян. - М.,
1980.
2. Зациорский В.М. Основы спортивной метрологии. - М., 1979.
3. Лакин Г.Ф. Биометрия. - М., 1990.
4. Масальгин Н.А. Методы математической статистики в спорте. - М.,
1974.
5. Начинская С.В. Математическая статистика в спорте. - Киев, 1978.
6. Начинская С.В. Основы спортивной статистики. - Киев, 1987.
7. Основы математической статистики: Учебное пособие для ин-тов физ.
культ. / Под ред. B.C. Иванова. - М., 1990.
8. Плохинский Н.А. Алгоритмы биометрии. - М., 1980.
9. Спортивная метрология: Учеб. для ин-тов физ. культ. / Под. ред. В.М.
Зациорского. - М . , 1982.
Ю.Спортивная метрология: Учеб. для ин-тов физ. культ. - М . , 1988.
И.Смирнов Ю.И., Полевщиков М.М. Спортивная метрология: Учеб. для
студ. пед. вузов. - М., 2000.
12.Статистика. Обработка спортивных данных на компьютере: Учебное
пособие для студентов высших учебных заведений физической культуры / Под ред. М.П. Шестакова и Г.И. Попова.- М.: СпортАкадемПресс,2002.-278с.
13.Суслаков Б.А. Применение дисперсионного анализа в спортивныхисследованиях. - М . , 1982.
57
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
3
УСТАНОВКА ПАКЕТА АНАЛИЗА
4
1. ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РЯДА РАСПРЕДЕЛЕНИЯ
5
2. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ВЫБОРКИ
2.1. Положение ряда распределения
2.2. Колеблемость (рассеяние) признака
8
12
12
3. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
3.1. Проверка выборки на соответствие нормальному распределению
3.2. Создание выборки из генеральной совокупности
13
13
14
4. ОПРЕДЕЛЕНИЕ СРЕДНЕСТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ
ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ
17
5. ПОДСЧЕТ КОЛИЧЕСТВА НАБЛЮДЕНИЙ
В ЗАДАННОМ ИНТЕРВАЛЕ
18
6. РАЗРАБОТКА ПЕРСЕНТИЛЬНОЙ ШКАЛЫ
И ОПРЕДЕЛЕНИЕ ВЕЛИЧИНЫ ИЗУЧАЕМОГО
ПОКАЗАТЕЛЯ ДЛЯ ОТБОРА ПО ЗАДАННОМУ ПЕРСЕНТИЛЮ
6.1. Разработка персентильной шкалы
6.2. Определение величины изучаемого показателя
для отбора по заданному персентилю
21
21
25
7. ПРОВЕРКА ГИПОТЕЗ О РАВЕНСТВЕ СРЕДНИХ
И О РАВЕНСТВЕ ДИСПЕРСИЙ ДВУХ ВЫБОРОК
7.1. Проверка гипотезы о равенстве средних двух выборок
при помощи t-теста Стьюдента
7.2. Проверка гипотезы о равенстве дисперсий двух выборок
при помощи F-теста
30
8. КОРРЕЛЯЦИОННОЕ ПОЛЕ И ЛИНИЯ ТРЕНДА,
КОРРЕЛЯЦИЯ, РЕГРЕССИЯ
8.1. Корреляционное поле и линия тренда
8.2. Корреляция
8.3. Регрессия
32
33
35
38
9. ДИСПЕРСИОННЫЙ АНАЛИЗ
9.1. Однофакторный дисперсионный анализ
9.2. Двухфакторный дисперсионный анализ с повторениями
9.3. Двухфакторный дисперсионный анализ без повторений
44
45
48
52
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
57
58
27
27
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
МАТЕМАТИКО-СТАТИСТИЧЕСКИЙ АНАЛИЗ
К О Л И Ч Е С Т В Е Н Н Ы Х ДАННЫХ Ф И З К У Л Ь Т У Р Н О ПЕДАГОГИЧЕСКИХ ИССЛЕДОВАНИЙ
С Р Е Д С Т В А М И Microsoft ® Excel
Подписано в печать 29.11.04. Формат 60x84 1/16
Объем 3,75 печ.л. Тираж 400 экз. Заказ 96.
Издательство СибГУФК.
644009, г.Омск, ул.Масленникова, 144.
Download