Document 73205

advertisement
Институт экономики, управления и права (г. Казань)
Зеленодольский филиал
Кафедра высшей математики
Контрольная работа
по дисциплине
«Основы математической обработки информации»
Вариант №
Работу выполнил (ла)
студент (ка) группы № _____
заочной (очной) формы обучения
Ф.И.О.______________________
Работу проверил (а)____________
Ф.И.О. преподавателя дисциплины
направления подготовки
050100.62 «Педагогическое образование»
Квалификация (степень) выпускника
Бакалавр
Зеленодольск – 2014
Задание №1.
Пусть дана последовательность значений некоторого признака: 182; 184; 176;
177; 180; 184; 186; 186; 179; 190; 170; 172; 185; 184; 182; 180; 177; 176;172;
189; 174; 176; 172; 174; 175; 182; 186; 186; 183; 165; 177; 172. Выполните
статистическую обработку данных по следующей схеме:
1. выполнить ранжирование признака и составить безинтервальный
вариационный ряд распределения;
2. составить равноинтервальный вариационный ряд, разбив всю вариацию на
k интервалов (k = 5);
3. построить гистограмму распределения;
4.
найти
числовые
характеристики
выборочной
совокупности:
характеристики положения (выборочную среднюю, моду, медиану);
характеристики рассеяния (выборочную дисперсию, среднеквадратическое
отклонение);
5. найти доверительный интервал для генеральной средней Х г. Принять
уровень значимости α = 0,05.
Решение:
1) Выполним ранжирование признака
165; 170; 172; 172; 172; 172; 174; 174; 175; 176; 176; 176; 177; 177; 177;
179; 180; 180; 182; 182; 182; 183; 184; 184; 184; 185; 186; 186; 186; 186;
189; 190.
Составим безинтервальный вариационный ряд распределения при n = 32
i
xi
mi
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
165 170 172 174 175 176 177 179 180 182 183 184 185 186 189 190
1
1
4
2
1
3
3
1
2
3
1
3
1
4
1
1
2) Составим равноинтервальный вариационный ряд, разбив всю вариацию на
k интервалов (k=5)
Определим в данной выборке xmax = 190; xmin = 165
Рассчитаем ширину частичного интервала ℎ =
𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛
𝑘
=
25
5
= 5, где
k – число равных интервалов. Определим частоту вариант, попавших в
соответствующий частичный интервал и относительную частоту.
№ интервала
1
2
3
4
Частичный
интервал
165-174
174-177
177-182
182-185
Частота вариант
mi
8
7
6
5
2
Относительная
частота 𝑝𝑖∗
8/32 = 0,25
7/32 = 0,22
6/32 = 0,19
5/32 = 0,16
5
185-190
6
6/32 = 0,19
3) Построим гистограмму относительных частот распределения, отложив по
*
оси абсцисс (xi) интервалы, по оси ординат ( pi ) относительные частоты
(смотри рис.1.).
Рис.1. Гистограмма относительных частот распределения
4) Рассчитаем числовые характеристики выборочной совокупности
𝑥̅В =
∑ 𝑥𝑖 𝑚𝑖 165 ∗ 1 + 170 ∗ 1 + 172 ∗ 4 + 174 ∗ 2 + 175 ∗ 1 + 176 ∗ 3
=
+
𝑛
32
177 ∗ 3 + 179 ∗ 1 + 180 ∗ 2 + 182 ∗ 3 + 183 ∗ 1 + 184 ∗ 3 + 185 ∗ 1
+
32
186 ∗ 4 + 189 ∗ 1 + 190 ∗ 1
+
= 179,16
32
+
∑(𝑥𝑖 − 𝑥̅в )2 𝑚𝑖 (165 − 179,16)2 ∗ 1 + (170 − 179,16)2 ∗ 1
𝐷В =
=
+
𝑛
32
(172 − 179,16)2 ∗ 4 + (174 − 179,16)2 ∗ 2 + (175 − 179,16)2 ∗ 1
+
+
32
(176 − 179,16)2 ∗ 3 + (177 − 179,16)2 ∗ 3 + (179 − 179,16)2 ∗ 1
+
+
32
(180 − 179,16)2 ∗ 2 + (182 − 179,16)2 ∗ 3 + (183 − 179,16)2 ∗ 1
+
+
32
(184 − 179,16)2 ∗ 3 + (185 − 179,16)2 ∗ 1 + (186 − 179,16)2 ∗ 4
+
+
32
3
(189 − 179,16)2 ∗ 1 + (190 − 179,16)2 ∗ 1 1150,2192
+
=
= 35,94435
32
32
𝜎В = √𝐷В = √35,94435 = 6
Мода: Ряд называется полимодальным, если есть несколько значений
признака, которые встречаются одинаково часто. Для полимодального ряда
моду не вычисляют.
Медиана: Если выборка содержит четное число членов, то ранг медианы
равен 𝑅𝑀𝑒 =
32+1
2
= 16,5. Медианой в этом случае может быть любое число
между 16-м и 17-м членами ряда.
5) Рассчитаем границы доверительного интервала для среднего значения
(математического ожидания ) 𝑥̅В , принимая уровень значимости α = 0,05.
Вычислим исправленную дисперсию по формуле
∑(𝑥𝑖 − 𝑥̅в )2 𝑚𝑖 1150,2192 1150,2192
2
𝑆 =
=
=
= 37,1038
𝑛−1
32 − 1
31
Найдем исправленное среднее квадратическое отклонение
𝑆 = √𝑆 2 = √37,1038 = 6,09
По таблице приложения (основной литературы) определим значение
коэффициента Стьюдента tα,n= 2,037 при α = 0,05 n = 32
Определим точность оценки по формуле 𝛿 = 𝑡𝛼,𝑛
𝛿 = 2,037 ∗
𝑆
√𝑛
6,09
= 2,19
√32
( 𝑥̅В – δ< μ< 𝑥̅В + δ)
(179,16 – 2,19 < μ < 179,16 + 2,19) или (176,97; 181,35)
Ответ: 𝑥̅В = 179,16; М0 = –; me = –; Dв = 35,94435; σв = 6; (176,97; 181,35) –
доверительный интервал для генеральной средней Х г.
Задание №2.
Вычислить выборочный коэффициент корреляции по следующим данным:
xi
10
11
12
13
14
15
16
yi
2
2
3
3
4
5
6
Проверить его значимость с надежностью 0,95.
Решение:
Рассчитаем величины, входящие в формулу выборочного коэффициента
корреляции
4
𝑥̅ =
10 + 11 + 12 + 13 + 14 + 15 + 16 91
=
= 13
7
7
𝑦̅ =
2 + 2 + 3 + 3 + 4 + 5 + 6 25
=
= 3,6
7
7
= 10,7
∑ 𝑥𝑖 𝑦𝑖 = 10 ∗ 2 + 11 ∗ 2 + 12 ∗ 3 + 13 ∗ 3 + 14 ∗ 4 + 15 ∗ 5 + 16 ∗ 6 =
= 344
𝜎𝑥 = √𝐷𝑥 = √
(10 − 13)2 + (11 − 13)2 + (12 − 13)2 + (13 − 13)2 +
7
+(14 − 13)2 + (15 − 13)2 + (16 − 13)2
28
√
= √ = √4 = 2
7
7
(2 − 3,6)2 + (2 − 3,6)2 + (3 − 3,6)2 + (3 − 3,6)2 +
𝜎𝑦 = √𝐷𝑦 = √
7
+(4 − 3,6)2 + (5 − 3,6)2 + (6 − 3,6)2
13,72
√
=√
= √1,96 = 1,4
7
7
Подставим вычисленные величины в формулу для выборочного коэффициента
корреляции
𝑟В =
344 − 7 ∗ 13 ∗ 3,6
= 0,84
7 ∗ 2 ∗ 1,4
При заданном уровне значимости p = 0,95 необходимо вычислить
наблюдаемое значение критерия
𝑛−2
7−2
√
𝑡набл = 𝑟В ∗ √
=
0,84
∗
= 3,49
1 − 0,71
1 − 𝑟В2
Величина t имеет распределение Стьюдента с k = n – 2 степенями свободы. По
таблице приложения (основной литературы) критических точек распределения
Стьюдента, по заданному уровню значимости
p = 0,95 и числу степеней
свободы k = 5 находим критическую точку tкр(p;k) = 0,066.
5
Если |tнабл| < tкр, то совокупности Х и У линейно не коррелированы, если |tнабл|
> tкр, то совокупности Х и У линейно коррелированны.
В нашем случае |tнабл| = 3,49, tкр = 0,066. Т.к. 3,49 > 0,066, то совокупности Х и
У линейно коррелированны.
Ответ: 𝑟В =0,84 – выборочный коэффициент корреляции значим.
Задание №3.
Пяти дошкольникам предъявляют тест. Фиксируется время решения каждого
задания. Будут ли найдены статистически значимые различия между
временем решения первых трёх заданий теста?
№
Время решения Время решения Время решения
испытуемых первого задания второго задания третьего задания
п/п
теста (в сек.).
теста (в сек.).
теста (в сек.).
1
9
4
12
2
11
6
18
3
10
5
24
4
12
6
20
5
9
5
23
Решение:
Методом дисперсионного анализа при уровне значимости α = 0,05 проверим
нулевую гипотезу (Hо) о существовании статистически значимых различий
между временем решения первых трёх заданий теста у пяти дошкольников.
Рассмотрим таблицу условия задания, в которой найдем среднее время
решения каждого из трех заданий теста
№
Время решения
Время решения
Время решения
испытуемых первого задания второго задания третьего задания
п/п
теста (в сек.).
теста (в сек.).
теста (в сек.).
1
9
4
12
2
11
6
18
3
10
5
24
4
12
6
20
5
9
5
23
групповая
10,2
5,2
19,4
средняя
Находим общую среднюю:
6
𝑥̅ =
10,2 + 5,2 + 19,4
= 11,6
3
Рассчитаем общую сумму квадратов отклонений вариант от общей средней
по формуле
 
 pq x 
x
Rобщ  
ij
j 1 i 1
 
p
q
2
2
, где р – число измерений времени решений заданий теста,
q – количество испытуемых. Для этого составим таблицу квадратов вариант
№
Время решения
Время решения
Время решения
испытуемых первого задания второго задания третьего задания
п/п
теста (в сек.).
теста (в сек.).
теста (в сек.).
1
81
16
144
2
121
36
324
3
100
25
576
4
144
36
400
5
81
25
529
527
138
1973

𝑅общ = 527 + 138 + 1973 − 3 ∗ 5 ∗ (11,6)2 = 2638 − 2018,4 = 619,6
Рассчитаем факторную сумму квадратов отклонений групповых средних от
общей средней, которая и характеризует значимость данного фактора, т.е.
различия между временем решения первых трёх заданий теста, по
следующей формуле
R
факт
 p
 q 
 j 1

x 
2
rj
 
 p x 
 
2




𝑅факт = 5 ∗ (10,22 + 5,22 + 19,42 − 3 ∗ 11,62 ) = 5 ∗ (104,04 + 27,04 +
+376,36 − 403,68) = 518,8
Остаточная сумма квадратов отклонений получается как разность
𝑅ост = 𝑅общ − 𝑅факт = 619,6 − 518,8 = 100,8
Определяем факторную и остаточную дисперсии
𝑅факт 518,8
2
=
= 259,4
(𝑆факт
)=
𝑝−1
2
2 )
(𝑆ост
=
𝑅ост
100,8
=
= 8,4
𝑝 ∗ (𝑞 − 1)
12
Находим 𝑓набл =
2
𝑆факт
2
𝑆ост
=
259,4
8,4
= 30,88
Для уровня значимости α = 0,05 и чисел степеней свободы 2 и 12 находим
f крит из таблицы распределения Фишера – Снедекора
𝑓крит (0,05; 2; 12) = 3,89
7
В связи с тем, что
f
набл

f
крит
, то с вероятностью α основная гипотеза о
незначимости коэффициента множественной регрессии отклоняется, и он
признается значимым.
Ответ: При предъявлении теста пяти дошкольникам фиксируемое время
решения каждого задания является статистически значимым между временем
решения первых трёх заданий теста.
8
Download