Задачи по статистике

advertisement
НИУ ВШЭ, 2013/14, «Математические основы компьютерной лингвистики»
Магистратура отделения лингвистики, 2013/14 уч. год
Математические основы компьютерной лингвистики
Задачи по статистике (14 января 2014)
Д. А. Филимонов
Нам потребуется определить 𝛼-квантиль — это часть выборки с самыми маленькими значениями, составляющая долю 𝛼 от всей выборки.
Определение 1. Рассмотрим выборку {𝑥0 , 𝑥2 , . . . , 𝑥𝑁 −1 }. (Мы начинаем нумерацию с нуля,
в выборке 𝑁 элементов.) Перенумераем элементы в выборке по возрастанию. Обозначим
то, что получится, через {𝑣0, 𝑣1, . . . , 𝑣𝑁 −1}. Пусть 𝛼 — доля (число от 0 до 1). Обозначим
через 𝐾 нижнее целое от 𝛼 · (𝑁 − 1) (то есть максимальное целое число, не превосходящее
𝛼 · (𝑁 − 1)).
Тогда
∙ при 𝐾 + 1 < 𝛼𝑁 , 𝛼-квантиль = 𝑣𝐾+1
∙ при 𝐾 + 1 = 𝛼𝑁 , 𝛼-квантиль = (𝑣𝑘 + 𝑣𝐾+1 )/2
∙ при 𝐾 + 1 > 𝛼𝑁 , 𝛼-квантиль = 𝑣𝐾 .
Задача 1. Пусть дана выборка {2, 4, 1, 3, 2, 4}.
(a) найти медиану и первый и третий квартили;
(b) найти 0.3-квантиль и 0.9-квантиль;
Задача 2. Пусть дана выборка {−5, −3, 0, 4, 4.1, 4.2, 3.9, 4.4, 3.7, 4}.
(a) найти медиану и первый и третий квартили;
(b) найти 0.3-квантиль и 0.9-квантиль;
Задача 3. Пусть дана выборка {2, 0, 4, 2, 1, 3, 2, 2, 1, 2} из значений биномиальной случайной
величины 𝜉.
(a) Найти оценки для математического ожидания и дисперсии;
(b) Найти оценку для вероятности удачи в одном опыте 𝑝;
(c) Найти оценку для количества испытаний;
Задача 4. Пусть дана выборка {2, 9; 2, 4; 1, 6; 1, 9; 2, 6; 1, 6; 2, 3; 1; 2, 4; 1, 7} из значений равномерной случайной величины 𝜉.
(a) Найти оценки для математического ожидания и дисперсии;
(b) Найти оценки для границ отрезка (Подсказка: вспомнить, как выражаются математическое ожидание и дисперсия через границы отрезка для равномерного распределения);
Д. А. Филимонов
1
Download