Подготовка к работе

advertisement
Подготовка к работе
Статистический анализ в Excel можно осуществлять двумя способами:


С помощью функций
С помощью средств надстройки «Пакет анализа». Ее, как правило, еще необходимо
установить.
Установка надстройки «Пакет анализа»
Работа выполняется в MS Excel 2007 или выше. Для выполнения этой и последующих работ
потребуется пакет «Анализ данных». По умолчанию он отключен.
В меню Office нажать кнопку «Параметры Excel».
В окне параметров Excel выбрать «Надстройки», в выпадающем списке внизу выбрать
«Надстройки Excel» и нажать кнопку «Перейти...»
В окне «Надстройки» поставить галочку «Пакет анализа» и нажать «OK».
В результате на Ленте на вкладке «Данные» должна появиться кнопка «Анализ данных».
Вычисление выборочных характеристик в Excel
Вычисляет частоту появления значений в интервале значений и возвращает массив чисел.
Функцией ЧАСТОТА можно воспользоваться, например, для подсчета количества результатов
тестирования, попадающих в интервалы результатов. Поскольку данная функция возвращает
массив, ее необходимо вводить как формулу массива.
Синтаксис:
ЧАСТОТА(массив_данных; массив_интервалов)
аргумент функции ЧАСТОТА описаны ниже.


Массив_данных — обязательный аргумент. Массив или ссылка на множество значений,
для которых вычисляются частоты. Если аргумент "массив_данных" не содержит значений,
функция ЧАСТОТА возвращает массив нулей.
Массив_интервалов — обязательный аргумент. Массив или ссылка на множество
интервалов, в которые группируются значения аргумента "массив_данных". Если аргумент
"массив_интервалов" не содержит значений, функция ЧАСТОТА возвращает количество
элементов в аргументе "массив_данных".
Замечания




Функция ЧАСТОТА вводится как формула массива после выделения диапазона смежных
ячеек, в которые требуется вернуть полученный массив распределения.
Количество элементов в возвращаемом массиве на единицу больше числа элементов в
массиве "массив_интервалов". Дополнительный элемент в возвращаемом массиве
содержит количество значений, превышающих верхнюю границу интервала, содержащего
наибольшие значения. Например, при подсчете трех диапазонов значений (интервалов),
введенных в три ячейки, убедитесь в том, что функция ЧАСТОТА возвращает значения в
четырех ячейках. Дополнительная ячейка возвращает число значений в аргументе
"массив_данных", превышающих значение верхней границы третьего интервала.
Функция ЧАСТОТА пропускает пустые ячейки и текст.
Формулы, возвращающие массивы, необходимо вводить как формулы массива.
Прежде чем использовать данную функцию имеет смысл определить границы интервалов. Для
этого определим сначала минимальный и максимальный элемент.
Размах вариации вычисляется как разность максимального значения и минимального значений
массива, деленная на количество интервалов:
R
xmax  xmin
.
n
Для оценки оптимального для нашего массива данных количества интервалов можно
воспользоваться формулой Стерджесса: n=1+3,322lgN, где N — количество всех значений
величины. Например для N=100, n=7,6. Естественно, округляем до 8.
Для нахождения максимального и минимального значений воспользуемся соответствующими
функциями: =МАКС(наш диапазон значений) и =МИН(наш диапазон значений).
При этом формулы на листе будут следующие:
Теперь построим интервалы: сначала к минимальному значению нашего массива прибавим
размах, затем в следующей ячейке ниже — к полученной сумме еще раз прибавим размах и т.д.
Так постепенно доходим до максимального значения. Вот мы и построили интервальный ряд
распределения в виде столбца значений. Для наглядности мы записали ряд в виде набора двух
значений: левая и правая граница интервала.
Формулы:
Обратите внимание на то, что последнее число лучше ввести вручную! Дело в том, что если это
число будет вычислено, оно в ряде случаев может «не подхватиться» функцией частота при
вычислении. Фактически, вычисленное число окажется чуть меньше (практически на бесконечно
малую величину), чем число в диапазоне данных.
Выделяем столбец рядом с построенным (обязательно столбец, а не одну ячейку), нажимаем «F2»
и вводим функцию: =ЧАСТОТА(массив данных; диапазон карманов) и нажимаем Ctrl+Shift+Enter.
ВНИМАНИЕ! При вводе функции не жмем на «ОК», а нажимаем Ctrl+Shift+Enter в противном
случае у вас введется значение только в первую ячейку диапазона!
Итак, вариационный ряд построен. Теперь построим гистограмму распределения. Для этого
выделим полученный столбец частот и затем выберем Вставка > Гистограмма. Осталось задать
название гистограммы (при выделенной гистограмме Макет > Название диаграммы > Над
диаграммой) и задать правильные подписи интервалов (Конструктор > Выбрать данные, затем
щелкнуть по кнопке Изменить в столбце Подписи горизонтальной оси (категории), выбрать ОБА
столбца границ интервалов, в нашем примере это диапазон C9:D13). Получится:
Для построения полигона относительных частот нам нужно подсчитать сумму частот и добавить к
столбец расчета относительных частот по формуле wi 
ni
.
 ni
i
Формулы:
Теперь аналогично построению гистограммы построим полигон:
Есть другой способ построения частотного графика при помощи Пакета анализа: Данные > Пакет
анализа, затем выбрать Гистограмма. Установить Входной интервал – ряд исходных данных,
Интервал карманов – правые границы отрезков интервального ряда распределения, также
установите флажок Вывод графика:
Математическое ожидание (среднее арифметическое) вычисляется при помощи функции
СРЗНАЧ(), а дисперсия при помощи функции ДИСП() в которых в качестве аргументов указываем
наш ряд данных:
Среднее квадратическое отклонение вычисляем при помощи функции КОРЕНЬ() как квадратный
корень из дисперсии.
Download