Описание лабораторных работ - Томский политехнический

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего
образования «НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
Л.А. Редько
МАТЕМАТИЧЕСКИЕ МЕТОДЫ В
ИННОВАЦИОННОЙ И УПРАВЛЕНЧЕСКОЙ
ДЕЯТЕЛЬНОСТИ
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ВЫПОЛНЕНИЮ ЛАБОРАТОРНЫХ
РАБОТ
Рекомендовано в качестве учебно-методического пособия
Редакционно-издательским советом
Томского политехнического университета
Издательство
Томского политехнического университета
2015
УДК 000000
ББК 00000
Р336
Редько Л.А.
Р336
Математические методы в инновационной и управленческой
деятельности. Методические указания к выполнению лабораторных
работ: учебно-методическое пособие / Л.А. Редько; Томский
политехнический университет. – Томск : Изд-во Томского
политехнического университета, 2015. – Х с.
1
В пособии изложены научные основы синтеза высокомолекулярных
соединений цепной и ступенчатой полимеризацией,
реакциями
полимераналогичных превращений. Дано физико-химическое обоснование
происходящих при этом процессов и их количественное описание.
Рассмотрены современные представления о механизме и кинетике реакций,
о связи строения мономеров с параметрами их реакционной способности, о
структуре полимеров, их фазовых и физических состояниях, о растворах
полимеров.
Предназначено для студентов, обучающихся по направлению 550800
«Химическая технология и биотехнология».
УДК 000000
ББК 00000
Рецензент
© ФГАОУ ВО НИ ТПУ, 2015
© Редько Л.А., 2015
© Оформление. Издательство Томского
политехнического университета, 2015
2
Оглавление
Лабораторная работа №1
Описательная статистика ............................................................................. 4
Лабораторная работа №2
Графическое представление данных ......................................................... 19
Лабораторная работа №3
Законы распределения вероятностей ........................................................ 37
Лабораторная работа №4
Построение доверительных интервалов ................................................... 55
3
Лабораторная работа №1
Описательная статистика
Цель работы: научиться рассчитывать описательные статистики ряда
распределения в программе Excel.
Задачи работы:
определить описательные статистики посредством функции Пакет
анализа программы Excel, интерпретировать полученные результаты;
познакомиться со статистическими функциями, доступными в
программе Excel.
Основные понятия:
Арифметическое среднее, медиана, мода, квартили, размах, дисперсия,
стандартное отклонение, коэффициент вариации, форма распределения,
доверительный интервал, уровень значимости, доверительная вероятность,
коэффициент эксцесса, коэффициент асимметрии.
Краткая теория
Статистическая информация представляется совокупностью данных,
для характеристики которых используются разнообразные показатели,
называемые
показателями
описательной
статистики.
Показатели
описательной статистики можно разбить на несколько групп.
Показатели положения описывают положение данных на числовой оси.
Примеры таких показателей – минимальный и максимальный элементы
выборки (первый и последний члены вариационного ряда), верхний и нижний
квартили (ограничивают зону, в которую попадают 50 % центральных
элементов выборки).
Квартили — это показатели, которые чаще всего используются для
оценки распределения данных при описании свойств больших числовых
выборок. В то время как медиана разделяет упорядоченный массив пополам
(50% элементов массива меньше медианы и 50% — больше), квартили
разбивают упорядоченный набор данных на четыре части.
Квартили вычисляются по формулам
Первый квартиль Q1 — это число, разделяющее выборку на две части:
25% элементов меньше, а 75% — больше первого квартиля.
𝑄𝑖 =
𝑛+1
4
-й элемент упорядоченного массива.
Третий квартиль Q3 — это число, разделяющее выборку на две части:
75% элементов меньше, а 25% — больше третьего квартиля.
𝑄𝑖 =
3(𝑛+1)
4
-й элемент упорядоченного массива.
4
Сведения о середине совокупности могут дать среднее арифметическое,
медиана, мода.
Среднее арифметическое (часто называемое просто средним) —
наиболее распространенная оценка среднего значения распределения. Она
является результатом деления суммы всех наблюдаемых числовых величин на
их количество.
Для выборки, состоящей из чисел Х1, Х2, … Хn, выборочное среднее
(обозначаемое символом X ) равно
𝑋̅ =
или
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑛
∑𝑛𝑖=1 𝑋𝑖
𝑛
где 𝑋̅ - выборочное среднее, n – объем выборки, 𝑋𝑖 – i-й элемент
выборки, ∑𝑛𝑖=1 𝑋𝑖 – сумма всех элементов выборки.
Медиана. Важной числовой характеристикой распределения для ряда
измерений объема n является медиана, или срединное значение. Для ее
вычисления все наблюдения необходимо расположить в порядке возрастания
или убывания результатов измерений. Если n — нечетное число, то медиана
просто является числом, находящимся в середине упорядоченной
последовательности.
𝑋̅ =
𝑀𝑒 =
𝑛+1
2
–й элемент упорядоченного массива.
При четном n медиана равна среднему арифметическому двух
расположенных в середине значений упорядоченной последовательности.
Мода D (наиболее вероятное значение) есть наиболее часто
встречающаяся в данном ряде измерений величина.
Если измерения образованы реализациями дискретной случайной
величины X то D можно установить непосредственно по таблице частот как
значение признака, имеющее максимальную абсолютную частоту.
Если же измерения являются реализациями непрерывной случайной
величины Х, то моду D определяют при наличии первичной таблицы
распределения как значение с максимальной абсолютной частотой или (при
отсутствии такой таблицы) приближенно по таблице частот.
Показатели разброса описывают степень разброса данных
относительно своего центра. К ним в первую очередь относятся: размах
выборки (разность между максимальным и минимальным элементами),
межквартильный размах (разность между верхним и нижним квартилем),
дисперсия, стандартное отклонение, эксцесс. Эти показатели определяют,
насколько кучно основная масса данных группируется около центра.
Размахом называется разность между наибольшим и наименьшим
элементами выборки:
5
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
Межквартильный размах (IQR) — это разность между третьим и
первым квартилями выборки:
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
Эта величина позволяет оценить разброс 50% элементов и не учитывать
влияние экстремальных элементов.
Выборочная дисперсия — это сумма квадратов разностей между
элементами выбор­ки и выборочным средним, деленная на величину, равную
объему выборки минус один:
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑆 =
𝑛−1
2
Стандартное выборочное отклонение — квадратный корень из суммы
квадратов раз­ностей между элементами выборки и выборочным средним,
деленной на величину, равную объему выборки минус один:
𝑆=
√𝑆 2
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2
√
=
𝑛−1
Дисперсия и стандартное отклонение позволяют оценить разброс
данных вокруг среднего значения, определить, сколько элементов выборки
меньше среднего, а сколько — больше. Величина дисперсии представляет
собой квадрат единицы измерения. Оценкой дисперсии является стандартное
отклонение, которое выражается в обычных единицах измерений.
Стандартное отклонение позволяет оценить величину колебаний элементов
выборки вокруг среднего значения. Практически во всех ситуациях основное
количество наблюдаемых величин лежит в интервале плюс-минус одно
стандартное отклонение от среднего значения. Зная среднее арифметическое
элементов выборки и стандартное выборочное отклонение, можно определить
интервал, которому принадлежит основная масса данных.
Форма распределения
Показатель эксцесса характеризует крутизну кривой распределения -ее
заостренность или пологость по сравнению с нормальной кривой (рисунок 1).
6
Рисунок 1. Кривые распределения с ненулевым эксцессом
Для оценки расхождений в степени крутизны кривых (при одинаковой
силе вариации) применяется коэффициент эксцесса Ek.
μ
Ek = σ44 -3,
где 𝜇4 – четвертый центральный момент, σ – стандартное отклонение.
Как правило, коэффициент эксцесса вычисляется только для
симметричных или близких к ним распределений. Это объясняется тем, что за
базу сравнения принята кривая нормального распределения, являющаяся
симметричной. Относительно вершины нормальной кривой и определяется
выпад вверх или вниз вершины теоретической кривой эмпирического
распределения. При этом:
 если Ek > 0, то вершина кривой распределения располагается выше
вершины нормальной кривой, а форма кривой является более
островершинной, чем нормальная (рисунок, а). Это говорит о скоплении
значений признака в центральной зоне ряда распределения, т.е. о
преимущественном появлении в данных значений, близких к средним;
 если Ek < 0, то вершина кривой распределения лежит ниже вершины
нормальной кривой, а форма кривой более пологая по сравнению с
нормальной (рисунок, б). Это означает, что значения признака не
концентрируются в центральной части ряда, а достаточно равномерно
рассеяны по всему диапазону от xmax до xmin.
Для нормального распределения Ek = 0, поэтому чем больше абсолютная
величина |Ek|, тем существеннее распределение отличается от нормального.
Показатели асимметрии характеризуют симметрию распределения
данных около своего центра. К ним можно отнести коэффициент асимметрии,
положение медианы относительно среднего.
𝜇3
𝐴𝑆 = 3
𝜎
где 𝜇3 – третий центральный момент, σ – стандартное отклонение.
7
Показатели асимметрии оценивают смещение ряда распределения влево
или вправо по отношению к оси симметрии нормального распределения.
Рисунок 2. Кривые асимметричных распределений
В симметричном распределении максимальная ордината прямой
располагается точно в середине кривой (рисунок), а соответствующие ей
характеристики центра распределения совпадают:
X
= Мо = Me.
В случае асимметричного распределения вершина кривой находится не
в середине, а сдвинута либо влево, либо вправо. Если вершина сдвинута влево,
то правая часть кривой оказывается длиннее левой (рисунок 2, а), т.е. имеет
место правосторонняя асимметрия, характеризующаяся неравенством
X
> Ме > Мо,
что означает преимущественное появление в распределении более
высоких значений признака.
Если же вершина кривой сдвинута вправо и левая часть оказывается
длиннее правой, то асимметрия левосторонняя (рисунок 2, б), для которой
справедливо неравенство
X
< Me < Мо,
означающее, что в распределении чаще встречаются более низкие
значения признака.
Чем больше величина расхождения между X , Me, Mo, тем более
асимметричен ряд. Наиболее точным показателем асимметрии распределения
является коэффициент асимметрии As.
Установлена следующая оценочная шкала асимметричности:
|As| < 0,25 - асимметрия незначительная;
0,25< |As| < 0,5 - асимметрия заметная (умеренная);
8
|As| >0,5 - асимметрия существенная.
Коэффициент As является относительной безразмерной величиной,
применяется для сравнительного анализа асимметричности различных рядов
распределения.
Показатели, описывающие закон распределения, дают представление о
законе распределения данных. Сюда относятся таблицы частот, полигоны,
гистограммы. С ними мы познакомимся в ходе выполнения работы «Семь
простых статистических методов».
На практике чаще всего используются следующие показатели: среднее
арифметическое, медиана, дисперсия, стандартное отклонение. Однако для
получения более точных и достоверных выводов необходимо учитывать и
другие из перечисленных выше характеристик, а также обращать внимание на
условия получения выборочных совокупностей. Наличие выбросов, т. е.
грубых ошибочных наблюдений, может не только сильно исказить значения
выборочных показателей (выборочного среднего, дисперсии, стандартного
отклонения и т. д.), но и привести ко многим другим ошибочным выводам.
Описание работы в Excel
Проверка наличия в Excel надстройки ПАКЕТ АНАЛИЗА
Для выполнения лабораторной работы необходимо наличие в Excel
программной надстройки Пакет анализа.
В случае, если Пакет анализа установлен, то меню Сервис будет
содержать пункт подменю Анализ данных. Если же этот пункт в меню Сервис
отсутствует, необходимо активизировать инструмент Пакет анализа
действиями:
1) Сервис -> Надстройки;
2) в диалоговом окне Надстройки отметить пункт Пакет анализа;
3) ОК.
В Microsoft Office 2010 Анализ данных находится в подменю Данные
(см. рис. 3).
Рисунок 3. Меню программы Excel из пакета программ Microsoft Office
2010
В пакет анализа данных
статистического анализа (рисунок 4)
включены
основные
инструменты
9
Рисунок 4. Окно пакета анализа данных
Для моделирования данных используется инструмент Генерация
случайных чисел (рисунок 5), позволяющий моделировать данные с
различными распределениями: нормальным, равномерным, биномиальным и
другими.
Рисунок 5. Окно функции Генерация данных
Результат расчета может быть выведен как на выходной интервал
данного рабочего листа (как на рисунке 2), так и на новый рабочий лист или в
новую рабочую книгу.
Поле Случайное рассеивание используется для фиксации определенной
совокупности случайных чисел: если оно не заполнено, каждый раз будет
моделироваться разный набор случайных чисел. Если же в этом поле стоит
какое-то число, то этому числу будет соответствовать вполне определенная
последовательность случайных чисел.
10
Из генеральной совокупности можно сделать выборку используя
функцию Выборка из меню Анализ данных (рисунок 6).
Рисунок 6. Меню функции Выборка
Определение характеристик выборки
Для определения числовых характеристик выборки можно
воспользоваться статистическими функциями, однако большинство
характеристик можно получить проще, используя инструмент Описательная
статистика того же пакета анализа. На рисунке 7 показано заполнение
диалогового окна, а на рисунке 8 — результаты расчета.
Рисунок 7. Диалоговое окно инструмента Описательная статистика
11
Рисунок 8.Результаты расчета при использовании инструмента
Описательная статистика
В диалоговом окне данного режима задаются следующие параметры:
 входной интервал – вводится ссылка на ячейки, содержащие
анализируемые данные;
 группирование – по строкам или столбцам данных;
 метки в первой строке/Метки в первом столбце – флажок
устанавливается в активное состояние, если первая строка (столбец) во
входном диапазоне содержит заголовки;
 выходной интервал/Новый рабочий лист/Новая рабочая книга;
 итоговая статистика – устанавливается в активное состояние, если в
выходном диапазоне необходимо получить по одному полю для каждого из
следующих показателей описательной статистики: средняя арифметическая
выборки, средняя ошибка выборки, медиана, мода, оценка стандартного
отклонения по выборке, оценка дисперсии по выборке, оценка эксцесса по
выборке, оценка коэффициента асимметрии по выборке, размах вариации
выборки, минимальный и максимальный элементы выборки, сумма элементов
выборки, количество элементов в выборке, k-й наибольший и k-й наименьший
элементы вы-борки, предельная ошибка выборки;
 уровень надежности – устанавливается в активное состояние, если в
выходную таблицу необходимо включить строку для предельной ошибки
выборки при установленном уровне надежности.
В поле, расположенном напротив флажка, вводится требуемое значе-ние
уровня надежности (например, значение уровня надежности 95 % равносильно
доверительной вероятности Р = 0,95 или уровню значимости α = 0,05);
 k-й наибольший – устанавливается в активное состояние, если в
выходную таблицу необходимо включить строку для k-го наиболь-шего
(начиная с максимума хmах) значения элемента выборки. В поле,
12
расположенное напротив флажка, вводится число k. Если k =1, то строка будет
содержать максимальное значение элемента выборки;
 k-й наименьший – устанавливается в активное состояние, если в
выходную таблицу необходимо включить строку для k-гo наименьшего
(начиная с минимума xmin) значения элемента выборке В поле,
расположенное напротив флажка, вводится число k. Если k = 1, то строка будет
содержать минимальное значение элемента выборки
Пример: Затраты, связанные с изготовлением бракованной продукции
по каждому из цехов завода «ХХХ» за 2008 год, приведены в таблице 1,
сформированной на рабочем листе Microsoft Excel.
Необходимо рассчитать основные показатели описательной статистики
и сделать соответствующие выводы.
Для решения задачи используем режим работы «Описательная
статистика». Значения параметров, установленных в одноименном
диалоговом окне, представлены на рисунке 2, а показатели, рассчитанные в
данном режиме, – в таблице 2 (результаты округлены до двух значащих цифр).
Таблица 1 – Затраты, связанные с изготовлением бракованной
продукции.
1
2
3
4
5
6
7
8
9
10
A
В
Затраты, связанные с изготовлением бракованной продукции
по каждому из цехов за 2008 г., тыс. руб.
Цех № 1
389,04
Цех № 2
417,78
Цех № 3
394
Цех № 4
371,96
Цех № 5
525,96
Цех № 6
405,12
Цех № 7
419,52
Цех № 8
401,93
Цех № 9
418,97
Таблица 2 – Результаты расчета
14
15
16
17
18
19
20
21
A
Столбец 1
Среднее
Стандартная ошибка
Медиана
Мода
Стандартное отклонение
Дисперсия выборки
B
416,0311111
14,71123677
405,12
#Н/Д
44,13371031
1947,784386
13
22
23
24
25
26
27
28
29
30
31
Эксцесс
Асимметричность
Интервал
Минимум
Максимум
Сумма
Счет
Наибольший (1)
Наименьший (1)
Уровень надежности (95,0 %)
6,063066502
2,259263465
154
371,96
525,96
3744,28
9
525,96
371,96
33,9241728
На основании проведенного выборочного обследования и рассчитанных
по данной выборке показателей описательной статистики (таблица 2) с
уровнем надежности 95 % можно предположить, что средние затраты,
связанные с изготовлением бракованной продукции по каждому из цехов
завода «ХХХ» за 2008 год, находились в пределах от 382,11 до 449,95 тыс. руб.
Поясним, на основании каких показателей описательной статистики был
сформирован соответствующий вывод. Такими показателями являются
средняя арифметическая выборки x (показатель Среднее в таблице 2) и
предельная ошибка выборки  (показатель Уровень надежности (95,0 %) в
таблице 2). Из выражения для доверительного интервала:
x   x  x 
находим: 416,03 – 33,92 = 382,11 – левая граница; 416,03 + 33,92 = 49,95
– правая граница.
Коэффициент вариации


x
*100% 
44,13
*100%  10,6%
416,03
существенно меньше 40 %, что свидетельствует о небольшом колебании
признака в исследованной выборочной совокупности. Надежность средней в
выборке подтверждается также и ее незначительным отклонением от
медианы: 416,03 – 405,12 = 10,91. Значительные положительные значения
коэффициентов асимметрии (As) и эксцесса (Ек) позволяют говорить о том, что
данное эмпирическое распределение существенно отличается от нормального,
имеет правостороннюю асимметрию и характеризуется скоплением членов
ряда в центре распределения.
Статистические функции программы Excel
Ниже приводятся описания
«Статистические» прпограммы Excel.
некоторых
из
функий
раздела
14
СРЗНАЧ (число1; число2, …). Возвращает среднее значение (среднее
арифметическое) аргументов. Например, если диапазон (Диапазон. Две или
более ячеек листа. Ячейки диапазона могут быть как смежными, так и
несмежными.) A1:A20 содержит числа, формула =СРЗНАЧ(A1:A20)
возвращает среднее значение этих чисел.
МЕДИАНА(число1, число2,...). Возвращает медиану заданных чисел.
Медиана — это число, которое является серединой множества чисел. Медиану
можно определить через функцию КВАРТИЛЬ(массив,часть). Медиана – это
второй квартиль.
МОДА.ОДН(число1,
число2,...).
Возвращает
наиболее
часто
встречающееся или повторяющееся значение в массиве или интервале данных.
Если набор данных не содержит повторяющихся точек данных, функция
МОДА.ОДН возвращает значение ошибки #Н/Д.
СТАНДОТКЛОН.В(число1,число2,...).
Оценивает
стандартное
отклонение по выборке. Логические значения и текст игнорируются.
СТАНДОТКЛОН.Г(число1, число2,...). Вычисляет стандартное
отклонение по генеральной совокупности, заданной аргументами. При этом
логические значения и текст игнорируются.
ДИСП.В(число1, число2,...). Оценивает дисперсию по выборке.
Логические значения и текст игнорируются.
ДИСП.Г(число1, число2,...). Вычисляет дисперсию для генеральной
совокупности. Логические значения и текст игнорируются.
МАКС (число1; число2; ...). Возвращает наибольшее значение из набора
зна-чений.
МИН (число1; число2; ...). Возвращает наименьшее значение в списке
аргументов.
СКОС (число1; число2; ...) Возвращает асимметрию распределения
относительно
среднего.
Асимметрия
характеризует
степень
несимметричности распределения относительно его среднего. Положительная
асимметрия указывает на отклонение распределения в сторону
положительных значений. Отрицательная асимметрия указывает на
отклонение распределения в сторону отрицательных значений.
ЭКСЦЕСС(число1, число2,...) Возвращает эксцесс множества данных.
Эксцесс характеризует относительную остроконечность или сглаженность
распределения по сравнению с нормальным распределением. Положительный
эксцесс
обозначает
относительно
остроконечное
распределение.
Отрицательный эксцесс обозначает относительно сглаженное распределение.
Задания
1. Смоделируйте два столбца по 500 нормально распределенных чисел
со средним значением 40 и стандартным отклонением 2. Рассматривая
смоделированные данные как генеральную совокупность, сделайте из них две
случайные выборки (по одной из каждого столбца) по 70 чисел.
15
Воспользуйтесь для анализа этих выборок инструментом анализ данных.
Интерпретируйте полученные результаты (см. пример).
Сделайте выводы.
2. Ниже приведена выборка чисел, имеющая объем n = 10:
12 7 4 9 0 7 3 4 2 7
Используя стандартные функции Excel:
2.1 Вычислите выборочное среднее, медиану и моду.
2.2 Вычислите размах, выборочную дисперсию, стандартное отклонение
и коэффициент вариации.
2.3 Опишите форму распределения этих данных.
3. Управляющий шинным заводом желает сравнить реальный
внутренний диаметр двух сортов шин, каждый из которых должен быть
равным 575 мм. Для оценки были выбраны по пять шин каждого сорта.
Результаты измерения их внутренних диаметров, упорядоченные по
возрастанию, приведены ниже.
Таблица 3 – Результаты измерения внутренних диаметров
568
570
Сорт Х
575
578
584
573
574
Сорт Y
575 577
578
3.1 Для каждого сорта шин вычислите выборочное среднее, медиану и
моду.
3.2 Какой сорт шин имеет более высокое качество? Почему?
4. Это задание можно выполнить любым способом: используя
инструмент Анализ данных или стандартные статистические функции.
Компания, производящая батарейки для ручных фонариков, создала
выборку из 13 батареек, произведенных за смену, и подвергла их испытанию
на длительность работы. Ниже приведено количество часов, которые
проработала каждая батарейка до момента отказа.
342 426 317 545 264 451 1049 631 512 266 492 562 298
4.1 Вычислите среднее арифметическое, медиану и моду.
4.2 Вычислите размах, дисперсию и стандартное отклонение.
4.3 Проанализируйте распределение времени работы батареек до
момента отказа.
5. Качество дневной продукции автомобильного предприятия
измеряется количеством автомобилей, требующих доработок после сборки.
Рассмотрим данные о качестве автомобилей за 15 дней:
30 34 9 14 28 9 23 0 5 23 25 7 0 3 24
16
а. Определите среднее, медиану, моду дневного выпуска бракованных
автомобилей
б. Определите размах, стандартное отклонение дневного выпуска
бракованных автомобилей
в. Определите квартили
г. Определите форму распределения
д. Сделайте выводы
6. Рассмотрим прочность хлопковых нитей на ткацкой фабрике (в
фунтах силы на разрыв) для выборки нитей, взятых со склада:
117 135 94 79 90 85 173 102 78 85 100 205 93 93 177 148 107
а. Определите среднее, медиану, моду прочности нити на разрыв
б. Определите размах, стандартное отклонение прочности нити на
разрыв
в. Определите квартили
г. Определите форму распределения
д. Сделайте выводы
Контрольные вопросы
1. Дайте определения следующим понятиям:
Генеральная совокупность
Выборка
Выборочное среднее
Медиана
Как найти медиану для набора данных:
а) с четным количеством значений?
б) с нечетным количеством значений?
Мода
Квартили
Размах
Стандартное отклонение
Дисперсия
Коэффициент вариации
Коэффициент асимметрии
Коэффициент эксцесса
2. Опишите работу с модуле «Анализ данных» Excel, какие
статистические характеристики он позволяет определять.
3. Расскажите о встроенных статистических функциях программы Excel.
4. Расскажите как можно охарактеризовать форму распределения с
использованием среднего значения и медианы, квартилей, коэффициентов
асимметрии и эксцесса.
17
5. Как влияют на форму распределения параметры: размах, дисперсия,
стандартное отклонение.
Структура отчета по лабораторной работе и правила его
оформления
1. Отчет является документом, свидетельствующим о выполнении
студентом лабораторной работы, и должен включать:
 титульный лист (Приложение 1);
 цели выполненной лабораторной работы;
 используемые материалы, технические и программные средства;
 термины и определения;
 описание задания (постановка задач, подлежащих выполнению в
процессе лабораторной работы, осуществляемая студентом.);
 описание основной части; результаты расчетов, представленные в
форме таблиц, графиков;
 обсуждение результатов выполнения лабораторной работы в виде
кратких обоснований, разъяснений, оценок, обобщений и выводов;
 приложения (при необходимости).
2. Оформление текста отчета о лабораторной работе выполняется в
соответствии с общими требованиями СТО ТПУ 2.5.01-2006.
3. Отчет
индивидуально.
оформляется
и
представляется
каждым
студентом
18
Лабораторная работа №2
Графическое представление данных
7 Простых японских методов
Цель работы: научиться использовать простые статистические методы
анализа данных для анализа причин проблем с качеством продукции,
процессов.
Задачи работы:
 ознакомиться с описанием примеров;
 построить в пакете Excel и проанализировать гистограмму;
 построить и проанализировать диаграмму Парето;
 построить диаграмму разброса, сделать выводы;
 построить диаграмму Исикавы, провести анализ возможных причин
проблем, обозначить их значимость;
 сделать выводы по работе.
1. Построение гистограммы.
Гистограмма – это серия столбиков одинаковой ширины, но разной
высоты, показывающая рассеяние и распределение данных. Ширина столбика
– это интервал в диапазоне наблюдений, высота – количество данных,
приходящихся на тот или иной интервал, т.е. частость. По существу,
гистограмма
отображает
распределение
исследуемого
показателя.
Гистограмма позволяет оценить характер рассеивания показателя и
разобраться в том, на чём следует сосредоточить усилия по улучшению.
Характерные типы гистограмм показаны на рис. 1.
Рисунок 1. Характерные типы гистограмм
На рис. 1, а показан обычный тип гистограммы с двусторонней
симметрией, что указывает на стабильность процесса.
19
На рис 1, б в распределении имеется два пика (двугорбая гистограмма).
Такая гистограмма получается при объединении двух распределений,
например, в случае двух видов сырья, изменения настройки процесса или
объединения в одну партию изделий, обработанных на двух разных станках.
Требуется расслоение продукции.
На рис. 1, в показана гистограмма с обрывом. Такое распределение
получается, когда невозможно получить значение ниже (или выше) некоторой
величины. Подобное распределение имеет место также, когда из партии
исключены все изделия с показателем ниже (и/или выше) нормы, т.е.
изначально это была партия с большим количеством дефектных изделий.
Такое же распределение получается, когда измерительные приборы были
неисправны.
На рис. 1, г показана гистограмма с островком. Получается при ошибках
в измерениях, или когда некоторое количество дефектных изделий
перемешано с доброкачественными.
На рис. 1, д показана гистограмма с прогалами («гребёнка»). Получается,
когда ширина интервала не кратна единице измерения или при ошибках
оператора.
На рис. 1, е показана гистограмма в форме плато. Получается, когда
объединяются несколько распределений при небольшой разнице средних
значений. В этом случае требуется расслоение.
Пример 1. Выявить характер рассеяния показателя качества изделий из
металлического материала.
Для определения характера рассеяния показателя строим гистограмму.
Порядок построения гистограммы:
1. Намечаем исследуемый показатель качества. В данном случае это
коэффициент деформации материала.
2. Проводим измерения. Должно быть не менее 30…50 данных,
оптимально – около 100.
Результаты измерений коэффициента деформации представлены в
Таблице 1.
Результаты измерений вводим в электронную таблицу. В ячейку А1
вводим заголовок работы. Начиная с ячейки А3 вводим в столбец порядковые
номера измерений с 1 по 100, например при помощи команды
ПравкаЗаполнитьПрогрессия… В ячейки В3:В102 вводим значения
коэффициента деформации из Таблицы 1.
3. Вводим единицу измерений. Единица измерений равна точности, с
которой проводились измерения, в данном случае 0,1. Вводим единицу
измерений в ячейку Е2.
20
Таблица 1 – Значения показателя качества
0,9
0,6
0,5
0,6
0,7
0,8
1,0
1,4
1,1
1,5
1,5
0,1
0,8
0,7
0,8
1,0
0,9
1,4
1,4
1,6
0,9
0,7
0,3
0,5
0,3
0,6
1,0
0,9
1,4
1,6
1,1
0,8
0,4
0,2
0,4
1,0
1,2
1,1
1,4
1,5
1,0
0,7
0,5
0,3
0,6
0,7
1,3
0,9
0,9
1,6
0,9
0,8
1,0
0,5
0,7
0,6
0,9
1,4
1,1
1,5
1,1
0,5
1,1
0,4
1,1
0,3
1,3
0,9
1,4
1,6
1,1
0,8
0,6
1,0
0,7
1,2
1,2
1,8
1,1
1,7
1,2
1,2
1,2
0,5
1,2
1,4
1,4
0,9
1,3
1,8
1,0
0,6
0,4
0,8
0,8
1,0
1,0
1,4
1,1
1,5
4. Находим минимальное и максимальное значения выборки.
Минимальное и максимальное значения выборки находим с помощью
статистических функций МИН и МАКС соответственно в ячейках Е3 и Е4.
При этом интервал для этих функций указываем от ячейки В3 до ячейки В102.
5. Находим размах выборки в ячейке Е5 как разность между
максимальным и минимальным значениями выборки.
6. Определяем предварительное количество интервалов Кпредв как
квадратный корень из объёма выборки N. Количество интервалов находим в
ячейке Е6. Поскольку количество интервалов должно быть целым числом, т.е.
полученный квадратный корень следует округлить до целого значения, то
сначала в ячейку Е6 вводим математическую функцию ОКРУГЛ. В строке
Количество цифр этой функции указываем 0, т.к. необходимо округление до
целого числа. Затем переводим курсор в строку Число и в качестве аргумента
функции ОКРУГЛ встраиваем функцию КОРЕНЬ. Для этого в строке формул
открываем список функций, выбираем Другие функции… и открываем
математическую функцию КОРЕНЬ. В качестве аргумента функции КОРЕНЬ
опять при помощи списка в строке формул выбираем статистическую
функцию СЧЁТ, в качестве аргумента которой вводим диапазон ячеек от В3
до В102. Поскольку функция СЧЁТ подсчитывает количество чисел в
указанном диапазоне, т.е. в данном случае объём выборки, то будет получено
значение 100. Затем функция КОРЕНЬ пересчитает это значение в 10, а
функция ОКРУГЛ округлит его до целых, т.е. до 10. В целом формула в ячейке
Е6 будет выглядеть примерно так:
=ОКРУГЛ(КОРЕНЬ(СЧЁТ(B3:B102));0).
7. Определяем ширину интервала в ячейке Е7 по формуле h =
R
Kпредв
с округлением до единицы измерения, т.е. в нашем случае до десятых долей.
Формула в ячейке Е7 будет выглядеть так:
=ОКРУГЛ(E5/E6;1).
21
8. Вводим номера интервалов. Для этого в ячейку D9 вводим заголовок
столбца «№ инт». Начиная с ячейки D10 вводим номера интервалов с 1
примерно до 25.
9. Рассчитываем границы и середины интервалов. В ячейке Е10
рассчитываем нижнюю границу первого интервала по формуле:
𝑋𝑚𝑖𝑛 −
ед. изм
2
Для этого в ячейку Е10 вводим формулу =E3-E2/2 и получаем значение
нижней границы первого интервала 0,05.
В ячейке Е11 рассчитываем нижнюю границу второго интервала,
прибавляя к нижней границе первого интервала значение шага. Формула в
ячейке Е11 будет выглядеть =E10+E7. После указания необходимой
абсолютной адресации копирует эту формулу в диапазон Е12:Е34.
В ячейке F10 рассчитываем верхнюю границу первого интервала,
прибавляя к его нижней границе значение шага. После указания необходимой
абсолютной адресации полученную формулу копируем в диапазон F11:F34.
В ячейке G10 рассчитываем среднее значение первого интервала,
например, по статистической формуле СРЗНАЧ. Полученную формулу
копируем в диапазон G11:G34.
Поскольку уже в десятом интервале нижняя граница равна 1,85. что
больше Xmax, то необходимое количество интервалов равно 9. Поэтому
содержимое ячеек диапазона D19:F34 следует очистить.
10. Подсчитываем частоты появления результатов измерений в
интервалах. В ячейке Н10 рассчитываем частоту для первого интервала при
помощи статистической функции СЧЁТЕСЛИ. Функция СЧЁТЕСЛИ
подсчитывает количество непустых ячеек в указанном диапазоне,
удовлетворяющих заданному условию. Следует подсчитать, сколько раз в
диапазоне B3:B102 встречаются ячейки, значения которых находятся в
границах первого интервала, т.е. больше 0,05, но меньше 0,25. Таким образом,
надо подсчитать ячейки, значения которых удовлетворяют двойному условию.
Однако функция СЧЁТЕСЛИ использует только одинарное условие. Поэтому
в формуле, записываемой в ячейке Н10, функцию СЧЁТЕСЛИ используем
дважды. Сначала в функции СЧЁТЕСЛИ вводим диапазон В3:В102 и условие
“>0,05” (к сожалению, нельзя указать условие ‘>E10”, ссылаясь на значение
нижней границы интервала, поскольку функция СЧЁТЕСЛИ использует
условие критерий в форме числа, выражения или текста, но не в форме ссылки
на ячейку). Затем переводим курсор в строку формул, ставим знак минус,
вновь вводим функцию СЧЁТЕСЛИ, указываем в ней диапазон В3:В102 и
условие “>0,25”. В результате получаем расчётную формулу:
=СЧЁТЕСЛИ(B3:B102;">0,05")-СЧЁТЕСЛИ(B3:B102;">0,25"),
22
по которой рассчитывается частота для первого интервала. После
указания абсолютной адресации для интервалов копируем эту формулу в
диапазон Н11:Н18. Поскольку в копируемой формуле границы интервалов
были указаны численными значениями, то в формулах ячеек диапазона
Н11:Н18 следует исправить численные значения границ на соответствующие
тому или иному диапазону. Например. в ячейке Н11 формула будет выглядеть
так:
=СЧЁТЕСЛИ($B$3:$B$102;">0,25")-ЧЁТЕСЛИ($B$3:$B$102;">0,45").
Результаты расчётов показаны на рис. 2.
Рисунок 2. Расчёт данных для построения гистограммы в примере 1
11. Строим гистограмму распределения. Открываем мастер диаграмм,
выбираем тип «Гистограмма» и вид «Обычная гистограмма» отображает
значения различных категорий. На втором шаге на вкладке «Диапазон»
данных указываем диапазон Н10:Н18. На вкладке Ряд в строке «Подписи по
Х» указываем диапазон G10:G18 (возможно указание диапазона Е10:F18). На
третьем шаге вводим заголовки по осям, а также убираем легенду и линии
сетки. После создания диаграммы редактируем её, используя контекстное
меню. В частности, открыв контекстное меню на одном из столбцов
диаграммы, выбираем команду «Формат рядов данных», вкладку
«Параметры», и устанавливаем ширину зазора 0.
Готовая гистограмма показана на рис. 2а.
Возможно представление гистограммы в виде непрерывной кривой или
ломаной линии. Для этого надо в области гистограммы открыть контекстное
меню, выбрать команду «Тип диаграммы», выбрать диаграмму «Точечная» и
соответствующий её вид. (Рис. 2б, в).
23
а
б
25
частота f
20
15
10
5
0
0.15
0.35
0.55
0.75
0.95
1.15
1.35
1.55
1.75
коэффициент деформации
в
25
частота f
20
15
10
5
0
0
0.5
1
1.5
2
коэффициент деформации
Рисунок 2. Гистограмма в виде столбиковой диаграммы (а), ломаной
линии (б) и непрерывной кривой (в).
Полученная гистограмма близка к обычной гистограмме с двусторонней
симметрией, что указывает на стабильность процесса.
Задание:
1. По результатам измерения длины деталей, мм (Таблицы 2) построить
гистограмму.
2. Рассчитать среднее, дисперсию и размах данных с помощью
программы Excel.
14.57
14.53
14.68
14.78
14.95
14.58
Таблица 2 – Значения измерений длины деталей
14.94 14.5 14.93 14.68 14.44 14.75 14.65
14.85 14.56 14.6 14.86 14.66 14.7 14.41
24
14.57
14.67
14.56
14.26
14.55
14.12
14.66
14.79
15.14
14.45
14.37
14.32
14.24
14.43
14.81
14.4
14.46
14.36
14.58
14.14
14.42
14.5
14.88
14.47
14.52
14.6
14.59
14.51
14.03
14.46
14.96
14.67
14.33
14.48
14.54
14.38
14.35
14.15
14.94
14.73
14.65
14.44
14.8
14.18
14.48
14.4
14.84
14.43
15.06
14.82
14.5
14.53
14.52
14.22
14.62
14.8
14.69
14.61
14.38
14.27
14.51
14.61
14.92
14.55
14.77
14.59
14.49
14.63
14.64
14.45
14.51
14.71
14.79
14.64
14.7
14.78
14.54
14.62
14.71
15.04
2. Применение метода стратификации (расслоения) данных.
Стратификация — разделение полученных данных на отдельные группы
(слои, страты) в зависимости от выбранного стратифицирующего фактора.
В качестве стратифицирующего фактора могут быть выбраны любые
параметры, определяющие особенности условий возникновения и получения
данных:
 различное оборудование;
 операторы, производственные бригады, участки, цехи, предприятия и
т. п.;
 время сбора данных;
 разные виды сырья;
 различие используемых станков, средств измерения и т. д.
При отсутствии учета стратифицирующего фактора (расслоения
данных) происходит их объединение и обезличивание, затрудняющее
установление действительной взаимосвязи между полученными данными и
особенностями их возникновения.
Например, при анализе источника дефектной продукции, поставляемой
предприятию несколькими сторонними поставщиками, целесообразно в
качестве стратифицирующего фактора выбрать поставщиков и произвести
стратификацию дефектной продукции по поставщикам.
Задание:
Обратимся к результатам измерений параметра случайной величины Х.
Допустим, что экземпляры 1–50 изготовлены исполнителем А, а экземпляры
50–100 исполнителем В.
Результаты измерений
(ширина интервала)
…
Таблица 3 – Результаты измерений
Частота
Исполнитель А Исполнитель В
Сумма
25
…
….
Итого:
По данным таблицы 3 построить гистограмму результатов измерений
(по исполнителям) с помощью программы Excel.
3. Построение диаграммы Парето.
Диаграмма Парето строится в виде столбчатого графика и показывает в
убывающем порядке относительное влияние каждой причины на общую
проблему. Кроме того, на диаграмме обычно приводят кумулятивную кривую
накопленного процента причин.
Диаграмма Парето позволяет анализировать проблемы из любой сферы
деятельности предприятия, в том числе в сфере управления качеством.
Причины изменений качества делятся на две группы: немногочисленные
существенно важные и многочисленные несущественные. Устраняя причины
первой группы, можно устранить почти все потери, вызванные снижением
качества.
Диаграмму Парето целесообразно применять вместе с причинноследственной диаграммой.
При использовании диаграммы Парето обычно сначала строят
диаграмму по результатам деятельности для выявления главной из
существующих проблем. Затем строят диаграмму по причинам для выявления
главных причин этой проблемы и её решения и т.д. После проведения
корректирующих мероприятий диаграмму Парето можно вновь построить и
проверить эффективность проведённых улучшений.
При использовании диаграммы Парето для контроля важнейших
факторов распространён АВС-анализ. Например, если на складе находится
большое число деталей, проводить контроль всех деталей без всякого
различия неэффективно. Но если разделить детали на группы по их стоимости,
то на долю группы наиболее дорогих деталей (группа А), составляющих 2030% от общего числа деталей, придётся 70-80% от общей стоимости всех
деталей. На долю группы самых дешёвых деталей (группа С), составляющей
40-50% от всего количества деталей, придётся всего 5-10% от общей
стоимости. Стоимость промежуточной группы (группа В) составляет 20-30%
от общей стоимости. Контроль деталей на складе будет эффективным, если
контроль деталей группы А будет самым жёстким, а контроль деталей группы
С – упрощённым.
Рекомендуется составлять несколько вспомогательных диаграмм,
входящих в состав группы А, с тем чтобы, последовательно анализируя их, в
конечном итоге составить отдельную диаграмму Парето для конкретных
явлений недоброкачественности.
Пример 2. Исследовать проблему появления брака при выпуске деталей.
26
С учётом того, что потери от брака одной детали каждого вида примерно
одинаковы, в качестве единицы измерения выбираем число дефектных
деталей каждого вида. После заполнения контрольных листков получаем
данные, представленные в Таблице 6.
Таблица 4 – Число дефектных деталей
№ детали
1
2
Число дефектных деталей 255 101
3
59
4
39
5
26
6
15
Прочие
11
По полученным данным разрабатываем таблицу для проверок данных.
Создаём новую книгу Excel. В ячейке А1 вводим заголовок работы. В ячейки
А3:Е3 вводим заголовки: «№ детали», «Число дефектных деталей»,
«Накопленная сумма деталей», «Процент деталей», «Накопленный процент».
Для компактного размещения заголовков выделяем третью строку и
используем
команду
ФорматФормат
ячеекВыравнивание
по
вертикалиПо центру, режим отображенияПереносить по словам.
В ячейки А4:В10 вводим данные из Таблицы 4. В ячейку А11 вводим
заголовок «Итого». В ячейке В11 рассчитываем суммарное число дефектных
деталей при помощи математической формулы СУММ.
Для расчёта накопленной суммы деталей в ячейку С4 вводим значение
255, т.е. число дефектных деталей 1. В ячейке С5 суммируем число дефектных
деталей 1 и 2, т.е. вводим формулу:
=C4+B5.
Для расчёта накопленной суммы деталей в остальных ячейках копируем
формулу из ячейки С5 в диапазон С6:С10.
Для расчёта процента деталей следует делить число дефектных деталей
каждого вида на общее число дефектных деталей и умножать на 100. Таким
образом, в ячейку D4 вводим формулу:
=B4/B11*100.
После указания необходимой абсолютной адресации копируем эту
формулу в диапазон D5:D10. В ячейке D11 рассчитываем суммарный процент,
который должен составить 100%.
Для расчёта накопленного процента деталей в ячейку Е4 значение
(только значение, а не формулу) из ячейки D4. Для этого используем команды
ПравкаКопировать и ПравкаСпециальная вставка. В ячейке Е5
суммируем процент дефектных деталей 1 и 2, т.е. вводим формулу:
=E4+D5.
Для расчёта накопленного процента в остальных ячейках копируем
формулу из ячейки Е5 в диапазон Е6:Е10.
27
По таблице для проверок данных строим диаграмму Парето. Для этого
открываем в мастере диаграмм вкладку «Нестандартные», выбираем
диаграмму типа «График/гистограмма 2». На втором шаге указываем диапазон
данных А4:В10; Е4:E10. На третьем шаге вводим заголовки и убираем легенду.
После создания диаграммы мастером диаграмм редактируем её при
помощи контекстных меню. В частности, максимальное значение шкалы
«Число дефектных деталей» указываем 506, а минимальное 0. Максимальное
значение шкалы «Накопленный процент» указываем 100. Открываем
контекстное меню на одном из столбцов, выбираем команду «Формат рядов
данных», вкладку «Параметры», и устанавливаем ширину зазора 0.
Результаты расчётов и построений показаны на рис. 3.
Рисунок 3. Построение диаграммы Парето по числу дефектных деталей
Как видно из диаграммы, к группе А можно отнести детали 1 и 2 (70% от
брака), к группе В – детали 3,4,5, к группе С – детали 6 и прочие.
Для выяснения наиболее важных дефектов целесообразно построить
диаграммы Парето по явления дефектности в деталях 1 и 2.
Рассмотрим построение такой диаграммы для детали 1. В качестве
единицы измерения выбираем сумму потерь от брака, млн. руб. После
исследования явлений дефектности получили данные, представленные в
Таблице 5.
Таблица 5 – Потери от брака
Дефект
Шаг резьбы завышен
Сумма потерь, млн. руб.
1,5
28
На режущей кромке резца налипы
Зависание
Пропуск операции
Осталась чернота
Скос кромки увеличен
Наружный диаметр занижен
Прочие
6,9
1,9
0,4
0,9
0,6
8,3
0,2
Диаграмма Парето, построенная по этим данным, показана на рис. 4.
Рисунок 4. Диаграмма Парето по дефектам детали 1
Как видно из диаграммы, к группе А можно отнести занижение
наружного диаметра и налипы на режущей кромке резца (73% от суммы
потерь), к группе В – зависание, завышение шага резьбы, остаточную черноту,
к группе С – увеличение скоса кромки, пропуск операции и прочие.
Для выяснения наиболее важных причин потерь целесообразно построить
диаграммы Парето по причинам занижения наружного диаметра и налипов на
режущей кромке резца.
При построении такой диаграммы для причин занижения наружного
диаметра после заполнения контрольных листков получили данные,
представленные в Таблице 6.
Таблица 6 – Причины брака
Причина
Число дефектов
29
Смещение копира
Неопытность оператора
Неточность рабочего инструмента
Устаревший чертёж
Ошибки в управлении станком
Неточность станка
Прочие
53
11
4
98
20
8
7
По этим данным необходимо построить диаграмму Парето, выявить
причины занижения наружного диаметра группы А и провести по ним
корректирующие мероприятия. После этого можно вновь построить
диаграмму Парето для изменившихся условий, чтобы проверить
эффективность улучшений.
Задание:
3.1 Построить диаграмму Парето по следующим данным
Таблица 7 – Контрольный листок
Типы дефектов
(пороков)
Число дефектов
(пороков), м. пог.
Концевые
Складки
Засечки
Вмятины
Грязь
Прочие
Итого
156
51
36
24
12
18
300
На основе контрольного листка заполнить Таблицу 8 и построить
диаграмму Парето с помощью программы Excel, сделать выводы.
Таблица 8 – Доля дефектов в процентах
Тип
дефекта
Число
дефектов
Накопленная
 числа
дефектов
% числа каждого
дефекта от общей 
Накопленный
процент
Итого
3.2 Построить диаграмму Парето по данным, представленным в
таблице 8 - частота появления дефектных изделий в механическом цехе(№4)
за январь-декабрь 2011 года, сделать выводы.
Наименование
Таблица 9 – Частота появления дефектных изделий
Частота
Часто
та
30
абсол
ютная
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
11
1
1111111111111111111111111111111111111111111111
111111111111111111111111111111111111
11
111
111111111111111111111111111
111111111111111111
1111111111111111111111111111111111111111111111111111
111111
1111111111111111111111111111111111111111111111111111
1111
1111111
1
11
1111111111111111
11
11
111
1111111111111111111111111111111111111111111111111111
11111111111111111111111111111111111111111111111111
1111111111111111111111111111
1
1111111111111111111111111111111111111111111111
1111111111111111111111
11111111111111111111111111111111111111111111111
11111111111111111111111111111111111
1111111
111
111111111
111111
111111111
11
1111111111111111111111111
1111
1111111111111111111111111111111111111111111111111111
111111111111111111111111111111111111111111
1111
1111111111111111111111111
1111111111111
1111111111111111111
11111111111111111111111111111111111111111111111
2
1
46
36
2
3
27
18
58
56
7
1
2
16
2
2
3
102
28
1
46
22
47
35
7
3
9
6
9
2
25
4
94
4
25
13
19
47
4. Построение диаграммы разброса.
31
Диаграммой
разброса
(рассеивания)
называется
графической
изображение взаимосвязи между случайными величинами x и y. Значения
случайных величин x , y получаются из опыта, строится диаграмму и по виду
диаграммы делается вывод о существовании корреляции (взаимосвязи) между
параметрами x и y.
Диаграмма разброса представляет вид графика, выстроенного путем
нанесения в определенном масштабе экспериментальных точек, полученных в
результате наблюдений. Координация точек на графике соответствует
значениям рассматриваемой величины и влияющего на него фактора.
Расположение точек показывает наличие и характер взаимосвязи между двумя
переменными. По полученным экспериментальным точкам могут быть
определены и числовые характеристики связи между рассматриваемыми
случайными величинами – коэффициент корреляции и коэффициенты
регрессии.
Последовательность построение диаграммы рассеивания:
Шаг 1. Выбор переменных (факторов) для анализа.
Шаг 2. Сбор парных данных (x, y), между которыми исследуется зависимость.
Шаг 3. Построение осей и выбор шкал.
Шаг 4. Построение графика.
Пример построения диаграммы разброса:
В таблице 10 приведены данные о давлении воздуха и доле дефектов
изделий в рабочие дни.
Таблица 10 – Данные для построения диаграммы разброса
Дата
Давление,
кПа
Доля дефектов,
%
Дата
Давление,
кПа
Доля дефектов,
%
1.07.02
0,86
0,889
22.07.02
0,87
0,892
2.07.02
0,89
0,884
23.07.02
0,85
0,877
3.07.02
0,88
0,874
24.07.02
0,92
0,885
4.07.02
0,88
0,891
25.07.02
0,85
0,886
5.07.02
0,84
0,874
26.07.02
0,83
0,896
8.07.02
0,87
0,886
29.07.02
0,87
0,896
9.07.02
0,92
0,911
30.07.02
0,93
0,928
10.07.02
0,86
0,912
31.07.02
0,89
0,886
11.07.02
0,92
0,895
1.08.02
0,89
0,908
12.07.02
0,87
0,896
2.08.02
0,83
0,881
15.07.02
0,84
0,894
5.08.02
0,87
0,882
16.07.02
0,82
0,864
6.08.02
0,89
0,904
17.07.02
0,92
0,922
7.08.02
0,87
0,912
18.07.02
0,87
0,909
8.08.02
0,91
0,925
19.07.02
0,94
0,905
9.08.02
0,87
0,872
Для построения диаграммы разброса в Excel необходимо нажать
ВставкаДиаграммаТочечная.
32
После вставки диаграммы можно добавить линию регрессии. Для этого
нужно нажать на одной из точек правой кнопкой мыши и выбрать команду
«Добавить линию тренда», тип – Линейная.
0.94
0.93
0.92
0.91
0.9
0.89
0.88
0.87
0.86
0.8
0.82
0.84
0.86
0.88
0.9
0.92
0.94
0.96
Рисунок 5. Диаграмма рассеивания для давления воздуха и доли
дефектов
Задание:
В таблице 11 приведены произведенное количество изделий и затраты
на производство за неделю.
Таблица 11 – Затраты на производство
Количество
изделий
22
30
26
31
36
30
22
45
38
3
Затраты, дол.
3470
3783
3856
3910
4489
3676
3221
4579
4325
14131
Количество
изделий
30
38
41
27
28
31
37
32
41
Затраты,
дол.
3689
3999
4158
3666
3885
3574
4495
3814
4430
1.
Постройте диаграмму разброса, у которой по оси X отложено
количество изделий, а по оси У — затраты.
33
2.
Существует ли зависимость между количеством изделий и
затратами на производство?
3. Посчитайте коэффициент корреляции.
Коэффициент корреляции можно определить через функцию Excel
КОРРЕЛ, которая вычисляют коэффициент корреляции между двумя
переменными измерений, когда для каждой переменной измерение
наблюдается для каждого из N субъектов.
5. Построение диаграммы Исикавы.
Данная диаграмма представляет собой наиболее эффективный метод
проверки различных гипотез о потенциальных причинах проблемы качества.
Идея диаграммы состоит в установлении взаимосвязей между показателями
качества – следствием – и воздействующими на него факторами – причинами.
Для построения диаграммы Исикавы сначала в общих чертах выявляются
главные причины, отображаемые в виде «больших костей», затем каждая
причина рассматривается более детально, пр этом выделяются причины
второго и третьего уровня («средние» и «мелкие» кости). При этом следствие,
результат или проблема обозначаются на правой стороне диаграммы, а
главные воздействующие факторы или причины перечисляются на левой
стороне. Главные причины при построении диаграммы Исикавы
группируются по следующим факторам: «человек», «машина», «метод»,
«контроль, управление (менеджмент)», «среда», «материал».
Алгоритм построения диаграммы Исикавы:
1. Определить показатель качества и написать его в середине правого края
чистого листа бумаги.
2. Слева направо провести центральную прямую линию, записанный
показатель заключить в прямоугольник.
3. Написать главные причины, влияющие на показатель качества,
заключить их в прямоугольники и соединить с центральной линией стрелками.
4. Написать причины (вторичные), влияющие на главные причины, и
расположить их в виде "стрелок", примыкающих к стрелкам главных причин.
5. Написать причины третичного порядка, влияющие на «вторичные»
причины, и расположить их в виде «стрелок», примыкающих к стрелкам
вторичных причин.
6. Проранжировать факторы по их значимости и выделить особо важные,
оказывающие предположительно наибольшее влияние на показатель качества.
Наглядно Диаграмма Исикавы представлена на рис. 5.
34
Рисунок 6. Пример диаграммы Исикавы
Задание:
1.Сформулировать проблему.
2. Построить причинно-следственную диаграмму для выявления ее
причин.
Контрольные вопросы
1. Дайте определения следующим понятиям:
гистограмма, полигон, полигон интегральных процентов, кумулятивная
кривая, диаграмма Парето, стратификация, диаграмма разброса,
коэффициент корреляции, контрольный листок.
2. Достоинства и недостатки использования гистограммы.
3. Для чего используется диаграмма Парето.
4. Правила построения гистограммы.
5. Какие виды гистограмм бывают, на что указывают?
6. Какие выводы можно сделать, используя гистограмму для описания
распределения частот?
7. Этапы построения диаграммы Парето.
8. Указывает ли диаграмма разброса на наличие причинно-следственной
связи между параметрами? Почему?
35
Структура отчета по лабораторной работе и правила его
оформления
1. Отчет является документом, свидетельствующим о выполнении
студентом лабораторной работы, и должен включать:
 титульный лист (Приложение 1);
 цели выполненной лабораторной работы;
 ответы на контрольные вопросы;
 описание задания (постановка задач, подлежащих выполнению в
процессе лабораторной работы, осуществляемая студентом.);
 описание основной части; результаты расчетов, представленные в
форме таблиц, графиков;
 обсуждение результатов выполнения лабораторной работы в виде
кратких обоснований, разъяснений, оценок, обобщений и выводов;
 приложения (при необходимости).
2. Оформление текста отчета о лабораторной работе выполняется в
соответствии с общими требованиями СТО ТПУ 2.5.01-2006.
3. Отчет оформляется и представляется каждым студентом
индивидуально в печатном и электронном виде.
36
Лабораторная работа №3
Законы распределения вероятностей
Вычисление вероятностей дискретных и непрерывных случайных
величин в программе Excel
Цель работы: научиться использовать законы распределения
вероятностей случайных величин для решения задач статистического
контроля качества; научиться использовать графическую и табличную формы
представления распределения вероятностей случайных величин в пакете
Excel.
Задачи работы:
 задать таблично и графически распределения вероятностей
случайных величин в пакете Excel;
 решить предложенные задачи о применении распределения
вероятностей случайных величин для решения задач контроля качества;
 проанализировать полученные результаты.
Основные понятия:
Случайная величина; непрерывная случайная величина; дискретная
случайная величина; вероятность; генеральная совокупность; выборка;
математическое ожидание; дисперсия; стандартное отклонение; закон
распределения плотности вероятности случайной величины; нормальное
распределение; стандартное нормальное распределение; функция Лапласа.
Теоретические основы
Качество продукции оценивается при помощи тех или иных
показателей. Показатели качества (признаки качества) могут быть
количественными или качественными. Количественный признак выражается
численным значением, например, длиной детали, мощностью изделия и т.п.
Если партия продукции состоит из единиц продукции (например, из изделий),
то в каждой единице продукции количественный признак качества принимает
некоторое случайное значение, т.е. является случайной величиной и имеет
некоторое распределение.
Случайная величина Х называется дискретной, если она может
принимать конечное или счетное число различных значений х1, х2, х3…..
Примеры:
 при подсчете числа простоев станка за смену (0, 1, 2 ….);
 при подсчете числа дефектов (несоотвествий) в выборке из партии
продукции;
 при подсчете количества единиц транспорта на перекрестке в
определенное время дня.
Один из способов задания случайной величины – с помощью функции
распределения – вероятности того, что случайная величина X окажется
меньше некоторого значения x.
37
F(x) = P*(X < x)
Этот способ задания случайной величины может быть использован как
для дискретной, так и для непрерывной случайной величины.
Основные свойства функции распределения:
её значения лежат в промежутке от 0 до 1
F(-∞) = 0, F(∞)=1.
Функция F(x) – монотонно неубывающая: при x2>x1, F(x2)≥F(x1).
Функция распределения непрерывной случайной величины кроме того
непрерывна и дифференцируема.
Законом распределения случайной величины называется всякое
соответствие между возможными значениями случайной величины и
соответствующими им вероятностями. Закон распределения случайной
величины может быть задан в виде таблицы, функции распределения и
плотности распределения.
Если задача позволяет явно записать математическое выражение,
представляющее случайную величину, можно вычислить точную вероятность
любого ее значения. В этом случае можно вычислить и перечислить все
значения функции распределения.
Биномиальное распределение
Биномиальное распределение используется для оценки количества
успехов в выборке, состоящей из n наблюдений.
Таким образом, случайная величина, подчиняющаяся биномиальному
закону распределения, принимает значения от 0 до n.
Биномиальное распределение используется для моделирования
ситуаций, характеризующихся следующими особенностями.
Выборка состоит из фиксированного числа элементов n,
представляющих собой исходы некоего испытания.
Каждый
элемент
выборки
принадлежит
одной
из
двух
взаимоисключающих
категорий,
исчерпывающих
все
выборочное
пространство. Как правило, эти две категории называют успех и неудача.
Вероятность успеха р является постоянной. Следовательно, вероятность
неудачи равна 1-р.
Исход (т.е. удача или неудача) любого испытания не зависит от
результата другого испытания.
Чтобы гарантировать независимость исходов, элементы выборки, как
правило, получают с помощью двух разных методов. Каждый элемент
выборки случайным образом извлекается из бесконечной генеральной
совокупности без возвращения или из конечной генеральной совокупности с
возвращением.
Количество вариантов выбора X объектов из выборки, содержащей n
элементов, определяется по формуле Сочетания:
38
𝑛!
𝑛
= ( ),
𝑋
𝑋! (𝑛 − 𝑋)!
где n!=1*2*…*n - факториал числа n, причем 0!=1 и 1!=1.
Формула биноминального распределения:
Р(х) =
𝑛!
× 𝑃 𝑥 × (1 − 𝑃)𝑛−𝑥 ,
𝑥! × (𝑛 − 𝑥)!
где Р(Х) – вероятность Х успехов при заданном объеме выборки n и
вероятности успеха р, Х = 0,1,2, … ,n.
Гипергеометрическое распределение
Гипергеометрическое распределение, как и биномиальное, позволяет
оценить количество успехов в серии из n испытаний.
Разница между ними заключается лишь в способе получения исходных
данных.
В биномиальной модели данные выбираются либо из конечной
генеральной совокупности с возвращением либо из бесконечной генеральной
совокупности без возвращения.
В гипергеометрической модели данные извлекаются только из конечной
генеральной совокупности без возвращения.
Таким образом, в то время как в биномиальной модели вероятность
успеха р остается постоянной, а испытания не зависят друг от друга, в
гипергеометрической модели эти условия не выполняются. Наоборот, в
гипергеометрической модели каждый исход зависит от предыдущих исходов.
Гипергеометрическое распределение, описывающее вероятность X
успехов при заданных параметрах n, N и А, задается формулой:
 A   N  A
 X  n  X 

P( X )    
N
n 
 
где Р(Х) – вероятность X успехов при заданных n, N и А, n – объем
выборки, N –объем генеральной совокупности, А – количество успешных
исходов в генеральной совокупности, N-А – количество неудачных исходов в
генеральной совокупности, X – количество успехов в выборке,
N-X – количество неудачных исходов в выборке.
Количество успехов X в выборке не может превосходить количество
успехов А в генеральной совокупности либо объем выборки n. Таким образом,
диапазон значений, которые может принимать случайная величина,
подчиняющаяся гипергеометрическому распределению, ограничен либо
39
объемом выборки (как и диапазон биномиальной переменной), либо объемом
генеральной совокупности.
Распределение Пуассона
Пуассоновский процесс (Poisson process) возникает в ситуациях,
обладающих следующими свойствами. Нас интересует, сколько раз
происходит некое событие в заданной области возможных исходов случайного
эксперимента. Область возможных исходов (area of opportunity) может
представлять собой интервал времени, отрезок, поверхность и т.п.
Вероятность данного события одинакова для всех областей возможных
исходов. Количество событий, происходящих в одной области возможных
исходов, не зависит от количества событий, происходящих в других областях.
Вероятность того, что в одной и той же области возможных исходов данное
событие происходит больше одного раза стремится к нулю по мере
уменьшения области возможных исходов.
Распределение Пуассона имеет один параметр λ (греческая буква
«лямбда»). Этим параметром является среднее количество успешных
испытаний в заданной области возможных исходов.
Распределение Пуассона описывается формулой:
𝑒 𝜆 ∙ 𝜆𝑋
𝑃(𝑋) =
𝑋!
где Р(Х) – вероятность X успешных испытаний, λ – ожидаемое
количество успехов, е– основание натурального логарифма, равное 2,71828,
X– количество успехов в единицу времени.
Для того, чтобы запомнить в чем отличие этих распределений, можно
воспользоваться схемой:
40
Рисунок 1. Схема выбора распределений
Непрерывные случайные величины
Непрерывные случайные величины возникают в результате измерений,
результатом которых может являться любая величина, принадлежащая
числовой оси или интервалу.
Вероятность попадания случайной величины в некоторый интервал
равна разности значений функции распределения в концах этого интервала:
Р (x1<X<x2) = F(x2) – F(x1)
Часто непрерывная случайная величина задается с помощью
производной от функции распределения, которая называется плотностью
распределения вероятности:
f(x) = F’(x)
Дифференциальная (или весовая) функция (или плотность)
распределения f(x) случайной величины является производной от
интегральной функции. Она приближённо равна отношению вероятности
попадания случайной величины внутрь некоторого интервала к длине этого
интервала. Вероятность попадания случайной величины в некоторый интервал
равна площади под кривой дифференциальной функции распределения в этом
интервале. Площадь под всей кривой дифференциальной функции равна
единице.
Основные свойства плотности распределения:
41
• плотность распределения неотрицательна (кривая распределения всегда
лежит в верхней полуплоскости)
• площадь, ограниченная кривой распределения и осью абсцисс, равна
единице (условие нормировки)
• вероятность попадания случайной величины в промежуток [х1, х2)
равна:
𝑥2
𝑃(𝑥1 ≤ 𝑋 < 𝑥2 ) = ∫ 𝑓(𝑥)𝑑𝑥
𝑥1
Наиболее часто количественный показатель качества имеет
приблизительно нормальное распределение.
Нормальным распределением (или законом Гаусса) называется
распределение непрерывной случайной величины, плотность которой
определяется по формуле:
𝑓(𝑥) =
1
𝜎√2𝜋
(𝑥−𝑚)2
−
𝑒 2𝜎2 ,
Любое нормальное распределение имеет два параметра, однозначно
определяющих его: математическое ожидание показателя  и среднее
квадратичное отклонение  (или дисперсия 2) как мера рассеяния показателя.
К сожалению, вычислить математическое выражение, заданное
формулой довольно сложно.
Чтобы упростить задачу, значения плотности нормального
распределения, как правило, табулируют.
Поскольку количество возможных комбинаций параметров  и σ
бесконечно, для вычислений понадобилось бы бесконечное количество
таблиц.
Однако, если нормировать данные, все распределения можно свести к
одной таблице.
Используя
формулу
преобразования,
любую
нормально
распределенную случайную величину X можно преобразовать в
нормированную нормально распределенную случайную величину Z:
𝑍=
𝑋−𝜇
.
𝜎
В частном случае параметр  = 0, σ = 1.
Нормальное распределение N(0,1) называется стандартным нормальным
распределением.
В этом случае плотность распределения
42
𝑓(𝑥) =
1
1 2
√2𝜋
𝑒 −2𝑍 .
Функцию распределения стандартного нормального распределения
N(0,1) называют функцией Лапласа (функция распределения нормально
распределенной случайной величины).
Она имеет специальное обозначение:
Ф(𝑥) =
1
√2𝜋
𝑥
𝑡2
−
∫ 𝑒 2 𝑑𝑡.
−∞
Эта функция табулирована, например, Ф (2,48) = 0,9934.
Из симметрии графика функции вытекает соотношение ^
Ф(-х) = -Ф(х).
Ход выполнения работы
1. Расчет вероятностей
1.1 Биноминальное распределение.
Вычислите следующие вероятности:
а. P(X=0), если n=4, p=0.12
б. P(X=9), Р(Х≤8), Р(Х<6) если n=10, p=0,4
в. P(X=8), Р(Х≤7), Р(Х>5) если n=10, p=0,5
г. P(X=5), Р(Х≤3), Р(Х>2) если n=6, p=0,83
д. P(X=9), если n=10, p=0,9
Методика работы в Excel
Вычисление биномиальных вероятностей
Создать рабочий лист, использующий для вычисления биномиального
распределения функцию БИНОМРАСП. Вызов этой функции имеет
следующий вид:
БИНОМРАСП(Х; n; р; cumulative)
Здесь параметр X – количество успехов, n – объем выборки, р –
вероятность успеха, cumulative – величина, принимающая значение ИСТИНА
или ЛОЖЬ (в первом случае вычисляется вероятность не менее X событий, а
во втором – вероятность точно X событий).
43
Таблица 1- Фрагмент рабочего листа в Excel «Биномиальные
вероятности»
АВ
12
13
14
x
0
15
1
16
2
17
3
18
4
1.2
а.
б.
в.
г.
С
D
Е
Таблица биномиальных вероятностей
Р(<х)
Р(х)
Р(≤х)
=БИНОМРАСП
=
БИНОМРАСП =D14(В14;$В$4;
(B14;
$B$4; C14
$В$5; ЛОЖЬ)
$В$5; ИСТИНА)
=БИНОМРАСП
=
БИНОМРАСП =D15(В15;$В$4;
(В15;$В$4;
C15
$В$5; ЛОЖЬ)
$B$5; ИСТИНА)
=
БИНОМРАСП =БИНОМРАСП
= D16(В16;$В$4;
(В16;$В$4,
C16
$В$5; ЛОЖЬ)
$В$5; ИСТИНА)
=
БИНОМРАСП =БИНОМРАСП (B17; =D17(B17;$B$4;
$B$4;
C17
$В$5; ЛОЖЬ)
$В$5; ИСТИНА)
=БИНОМРАСП
=БИНОМРАСП
= D18(В18;$В$4;
(В18;$В$4,
C18
SB$5; ЛОЖЬ)
$В$5, ИСТИНА)
F
G
P(>x) P(≥x)
=1-D14 =1-E14
=1-D15 =1-E15
=1-D16 =1-E16
=1-D17 =1-E17
=1-D18 =1-E18
Гипергеометрическое распределение
1.2.1. Вычислить вероятности:
P(X=3), если n=4, N=10 и A=5
P(X=1), если n=4, N=6 и A=3
P(X=0), если n=5, N=12 и A=3
P(X=3), если n=3, N=10 и A=3
1.2.2 В партии 15 жестких дисков обнаружено 5 дефектных.
Предположим, что проверке подвергается 4 диска.
а. Какова вероятность того, что среди них окажется только 1
дефектный?
б. Какова вероятность того, что среди них окажется по крайней мере 1
дефектный?
в. Какова вероятность того, что среди них окажется не более двух
дефектных?
г. Каково ожидаемое среднее количество дефектных изделий в выборке
из 4 дисков?
44
Методика работы в Excel
Создать
рабочий
лист,
использующий
для
вычисления
гипергеометрического распределения функцию ГИПЕРГЕОМЕТ. Вызов этой
функции имеет следующий вид:
ГИПЕРГЕОМЕТ(Х; n; A; N)
Здесь параметр X – количество успехов, n – объем выборки, А –
количество успехов в генеральной совокупности, N – объем генеральной
совокупности.
Таблица 2 – Рабочий лист Гипергеометрическое распределение
А
В
С
Гипергеометрические
вероятности
1
Данные
2
Объем
выборки
8
3
Количество
успехов в 10
4
генеральной
совокупности
Объем
генеральной 30
5
совокупности
X
Р(Х)
6
0 =ГИПЕРГЕОМЕТ(В10;$В$4;$В$5;$В$6)
7
1 =ГИПЕРГЕОМЕТ(В11;$В$4;$В$5;$В$6)
8
……
… …
1.3 Распределение Пуассона
1.3.1. Вычислитm следующие пуассоновские вероятности
а. P(X=2), если =2,5
б. P(X=8), если =8,0
в. P(X=1), если =0,5
г. P(X=0), если =3,7
1.3.2. Вычислить следующие пуассоновские вероятности
а. P(X2), если =2,5
б. P(X8), если =8,0
в. P(X1), если =0,5
г. P(X1), если =4,0
45
Методика работы в Excel
Вычисление распределения Пуассона
Создать рабочий лист, использующий для вычисления распределения
Пуассона, использующий функцию ПУАССОН. Вызов этой функции имеет
следующий вид:
ПУАССОН(Х; lambda; cumulative)
Здесь параметр X – количество успехов, lambda – ожидаемое количество
успехов, cumulative – величина, принимающая значение ИСТИНА или ЛОЖЬ
(в первом случае вычисляется вероятность не менее X событий, а во втором –
вероятность точно X событий).
Таблица 3 – Рабочий лист Распределение Пуассона
1
2
3
4
А В
С
Среднее/ожидаемое
количество успехов
X
Р(Х)
0 =ПУАССОН
(В8;$Е$4; ЛОЖЬ)
1 =ПУАССОН
(В9;$Е$4; ЛОЖЬ)
D
E
F
G
3
Р(<=Х)
Р(<Х) P(>X) P(>=X)
=ПУАССОН
=D8- =1-D8 =1-E8
(В8;$Е$4;ИСТИНА) C8
=
ПУАССОН =D9- =1-D9 =1-E9
(В9;$Е$4;ИСТИНА) C9
14 = ПУАССОН (B22; =
ПУАССОН =D22- =1-D22 =1-E22
$E$4; ЛОЖЬ)
(В22;$Е$4;ИСТИНА) C22
15 =
ПУАССОН =
ПУАССОН =D23- =1-D23 =1-E23
(В23;$Е$4; ЛОЖЬ) (В23;$Е$4,ИСТИНА) C23
2.
Построение
графиков
дифференциальных
гипергеометрического распределения.
функций
Из партии, состоящей из 1000 изделий, 30 из которых дефектные, взята
выборка объёмом 50 изделий. Построить график дифференциальной функции
распределения вероятностей, используя гипергеометрическое распределение.
Открываем новую книгу Excel. Вводим исходные данные (рис. 2).
Рисунок 2. Исходные данные для расчёта распределения
Поскольку график представляет собой зависимость P(X), то для его
построения понадобятся диапазоны данных m и P(X)гипер. Соответствующие
46
заголовки вводим в ячейки А7 и В7. В диапазон А8:А38 вводим количество
дефектных изделий в выборке от 0 до 50 с шагом 1.
В ячейке В8 рассчитываем вероятность для X=0 при помощи
статистической функции ГИПЕРГЕОМЕТ. В первую строку диалогового окна
вводим ссылку на ячейку А8. Во вторую строку вводим ссылку на ячейку В5.
В третьей строке делаем ссылку на ячейку В4. В четвёртой строке делаем
ссылку на ячейку В3.
В результате в ячейке В8 получаем значение 0,209681. Формулу из ячейки
В8 копируем в диапазон В9:В38. Перед копированием вводим в формуле
абсолютную адресацию тех ячеек, ссылки на которые не должны меняться при
копировании – ячеек В3, В4, В5.
При построении графика выбираем диаграмму Точеная вида Позволяет
сравнить пары значений, т.е. график будет представлять отдельные точки, не
соединённые линией. Это связано с тем, что количество дефектных изделий в
выборке – дискретная случайная величина, принимающая только целые
значения.
На втором шаге создания диаграммы в качестве диапазона данных вводим
диапазон А8:В15. Остальные значения P(X) можно на графике не
использовать, поскольку они практически равны нулю, начиная с P(7),
находящегося в ячейке В15.
После редактирования диаграммы получаем график, показанный вместе
с расчётными данными на рис. 3.
Рисунок 3. Результаты расчётов и график дифференциальной функции
гипергеометрического распределения
Нормальное распределение
Задание
1. Выполнить расчёты и построения в соответствии с примером.
2. Как изменится наиболее вероятное число дефектных изделий в
выборке при увеличении объёма выборки до 100?
1. Используя таблицу, приведенную в Приложении 1, определите:
47









Чему равна вероятность P(Z < 1,57)?
Чему равна вероятность P(Z > 1,84)?
Чему равна вероятность Р(1,57 < Z < 1,84)?
Чему равна вероятность P(Z < 1,57 или Z > 1,84)?
Чему равна вероятность Р(-1,57 < Z < 1,84)?
Чему равна вероятность P(Z < -1,57 или Z > 1,84)?
Чему равна величина Z, если 50% всех значений превышают Z?
Чему равна величина Z, если только 2,5% всех значений превышают Z?
9.Между какими значениями переменной Z (симметрично
распределенной относительно математического ожидания) лежат
68,26% всех ее возможных значений?
2. Случайная величина распределена нормально с математическим
ожиданием 50 и стандартным отклонением 4.
Вычислите следующие вероятности, используя программу Excel:
1)
P(X>43)
2)
P(X<42)
3)
P(X>57,5)
4)
P(42<X<48)
5)
P(X<40 и X>55)
Вычисление
вероятностей
нормального
распределения
с
использованием Excel
Реализуем рабочий лист, использующий для вычисления вероятностей
нормального распределения функции НОРМАЛИЗАЦИЯ, НОРМРАСП,
НОРМСТОБР и НОРМОБР. Вызовы этих функций имеют следующий вид.
НОРМАЛИЗАЦИЯ (X; математическое ожидание; стандартное
отклонение),
НОРМРАСП (X; математическое ожидание; стандартное отклонение;
ИСТИНА), где параметр X задает интересующую нас величину X, а параметры
математическое ожидание и стандартное отклонение — математическое
ожидание и стандартное отклонение нормального распределения.
НОРМСТОБР (вероятность), где параметр вероятность представляет
собой площадь, ограниченную кривой и расположенную слева от величины X.
НОРМОБР (вероятность; математическое ожидание; стандартное
отклонение), где параметр вероятность представляет собой площадь,
ограниченную кривой и расположенную слева от величины X, а параметры
математическое ожидание и стандартное отклонение задаются функцией
НОРМРАСП.
Параметры функций:
X - Обязательный. Значение, для которого строится распределение.
Математическое ожидание - Обязательный. Среднее арифметическое
распределения.
48
Стандартное откл - Обязательный. Стандартное отклонение
распределения.
Интегральная - Обязательный. Логическое значение, определяющее
форму функции. Если аргумент «интегральная» имеет значение ИСТИНА,
функция НОРМРАСП возвращает интегральную функцию распределения;
если этот аргумент имеет значение ЛОЖЬ, возвращается весовая функция
распределения.
Функция НОРМАЛИЗАЦИЯ возвращает величину Z, соответствующую
заданному значению X, математическому ожиданию и стандартному
отклонению. Функция НОРМРАСП вычисляет площадь, ограниченную
гауссовой кривой и величиной X. Функция НОРМСТОБР возвращает
обратное значение стандартизованного нормального распределения. Функция
НОРМОБР вычисляет величину X, соответствующую заданной вероятности,
математическому ожиданию и стандартному отклонению.
На рисунках 1 и 2 продемонстрированы шаблоны рабочего листа
«Нормальное распределение», вычисляющего вероятности нормального
распределения. Формулы в ячейках А18 и D13 должны набираться в одной
строке, а столбец С должен оставаться пустым. Кроме того, А10, А15, А17,
А18, D11 и D12 содержат по две пары двойных кавычек, а формула в ячейке
D13 — три пары двойных кавычек. Для того чтобы вычислить вероятность,
которая должна быть неотрицательной, в ячейке Е13 использована функция
ABS, возвращающая абсолютную величину.
Рисунок 4. Шаблон рабочего листа «Нормальное распределение»
49
Рисунок 5. Диапазон D6:E18 из рабочего листа «Нормальное
распределение»
3. Выполните действия в программе Excel в соответствии с примером,
приведенным ниже.
Из текущей продукции отобраны 30 пластин пьезоэлементов.
Электрическая ёмкость пластин в пФ*103 представлена в следующем ряду:
9,2 12,2 10,5 9,4 8,9 7,4 10,1 11,7 11,4 11,0 10,2 8,0 7,3 7,0 9,6 8,4 10,8
8,4 11,2 8,8 10,7 8,6 9,7 9,8 9,5 12,5 9,8 9,5 9,2 7,7. Известно, что
распределение
показателя
ёмкости
приблизительно
соответствует
нормальному. Необходимо найти параметры распределения и построить
графики интегральной и дифференциальной функций распределения ёмкости
пластин.
Используем программу Excel пакета MS Office.
В ячейку А5 вводим заголовок столбца Ёмкость. Далее, начиная с ячейки
А6 в столбец А вводим значения ёмкости пластин.
Затем находим параметры распределения. Вообще говоря, параметры
распределения не могут быть найдены абсолютно точно никогда. Однако при
объёме выборки не менее 30 обычно считают, что точечные оценки
параметров нормального распределения с приемлемой точностью равны
параметрам. Оценкой математического ожидания  является среднее значение
выборки х , а оценкой среднего квадратичного отклонения (СКО)  –
выборочное СКО s.
Таким образом, расчёт параметров распределения может быть выполнен
следующим образом: в ячейку А3 вводим текст = и выравниваем его по
правому краю ячейки кнопкой на панели инструментов. В соседней ячейке В3
рассчитываем значение среднего выборки как оценку математического
ожидания. Для этого выбираем команду Вставка Функция (или нажимаем
соответствующую кнопку на панели инструментов) и в диалоговом окне
выбираем статистическую функцию СРЗНАЧ. В окно Число 1 вводим
диапазон ячеек с данными А6:А35 путём выделения этого диапазона
50
указателем мыши при нажатой левой кнопке. (Внимание! Адреса ячеек
вводить в формулы рекомендуется путём указания мышью на эти ячейки., но
не вводом адресов с клавиатуры, который значительно увеличивает
вероятность ошибок и замедляет работу). Нажав кнопку ОК, получаем в
ячейке В3 значение математического ожидания 9,61667. В ячейку D3 вводим
текст = и выравниваем его по правому краю. В соседней ячейке F3
рассчитываем выборочное СКО как оценку генерального СКО по
статистической функции СТАНДОТКЛОН. Получаем значение СКО
1,437691.
Для построения графиков нужны столбцы данных x, F(x) и f(x).
Соответствующие заголовки вводим в ячейках С5, D5, E5.
В столбце с заголовком x должны находиться значения квантиля
распределения (в данном случае – ёмкости). Целесообразно варьировать x в
интервале   3, поскольку в соответствии с правилом трёх сигм в этом
интервале находится практически 100% значений случайной величины (более
точно – 99,73%). Поэтому в ячейку С6 вводим значение 5,4, что примерно
равно  - 3. Затем вводим остальные значения х командой
ПравкаЗаполнитьПрогрессия. В открывшемся диалоговом окне выбираем
расположение по столбцам, шаг 0,1 (чтобы получить достаточно много точек
для построения графиков) и предельное значение 13,8, соответствующее
примерно  + 3. В результате выполнения команды столбец будет заполнен
значениями, возрастающими с шагом 0,1 до значения 13,8 в ячейке С90.
Далее в ячейке D6 рассчитываем значение интегральной функции
распределения F(x) для квантиля 5,4 по статистической функции НОРМРАСП.
В открывшемся диалоговом окне делаем ссылки на соответствующие ячейки,
в строке Интегральный вводим (в соответствии со справкой в нижней части
окна) значение истина и получаем в ячейке D6 значение 0,001679.
Аналогичным образом в ячейке E6 рассчитываем значение дифференциальной
функции распределения f(x) для квантиля 5,4, но в строке Интегральный
вводим (в соответствии со справкой в нижней части окна) значение ложь.
Получаем значение f(x), равное 0,003761.
Формулы из ячеек D6 и E6 следует скопировать в диапазон D7:E90.
Однако сначала надо задать в формулах абсолютную адресацию для тех строк,
столбцов или ячеек, адреса которых при копировании не должны меняться. В
обеих формулах абсолютные адреса должны быть у ячеек B3 и E3, в которых
содержатся значения математического ожидания и СКО. В адресах этих ячеек
перед именами строк и столбцов следует ввести символ $. Это можно сделать
в строке формул вводом с клавиатуры, но более эффективен следующий
способ: в строке формул выделить адреса нужных ячеек указателем мыши,
нажать клавишу F4, а затем Enter. В результате, например, в ячейке D6 должна
быть получена формула =НОРМРАСП(C6;$B$3;$E$3;ИСТИНА).
После этого можно скопировать формулы из ячеек D6 и E6 в диапазон
D7:E90. На этом расчёт данных для построения графиков будет закончен (рис.
3).
51
Для построения графика интегральной функции распределения
открываем Мастер диаграмм, выбираем тип диаграммы Точечная и вид Со
значениями, соединёнными сглаживающими линиями без маркеров. На
втором шаге выделяем диапазон С6:D90, На третьем шаге вводим заголовки
(заголовки см. на рис.4) и основные линии сетки, отменяем легенду. На
четвёртом шаге помещаем диаграмму на имеющемся листе. Полученную
(после нажатия кнопки Готово) диаграмму редактируем, используя
контекстное меню и двойной щелчок мышью на редактируемых элементах
диаграммы. Полученный график интегральной функции распределения
показан на рис. 6.
Рисунок 6. Результаты расчёта параметров распределения и данных для
построения графиков
52
Интегральная функция распределения
1
0.9
0.8
0.7
F(x)
0.6
0.5
0.4
0.3
0.2
0.1
0
5
6
7
8
9
10
Ёмкость,
пФ*103
11
12
13
14
Рисунок 7. Интегральная функция распределения ёмкости пластин
пьезоэлементов
Для построения графика дифференциальной функции распределения
выполняем аналогичные действия. При этом на втором шаге в качестве
диапазона данных выделяем диапазоны ячеек С6:С90 и Е6:Е90. Поскольку эти
диапазоны находятся не в соседних столбцах, их выделение может быть
сделано при нажатой клавише Ctrl. График дифференциальной функции
распределения показан на рис. 8.
Дифференциальная функция распределения
0.3
0.25
f(x)
0.2
0.15
0.1
0.05
0
5
6
7
8
9
10
11
12
13
14
Ёмкость, пФ*103
Рисунок 8. Дифференциальная функция распределения ёмкости
пластин пьезоэлементов
4. Чему равна вероятность того, что ёмкость случайно выбранной
пластины пьезоэлемента меньше 11 пФ*103? Чему равна вероятность того, что
ёмкость случайно выбранной пластины пьезоэлемента находится в интервале
от 9 пФ*103 до 10 пФ*103?
53
5. Построить на одной диаграмме графики интегральных функций трёх
нормальных распределений, имеющих параметры, приведённые в табл. 1.
6. Построить на одной диаграмме графики дифференциальных функций
трёх нормальных распределений, имеющих параметры, приведённые в табл.
4.
7. Сделать выводы о влиянии параметров распределения на вид и
положение графиков функций распределения.
№
1
2
3
№
1
2
3
Вариант 1


1
2
2
2
2
4
Вариант 6


2
3
0
3
0
1
Таблица 4 – Параметры нормальных распределений
Вариант 2 Вариант 3 Вариант 4 Вариант 5








2
2
6
1
0,5 0,5 1
4
2
4
9
1
1
0,5 0,5 4
1
4
9
3
1
2
0,5 2
Вариант 7 Вариант 8 Вариант 9 Вариант10








0,5 0,5 3
3
5
2
40
30
0,5 1
1
3
3
2
50
30
1
1
1
1
3
1
50
20
Структура отчета по лабораторной работе и правила его
оформления
1. Отчет является документом, свидетельствующим о выполнении
студентом лабораторной работы, и должен включать:
- титульный лист;
- цели выполненной лабораторной работы;
- используемые материалы, технические и программные средства;
- термины и определения;
- описание задания (постановка задач, подлежащих выполнению в
процессе лабораторной работы, осуществляемая студентом.);
- описание основной части; результаты расчетов, представленные в
форме таблиц, графиков;
- обсуждение результатов выполнения лабораторной работы в виде
кратких обоснований, разъяснений, оценок, обобщений и выводов;
- приложения (при необходимости).
2 Оформление текста отчета о лабораторной работе выполняется в
соответствии с общими требованиями СТО ТПУ 2.5.01-2006.
3 Отчет составляется каждым студентом индивидуально.
54
Лабораторная работа №4
Построение доверительных интервалов
Цель работы: научиться рассчитывать границы доверительных
интервалов в программе Excel.
Задачи работы:
 определить описательные статистики посредством функции Пакет
анализа программы Excel, интерпретировать полученные результаты;
 познакомиться с статистическими функциями, доступными в
программе Excel.
 рассчитать границы доверительных интервалов с различным уровнем
значимости α.
Основные понятия:
Доверительный интервал, уровень значимость, доверительная
вероятность.
Краткая теория
В статистике существует два вида оценок: точечные и интервальные.
Точечная оценка представляет собой отдельную выборочную
статистику, которая используется для оценки параметра генеральной
совокупности.
̅ — это точечная оценка
Например, выборочное среднее Х
математического ожидания генеральной совокупности, а выборочная
дисперсия S2 — точечная оценка дисперсии генеральной совокупности.
Доверительным интервалом называется интервал, построенный с
помощью случайной выборки из распределения с неизвестным параметром,
такой, что он содержит данный параметр с заданной вероятностью P.
Интервальная оценка математического ожидания генеральной
совокупности, доверительный уровень которой равен 95%, интерпретируется
следующим образом: если из генеральной совокупности извлечь все выборки,
имеющие объем n, и вычислить их выборочные средние, то 95%
доверительных интервалов, построенных на их основе, будут содержать
математическое ожидание генеральной совокупности, а 5% - нет.
В некоторых ситуациях желательно иметь более высокий
доверительный уровень, а, следовательно, точность оценки величины ц
(например, 99%). Но иногда можно ограничиться и менее точной оценкой
(например, 90%).
Как правило, доверительный уровень обозначают следующим образом:
(1-α)*100%, где величина α представляет собой площадь, ограниченную
хвостом распределения, выходящим за пределы доверительного интервала.
Величину α называют уровнем значимости доверительного интервала.
Кроме того, в качестве синонима для доверительного уровня иногда
употребляется выражение «доверительная вероятность».
55
Площади, ограниченные как левым, так и правым хвостами
распределения, выходящими за пределы доверительного интервала, равны α/2.
Построение доверительного интервала для математического ожидания
генеральной совокупности при известном стандартном отклонении:
𝑋̅ − 𝑍
𝜎
√𝑛
≤ μ ≤ 𝑋̅ + 𝑍
𝜎
√𝑛
,
где Z — значение стандартизованной нормально распределенной
случайной величины, соответствующее интегральной вероятности, равной 1α/2, σ— стандартное отклонение генеральной совокупности.
Построение доверительного интервала для математического ожидания
генеральной совокупности при неизвестной дисперсии:
𝑋̅ − 𝑡𝑛−1
𝜎
√𝑛
≤ μ ≤ 𝑋̅ + 𝑡𝑛−1
𝜎
√𝑛
,
где 𝑡𝑛−1 — критическое значение t-распределения с n - 1 степенями
свободы, соответствующее площади, ограниченной правым хвостом и равной
α/2.
Определение объема выборки:
𝑍2𝜎 2
𝑛= 2 ,
𝑒
где е - ошибка выборочного исследования.
Вычисление доверительного интервала с использованием функции
«Анализ данных», режима работы «Описательная статистика»
Пример
Затраты, связанные с изготовлением бракованной продукции по
каждому из цехов завода «ХХХ» за 2008 год, приведены в таблице 1,
сформированной на рабочем листе Microsoft Excel.
Необходимо рассчитать основные показатели описательной статистики
и сделать соответствующие выводы.
Для решения задачи используем режим работы «Описательная
статистика». Показатели, рассчитанные в данном режиме, – в таблице 2
(результаты округлены до двух значащих цифр).
Таблица 1 – Затраты, связанные с изготовлением бракованной
продукции
56
1
2
3
4
5
6
7
8
9
10
A
В
Затраты, связанные с изготовлением бракованной продукции
по каждому из цехов за 2008 г., тыс. руб.
Цех № 1
389,04
Цех № 2
417,78
Цех № 3
394
Цех № 4
371,96
Цех № 5
525,96
Цех № 6
405,12
Цех № 7
419,52
Цех № 8
401,93
Цех № 9
418,97
Таблица 2 – Результаты расчета
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
A
Столбец 1
B
Среднее
Стандартная ошибка
Медиана
Мода
Стандартное отклонение
Дисперсия выборки
Эксцесс
Асимметричность
Интервал
Минимум
Максимум
Сумма
Счет
Наибольший (1)
Наименьший (1)
Уровень надежности (95,0 %)
416,0311111
14,71123677
405,12
#Н/Д
44,13371031
1947,784386
6,063066502
2,259263465
154
371,96
525,96
3744,28
9
525,96
371,96
33,9241728
На основании проведенного выборочного обследования и рассчитанных
по данной выборке показателей описательной статистики (таблица 2) с
уровнем надежности 95 % можно предположить, что средние затраты,
связанные с изготовлением бракованной продукции по каждому из цехов
завода «ХХХ» за 2008 год, находились в пределах от 382,11 до 449,95 тыс. руб.
Поясним, на основании каких показателей описательной статистики был
сформирован соответствующий вывод. Такими показателями являются
средняя арифметическая выборки ~x (показатель Среднее в таблице 2) и
57
предельная ошибка выборки  ~x (показатель Уровень надежности (95,0 %) в
таблице 2). Из выражения для доверительного интервала:
𝑥̃ − ∆𝑥̃ ≤ 𝑥̅ ≤ 𝑥̃ + ∆𝑥̃
находим: 416,03 – 33,92 = 382,11 – левая граница; 416,03 + 33,92 = 49,95
– правая граница.
Вычисление доверительных интервалов
Вычисление доверительного интервала для математического
ожидания при известном стандартном отклонении
Чтобы вычислить доверительный интервал для математического
ожидания при известном стандартном отклонении, создадим рабочий лист,
использующий функцию ДОВЕРИТ. Вызов этой функции выглядит
следующим образом.
ДОВЕРИТ (1-доверительный уровень, стандартное отклонение;
объем выборки). Шаблон этого рабочего листа в таблице 3. Для вычисления
нижней и верхней доверительной границы ширина доверительного интервала,
возвращаемая функцией ДОВЕРИТ, делится пополам и прибавляется к
выборочному среднему. На листе также продемонстрированы вычисления
стандартной ошибки и величины Z.
Таблица 3 - Шаблон рабочего листа «Доверительныйинтервал»
При реализации этого шаблона ячейку В7 следует отформатировать так,
чтобы величина 0,95 была представлена как 95%. В этом случае величина 0,95
будет представлена как 95%. Если при решении аналогичной задачи
выборочное среднее не известно и подлежит вычислению, необходимо
заменить формулу в ячейке В5 формулой =СРЗНАЧ (диапазон).
58
Вычисление доверительного интервала для математического
ожидания при неизвестном стандартном отклонении
Чтобы вычислить доверительный интервал для математического
ожидания при неизвестном стандартном отклонении, создадим рабочий лист,
использующий функцию СТЬЮДРАСПОБР. Вызов этой функции выглядит
следующим образом.
СТЬЮДРАСПОБР (1-доверительный уровень; степени_свободы).
Шаблон этого рабочего листа приведен в таблице . Для вычисления половины
доверительного интервала, содержащего математическое ожидание, tзначение
распределения
Стьюдента,
возвращаемое
функцией
СТЬЮДРАСПОБР, умножается на стандартную ошибку среднего и делится
пополам.
Таблица 4 - Шаблон рабочего листа «Доверительныйинтервал»
При реализации этого шаблона ячейку В7 следует отформатировать так,
чтобы величина 0,95 была представлена как 95%.
Определение объема выборки для математического ожидания
генеральной совокупности
Создадим рабочий лист, использующий функцию НОРМСТОБР для
определения объема выборки, необходимой для вычисления доверительного
интервала,
содержащего
математическое
ожидание
генеральной
совокупности. Вызов этой функции имеет вид НОРМСТОБР (вероятность),
59
где аргумент вероятность представляет собой площадь фигуры, ограниченной
кривой стандартизованного нормального распределения и лежащей левее
числа X.
Шаблон рабочего листа приведен в таблице 5. Для вычисления объема
выборки, необходимой для вычисления доверительного интервала,
содержащего среднюю сумму накладных, используется значение Z,
возвращаемое функцией НОРМСТОБР. Объем выборки округляется с
помощью функции ОКРУГЛВВЕРХ.
Таблица 5. Шаблон рабочего листа «Объем выборки»
При реализации этого шаблона ячейку В6 следует отформатировать так,
чтобы величина 0,95 была представлена как 95%.
Задание
1. Менеджер из отдела контроля за качеством продукции на заводе,
производящем электрические лампочки, желает оценить среднюю
продолжительность работы лампочек из крупной партии. Номинальное
стандартное отклонение равно 100 ч. Для контроля выбрана партия, состоящая
из 64 лампочек, средняя продолжительность работы которых равна 350 ч.
1.1 Постройте интервал, содержащий математическое ожидание
генеральной совокупности, доверительный уровень которого равен 95% .
1.2 Можно ли утверждать, что средняя продолжительность работы
лампочек из анализируемой партии не меньше 400 ч? Обоснуйте свой ответ.
2. Одним из основных показателей качества шины является
износоустойчивость протектора. Этот показатель является относительным. В
качестве эталона выбирается шина, у которой показатель износоустойчивости
равен числу 100. Таким образом, шина с показателем износоустойчивости,
равным 200, в среднем прослужит вдвое больше, чем эталон. Необходимо
оценить реальный показатель износоустойчивости шин, произведенных
60
некоей широко известной компанией. Производитель утверждает, что
показатель износоустойчивости его шин равен 200. Выборочное среднее,
вычисленное по случайной выборке, состоящей из 18 шин, равно 195,3, а
выборочное стандартное отклонение — 21,4.
2.1 Предположим, что генеральная совокупность показателей
износоустойчивости шин имеет нормальное распределение. Постройте
интервал, содержащий математическое ожидание этой генеральной
совокупности, доверительный уровень которого равен 95% .
3. Одним из показателей качества процесса упаковки чая является вес
отдельного пакетика. На упаковке указывается номинальный средний вес чая
в пакетике: 5,5 г. Точно засыпать в пакетик 5,5 г невозможно, поскольку
температура и влажность воздуха на чайной фабрике постоянно изменяются,
а это влияет на плотность чая. Кроме того, скорость работы упаковочной
машины чрезвычайно высока (170 пакетиков в минуту). В следующей таблице
приведен вес в граммах 50 пакетиков чая, заполненных в течение часа
конкретной упаковочной машиной.
Таблица 6 – Вес пакетика чая
5,25
5,29
5,32
5,32
5,34
5,36
5,4
5,4
5,4
5,41
5,42
5,42
5,44
5,44
5,44
5,45
5,45
5,46
5,47
5,47
5,49
5,5
5,5
5,5
5,51
5,52
5,53
5,53
5,53
5,53
5,54
5,54
5,55
5,55
5,56
5,56
5,57
5,57
5,57
5,58
5,58
5,58
5,61
5,61
5,62
5,63
5,65
5,67
5,67
5,77
3.1 Постройте 99%-ный доверительный интервал, содержащий средний
вес пакетиков с чаем.
3.2 Соответствует ли средний вес пакета требованиям стандарта?
4. Промышленная компания производит стальные корпуса для
электротехнического оборудования. Основным компонентом корпуса
является прямоугольный профиль, который создается из рулона стальной
полосы с помощью 250-тонного пресса. Основным параметром корпуса
является расстояние между боковыми сторонами профиля, допускающее
установку электротехнического оборудования. В таблице приведены данные о
ширине 49 профилей (в дюймах).
Таблица 7 – Расстояние между боковыми сторонами профиля
8,312 8,373
8,343 8,481
8,317 8,422
8,414
8,419
8,385
8,413
8,489
8,414
8,458
8,462
8,46
8,42
8,41
8,405
8,405
8,439
8,411
61
8,383
8,348
8,41
8,351
8,476
8,382
8,484
8,403
8,465
8,498
8,447
8,436
8,481
8,415
8,479
8,429
8,444
8,429
8,46
8,412
8,323
8,42
8,396
8,447
8,427
8,42
8,498
8,409
4.1 Постройте 95%-ный доверительный интервал, содержащий среднее
расстояние между боковыми сторонами профиля.
4.2 Дайте интерпретацию этого интервала.
5. Инспектор по контролю за качеством продукции желает оценить
среднюю продолжительность работы электрических лампочек с точностью
±20 . Для этого он собирается построить 95% - ый доверительный интервал,
предполагая, что стандартное отклонение равно 100 ч. Определите
необходимый объем выборки.
Структура отчета по лабораторной работе и правила его
оформления
1. Отчет является документом, свидетельствующим о выполнении
студентом лабораторной работы, и должен включать:
 титульный лист;
 цели выполненной лабораторной работы;
 используемые материалы, технические и программные средства;
 термины и определения;
 описание задания (постановка задач, подлежащих выполнению в
процессе лабораторной работы, осуществляемая студентом.);
 описание основной части; результаты расчетов, представленные в
форме таблиц, графиков;
 обсуждение результатов выполнения лабораторной работы в виде
кратких обоснований, разъяснений, оценок, обобщений и выводов;
 приложения (при необходимости).
2. Оформление текста отчета о лабораторной работе выполняется в
соответствии с общими требованиями СТО ТПУ 2.5.01-2006.
3. Отчет составляется каждым студентом индивидуально.
62
Приложение 1
Форма титульного листа отчета по лабораторной работе.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ
ФЕДЕРАЦИИ
федеральное государственное автономное образовательное учреждение высшего образования
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
Институт/
Факультет
–
ИНК
Направление – 221400 Управление качеством
Кафедра
–
ФМПК
Наименование лабораторной работы
Отчет по лабораторной работе
по курсу «Статистические методы в управлении качеством»
Наименование учебной дисциплины
Выполнил студент гр. _______
__________
_________
Проверил Доцент каф. ФМПК
Редько__
_______
Дата
Должность
Дата
И.О.Фамилия
Л.А.
И.О.Фамилия
Томск – 2015
63
Учебное издание
Редько Людмила Анатольевна
Математические методы в инновационной и управленческой
деятельности
Методические указания по выполнению лабораторных работ
Учебно-методическое пособие
Научный редактор доктор … наук,
профессор И.О. Фамилия
Корректура И.О. Фамилия
Компьютерная верстка И.О. Фамилия
Дизайн обложки И.О. Фамилия
Подписано к печати 00.00.2015. Формат 60х84/16. Бумага «Снегурочка».
Печать XEROX. Усл.печ.л. 9,01. Уч.-изд.л. 8,16.
Заказ 000-15. Тираж 100 экз.
Национальный исследовательский Томский политехнический
университет
Система менеджмента качества
Издательства Томского политехнического университета
сертифицирована в соответствии с требованиями ISO 9001:2008
. 634050, г. Томск, пр. Ленина, 30
Тел./факс: 8(3822)56-35-35, www.tpu.ru
64
Download