статистические методы решения технологических задач

advertisement
Министерство образования и науки Российской Федерации
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ
Кафедра технологии вяжущих веществ и бетонов
СТАТИСТИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ
ТЕХНОЛОГИЧЕСКИХ ЗАДАЧ
Методические указания к выполнению практических занятий
по дисциплине «Архитектурно-строительное материаловедение»,
для студентов магистратуры
направления подготовки 08.04.01 Строительство
© НИУ МГСУ, 2015
Москва 2015
УДК 691.3:311
ББК 38.3
С78
Составитель
О.В. Александрова
С78
Статистические методы решения технологических задач [Электронный
ресурс] : методические указания к практическим занятиям по дисциплине
«Архитектурно-строительное материаловедение», для студентов магистратуры
направления подготовки 08.04.01 Строительство/ М-во образования и науки Рос.
Федерации, Нац. исследоват. Моск. гос. строит. ун-т, каф. технологии вяжущих
веществ и бетонов; сост. О.В. Александрова. — Электрон.дан. и прогр. (1,4 Мб).
— Москва : НИУ МГСУ, 2015. — Учебное сетевое электронное издание —
Режим
доступа:
http://lib.mgsu.ru/Scripts/irbis64r_91/cgiirbis_64.exe?C21COM=F&I21DBN=IBIS&
P21DBN=IBIS — Загл. с титул.экрана.
Освещены вопросы планирования и обработки результатов эксперимента в
области строительных материалов.
Для студентов магистратуры направления подготовки 08.04.01 Строительство.
Учебное сетевое электронное издание
©НИУ МГСУ, 2015
Отв. за выпуск — кафедра технологии вяжущих веществ и бетонов
Подписано к использованию 21.09.2015 г.Уч.-изд. л. 2,2. Объем данных 1,4 Мб
Федеральное государственное бюджетное
образовательное учреждение высшего образования
«Национальный исследовательский Московский государственный
строительный университет» (НИУ МГСУ).
129337, Москва, Ярославское ш., 26.
Издательство МИСИ – МГСУ.
Тел. (495) 287-49-14, вн. 13-71, (499) 188-29-75, (499) 183-97-95.
E-mail: ric@mgsu.ru, rio@mgsu.ru
Практическое занятие 1
Статистические оценки результатов наблюдений
Множество значений случайной величины, полученных в результате эксперимента
или наблюдений над объектом исследования, представляет собой статистическую
совокупность.
Статистическая совокупность, содержащая в себе все возможные значения случайной
величины, называется генеральной статистической совокупностью.
Выборочной статистической совокупностьюназывается совокупность, в которой
содержится только некоторая часть элементов генеральной совокупности.
По результатам эксперимента практически всегда встречаются с выборочной
статистической
совокупностью,
а
не
с
генеральной
совокупностью.
Выборочную
статистическую совокупность будем в дальнейшем называть выборкой, а число опытов
(наблюдений) n, содержащееся в выборке – объемом выборки.
При
повторении
опытов
в
одинаковых
условиях
обычно
обнаруживается
закономерность в частоте появлений тех или иных результатов. Некоторые значения
случайной величины появляются значительно чаще других, при этом в целом они
группируются относительно некоторого значения – центра группирования, которое
обозначим через Му.Для описания Му этого явления используется вероятностный подход.
Пусть pi–вероятность того, что случайная величина, являющаяся результатом эксперимента,
примет значение yi, i=1,2,…,n.Если значения рiизвестны для всех возможных значений yi из
генеральной совокупности, то величину Муможно найти по формуле
=
+
+ ⋯+
=
(1)
Величину Муназывают математическим ожиданием или генеральным средним
случайной величины. Одно только математическое ожидание не может отобразить все
характерные черты статической совокупности. Исследователю необходимо знать, кроме
того, изменчивость, или вариацию наблюдаемой характеристики объекта.
Рассеивание
случайной
величины
относительно
математического
ожидания
характеризуется величиной, называемой дисперсией, обычно она обозначается через σ2. Для
генеральной совокупности дисперсия определяется по формуле
=
−
(2)
σ2 часто называют генеральной дисперсией. Квадратный корень из
Дисперсию
дисперсии называется средним квадратическим отклонением случайной величины, или
=√
стандартом
.Как и дисперсия, среднее квадратическое отклонение является
характеристикой рассеивания значений случайной величины относительно математического
ожидания.
Формулы (1) и (2) справедливы для дискретных случайных величин. Для
непрерывных случайных величин математическое ожидание и дисперсия выражаются через
соответствующие интегралы.
Поскольку экспериментатор встречается не с генеральной
совокупностью, а
с
выборкой, необходимо иметь формулы, позволяющие приближенно оценить математическое
ожидание Муи дисперсию σ2 на основе экспериментальных данных.
Пусть по результатам однородной серии опытов получена выборка
+
+ ⋯+
.
Наилучшей оценкой для математического ожидания Муявляется среднее арифметическое
или просто «среднее»
=
+
+ ⋯+
(3)
Найденное значение называют еще выборочным средним в отличие от генерального
среднего Му. Оценкой дисперсииσ2случайной величины является выборочная, или
эмпирическая дисперсия. Она обозначается через s2 , вычисляется по формуле
=
(
− ) +(
− ) + ⋯+ (
−
− )
(4)
Числитель этой формулы представляет собой сумму квадратов отклонений значений
случайной величины от среднего значения
.
Знаменатель формулы для выборочной
дисперсии называется числом степеней свободы, связанным с этой дисперсией, и
обозначается через f:
=
− (5)
Формулу (1.4) можно преобразовать к виду, более удобному для вычислений:
=
−
Величина
−
(6)
=
=
(
−
− ) (7)
является оценкой среднего квадратического отклонения
выборки. Ее также называют
выборочным стандартом.
Часто для оценки изменчивости (вариации) случайных величин используют
коэффициент вариацииv. Он равен отношению sк ,%:
=
100%(8)
Коэффициент вариации характеризует не абсолютное, а относительное рассеивание
случайной величины относительно среднего.
Важное значение в статистике имеют также следующие статистические показатели:

средняя квадратическая ошибка среднего значения
=
√
(9)

показатель точности среднего значения
=
100% =
(10)
√

ошибка среднего квадратического отклонения
=
√
Статистическая совокупность может иногда содержать сотни и даже тысячи
наблюдений. При этом экспериментальный материал будет труднообозримым, и даже
нахождение оценок математического ожидания и дисперсии по формулам (1.3) и (1.6)
является трудоемкой задачей.
Для вычисления выборочного среднего
и выборочной дисперсии
в подобных
случаях прибегают к группировке данных. При этом весь диапазон значений случайной
величины от yminдо ymax разбивается на интервалы. Для ориентировочного определения числа
интервалов k можно воспользоваться формулой
=
+ ,
(11)
гдеn - объем выборки.
Значение k, найденное по этой формуле округляется до ближайшего целого. Чаще
всего используются интервалы равной длины. В этом случае длина (h) каждого интервала
равна
=
(
−
)
. Определяются границы интервалов.
Так, первый интервал лежит в пределах
…
,где
=
+ ;
второй интервал – в пределах
…
, где
=
+ и т.д.
∗
Для каждого i-го интервала вычисляется его середина
∗
=
(
−
)
,
по формуле
= , ,…,
Далее подсчитывается число наблюдений, попавших в каждый интервал. Обозначим
его (интервал) через mi, i=1,2,…,k.
Предварительно договариваются (решают), к какому интервалу приписывать значение
случайной величины, попавшее на границу интервала. Можно, например, условиться, что
значение случайной величины, попавшее на границу
, всегда относится кi+1-му интервалу.
Сума всех величин mi равна, очевидно, объему выборки:
= .
Тогда выборочное среднее и выборочная дисперсия
∗
=
=
−
определяются по формулам
(12)
(
∗
− ) (13)
Сгруппированные данные записывают в виде статистического ряда (табл. 1).
В последнем столбце этой таблицы приведены значения относительной частоты,
равной отношению числа наблюдений, попавших в данный интервал, к объему nвыборки:
∗
=
.
Таблица 1
№
интервала
Граница интервала
Середина
интервала
Число наблюдений
в интервале
∗
Относительная
частота
∗
= 1
−
∗
∗
2
.
.
.
i
.
.
.
k
−
.
.
.
−
.
.
.
−
∗
∗
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
∗
∗
∗
∗
График, построенный по данным статистического ряда, называется гистограммой.
При построении гистограммы по оси абсцисс откладывают значения границ интервалов и на
каждом из них, как на основании, строят прямоугольник, площадь которого равна
относительной
частоте,
соответствующей
данному
интервалу.
Высота
каждого
прямоугольника равна относительной частоте, деленной на длину интервала.
Пример1. В результате измерений активности цемента получено n=400 значений,
кгс/см2. Значения активности цемента измеряются в диапазоне от 285 до 555 МПа.
=
Определим значение числа интервалов
=
+ ,
+ ,
−
)
Определим длину интервала
=
(
)
−
=
(
=
Далее определяем границы интервалов.
В четвертый и пятый столбец таблицы заносим значения числа наблюдений в
интервале
и относительных частот
∗
Таблица 2
Середина
интервала
Число
наблюдений в
интервале
2
3
4
285-315
315-345
345-375
375-405
405-435
435-465
465-495
495-525
525-555
300
330
360
390
420
450
480
510
540
10
22
42
56
86
77
65
22
20
№
интервала
Граница
интервала
1
1
2
3
4
5
6
7
8
9
5
m, шт
Гистограмма эмперического распределения
100
90
80
70
60
50
40
30
20
10
0
300
330
360
390
420
450
480
510
540
Rcж, кгс/м2
Рис. 1
На рис. 1 изображена гистограмма, соответствующая статистическому ряду,
приведенному в таблице 1. Т.к. сумма всех относительных частот равна единице, то площадь
всей гистограммы также равна единице. С увеличением числа опытов n значение каждой
частоты становиться все ближе к pi утверждение, выражающее требование статистической
устойчивости часто, является важнейшей предпосылкой применения статистических
методов.
Если одновременно с увеличением числа опытов n увеличивать и количество
интервалов, то ломаная, ограничивающая гистограмму сверху, приближается к некоторой
кривой, называемой кривой распределения или кривой плотности вероятности. Она
является графиком соотношения между значениями данной случайной величины и их
вероятностями. В теории вероятности это соотношение называется статистическим
распределением.
Для случайных величин, имеющих разную природу, статистические распределения
могут быть различными. Известны, например. Распределения Пуансона, Пирсона,
биномиальное и многие другие.
Среди них существует распределение, называемое нормальным (или гауссовским),
которое применяется наиболее часто и играет важную роль в теории в теории вероятностей и
математической статистке. Основанием для этого служит центральная предельная теорема
теории вероятностей. Смысл ее состоит в утверждении, сто сумма достаточно большого
числа произвольно распределенных случайных величин распределена приблизительно по
нормальному закону и тем точнее, чем больше членов этой сумме.
При этом предполагается, что среди рассматриваемых случайных величин нет такой,
влияние которой на сумму существенно преобладало бы по сравнению с остальными
случайными величинами. Таким условиям, как правило, удовлетворяет измеряемая величина
в однородной серии опытов, подверженная влиянию большого числа факторов. Поэтому
распределение этой величины обычно считается нормальным. На рис. 1.2 изображена кривая
плотности нормального распределения.
Рис. 1.2
При изложении дальнейшего материала данного раздела будем предполагать, что
результаты наблюдений свободны от систематических ошибок, а случайные ошибки (а
значит и результаты наблюдений) подчинены нормальному закону распределения.
Практическое занятие 2
Расчет доверительного интервала для математического ожидания
Величина (выборочное среднее), найденная по выборке, представляет ценность
постольку, поскольку по ней можно судить об истинном среднем, математическом ожидании
.
Представляет интерес отыскание величины максимальной ошибки ∆, которую мы
допускаем, предполагая
равным .Требуется, следовательно, найти величину ∆, при
которой
− ∆≤ Неравенством
≤
(1.14)
+ ∆(14)
задается
интервал,
в
котором
находится
значение
математического ожиданияМу. Этот интервал называется доверительным интервалом для
математического ожидания. Величина ∆зависит, очевидно, от объема выборки
n.Чем
меньше n, тем максимальная ошибка ∆.
Однако, даже при заданном nнельзя абсолютно достоверно указать величину ∆, так
как расчет этой величины, как и любой статистически вывод, делают на основе результатов
эксперимента, а они заведомо содержат ошибки.
Выводы, которые делают на основе
неточных данных, принципиально не могут быть абсолютно достоверными. Поэтому говорят
о надежности статистического вывода, которую оценивают величиной доверительной
вероятности p, где 0<p<1.
Например, статистический вывод, сделанный с доверительной вероятностью p=0,95,
будет справедлив в 95 случаях из 100. Будем пользоваться чаще величиной q=1-p,
называемой уровнем значимости. Уровень значимости задается заранее, до проведения
расчетов. Типичные значения для q:0,01; 0,05; и 0,1 или, в процентах: 1, 5, 10.
Вернемся к отысканию доверительного интервала для математического ожидания.
Будем предполагать, что дисперсия измеряемой величины yзаранее неизвестна, а ее оценка
s2 найдена по выборке с помощью формул (1.4) или (1.13). В этом случае величина ∆
определяется
по
формуле
∆=ts/√n,следовательно,
доверительный
интервал
для
математического ожидания равен
−
√
≤
≤
+
√
(15)
Величина s- оценка стандарта: s=√s2. Кроме известных величинsи n в формулу (1.15)
входит величина t, для отыскания которой понадобятся статистические таблицы. Они
имеются практически в каждом руководстве по математической статистике или
планирование эксперимента.
Величина
tназывается
табличным
значением
t
–критерия
Стьюдента.
В
соответствующей таблице ее следует отыскать по предварительно заданному уровню
значимости qчислу степеней свободы f=n-1(приложение, таблица 1).
Оценку для математического ожидания в виде интервала (15) часто называют
интервальной оценкой в отличие от оценок по формулам (3) и (12), которые называют
точечными оценками для математического ожидания.
Пример 2. В результате эксперимента была определена прочность R28 твердения
цемента по ГОСТ 310.4-81.было выполнено 6 измерений прочности. В результате получены
следующие значения:
Число
опытов n
Активность
R28, кгс/см2( )
Требуется
1
2
3
4
5
6
450
452
458
460
466
488
рассчитать
точечную
оценку
и
доверительный
математического ожидания.
Вычислим среднее арифметическое и оценку дисперсииs2выборки
= ∑
, = 450 + 452 + ⋯ + 488
=
6
,
∑ R28=2774
интервал
для
=
=
−
−
,
450 + 452 + ⋯ + 488 − 6 ∗ 462,3
5
Отсюда = √
=
(
= 228
кгс
).
см Зададимся уровнем значимости q=0,05. Это соответствует доверительной
вероятности p=1-q=0,95. Из таблицы 1 приложения по величинам q=0,05 и f= n-1 = 5
найдем значение t=2,57.
Подставляя найденные значения для R28, s, n и t в формулу (1.15), получим
доверительный интервал для математического ожидания
, −
т. е.
2,57 ∗ 15
≤
6
≤
,
, (
≤
≤
, +
2,57 ∗ 15
,
6
кгс
).
см Не следует думать, что во всех случаях целесообразно задаваться возможно
большей надежностью статистического вывода. Покажем на материале предыдущего
примера
к чему это может привести. Зададимся теперь уровнем значимости q=0,01.
Доверительная вероятность будет теперь равна p=1-q=0,99. Новое значение t, найденное из
таблицы 1.3, составит 4,03, а доверительная оценка примет вид
, (
кгс
).
см ,
≤
≤
Как и следовало ожидать, с большей надежностью можно гарантировать
только более широкий доверительный интервал для математического ожидания при тех
же опытных данных.
Практическое занятие 3
Определение необходимого объема выборки
Пусть требуется найти минимальное число nповторений опытов, при котором среднее
арифметическое
, найденное по этой выборке, отличалось бы от математического
ожидания не более, чем на заданную величину ∆.
Это, по существу, задача обратная предыдущей. Для ее решения необходимо знать
оценку дисперсииs2. Здесь можно использовать, например, результаты проведенных ранее
исследований. Искомое значение n определяется по формуле
n=t2s2/∆2(16)
величину tнаходят из таблицы 1 приложения при уровне значимости qи числе
степеней свободыf, связанном с оценкой дисперсии
s2. Если эта дисперсия найдена по
выборке объема, большего 120, то вместо величины t в формуле (16) можно пользоваться
величиной τ, зависящей только от уровня значимости q. Значения τприведены ниже:
q
0,2
0,1
0,05
0,01
0,005
τ
1,28
1,64
1,96
2,58
2,81
Формулу (1.16) можно преобразовать следующим образом. Поделим числитель и
знаменатель на
.Обозначим черезε величину = (∆/ )
%.Это выражение представляет
собой относительную допускаемую ошибку. Учитывая, что отношение ( / )100% −это, по
определению, коэффициент вариацииv, получим
n=t2v2/ε 2(17)
Пример 3. На основе измерений активности цемента (пример 1) найти необходимый
объем выборки, при котором среднее отличалось бы от математического ожидания не
более чем на ∆=15 кгс/см2с доверительной вероятностью p=0,95.
Середина
интервала
Число
наблюдений в
интервале
2
3
4
285-315
315-345
345-375
375-405
405-435
435-465
465-495
495-525
525-555
300
330
360
390
420
450
480
510
540
10
22
42
56
86
77
65
22
20
№
интервала
Граница
интервала
1
1
2
3
4
5
6
7
8
9
5
Для определения необходимого объема выборки воспользуемся формулой (1.16),
причем вместо значения t можно подставить в нее значение τ (объем выборки более 120).
Данной величине p соответствует уровень значимости q=1-p=0,05. Соответствующее
значение τ = 1,96. По данным примера 1 вычислим среднее
и оценку дисперсии s2:
=
,s2=628,8.
Таблица 3
№
интервал
а
1
1
2
428
3
300
4
10
5
3000
6
-128
7
16384
8
163840
2
3
4
5
6
7
8
9
330
360
390
420
450
480
510
540
22
42
56
86
77
65
22
20
7260
15120
21840
36120
34650
31200
11220
10800
∑
-98
-68
-38
-8
22
52
82
112
171210
9604
4624
1444
64
484
2704
6724
12544
211288
194208
80864
5504
37268
175760
147928
250880
1267540
Тогда согласно формуле (16), имеем:
n=t2s2/∆2;
n= (1,962*628,8)/152≈11
В изложении дальнейшего материала широко используются процедуры проверки
статистических гипотез. Статистическая гипотеза – это некоторое предположение
относительно свойств совокупности, проверяемое по выборке. Например, гипотезе об
однородности средних или дисперсий, законе распределения и т.д. Проверка статистической
гипотезы – это процедура, по результатам которой гипотеза принимается
или
отбрасывается.
Проверка статистических гипотез связана с такими распространенными задачами, как
сравнительная оценка различных технологических процессов по их производительности,
точности, экономичности или сравнение конструктивных особенностей машин и приборов.
В планировании эксперимента проверка статистических гипотез позволяет правильно
оценить преимущества одной модели перед другой, выявить наиболее значимые факторы,
влияющие на данное явление, а также убедиться в пригодности (адекватности) полученного
математического описания процесса.
Выдвинутую гипотезу называют основной, или нулевой. Гипотезу, противоречащую
нулевой, называют конкурирующей. Для проверки нулевой гипотезы используют специально
подобранную случайную величину, распределение которой известно. Ее называют
статистическим критерием. Например, при проверке гипотезы об однородности дисперсий
в качестве критерия используют отношение выборочных дисперсий, которое подчиняется
статистическому
распределению
Фишера.
Для
проверки
статистической
гипотезы
вычисляют значение критерия по имеющимся опытным данным. Если оно находится внутри
некоторой заданной заранее области, называемой областью принятия гипотезы (областью
допустимых значений), то нулевая гипотеза принимается. В противоположном случае
значение критерия попадает в критическую область, и тогда гипотеза отвергается.
Однако попадание критерия в область допустимых значений не дает права
категорически утверждать, что гипотеза полностью подтвердилась. Можно только
заключить, что по данным выборки значение критерия не противоречит гипотезе. Поэтому,
принимая решение о правильности гипотезы, можно допустить ошибку.
Ошибка первого рода состоит в том, что отвергается гипотеза, которая на самом деле
верна. Вероятность этой ошибки задается заранее выбором
уровня значимостиq. (Как
указывалось, типичные значения q: 0,01; 0,05; 0,1 или 1, 5 и 10%).
Ошибка второго рода состоит в том, что гипотеза принимается, а на самом деле она
неверна. Уменьшение ошибки второго рода достигается увеличением уровня значимости.
Таким образом, уменьшение уровня значимости приводит к уменьшению ошибки
первого рода и при этом к увеличению ошибки второго рода. Отметим, что единственный
способ одновременного уменьшения вероятностей ошибок первого и второго рода состоит в
увеличении объема выборок.
Практическое занятие 4
Отбрасывание грубых наблюдений
Грубые наблюдения (промахи) подлежат исключению из выборки. Для их
обнаружения можно вновь воспользоваться
t –критерием Стьюдента. В этом случае
сомнительный результатyiвременно исключают из выборки, а по оставшимся данным
рассчитывают среднее арифметическое
расч =
|
и оценку дисперсии s2. Далее вычисляют
− |⁄ .
Из таблиц распределения Стьюдента (таб. 1 приложения) по выбранному уровню
значимости qи числу степеней свободы f,связанному с дисперсиейs2, находят табличное
значение t-критерия Стьюдента tтабл. Если tрасч>tтабл, то подозреваемый результат является
промахом и должен быть исключен из выборки.
Иногда сомнение вызывают одновременно два или даже три элемента выборки.
Исследование начинают с того из сомнительных элементов, значение которого ближе к
среднему выборки, а остальные сомнительные элементы временно отбрасывают. Затем
рассчитывают значения и s выборки без исключенных элементов, а также значениеtрасч для
оставшегося сомнительного элемента. Далее решают вопрос об исключении этого элемента с
уровнем значимости q. Если tрасч>tтабл, то оставшийся элемент выборки отбрасывают как
грубое измерение. Тем более грубыми будут и остальные, ранее исключенные элементы.
Если наименее сомнительный элемент не оказался промахом
(tрасч≤tтабл), то его
присоединяют к выборке и исследуют следующий сомнительный элемент, и т.д.
Пример 4.Проверим, не является ли промахом результатR28=488кгс/см2 в примере 2.
Исключив это значение из выборки, найдем среднее и дисперсию по оставшимся данным: =
, ;s2= 41,2;s≈6,4 ;tрасч=|488-457,2 |/6,4=4,8.
Зададимся уровнем значимости q= 0,01. Для этого q при f= 5– 1 = 4 из табл. 1
приложения
найдем tтабл=4,60. Полученное соотношение
tрасч<tтаблне дает оснований
считать результат R28= 488 промахом при выбранном уровне значимости.
Проверка гипотезы об однородности двух дисперсий
Результаты экспериментальных исследований часто используют, например, для
сравнения условий функционирования объектов, оценки сравнительной эффективности
различных технологий, разных способов измерения и т.д.
Во многих случаях соответствующие выводы делают на основе анализа и сравнения
нескольких выборок. Одна из простых задач такого типа возникает, когда надо сравнивать
точность двух измерительных приборов. В этом случае следует сравнивать оценки
дисперсий соответствующих выборок.
Пусть имеются две выборки объемом n1и n2, по которым найдены выборочные
дисперсии s иs . Они являются оценками для генеральных дисперсий соответственно
и
. Предположим, чтоs ≠ s
Требуется выяснить, можно ли утверждать, что обе выборки взяты из одной и той же
генеральной совокупности. Если это так, то
=
вэтом случае выборочные дисперсии
s иs называют однородными, а различие между ними объясняется влиянием случайных
ошибок. В противном случае генеральные дисперсии
и
не равны друг другу.Тогда
говорят, что различие между выборочными дисперсиями значимо.
Для
проверки
используется
статистической
гипотезы
об
однородности
двух
дисперсий
F – критерий Фишера. Вначале вычисляется величина Fрасч, равная
отношению большей из выборочных дисперсий к меньшей. Пусть для определенности
s > s . Тогда
расч
=
s
(18)
s
Далее задаются уровнем значимостиq и вычисляют числа степеней свободы
дисперсий числителя изнаменателя по формуле (1.5):f1 = n1–1 и
f2= n2–1. По трем величинам
q,f1 и f2из таблиц распределения Фишера отыскивают величину F=Fтабл. (таблица 4
приложения).
Если Fрасч>Fтабл, то выборочные дисперсии считаются неоднородными (различие
между ними значимо) для выбранного уровня значимости q. Если Fрасч≤Fтабл, то можно
принять гипотезу об однородности дисперсий.
Пример 5.Для сравнения точности двух электровлагомеров ЭВ-2К каждым из них
проведено 10 измерений влажности одного и того же участка доски. Результаты замеров
влажности W, %, первым и вторым приборами следующие:
Первый прибор
35
41
47
38
41
43
42
37
49
39
Второй прибор
42
39
42
43
45
40
37
44
44
43
Задание: вычислить значения средних и выборочных дисперсий для каждого
прибора.
Вычисленные значения средних и выборочных дисперсий для каждого прибора
соответственно равныy = 41,2;y = 41,9; s = 18,84;s = 6,32.
Дисперсии отличаются почти втрое. Следует ли отсюда, что точность первого
влагомера меньше, чем второго? Вычислим Fрасч. по формуле (18). В данном случае в
числителе должна быть дисперсия s .
расч
= s /s
= 1,84/6,32 = 2,98.
Зададимся уровнем значимости q=0,05. Числа степеней свободы каждой из дисперсий
равны f1 = f2 =10 – 1 = 9.Из табл. 2 приложения для q=0,05, f1 = f2 = 9найдемFтабл=3,18.
Полученное соотношение
Fрасч<Fтабл. не дает оснований сделать вывод о значимости
расхождения в точности исследуемых влагомеров по результатам данного эксперимента. Для
окончательного решения вопроса необходимо повторить эксперимент, существенно
увеличив объем каждой выборки.
Проверка однородности средних
Здесь исследуют две выборки, имеющие различные средние арифметические. Данная
проверка позволяет установить, вызвано ли расхождение между средними случайными
ошибками измерения или оно связано с влиянием каких-либо неслучайных факторов.
Эта процедура находит широкое применение, например, в случаях, если требуется
установить идентичность параметров одинаковых изделий, приготавливаемых на разном
оборудовании.
Проверка проводится с применением t-критерия Стьюдента.
Пусть n1 и n2 – объемы выборок,
и
– соответствующие средние,s иs
-
оценкидисперсий, найденные по этим выборкам.
Рассмотрим два случая.
1. Дисперсии s иs однородны.Вычисляется расчетноеt-отношение по формуле
расч
−
=
)
(
+
(
)
(20)
Из таблиц распределения Стьюдента при уровне значимости qи числе степеней
свободы f = n1+n2 – 2 находят табличное значение tтабл.(табл. 1 приложения). Если tрасч>tтабл.,
то расхождение между среднимизначимо. В противном случае можно принять гипотезу об
однородности средних. Формула (20) упрощается, если обе выборки имеют одинаковый
объем, т.е. n1=n2=n. В этом случае
расч
−
=
(
(21)
)
2. Дисперсии s иs неоднородны. Как и в предыдущем случае здесь можно
использовать t-критерий Стьюдента, но формула для tрасч имеет следующий вид:
расч
=
−
⁄
+
⁄
(22)
Далее вычисляют величинуfпо формуле
=
( ⁄
⁄
⁄
+
+
⁄
)
(23)
−2
Найденное значение f округляют до целого и принимают за число степеней свободы.
По этой величине и по уровню значимости qиз таблиц распределения Стьюдента
отыскивается tтабл. Дальнейший ход проверки не отличается от предыдущего случая.
Практическое занятие 5
Проверка нормальности распределения
При рассмотрении всех предыдущих статистических процедур предполагалось, что
выходная величина подчиняется нормальному закону распределения. Это предположение
можно проверить разными способами. Наиболее строгим из них является применение
критерияχ2 Пирсона.
Для этого необходимо иметь выборку достаточно большого объема: n≥ 50 –150.
Диапазон изменения выходной величины в этой выборке разбивается на lинтервалов так,
чтобы эти интервалы покрывали всю ось от -∞ до +∞ и в каждый интервал при этом попало
не менее пяти значений выходной величины. Подсчитывают количество miнаблюдений,
попавших в каждый интервал. Затем вычисляют теоретические вероятности попадания
случайной величины в каждый i-й интервал. Для этого используют формулу
pi = Ф(z2) – Ф(z1), где
н
=(
где
н
выборки;
− )/ ;
в
=(
− )/ (1.24),
– среднее арифметическое выборки;
– среднее квадратическое отклонение
в
– верхняя границаi-го интервала; Ф(z)-
– нижняя границаi-го интервала;
нормированная функция Лапласа:
Ф( ) =
1
⁄
√2
Значения ее дляz=z1иz=z2определяют из таблиц (Гмурман В.Е.). При отыскании значений
этой функции для отрицательных значений аргумента следует иметь в виду, что функция
Ф(z)нечетная:
Ф(-z)= - Ф(z).
Следующим этапом является вычисление величины χ2расч по формуле
расч
=
(
) ⁄
−
.(25)
По выбранному уровню значимости q и числе степеней свободыk = l –3 из табл. 3
приложения находят χ2табл. Гипотезу о нормальности распределения можно принять, если
χ2расч<χ2табл.
Пример.
Проверим
гипотезу
о
нормальности
распределения
значений
морозостойкости бетона при постоянном В/Ц=0,6 по выборке объема n=80, приведенной в
таблице 4.
Таблица4
1
2
3
4
5
6
7
8
Значения морозостойкости бетона, цикл
4
5
6
7
8
1
2
3
330
160
150
560
190
350
190
220
630
355
390
180
290
320
240
300
500
140
230
360
325
220
480
455
250
300
290
280
270
290
540
430
230
257
114
203
180
346
168
366
356
212
470
258
285
270
275
283
Вычисления удобно вести, заполняя табл. 5.
1. Данные выборки разобьем на l=6интервалов.
y=288
s2=s=115
285
203
555
362
392
194
243
106
219
381
129
120
187
154
343
265
9
10
215
354
257
198
222
468
386
156
506
308
164
249
189
250
165
342
Таблица 5
(mi- рi*n)2/ рi*n
№
интервала
Yiн
Yiв
mi
Z1
Z2
Ф( Z1)
Ф( Z2)
рi
рi*n
(mi- рi*n)2
1
2
3
4
5
6
7
8
9
10
11
12
1
-∞
200
20
-∞
-0,9
-0,5
-0,07171
0,42829
34,2632
203,4389
5,937533
2
200
300
29
-0,9
0,01
-0,07171
0,00798
0,07969
6,3752
511,8816
80,29263
3
300
400
20
0,01
0,11
0,00798
0,08759
0,07961
6,3688
185,8096
29,17498
4
400
500
5
0,11
0,22
0,08759
0,17413
0,08654
6,9232
3,698698
0,534247
5
500
600
5
0,22
0,32
0,17413
0,25103
0,0769
6,152
1,327104
0,215719
6
600
∞
1
0,32
∞
0,25103
0,5
0,24897
19,9176
357,8756
17,96781
∑
0
χ2расч=134
χ2табл=7, 81
к=l-3=6-3=3
q=0,05
Вывод: полученное соотношение позволяет или не позволяет принять гипотезу о нормальности распределения.
134,1229
Практическое занятие 6
Коэффициент корреляции
Во многих случаях целью экспериментальных исследований установление и изучение
зависимости между некоторыми величинами. Если каждая из этих величин является случайной,
то при этом используют методы корреляционного анализа.
Так, методами корреляционного анализа можно оценить степень взаимосвязи между
пределом прочности бетона при сжатии и водопоглощением и т.д.
Будем говорить, что между двумя случайными величинами имеется статистическая
связь, если при изменении одной из них меняется распределение другой. Для оценки
статистической связи по данным эксперимента широко используется выборочный коэффициент
корреляции. Пусть проведено n наблюдений и в каждом из них определялись значения двух
параметров (признаков) х и y. Следовательно, получаются две одновременно получаемые
выборки:
х1, х2,…, хnи
y1, y2, …, yn.
По каждой из них найдем среднее арифметическое и , а также выборочный стандарт sx и sy.
Выборочный коэффициент корреляции rрассчитывается по формуле
=
∑
( − ̅ )(
( − 1)
− )
,(26)
которую можно переписать в виде, более удобном для вычислений
=
∑
∑
(∑
(∑
)
)(∑
∑
)
(∑
.
(27)
)
При расчетах полезно иметь в виду, что выборочный коэффициент корреляции не
изменяется при изменении начала отсчета и масштаба измерения х и y.
Коэффициент корреляции всегда лежит в пределах – 1 ≤ r≤1. Он характеризует не
всякую, а только линейную зависимость между случайными величинами.
При положительном
rможно предполагать, что с возрастанием одной из случайных
величин другая в среднем тоже возрастает.
При отрицательном rс ростом одной из них другая величина в среднем будет убывать.
Чем ближе величина r к (+1) или к (-1), тем больше степень линейной зависимости
между рассматриваемыми случайными величинами.
21
Значение r =0 свидетельствует об отсутствии линейной статистической связи между
ними. Такие случайные величины называются
некоррелированными. Обычно величина
rоказывается не равной нулю.
Для выяснения того, будут ли некоррелированными в этом случае признаки х и y,
вычисляют величину
расч.
=| |
.
(28)
Ее сравнивают с табличным значением t-критерия
Стьюдента, найденным при
выбранном уровне значимости qи числе степеней свободы
f= n – 2. Если tрасч.<tтабл.,
принимается гипотеза о некоррелированности величин х и y. В противном случае коэффициент
корреляции значимо отличается от нуля, т.е. между величинами х и y существует линейная
статистическая связь.
Если требуется исследовать статистическую связь между тремя и более случайными
величинами, то пользуются коэффициентом множественной корреляции. Так, для оценки
степени статистической связи случайной величины z с величинами х и y рассчитывают
выборочный совокупный коэффициент корреляции ρ по формуле
=
−2
+
1−
где rху,rуz,rхz, - коэффициенты корреляции соответственно между величинами х и y, yиz,х и z.
Величина ρ лежит в пределах 0 ≤ ρ≤1 и, так же как и обычный коэффициент корреляции,
служит для оценки линейной статистической связи.
Пример.К системам двух случайных величин. Малая выборка нескольких свойств.
Случай, когда измеряется не одно свойство, а сразу несколько. В этом случае вводится
понятие о коэффициенте парной корреляции.
Результаты измерения трех свойств бетона на малой выборке представлены в
таблице:
Rб- прочность, МПа,
V - скорость прохождения ультразвука, м/с,
W - водопоглощение, % по массе.
22
Таблица 6
№
опыта
1
R,
МПа
20,3
2
V, м/с
W, %
R2
V2
W2
RV
RW
VW
3,85
3,68
412,09
14,82
13,54
78,16
74,70
14,17
22,7
4,21
3,22
515,29
17,72
10,37
95,57
73,09
13,56
3
24
4,1
3,5
576,00
16,81
12,25
98,40
84,00
14,35
4
24
4,29
3,2
576,00
18,40
10,24
102,96
76,80
13,73
5
24,5
4,21
3,4
600,25
17,72
11,56
103,15
83,30
14,31
6
24,8
4,25
3,25
615,04
18,06
10,56
105,40
80,60
13,81
Σ
140,30
24,91
20,25
3294,67
103,55
68,52
583,63
472,50
83,93
Вычисляем коэффициенты корреляции по формуле (27).
∑
=
∑
=
RV − (∑
R − (∑
6∙
[6 ∙
,
−
[6 ∙
=
[6 ∙
,
−(
6∙
,
,
,
,
−(
−
∙
,
=
,
−(
∙
) ][6 ∙
,
= 0,85
) ]
,
,
,
∙
) ][6 ∙
V)
,
,
,
−
V)
V − (∑
) ][6 ∙
,
6∙
=
∑
R)
,
−(
R) (∑
−(
) ]
,
,
,
−(
,
]
= −0,64
= −0,94
Судя по абсолютному значению оценок коэффициента корреляции
взаимосвязь может быть ранжирована так:
(V = W) > (Rб = V) >
(Rб = W)
0,94 >
0,64
0,85 >
Знак при r (R, V) указывает на направление взаимосвязи:
 при
r > 0 рост первого показателя должен сопровождаться
линейным увеличением
второго и наоборот,

при r < 0
за ростом первого показателя должно следовать линейное снижение второго.
Оценка коэффициента множественной корреляции для тех случайных величин
производится по формуле:
23
−2
=
+
(0,85) − 2 ∙ 0,85 ∙ (−0,64) ∙ (−0,94) + (−0,94)
= 0,98
1 − (0,85)
=
1−
при ρ = 0 взаимосвязь между случайными величинами отсутствует, а
приближается к детерминированной (существует значительная корреляционная связь).
при ρ

Практическое занятие 7
Статистический анализ уравнения регрессии
Дисперсия воспроизводимости
После того как уравнение регрессии получено, приступают к его статистическому
анализу. При этом решают две основные задачи:

оценивают значимость коэффициентов регрессии и

проверяют адекватность математической модели
Для выполнения каждой из этих процедур необходимо иметь количественную оценку
ошибок эксперимента в целом. Соответствующей характеристикой является дисперсия
воспроизводимости, обозначаемая s2{y}.рассмотрим способы ее вычисления в зависимости от
методики дублирования опытов.
1. Равномерное дублирование. Каждый из N запланированных опытов повторяется
одинаковое число n
раз, т.е. имеется
N серий, в каждой из которых становится n
дублированных опытов.
По результатам опытов первой серии рассчитываем дисперсию первого опыта
= [(
где
−
) +(
−
) + ⋯+ (
−
) ]/( − 1) = ∑(
−
) / ( − 1),
− среднеепосериидублированныхопытов, равное
+
=
+ ⋯+
=
/
Аналогично рассчитываются средние и дисперсии всех остальных опытов:
=∑
= ∑(
/ ;
(29)
−
) / ( − 1),
(30)
j=1,2,…,N
Числа степеней свободы всех дисперсий одинаковы и равны n-1: fj=f=n-1.
В качестве дисперсии воспроизводимости
s2{y} берется среднее арифметическое
дисперсий опытов
s y =
⋯
=∑
/ ,
(31)
Число степеней свободы fуэтой дисперсии равно сумме чисел степей свободы дисперсий
опытов
24
=∑
= ( − 1),
(32)
Необходимыми предпосылками статистического анализа являются нормальность
распределения выходной величины и однородность дисперсий опытов.
Проверка однородности дисперсий опытов при равномерном дублировании проводится
по критерию Кохрена.
2.
Отсутствие дублированных опытов. Для оценки дисперсии воспроизводимости в этом
случае приходится ставить отдельную серию дублированных опытов, если это возможно.
Как и в предыдущем случае, дисперсия опытов этой серии служит оценкой дисперсии
воспроизводимости с числом степеней свободы, равным fу=n0-1, где n0 – число дублированных
опытов в отдельной серии.
Оценка точности, значимости коэффициентов регрессии и
интерпретация результатов
Статистическую обработку проводят обычно для модели, записанной
в
нормализованных обозначениях факторов. Для определенности будем иметь в виду линейную
модель, содержащую k факторов.
После
того,
как
уравнение
регрессии
получено
и
рассчитана
дисперсия
воспроизводимости, следует оценить точность, с которой найдены коэффициенты регрессии.
Поскольку они вычислены по результатам эксперимента, а эти результаты являются
случайными величинами, то случайными величинами будут и коэффициенты регрессии bi .
Поэтому в качестве показателя точности отыскания коэффициента bi удобно взять его
дисперсию s{bi}.
Для большинства планов, рекомендованных теорией эксперимента, существуют простые
формулы для отыскания дисперсий коэффициентов регрессии (будут рассмотрены дальше при
изучении планов эксперимента).
После того как найдены дисперсии коэффициентов регрессии, следует выявить
незначимые коэффициенты, т.е., которые в математической модели можно приравнять нулю.
Для этого используется t-критерий Стьюдента. Для каждого коэффициента регрессии bi
отыскивается t-отношение
ti=|bi|/s{bi}
(33)
вычисленную величину ti сравнивают с табличным значением tтабл.
Стьюдента для заданного уровня значимости q и числа степеней свободы
t-критерия
fy , с которым
определялась дисперсия воспроизводимости s{y}.
Если ti<tтабл., токоэффициент регрессииbi незначим и соответствующий член в уравнении
регрессии должен быть отброшен.
25
С учетом (3.24)условие того, что коэффициент регрессии незначим, можно записать в
более удобном виде:
|bi| ≤ tтабл.s{bi}
(34)
При отбрасывании незначимых членов возникает определенное неудобство, связанное со
статической зависимостью коэффициентов регрессии. Эта зависимость появляется в том, что,
после того как незначимые коэффициенты регрессии приравняли нулю, оценки остальных
коэффициентов регрессии изменяются.
Практический вывод: после отбрасывания незначимых коэффициентов регрессии
желательно снова воспользоваться МНК для уточнения оставшихся значимых коэффициентов
регрессии.
С помощью t-критерия можно найти и доверительный интервал для произвольного
коэффициента регрессии bi. обозначим истинную величину этого коэффициента через βi. Тогда
bi- tтабл.s{bi} ≤ βi≤ bi+tтабл.s{bi}
(35)
даже простейшая линейная модель позволяет получить важную информацию об
объекте исследования.
Запишем ее в нормализованных обозначениях факторов
у =в0 + в1х1+в2х2+…+вkхk
(35)
Коэффициенты этой модели имеют четкий физический смысл
 Коэффициент в0 равен, очевидно, значению выходной величины, рассчитанному по
уравнению регрессии, если все факторы зафиксированы на основном уровне, т.е. в
середине диапазона варьирования.
 Знак коэффициента вi свидетельствует о характере влияния соответствующего фактора.

Если вi> 0, то с ростом значений факторов Хi выходная величина растет.

Если вi<0, то с ростом Хi отклик уменьшается.
 Величина вi равна приросту выходной величины, полученному при увеличении значения
фактора Хi на половину диапазона его варьирования, например, - с основного уровня
(Хi= Х 0i) до верхнего уровня (Хi= Х 1i).
 Графиком зависимости величины уот любого фактора будет прямая.
 Рассмотрение зависимостей выходной величины от этого фактора при разных
фиксированных значениях других факторов позволит получить семейство прямых,
причем все эти прямые будут параллельны. Это связано с тем, что представление
регрессионной модели в линейном виде предполагает отсутствие взаимодействий
факторов.
26
 Чем больше абсолютная величина линейного коэффициента регрессии в модели (35), тем
сильнее влияние соответствующего фактора. Если, например, оказалось, что |b3|>|b1 |, то
можно
сделать вывод о том, что изменение фактора Х3 в пределах его диапазона
варьирования оказывает большее влияние на изменение отклика, чем варьирование
фактора Х1 в его диапазоне.
Т.о., с помощью линейной регрессионной модели можно сравнить степень влияния
факторов на выходную величину и выявить важнейшие факторы.
Если уравнение регрессии отличается от линейного, то степень влияния фактора может
изменяться от начала к концу диапазона варьирования и зависит от уровней варьирования
других факторов.
Проверка адекватности регрессионной модели
Регрессионная модель, построенная по результатам эксперимента, позволяет рассчитать
значения отклика в разных точках области варьирования факторов.
Для этого в уравнение регрессии подставляют соответствующие значения варьируемых
факторов.
Проверка адекватности математической модели дает возможность экспериментатору
ответить на вопрос, будет ли построенная модель предсказывать значения выходной величины
с той же точностью, что и результаты эксперимента.
Пусть N – число опытов экспериментального плана или число серий параллельных
опытов, если опыты дублируются; р – число оцениваемых коэффициентов регрессии
математической модели.
Проверка адекватности возможна только при N>p, т.е. если план эксперимента является
насыщенным.
Для
проверки
адекватности
модели
необходимо
знать
оценку
дисперсии
воспроизводимости s2{у}, которую можно вычислить в зависимости от методики дублирования
по одной из формул, приведенных ранее в разделе 3.4.1.
Порядок проверки адекватности модели.
1. Определяют сумму квадратов, характеризующую адекватность модели Sад. При
равномерном дублировании е рассчитывают по формуле
ад
= [(
−
) +(
−
) +⋯+ (
−
) ] = n
(
−
) (36)
Здесь n – число дублированных опытов в каждой серии; ȳj – среднее значение результатов
эксперимента в j-й серии дублированных опытов, j=1,2,…,N; ŷj– среднее значение по
уравнению регрессии для j-го основного опыта.
27
В случае неравномерного дублирования
ад
=
(
−
) (37)
где n – число дублированных опытов в j-й серии.
2. Вычисляют число степеней свободы fад дисперсии адекватности. При любой методике
дублирования опытов оно равно
fад = N – p (38)
3. Вычисляют дисперсию адекватности s2ад
ад
=
ад ⁄ ад (39)
4. С помощью F-критерия Фишера проверяют однородность дисперсии адекватности s2ад и
дисперсии воспроизводимости s2{у}.
При этом вычисляют
Fрасч= s2ад/ s2{у},
(40)
которое сравнивают с табличным значением F – критерия Fтабл, найденным при выбранном
уровне значимости qдля чисел степеней свободы fад в числителе и fy в знаменателе (см. табл.
приложения).
Если
Fрасч<Fтабл, то модель считается адекватной и может быть использована для
описания объекта. В противном случае модель неадекватна.
Если оказалось, что уравнение не адекватно, следовательно, при проведении опытов
были допущены грубые ошибки
или выбранный полином недостаточно полно отражает
исследуемую зависимость. В этих случаях необходимо повторить опыты либо изменить
интервалы варьирования, либо применить другой план.
Рассмотренный метод проверки адекватности модели имеет простой физический смысл.
В основе этой процедуры лежит проверка гипотезы об однородности дисперсии адекватности и
дисперсии, характеризующей ошибку эксперимента.
Заметим, что дисперсия адекватности характеризует расхождение между результатами
эксперимента yj и значениями выходной величины ŷj, вычисленными по уравнению регрессии.
Логично принять, что модель удовлетворительно описывает объект исследования, т.е.
является адекватной, если указанное расхождение связано
только экспериментальными
ошибками, а не связано, например, с неудачным выбором вида математической модели.
Поверка гипотезы об однородности рассматриваемых дисперсий и выясняет «общность
происхождения» экспериментальных ошибок и расхождения между yj и ŷj.
Кроме
поверки
адекватности
модели
информационную ценность.
28
можно
оценить
ее
эффективность,
При
отсутствии
дублированных
опытов
эффективность
регрессионной
модели
оценивают следующим образом.
1. Вычисляют дисперсию относительно среднего значения отклика
с
=
(
− )
( − 1) (41)
где ȳ - среднее значение отклика по всем опытам;
=∑
⁄ .
2. Рассчитывают остаточную дисперсию s2ост:
ост
=
(
−
( − ) (42)
)
3. Вычисляют отношение Fu:
Fрасч= s2с / s2ост(43)
Величина Fu показывает, во сколько раз уравнение регрессии описывает результаты
эксперимента точнее, чем простое среднее арифметическое, взятое по всем опытам.
Регрессионная модель считается эффективной, если Fu> (3÷5).
Для экспериментов с дублированными опытами формула (43) остается в силе, а
выражения для дисперсий s2с и s2ост примут вид:
с
ост
=
∑
=
∑
− )
(
∑
∑
∑
(
−
− )
∑
−
гдеyju –значение отклика в u-м дублированном опыте j-й серии; N – число серий
дублированныхопытов;
=
∑
∑
∑
Последовательность действий исследователя при проведении эксперимента с
целью построения регрессионной модели объекта
1. Выбор варьируемых и стабилизируемых факторов, а также выходных величин
эксперимента.
2. Выбор регрессионной модели.
3. Определение диапазона варьирования факторов.
4. Выбор плана эксперимента.
5. Составление методики проведения эксперимента.
29
6. Постановка
разведывательных
опытов.
Проверка
нормальности
распределения
выходной величины. Определение числа дублированных опытов.
7. Проведение основного эксперимента.
8. Отбрасывание грубых наблюдений. Проверка однородности дисперсий опытов. Расчет
дисперсии воспроизводимости (при отсутствии дублированных опытов дисперсия
воспроизводимости определяется по результатам отдельной серии опытов).
9. Расчет коэффициентов регрессии математической модели.
10. Оценка значимости коэффициентов регрессии. Отбрасывание незначимых членов и
повторный расчет коэффициентов регрессии.
11. Проверка адекватности и эффективности регрессионной модели.
12. Интерпретация результатов.
Приведенный
перечень
этапов
только
приблизительно
отражает
реальную
последовательность действий экспериментатора, поскольку многие этапы оказываются
взаимосвязанными.
Таковы,
например,
выбор
математической
модели
и
определение
диапазона
варьирования факторов.
При выборе диапазона варьирования факторов существенны, прежде всего, соображения
экспериментатора, связанные с возможностью применения полученных им результатов и
рекомендаций в производственной сфере.
Поэтому диапазоны варьирования факторов в эксперименте обычно соответствуют
реальным производственным условиям.
Необходимо отметить, кроме того, что диапазоны варьирования факторов следует
выбирать тем больше, чем ниже точность фиксирования факторов и чем меньше диапазон
изменения выходной величины.
С другой стороны, для адекватного описания объекта моделью второго порядка
требуются, по сравнению с моделью первого порядка, более узкие диапазоны варьирования
факторов.
30
Библиографический список
1. Статистические методы решения технологических задач : учебное пособие /О.В.
Александрова, Т.А. Мацеевич, и др. ; М-во образования и науки Рос. Федерации, Моск.
гос. строит.уе-т. Москва : МГСУ, 2015. 160 с.
2. Сидняев, Н. И. Введение в теорию планирования эксперимента [Текст]: учебное пособие
для студентов высших учебных заведений / Н. И. Сидняев, Н. Т. Вилисова. - Москва :
МГТУ им. Н. Э. Баумана, 2011. - 463
3. Яковлев, В. П. Теория вероятностей и математическая статистика [Текст] : учебное
пособие / В. П. Яковлев. - 3-е изд. - Москва : Дашков и К, 2012. - 181 с. : ил., табл. Библиогр.: с. 179-181.
4. Соловьев, В. П. Организация эксперимента [Текст] : учебное пособие для вузов / В. П.
Соловьев, Е. М. Богатов. - Старый Оскол : ТНТ, 2012. - 255 с. : ил., табл. - Библиогр.: с.
235
5. Жуков, А. Д. Технологическое моделирование [Текст] : учебное пособие для студентов
вузов,
обучающихся
по
программе
бакалавриата
по
направлению
270800
"Строительство" (профиль "Производство и применение строительных материалов,
изделий и конструкций") / А. Д. Жуков ; Московский государственный строительный
университет. - Москва : МГСУ, 2013. - 203 с.
6. Ермаков, С. М. Математическая теория оптимального эксперимента [Text] / С. М.
Ермаков, А. А. Жиглявский. - М. : Наука, 1987. - 318 с.
7. Дворкин Л.И. оптимальное проектирование составов бетона. Львов: Вища школа. Изд-во
приЛьвов, ун-те, 1981
8. Хамханов К.М. Основы планирования эксперимента. Методическое пособие. Улан-Удэ,
2001
31
Приложение
Значения t-критерия Стьюдента
Таблица 1
n
p
0.80
0.90
0.95
0.98
0.99
0.995
0.998
0.999
1
3.0770
6.3130
12.7060
31.820
63.656
127.656
318.306
636.619
2
1.8850
2.9200
4.3020
6.964
9.924
14.089
22.327
31.599
3
1.6377
2.35340
3.182
4.540
5.840
7.458
10.214
12.924
4
1.5332
2.13180
2.776
3.746
4.604
5.597
7.173
8.610
5
1.4759
2.01500
2.570
3.649
4.0321
4.773
5.893
6.863
6
1.4390
1.943
2.4460
3.1420
3.7070
4.316
5.2070
5.958
7
1.4149
1.8946
2.3646
2.998
3.4995
4.2293
4.785
5.4079
8
1.3968
1.8596
2.3060
2.8965
3.3554
3.832
4.5008
5.0413
9
1.3830
1.8331
2.2622
2.8214
3.2498
3.6897
4.2968
4.780
10
1.3720
1.8125
2.2281
2.7638
3.1693
3.5814
4.1437
4.5869
11
1.363
1.795
2.201
2.718
3.105
3.496
4.024
4.437
12
1.3562
1.7823
2.1788
2.6810
3.0845
3.4284
3.929
4.178
13
1.3502
1.7709
2.1604
2.6503
3.1123
3.3725
3.852
4.220
14
1.3450
1.7613
2.1448
2.6245
2.976
3.3257
3.787
4.140
15
1.3406
1.7530
2.1314
2.6025
2.9467
3.2860
3.732
4.072
16
1.3360
1.7450
2.1190
2.5830
2.9200
3.2520
3.6860
4.0150
17
1.3334
1.7396
2.1098
2.5668
2.8982
3.2224
3.6458
3.965
18
1.3304
1.7341
2.1009
2.5514
2.8784
3.1966
3.6105
3.9216
19
1.3277
1.7291
2.0930
2.5395
2.8609
3.1737
3.5794
3.8834
20
1.3253
1.7247
2.08600
2.5280
2.8453
3.1534
3.5518
3.8495
21
1.3230
1.7200
2.2.0790
2.5170
2.8310
3.1350
3.5270
3.8190
22
1.3212
1.7117
2.0739
2.5083
2.8188
3.1188
3.5050
3.7921
23
1.3195
1.7139
2.0687
2.4999
2.8073
3.1040
3.4850
3.7676
24
1.3178
1.7109
2.0639
2.4922
2.7969
3.0905
3.4668
3.7454
25
1.3163
1.7081
2.0595
2.4851
2.7874
3.0782
3.4502
3.7251
26
1.315
1.705
2.059
2.478
2.778
3.0660
3.4360
3.7060
27
1.3137
1.7033
2.0518
2.4727
2.7707
3.0565
3.4210
3.6896
28
1.3125
1.7011
2.0484
2.4671
2.7633
3.0469
3.4082
3.6739
29
1.3114
1.6991
2.0452
2.4620
2.7564
3.0360
3.3962
3.8494
30
1.3104
1.6973
2.0423
2.4573
2.7500
3.0298
3.3852
3.6460
32
1.3080
1.6930
2.0360
2.4480
2.7380
3.0140
3.3650
3.6210
34
1.3070
1.6909
2.0322
2.4411
2.7284
3.9520
3.3479
3.6007
36
1.3050
1.6883
2.0281
2.4345
2.7195
9.490
3.3326
3.5821
38
1.3042
1.6860
2.0244
2.4286
2.7116
3.9808
3.3190
3.5657
40
1.303
1.6839
2.0211
2.4233
2.7045
3.9712
3.3069
3.5510
42
1.320
1.682
2.018
2.418
2.6980
2.6930
3.2960
3.5370
44
1.301
1.6802
2.0154
2.4141
2.6923
3.9555
3.2861
3.5258
46
1.300
1.6767
2.0129
2.4102
2.6870
3.9488
3.2771
3.5150
32
48
1.299
1.6772
2.0106
2.4056
2.6822
3.9426
3.2689
3.5051
50
1.298
1.6759
2.0086
2.4033
2.6778
3.9370
3.2614
3.4060
55
1.2997
1.673
2.0040
2.3960
2.6680
2.9240
3.2560
3.4760
60
1.2958
1.6706
2.0003
2.3901
2.6603
3.9146
3.2317
3.4602
65
1.2947
1.6686
1.997
2.3851
2.6536
3.9060
3.2204
3.4466
70
1.2938
1.6689
1.9944
2.3808
2.6479
3.8987
3.2108
3.4350
80
1.2820
1.6640
1.9900
2.3730
2.6380
2.8870
3.1950
3.4160
90
1.2910
1.6620
1.9867
2.3885
2.6316
2.8779
3.1833
3.4019
100
1.2901
1.6602
1.9840
2.3642
2.6259
2.8707
3.1737
3.3905
120
1.2888
1.6577
1.9719
2.3578
2.6174
2.8598
3.1595
3.3735
150
1.2872
1.6551
1.9759
2.3515
2.6090
2.8482
3.1455
3.3566
200
1.2858
1.6525
1.9719
2.3451
2.6006
2.8385
3.1315
3.3398
250
1.2849
1.6510
1.9695
2.3414
2.5966
2.8222
3.1232
3.3299
300
1.2844
1.6499
1.9679
2.3388
2.5923
2.8279
3.1176
3.3233
400
500
1.2837
1.2830
1.6487
1.6470
1.9659
1.9640
2.3357
2.3330
2.5882
2.7850
2.8227
2.8190
3.1107
3.1060
3.3150
3.3100
Таблица 2
Значения t-критерия Стьюдента
f
1
2
3
4
5
6
7
8
9
10
11
12
13
q
0,05
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
f
0,01
63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,05
3,01
14
15
16
17
18
19
20
21
22
23
24
25
26
q
0,05
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
2,06
2,06
33
f
0,01
2,98
2,95
2,92
2,90
2,88
2,86
2,85
2,83
2,82
2,81
2,80
2,79
2,78
27
28
29
30
40
50
60
80
100
120
200
500
∞
q
0,05
2,05
2,05
2,05
2,04
2,02
2,01
2,00
1,99
1,98
1,98
1,97
1,96
1,96
0,01
2,77
2,76
2,76
2,75
2,70
2,68
2,66
2,64
2,63
2,62
2,60
2,59
2,58
Таблица 3
Вероятность Р(
( )>
)
=
f
0,99
0,98
0,95
0,90
0,80
0,20
0,10
0,05
0,02
0,01
5
0,554
0,752
1,145
1,610
2,343
7,289
9,236
11,070
13,388
15,086
6
0,872
1,134
1,635
2,204
3,070
8,558
10,645
12,592
15,033
16,812
7
1,239
1,564
2,167
2,833
3,822
9,803
12,017
14,067
16,622
18,475
8
1,646
2,032
2,733
3,490
4,594
11,030
13,362
15,507
18,168
20,090
9
2,088
2,532
3,325
4,168
5,380
12,242
14,684
16,919
19,679
21,666
10
2,558
3,059
3,940
4,865
6,179
13,442
15,987
18,307
21,161
23,209
11
3,053
3,609
4,575
5,578
6,989
14,631
17,275
19,675
22,618
24,725
12
3,571
4,178
5,226
6,304
7,807
15,812
18,549
21,026
24,054
26,217
13
4,107
4,765
5,892
7,042
8,634
16,985
19,812
22,362
25,472
27,688
14
4,660
5,368
6,571
7,790
9,467
18,151
21,064
23,685
26,873
29,141
15
5,229
5,985
7,262
8,547
10,307
19,311
22,307
24,996
28,259
30,578
16
5,812
6,614
7,962
9,312
11,152
20,465
23,542
26,296
29,633
32,000
17
6,408
7,255
8,672
10,085
12,002
21,615
24,769
27,587
30,995
33,409
18
7,015
7,906
9,390
10,865
12,857
22,760
25,989
28,869
32,346
34,805
19
7,633
8,567
10,117
11,651
13,716
23,900
27,204
30,144
33,687
36,191
20
8,260
9,237
10,851
12,443
14,578
25,038
28,412
31,410
35,020
37,566
21
8,897
9,915
11,591
13,240
15,445
26,171
29,615
32,671
36,343
38,932
22
9,542
10,600
12,338
14,041
16,314
27,301
30,813
33,924
37,659
40,289
23
10,196
11,293
13,091
14,848
17,187
28,429
32,007
35,172
38,968
41,638
24
10,856
11,992
13,848
15,659
18,062
29,553
33,196
36,415
40,270
42,980
25
11,524
12,697
14,611
16,473
18,940
30,675
34,382
37,652
41,566
44,314
26
12,198
13,409
15,379
17,292
19,820
31,795
35,563
38,885
42,856
45,642
27
12,879
14,125
16,151
18,114
20,703
32,912
36,741
40,113
44,140
46,963
34
28
13,565
14,847
16,928
18,939
21,588
34,027
37,916
41,337
45,419
48,278
29
14,256
15,574
17,708
19,768
22,475
35,139
39,087
42,557
46,693
49,588
30
14,953
16,306
18,493
20,599
23,364
36,250
40,256
43,773
47,962
50,892
35
Таблица 4
Значения F – критерия Фишера
(f1 – число степеней свободы большей дисперсии, f2 – число степеней свободы меньшей
дисперсии)
f2
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
∞
161
18,51
10,13
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45
4,41
4,38
4,35
4,32
4,30
4,28
4,26
4,24
4,23
4,21
4,20
4,18
4,17
4,08
4,00
3,92
3,84
2
3
4
200
19,00
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,89
3,81
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3,47
3,44
3,42
3,40
3,39
3,37
3,35
3,34
3,33
3,32
3,23
3,15
3,07
3,00
216
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
3,07
3,05
3,03
3,01
2,99
2,98
2,96
2,95
2,93
2,92
2,84
2,76
2,68
2,60
225
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
2,84
2,82
2,80
2,78
2,76
2,74
2,73
2,71
2,70
2,69
2,61
2,53
2,45
2,37
5
230
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,68
2,66
2,64
2,62
2,60
2,59
2,57
2,56
2,55
2,53
2,45
2,37
2,29
2,21
6
234
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,53
2,51
2,49
2,47
2,46
2,45
2,43
2,42
2,34
2,25
2,17
2,10
f1
8
q=0,05
237
239
19,35 19,37
8,89
8,85
6,09
6,04
4,88
4,82
4,21
4,15
3,79
3,73
3,50
3,44
3,29
3,23
3,14
3,07
3,01
2,95
2,91
2,85
2,83
2,77
2,76
2,70
2,71
2,64
2,66
2,59
2,61
2,55
2,58
2,51
2,54
2,48
2,51
2,45
2,49
2,42
2,46
2,40
2,44
2,37
2,42
2,36
2,40
2,34
2,39
2,32
2,37
2,31
2,36
2,29
2,35
2,28
2,33
2,27
2,25
2,18
2,17
2,10
2,09
2,02
2,01
1,94
7
9
241
19,38
8,81
6,00
4,77
4,10
3,68
3,39
3,18
3,02
2,90
2,80
2,71
2,65
2,59
2,54
2,49
2,46
2,42
2,39
2,37
2,34
2,32
2,30
2,28
2,27
2,25
2,24
2,22
2,21
2,12
2,04
1,96
1,88
10
12
15
20
30
∞
242
19,40
8,79
5,94
4,74
4,06
3,64
3,35
3,14
2,98
2,85
2,75
2,67
2,60
2,54
2,49
2,45
2,41
2,38
2,35
2,32
2,30
2,27
2,25
2,24
2,22
2,20
2,19
2,18
2,16
2,08
1,99
1,91
1,83
244
19,41
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38
2,34
2,31
2,28
2,25
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,00
1,92
1,83
1,75
246
19,43
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,2
2,20
2,18
2,15
2,13
2,11
2,09
2,07
2,06
2,04
2,03
2,01
1,92
1,84
1,75
1,67
248
19,45
8,66
5,80
4,56
3,87
3,44
3,15
2,94
2,77
2,65
2,54
2,46
2,39
2,33
2,28
2,23
2,19
2,16
2,12
2,10
2,07
2,05
2,03
2,01
1,99
1,97
1,96
1,94
1,93
1,84
1,75
1,66
1,57
250
19,46
8,62
5,75
4,50
3,81
3,38
3,08
2,86
2,70
2,57
2,47
2,38
2,31
2,25
2,19
2,15
2,11
2,07
2,04
2,01
1,98
1,96
1,94
1,92
1,90
1,88
1,87
1,85
1,84
1,74
1,65
1,55
1,46
254
19,50
8,53
5,63
4,36
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,81
1,78
1,76
1,73
1,71
1,69
1,67
1,65
1,64
1,62
1,51
1,39
1,25
1,00
ОГЛАВЛЕНИЕ
Практическое занятие 1
4
Практическое занятие 2
10
Практическое занятие 3
12
Практическое занятие 4
15
Практическое занятие 5
18
Практическое занятие 6
21
Практическое занятие 7
24
Библиографический список
31
ПРИЛОЖЕНИЕ
32
37
Download