Планирование эксперимента

advertisement
В.И. Корольков И.С. Попов
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
Учебное пособие
Воронеж 2013
0
ФГБОУВПО «Воронежский государственный
технический университет»
В.И. Корольков И.С. Попов
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
Утверждено Редакционно-издательским советом университета
в качестве учебного пособия
1
Воронеж 2013
УДК: 629.7.02
Корольков
В.И.,
Попов
И.С.
Планирование
эксперимента: учеб. пособие. Воронеж: ФГБОУВПО
«Воронежский государственный технический университет»,
2013. 80 с.
В
учебном
пособии
рассматривается
вопрос
планирования
эксперимента.
Издание
соответствует
требованиям Государственного образовательного стандарта
высшего профессионального образования по направлению
652100 «Авиастроение», специальности 160201 «Самолето- и
вертолетостроение»,
дисциплине
«Планирование
экспериментов и обработка результатов».
Учебное пособие разработано в рамках реализации
федеральной целевой программы «Научные и научнопедагогические кадры инновационной России» на 2009 – 2013
годы, соглашение № 14.B37.21.1824, связанной с выполнением
научно-исследовательской работы (проекта) по теме
«Исследование,
разработка
конструкции
неразрезных
эллиптических обтекателей воздухозаборников двигателей
летательных аппаратов и моделирование технологического
процесса»
Табл. 3. Ил. 8. Библиогр.: 4 назв.
Научный редактор канд. техн. наук, доц. В.В.
Самохвалов
Рецензенты: филиал ОАО «НПК «Иркут»» в г. Воронеже
(зам. руководителя, канд. техн. наук, с.н.с.
В.А. Шалиткин);
Канд.техн. наук В.В. Рыжков
© Корольков В.И., Попов И.С., 2013
©
Оформление.
ФГБОУВПО
«Воронежский
государственный
2
технический
3
Университет»,
2013
ВВЕДЕНИЕ
Традиционные методы исследований связаны с
экспериментами, которые требуют больших затрат, сил и
средств.
Эксперименты, как правило, являются многофакторными
и связаны с оптимизацией качества материалов, отысканием
оптимальных условий проведения технологических процессов,
разработкой
наиболее
рациональных
конструкций
оборудования и т.д. Системы, которые служат объектом таких
исследований, очень часто являются такими сложными, что не
поддаются теоретическому изучению в разумные сроки.
Поэтому, несмотря на значительный объем выполненных
научно-исследовательских работ, из-за отсутствия реальной
возможности достаточно полно изучить значительное число
объектов исследования, как следствие, многие решения
принимаются на основании информации, имеющей случайный
характер, и поэтому далеки от оптимальных.
Исходя из выше изложенного возникает необходимость
поиска пути, позволяющего вести исследовательскую работу
ускоренными темпами и обеспечивающим принятие решений,
близких к оптимальным. Этим путем и явились статистические
методы
планирования
эксперимента,
предложенные
английским статистиком Рональдом Фишером (конец
двадцатых годов). Он впервые показал целесообразность
одновременного варьирования всеми факторами в противовес
широко распространенному однофакторному эксперименту
[1].
Применение
планирования
эксперимента
делает
поведение
экспериментатора
целенаправленным
и
организованным, существенно способствует повышению
производительности труда и надежности полученных
результатов.
Важным
достоинством
является
его
универсальность, пригодность в огромном большинстве
4
областей исследований. В нашей стране планирование
эксперимента развивается с 1960 г. под руководством В.В.
Налимова. Однако даже простая процедура планирования
весьма непроста, что обусловлено рядом причин, таких как
неверное применение методов планирования, выбор не самого
оптимального
пути
исследования,
недостаточность
практического
опыта,
недостаточная
математическая
подготовленность экспериментатора и т.д.
Цель данного учебного пособия – ознакомление
студентов с наиболее часто применяемыми и простыми
методами планирования эксперимента, выработка навыков
практического применения. Более подробно рассмотрена
задача оптимизации процессов.
5
1 ОСНОВНЫЕ ПОНЯТИЯ ПЛАНИРОВАНИЯ
ЭКСПЕРИМЕНТА
Планирование эксперимента, имеет свою определенную
терминологию. Рассмотрим общие термины.
Эксперимент — это система операций, воздействий и
(или) наблюдений, направленных на получение информации
об объекте при исследовательских испытаниях.
Опыт — воспроизведение исследуемого явления в
определенных условиях проведения эксперимента при
возможности регистрации его результатов. Опыт — отдельная
элементарная часть эксперимента.
Планирование эксперимента — процедура выбора числа
опытов и условий их проведения, необходимых для решения
поставленной задачи с требуемой точностью. Все факторы,
определяющие процесс, изменяются одновременно по
специальным
правилам,
а
результаты
эксперимента
представляются в виде математической модели.
Задачи, для решения которых может использоваться
планирование эксперимента, чрезвычайно разнообразны. К
ним относятся: поиск оптимальных условий, построение
интерполяционных формул, выбор существенных факторов,
оценка и уточнение констант теоретических моделей, выбор
наиболее приемлемых из некоторого множества гипотез о
механизме явлений, исследование диаграмм состав – свойство
и т.д.
Поиск оптимальных условий является одной из наиболее
распространенных научно-технических задач. Они возникают
в тот момент, когда установлена возможность проведения
процесса и необходимо найти наилучшие (оптимальные)
условия его реализации. Такие задачи называются – задачами
оптимизации. Процесс их решения называется – процессом
оптимизации или просто оптимизацией. Примеры задачи
6
оптимизации
–
выбор
оптимального
состава
многокомпонентных
смесей
и
сплавов,
повышение
производительности действующих установок, повышение
качества продукции, снижение затрат на ее получение и т.п.
Выделяют следующие этапы построения математической
модели
1.
сбор и анализ априорной информации;
2.
выбор факторов и выходных переменных,
области экспериментирования;
3.
выбор математической модели, с помощью
которой будут представляться экспериментальные данные;
4.
выбор критерия оптимальности и плана
эксперимента;
5.
определение метода анализа данных;
6.
проведение эксперимента;
7.
проверка статистических предпосылок для
полученных экспериментальных данных;
8.
обработка результатов;
9.
интерпретация и рекомендации.
Факторы определяют состояние объекта. Основное
требование
к
факторам
—
управляемость.
Под
управляемостью понимается установление нужного значения
фактора (уровня) и поддержание его в течение всего опыта. В
этом состоит особенность активного эксперимента. Факторы
могут быть количественными и качественными. Примерами
количественных факторов являются температура, давление,
концентрация и т. п. Их уровням соответствует числовая
шкала. Различные катализаторы, конструкции аппаратов,
способы лечения, методики преподавания
являются
примерами качественных факторов. Уровням таких факторов
не соответствует числовая шкала, и их порядок не играет роли.
Выходные переменные — это реакции (отклики) на
воздействие факторов. Отклик зависит от специфики
исследования и может быть экономическим (прибыль,
рентабельность), технологическим (выход, надежность),
7
психологическим, статистическим и т. д. Параметр
оптимизации должен быть эффективным с точки зрения
достижения
цели,
универсальным,
количественным,
выражаемым числом, имеющим физический смысл, быть
простым и легко вычисляемым.
Затраты машинного времени можно значительно
сократить, если на этапе оптимизации параметров
использовать экспериментальную факторную математическую
модель. Экспериментальные факторные модели, в отличие от
теоретических,
не
используют
физических
законов,
описывающих происходящие в объектах процессы, а
представляют собой некоторые формальные зависимости
выходных параметров от внутренних и внешних параметров
объектов проектирования.
Экспериментальная факторная модель может быть
построена
на
основе
проведения
экспериментов
непосредственно на самом техническом объекте (физические
эксперименты), либо вычислительных экспериментов на ЭВМ
с теоретической моделью.
Рисунок 1
При построении экспериментальной факторной модели
объект моделирования (проектируемая техническая система)
представляется в виде "черного ящика", на вход которого
8
подаются некоторые переменные Xи Z, а на выходе можно
наблюдать и регистрировать переменные Y.
В процессе проведения эксперимента изменение
переменных Xи Zприводит к изменениям выходных
переменных Y. Для построения факторной модели необходимо
регистрировать эти изменения и осуществить необходимую их
статистическую обработку для определения параметров
модели.
При
проведении
физического
эксперимента
переменными Xможно управлять, изменяя их величину по
заданному закону. Переменные Z— неуправляемые,
принимающие случайные значения. При этом значения
переменных Xи Zможно контролировать и регистрировать с
помощью соответствующих измерительных приборов. Кроме
того, на объект воздействуют некоторые переменные Е,
которые нельзя наблюдать и контролировать. Переменные X=
(x1, х2,..., хn) называют контролируемыми управляемыми;
переменные Z = (z1, z2,…… zm) — контролируемыми, но
неуправляемыми, а переменные E = (ε1, ε2,..., εl) —
неконтролируемыми и неуправляемыми.
Переменные X и Z называют факторами. Факторы X
являются
управляемыми
и
изменяются
как
детерминированные переменные, а факторы Z неуправляемые,
изменяемые во времени случайным образом, т. е. Z
представляют собой случайные процессы. Пространство
контролируемых переменных — факторов X и Z — образует
факторное пространство.
Выходная переменная Y представляет собой вектор
зависимых переменных моделируемого объекта. Ее называют
откликом, а зависимость Y от факторов Xи Z— функцией
отклика. Геометрическое представление функции отклика
называют поверхностью отклика.
Переменная Е действует в процессе эксперимента
бесконтрольно. Если предположить, что факторы X и Z
стабилизированы во времени и сохраняют постоянные
9
значения, то под влиянием переменных E функция отклика Y
может меняться как систематическим, так и случайным
образом. В первом случае говорят о систематической помехе, а
во втором — о случайной помехе. При этом полагают, что
случайная помеха обладает вероятностными свойствами, не
изменяемыми во времени.
Возникновение помех обусловлено ошибками методик
проведения
физических
экспериментов,
ошибками
измерительных приборов, неконтролируемыми изменениями
параметров ихарактеристик объекта и внешней среды.
В
вычислительных
экспериментах
объектом
исследования является теоретическая математическая модель,
на основе которой необходимо получить экспериментальную
факторную модель. Для ее получения необходимо определить
структуру и численные значения параметров модели.
Под структурой модели понимается вид математических
соотношений между факторами X, Z и откликом Y. Параметры
представляют собой коэффициенты уравнений факторной
модели. Структуру модели обычно выбирают на основе
априорной информации об объекте с учетом назначения и
последующего использования модели. Задача определения
параметров модели полностью формализована. Она решается
методами регрессионного анализа. Экспериментальные
факторные модели называют также регрессионными
моделями.
Регрессионную модель можно представить выражением
Y   ( X , Z , B);
(1.1)
где В — вектор параметров факторной модели.
Вид вектор-функции φ определяется выбранной
структурой модели и считается заданным, а параметры В
подлежат определению на основе результатов эксперимента.
Различают эксперименты пассивные и активные.
10
Пассивным называется такой эксперимент, когда
значениями факторов управлять нельзя, и они принимают
случайные значения. В таком эксперименте существуют
только факторы Z. В процессе эксперимента в определенные
моменты времени измеряются значения факторов Z и функций
откликов Y. После проведения N опытов полученная
информация обрабатывается статистическими методами,
позволяющими определить параметры факторной модели.
Такой подход к построению математической модели лежит в
основе метода статистических испытаний (Монте-Карло).
Активным называется такой эксперимент, когда
значениями факторов задаются и поддерживают их
неизменными в заданных уровнях в каждом опыте в
соответствии с планом эксперимента. Следовательно, в этом
случае существуют только управляемые факторы X.
Основные особенности экспериментальных факторных
моделей следующие: они статистические; представляют собой
сравнительно простые функциональные зависимости между
оценками математических ожиданий выходных параметров
объекта от eё внутренних и внешних параметров; дают
адекватное описание установленных зависимостей лишь в
области факторного пространства, в которой реализован
эксперимент. Статистически регрессионная модель описывает
поведение объекта в среднем, характеризуя его неслучайные
свойства, которые в полной мере проявляются лишь при
многократном повторении опытов в неизменных условиях.
11
2 ОСНОВНЫЕ ПРИНЦИПЫ ПЛАНИРОВАНИЯ
ЭКСПЕРИМЕНТА
Для получения адекватной математической модели
необходимо обеспечить выполнение определенных условий
проведения эксперимента. Модель называют адекватной, если
в оговоренной области варьирования факторов X полученные
с помощью модели значения функций отклика Y отличаются
от истинных не более чем на заданную величину. Методы
построения
экспериментальных
факторных
моделей
рассматриваются в теории планирования эксперимента.
Цель планирования эксперимента — получение
максимума информации о свойствах исследуемого объекта
при минимуме опытов. Такой подход обусловлен высокой
стоимостью экспериментов, как физических, так и
вычислительных, и вместе с тем необходимостью построения
адекватной модели.
При
планировании
активных
экспериментов
используются следующие принципы:
– отказ от полного перебора всех возможных состояний
объекта;
– постепенное усложнение структуры математической
модели;
– сопоставление результатов эксперимента с величиной
случайных помех;
– рандомизация опытов;
– оптимальное планирование эксперимента.
Детальное представление о свойствах поверхности
отклика может быть получено лишь при условии
использования густой дискретной сетки значений факторов,
покрывающей все факторное пространство. В узлах этой
многомерной сетки находятся точки плана, в которых
проводятся опыты. Выбор структуры факторной модели
12
основан на постулировании определенной степени гладкости
поверхности отклика. Поэтому с целью уменьшения
количества опытов принимают небольшое число точек плана,
для которых осуществляется реализация эксперимента.
При большом уровне случайной помехи получается
большой разброс значений функции отклика Yв опытах,
проведенных в одной и той же точке плана. В этом случае
оказывается, что чем выше уровень помехи, тем с большей
вероятностью простая модель окажется работоспособной. Чем
меньше уровень помехи, тем точнее должна быть факторная
модель.
Кроме случайной помехи при проведении эксперимента
может иметь место систематическая помеха. Наличие этой
помехи практически никак не обнаруживается и результат ее
воздействия на функцию не поддается контролю. Однако если
путем соответствующей организации проведения опытов
искусственно
создать
случайную
ситуацию,
то
систематическую помеху можно перевести в разряд
случайных. Такой принцип организации эксперимента
называют рандомизациейсистематически действующих помех.
Наличие помех приводит к ошибкам эксперимента.
Ошибки подразделяют на систематические и случайные,
соответственно наименованиям вызывающих их факторов —
помех.
Рандомизацию опытов осуществляют только в
физических экспериментах. Следует отметить, что в этих
экспериментах систематическую ошибку может порождать
наряду с отмеченными ранее факторами также неточное
задание значений управляемых факторов, обусловленное
некачественной калибровкой приборов для их измерения
(инструментальная
ошибка),
конструктивными
или
технологическими факторами.
К факторам в активном эксперименте предъявляются
определенные требования. Они должны быть:
13
– управляемыми(установка заданных значений и
поддержание постоянными в процессе опыта);
– совместными(их взаимное влияние не должно
нарушать процесс функционирования объекта);
–независимыми(уровень
любого фактора должен
устанавливаться независимо от уровней остальных);
– однозначными(одни факторы не должны быть
функцией других);
– непосредственно влияющими на выходные параметры.
Выбор
параметров
оптимизации
(критериев
оптимизации) является одним из главных этапов работы на
стадии предварительного изучения объекта исследования, т.к.
правильная постановка задачи зависит от правильности
выбора параметра оптимизации, являющегося функцией цели.
Под параметром оптимизации понимают характеристику
цели, заданную количественно. Параметр оптимизации
является реакцией (откликом) на воздействие факторов,
которые определяют поведение выбранной системы.
Реальные объекты или процессы, как правило, очень
сложны. Они часто требуют одновременного учета
нескольких, иногда очень многих, параметров. Каждый объект
может характеризоваться всей совокупностью параметров, или
любым подмножеством этой совокупности, или одним –
единственным параметром оптимизации. В последнем случае
прочие характеристики процесса уже не выступают в качестве
параметра оптимизации, а служат ограничениями. Другой путь
– построение обобщенного параметра оптимизации как
некоторой функции от множества исходных.
Параметр оптимизации (Функции отклика) – это признак,
по которому оптимизируется процесс. Он должен быть
количественным, задаваться числом. Множество значений,
которые может принимать параметр оптимизации, называется
областью его определения. Области определения могут быть
непрерывными
и
дискретными,
ограниченными
и
неограниченными. Например, выход реакции – это параметр
14
оптимизации с непрерывной ограниченной областью
определения. Он может изменяться в интервале от 0 до 100%.
Число бракованных изделий, число зерен на шлифе сплава,
число кровяных телец в пробе крови – вот примеры
параметров
с
дискретной
областью
определения,
ограниченной снизу.
Количественная оценка параметра оптимизации на
практике не всегда возможна. В таких случаях пользуются
приемом, называемым ранжированием. При этом параметрам
оптимизации присваиваются оценки – ранги по заранее
выбранной шкале: двухбалльной, пятибалльной и т.д.
Ранговый параметр имеет дискретную ограниченную область
определения. В простейшем случае область содержит два
значения (да, нет; хорошо, плохо). Это может соответствовать,
например, годной продукции и браку.
2.1 Виды параметров оптимизации
В зависимости от объекта и цели параметры
оптимизации могут быть весьма разнообразными. Введем
некоторую классификацию [2]. Реальные ситуации, как
правило довольно сложны. Они часто требуют нескольких,
иногда очень многих, параметров. В принципе каждый объект
может характеризоваться сразу всей совокупностью
параметров, приведенных на рисунке 2, или любым
подмножеством из этой совокупности.Движение к оптимуму
возможно, если выбран один-единственный параметр
оптимизации. Тогда прочие характеристики процесса уже не
выступают в качестве параметров оптимизации, а служат
ограничениями. Другой путь — построение обобщенного
параметра оптимизации как некоторой функции от множества
исходных [1—3].
15
16
Рисунок 2 – Классификация параметров оптимизации
Прокомментируем некоторые элементы схемы.
Экономические параметры оптимизации, такие, как
прибыль,
себестоимость
и
рентабельность,
обычно
используются при исследовании действующих промышленных
объектов, тогда как затраты на эксперимент имеет смысл
оценивать в любых исследованиях, в том числе и
лабораторных. Если цена опытов одинакова, затраты на
эксперимент пропорциональны числу опытов, которые
необходимо поставить для решения данной задачи. Это в
значительной мере определяет выбор плана эксперимента.
Среди технико-экономических параметров наибольшее
распространение имеет производительность. Такие параметры,
как долговечность, надежность и стабильность, связаны с
длительными наблюдениями. Имеется некоторый опыт их
использования при изучении дорогостоящих ответственных
объектов, например радиоэлектронной аппаратуры.
Почти во всех исследованиях приходится учитывать
количество и качество получаемого продукта. Как меру
количества продукта используют выход, например, процент
выхода химической реакции, выход годных изделий.
Показатели качества чрезвычайно разнообразны. В схеме
они сгруппированы по видам свойств. Характеристики
количества и качества продукта образуют группу техникотехнологических параметров.
Под рубрикой «прочие» сгруппированы различные
параметры, которые реже встречаются, но не являются менее
важными.
Сюда
попали
статистические
параметры,
используемые для улучшения характеристик случайных
величин или случайных функций. В качестве примеров
назовем задачи на минимизацию дисперсии случайной
величины, на уменьшение числа выбросов случайного
процесса за фиксированный уровень и т. д. Последняя задача
возникает, в частности, при выборе оптимальных настроек
автоматических регуляторов или при улучшении свойств
нитей (проволока, пряжа, искусственное волокно и др.).
17
2.2 Требования к параметрам оптимизации
1) параметр оптимизации должен быть количественным.
2) параметр оптимизации должен выражаться одним
числом. Иногда это получается естественно, как регистрация
показания прибора. Например, скорость движения машины
определяется числом на спидометре. Часто приходится
проводить некоторые вычисления. Так бывает при расчете
выхода реакции. В химии часто требуется получать продукт с
заданным отношением компонентов, например, А:В=3:2. Один
из возможных вариантов решения подобных задач состоит в
том, чтобы выразить отношение одним числом (1,5) и в
качестве параметра оптимизации пользоваться значением
отклонений (или квадратов отклонений) от этого числа.
3) однозначность в статистическом смысле. Заданному
набору значений факторов должно соответствовать одно
значение параметра оптимизации, при этом обратное неверно:
одному и тому же значению параметра могут соответствовать
разные наборы значений факторов.
4) наиболее важным требованием к параметрам
оптимизации является его возможность действительно
эффективной
оценки
функционирования
системы.
Представление об объекте не остается постоянным в ходе
исследования. Оно меняется по мере накопления информации
и в зависимости от достигнутых результатов. Это приводит к
последовательному
подходу
при
выборе
параметра
оптимизации. Так, например, на первых стадиях исследования
технологических процессов в качестве параметра оптимизации
часто используется выход продукта. Однако в дальнейшем,
когда возможность повышения выхода исчерпан, начинают
интересоваться такими параметрами, как себестоимость,
чистота
продукта
и
т.д.
Оценка
эффективности
функционирования системы может осуществляться как для
всей системы в целом, так и оценкой эффективности ряда
подсистем, составляющих данную систему. Но при этом
18
необходимо учитывать возможность того, что оптимальность
каждой из подсистем по своему параметру оптимизации «не
исключает возможность гибели системы в целом». Это
означает, что попытка добиться оптимума с учетом некоторого
локального или промежуточного параметра оптимизации
может оказаться неэффективной или даже привести к браку.
5) требование универсальности или полноты. Под
универсальностью параметра оптимизации понимают его
способность всесторонне охарактеризовать объект. В
частности,
технологические
параметры
недостаточно
универсальны:
они
не
учитывают
экономику.
Универсальностью
обладают,
например,
обобщенные
параметры оптимизации, которые строятся как функции от
нескольких частных параметров.
6) параметр оптимизации желательно должен иметь
физический смысл, быть простым и легко вычисляем.
Требование физического смысла связано с последующей
интерпретацией результатов эксперимента. Не представляет
труда объяснить, что значит максимум извлечения, максимум
содержания ценного компонента. Эти и подобные им
технологические параметры оптимизации имеют ясный
физический смысл, но иногда для них может не выполняться,
например, требование статистической эффективности. Тогда
рекомендуется переходить к преобразованию параметра
оптимизации. Второе требование, т.е. простота и легко
вычисляемость, также весьма существенны. Для процессов
разделения термодинамические параметры оптимизации более
универсальны. Однако на практике ими пользуются мало: их
расчет довольно труден. Из приведенных двух требований
первое является более существенным, потому что часто
удается найти идеальную характеристику системы и сравнить
ее с реальной характеристикой.
19
2.3Факторы
После выбора объекта исследования и параметра
оптимизации нужно рассмотреть все факторы, которые могут
влиять на процесс. Если какой-либо существенный фактор
окажется неучтенным и принимал произвольные значения, не
контролируемые экспериментатором, то это значительно
увеличит ошибку опыта. При поддержании этого фактора на
определенном уровне может быть получено ложное
представление об оптимуме, т.к. нет гарантии, что полученный
уровень является оптимальным.
С другой стороны большое число факторов увеличивает
число опытов и размерность факторного пространства.
Выбор факторов эксперимента является весьма
существенным, от этого зависит успех оптимизации.
Фактор
–
измеряемая
переменная
величина,
принимающая в некоторый момент времени определенное
значение и влияющая на объект исследования.
Факторы должны иметь область определения, внутри
которой задаются его конкретные значения. Область
определения может быть непрерывной или дискретной. При
планировании эксперимента значения факторов принимаются
дискретными, что связано с уровнями факторов. В
практических задачах области определения факторов имеют
ограничения, которые носят либо принципиальный, либо
технический характер.
Факторы
разделяются
на
количественные
и
качественные.
К количественным относятся те факторы, которые можно
измерять, взвешивать и т.д.
Качественные факторы – это различные вещества,
технологические способы, приборы, исполнители и т.п.
Хотя к качественным факторам не соответствует
числовая шкала, но при планировании эксперимента к ним
применяют условную порядковую шкалу в соответствии с
20
уровнями, т.е. производится кодирование. Порядок уровней
здесь произволен, но после кодирования он фиксируется.
2.3.1 Требования к факторам эксперимента
1)
Факторы должны быть управляемыми, это
значит, что выбранное нужное значение фактора можно
поддерживать постоянным в течение всего опыта.
Планировать эксперимент можно только в том случае, если
уровни факторов подчиняются воле экспериментатора.
Например, экспериментальная установка смонтирована на
открытой площадке. Здесь температурой воздуха мы не можем
управлять, ее можно только контролировать, и потому при
выполнении опытов температуру, как фактор, мы не можем
учитывать.
2)
Чтобы точно определить фактор, нужно указать
последовательность действий (операций), с помощью которых
устанавливаются его конкретные значения. Такое определение
называется операциональным. Так, если фактором является
давление в некотором аппарате, то совершенно необходимо
указать, в какой точке и с помощью какого прибора оно
измеряется
и
как
оно
устанавливается.
Введение
операционального определения обеспечивает однозначное
понимание фактора.
3)
Точность замеров факторов должна быть
возможно более высокой. Степень точности определяется
диапазоном изменения факторов. В длительных процессах,
измеряемых многими часами, минуты можно не учитывать, а в
быстрых процессах приходится учитывать доли секунды.
Исследование существенно усложняется, если фактор
измеряется с большой ошибкой или значения факторов трудно
поддерживать на выбранном уровне (уровень фактора
«плывет»), то приходится применять специальные методы
исследования, например, конфлюэнтный анализ [3,4].
21
4)
Факторы должны быть однозначны. Трудно
управлять фактором, который является функцией других
факторов. Но в планировании могут участвовать другие
факторы, такие, как соотношения между компонентами, их
логарифмы и т.п. Необходимость введения сложных факторов
возникает
при
желании
представить
динамические
особенности объекта в статической форме. Например,
требуется найти оптимальный режим подъема температуры в
реакторе. Если относительно температуры известно, что она
должна нарастать линейно, то в качестве фактора вместо
функции (в данном случае линейной) можно использовать
тангенс угла наклона, т.е. градиент.
5)
При планировании эксперимента одновременно
изменяют несколько факторов, поэтому необходимо знать
требования к совокупности факторов. Прежде всего
выдвигается требование совместимости. Совместимость
факторов означает, что все их комбинации осуществимы и
безопасны. Несовместимость факторов наблюдается на
границах областей их определения. Избавиться от нее можно
сокращением областей. Положение усложняется, если
несовместимость проявляется внутри областей определения.
Одно из возможных решений – разбиение на подобласти и
решение двух отдельных задач.
6)
При
планировании
эксперимента
важна
независимость факторов, т.е. возможность установления
фактора на любом уровне вне зависимости от уровней других
факторов. Если это условие невыполнимо, то невозможно
планировать эксперимент.
2.3.2 Требования к совокупности факторов
При планировании эксперимента обычно одновременно
изменяется несколько факторов. Поэтому очень важно
сформулировать требования, которые предъявляются к
совокупности факторов. Прежде всего выдвигается требование
22
совместимости. Совместимость факторов означает, что все их
комбинации осуществимы и безопасны. Это очень важное
требование.
Представьте
себе,
что
вы
поступили
легкомысленно, не обратили внимания на требование
совместимости факторов и запланировали такие условия
опыта, которые могут привести к взрыву установки или
осмолению продукта. Согласитесь, что такой результат очень
далек от целей оптимизации.
Несовместимость факторов может наблюдаться на
границах областей их определения. Избавиться от нее можно
сокращением областей. Положение усложняется, если
несовместимость проявляется внутри областей определения.
Одно из возможных решений — разбиение на подобласти и
решение двух отдельных задач.
При планировании эксперимента важна независимость
факторов, т. е. возможность установления фактора на любом
уровне вне зависимости от уровней других факторов. Если это
условие
невыполнимо,
то
невозможно
планировать
эксперимент. Итак, мы подошли ко второму требованию —
отсутствию корреляции между факторами. Требование
некоррелированности не означает, что между значениями
факторов нет никакой связи. Достаточно, чтобы связь не была
линейной.
23
3 ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
3.1 План эксперимента
При проведении активного эксперимента задается
определенный план варьирования факторов, т. е. эксперимент
заранее планируется
План
эксперимента
—
совокупность
данных,
определяющих число, условия и порядок реализации опытов.
Планирование
эксперимента
—
выбор
плана
эксперимента, удовлетворяющего заданным требованиям.
Точка плана — упорядоченная совокупность численных
значений факторов, соответствующая условиям проведения
опыта, т. е. точка факторного пространства, в которой
проводится эксперимент. Точке плана с номером i
соответствует вектор-строка (3.1):
X i1  ( X i1 , X i 2 ,..., X in ).
(3.1)
Общая совокупность таких векторов Xi, i= 1, Lобразует
план эксперимента, а совокупность различных векторов, число
которых обозначим N, — спектр плана.
В активном эксперименте факторы могут принимать
только фиксированные значения. Фиксированное значение
фактора называют уровнем фактора. Количество принимаемых
уровней факторов зависит от выбранной структуры факторной
модели и принятого плана эксперимента. Минимальный Xjmin и
максимальный Хimах, j=l,n (n — число факторов) уровни всех
факторов выделяют в факторном пространстве некоторый
гиперпараллелепипед,
представляющий
собой
область
планирования. В области планирования находятся все
возможные значения факторов, используемые в эксперименте.
24
Вектор X  ( X 1 , X 2 ,..., X n ) задает точку центра
областипланирования. Координаты этой точки Xj0 обычно
выбирают из соотношения (3.2)
0
0
X 0j 
0
0
( X j max  X j min )
2
.
(3.2)
Точку Х0называют центром эксперимента. Она
определяет основной уровень факторов Хj0, j = 1,n.Центр
эксперимента стремятся выбрать как можно ближе к точке,
которая соответствует искомым оптимальным значениям
факторов. Для этого используется априорная информация об
объекте.
Интервалом (или шагом) варьирования фактора Xj
называют величину, вычисляемую по формулам (3.3, 3.4):
X j 
X
j max
 X j min
2
,
(3.3)
j  1, n.
(3.4)
Факторы нормируют, а их уровни кодируют. В
кодированном виде верхний уровень обозначают +1, нижний 1, а основной 0. Нормирование факторов осуществляют на
основе соотношения (3.5, 3.6):
xj =(Xj-X0j)/ΔXj,
j=1,n.
25
(3.5)
(3.6)
Рисунок 3 – Геометрическое представление области
планирования при двух факторах: Х1 и Х2
Точки 1,2,3,4 являются точкамиплана эксперимента.
Например, значения факторов Х1и Х2в точке 1равны
соответственно X1min иХ2min, а нормированные их значения
xlmin = -1, х2min = -1.
После установления нулевой точки выбирают интервалы
варьирования факторов. Это связано с определением таких
значений факторов, которые в кодированных величинах
соответствуют +1 и –1. Интервалы варьирования выбирают с
учетом того, что значения факторов, соответствующие
уровням +1 и –1, должны быть достаточно отличимы от
значения, соответствующему нулевому уровню. Поэтому во
всех случаях величина интервала варьирования должна быть
больше удвоенной квадратичной ошибки фиксирования
данного фактора. С другой стороны, чрезмерное увеличение
величины интервалов варьирования нежелательно, т.к. это
может привести к снижению эффективности поиска оптимума.
26
А очень малый интервал варьирования уменьшает область
эксперимента, что замедляет поиск оптимума.
При выборе интервала варьирования целесообразно
учитывать, если это возможно, число уровней варьирования
факторов в области эксперимента. От числа уровней зависят
объем эксперимента и эффективность оптимизации.
План эксперимента удобно представлять в матричной
форме.
Матрица планапредставляет собой прямоугольную
таблицу, содержащую информацию о количестве и условиях
проведения опытов. Строки матрицы плана соответствуют
опытам, а столбцы — факторам. Размерность матрицы плана L
х n, где L— число опытов, n— число факторов. При
проведении повторных (дублирующих) опытов в одних и тех
же точках плана матрица плана содержит ряд совпадающих
строк.
Матрица спектра плана— это матрица, в которую входят
только различающиеся между собой строки матрицы плана.
Размерность матрицы спектра плана N х n, где N — число
точек плана, различающихся между собой хотя бы одной
координатой U
Матрица спектра плана имеет вид (3.7):
X 
X1
X2
...
X 11
Xi
...
X 21 X 22
...
... .
 X.... X... ...... X ...
X
...
ij
i1
i2
in
..... ..... ...... . .......
XN
X N 1 X N 2 ... X Nj ... X Nn
27
(3.7)
3.2 Структура экспериментальной факторной модели
Под
структурой
экспериментальной
факторной
математической модели понимается вид математических
соотношений между факторами X, Zи откликом Y. В качестве
факторов принимают внутренние и внешние параметры
технической системы, подлежащие оптимизации в процессе ее
проектирования. Внутренние параметры системы — это
параметры ее элементов, внешние — это параметры внешней
среды, в условиях воздействий которой осуществляется
функционирование системы. Функциями отклика Yявляются
выходные параметры технической системы, характеризующие
ее эффективность и качество процессов функционирования.
Выходные параметры системы принимаются в качестве
критериев оптимальности.
Структура факторной модели выбирается на основе
априорной информации, используя принцип постепенного ее
усложнения. Параметры факторной математической модели
определяются методами регрессионного анализа. При
определении параметров этими методами нет необходимости
различать виды факторов, т. е. подразделять факторы на
управляемые Xи неуправляемые Z. Поэтому в дальнейшем все
они будут обозначаться буквой X. Тогда факторную модель
можно представить векторным уравнением регрессии вида
(3.8):
Y   ( X , B).
(3.8)
Для определения параметров используются результаты
эксперимента. Результаты эксперимента можно представить
функцией вида (3.9):
Y  ( X )   ;
28
(3.9)
где βj — j-ый элемент вектора искомых коэффициентов
уравнения регрессии;
fj(x) - j-ая базисная функция.
В качестве базисных функций используют переменные
простейших полиномов, системы ортогональных полиномов,
тригонометрические функции. Наиболее часто пользуются
простейшими полиномами первой и второй степеней.
Например, полином первой степени, описывающий функцию
отклика у при двух факторах х1 и х2 ,может иметь вид (3.10,
3.11):
y=b0 + b1x1 + b2x2
(3.10)
y=b0 + b1x1 + b2x2 + b3x1x2
(3.11)
или
А полином второй степени будет иметь вид (3.12):
y=b0 + b1x1 + b2x2 + b3x1x2 + b4x12 + b5x22
(3.12)
Базисные функции в случае использования последнего
выражения имеют вид
f0(X)=1;
f1(X)=x1;
f2(X)=x2;
f3(X)=x1 x2;
f4(X)=x12;
f5(X)=x22;
29
4. ПЛАНЫ ЭКСПЕРИМЕНТОВ И ИХ СВОЙСТВА
4.1 Виды экспериментов
Для проведения активных экспериментов разработано
множество различных планов. Планы учитывают, как
особенности структуры регрессионных моделей, так и
требования их эффективности с позиций повышения точности
получаемых моделей и снижения затрат на проведение
эксперимента.
При построении линейных моделей или нелинейных,
содержащих только взаимодействия факторов, но без
квадратов этих факторов, каждый фактор можно варьировать
только на двух уровнях. Для получения таких моделей
используют планы первого порядка.
Известно несколько разновидностей планов первого
порядка. Они предназначены для планирования следующих
видов экспериментов:
– однофакторного (классического) эксперимента;
– полного факторного эксперимента;
– дробного факторного эксперимента.
Если в регрессионную модель входят факторы в квадрате
или с более высокими степенями, то необходимо не менее трех
уровней
варьирования
факторов.
При
построении
квадратичных моделей применяют планы второго порядка.
Планы различают по степени насыщенности и
композиционности. План называют насыщенным, если общее
число точек плана равно числу неизвестных параметров
регрессионной модели. Такой план позволяет получить
экспериментальную факторную модель при минимальных
затратах, так как обеспечивает минимум числа опытов.
План называется композиционным, если в спектр его в
качестве составной части входят точки спектра плана, который
30
был реализован при построении более простой модели.
Композиционность плана позволяет реализовать принцип
постепенного усложнения модели при минимальных затратах,
так как при этом используются результаты опытов,
выполненных для получения простой модели. Многие планы
второго порядка являются композиционными.
4.2 План однофакторного эксперимента
Однофакторный
(классический)
эксперимент
предназначен для получения линейной экспериментальной
факторной модели вида (4.1):
y  b0  b1 x1  b2 x2  ...  bn xn .
(4.1)
Однофакторный
эксперимент
предусматривает
поочередное варьирование каждого из факторов при
фиксированных на некотором уровне значениях остальных
факторов. Фактор Хiварьируют на двух уровнях XiB и XiH, а все
остальные при этом должны находиться в точке центра
эксперимента Xj0, j # i. Для нормированных факторов xjB= +1,
xiH= -1, xj= 0. С учетом этого составим матрицу спектра плана
однофакторного эксперимента (4.2):
1 0
... 0
 1 0 ... 0
0
 1 ... 0
X0
 1 ... 0 .
...
...
... ...
0
0
...  1
0
0
...  1
31
(4.2)
Число точек плана в этом случае N = 2n, где n —
количество факторов.
Рисунок 4
Вектор базисных функций имеет вид (4.3):
 
f X  1, x1 , x2 ,..., xn .
(4.3)
4.3 План полного факторного эксперимента
Спектр плана полного факторного эксперимента (ПФЭ)
содержит все возможные комбинации значений факторов на
всех уровнях их изменения. Число точек N спектра плана
определяется по формуле (4.4):
N U n;
(4.4)
где U— число уровней варьирования факторов; n—
количество факторов.
32
Рассмотрим особенности и свойства ПФЭ, применяемых
при построении линейных регрессий вида (4.5):
n
n
n
j 1
j 1 k  j 1
n
n
y  b0   b j x j    b j ,k x j xk   
n
b
j 1 k  j 1 l  k 1
x x x  ...  b1,2,..., n x1 x2 ...xn .
j , k ,l j k l
(4.5)
Для получения линейной регрессии достаточно
варьировать факторы на двух уровнях, т. е. U= 2. Тогда число
точек спектра плана будет (4.6):
N = 2n.
(4.6)
Такой план принято обозначать ПФЭ2n.
Рассмотрим порядок составления матрицы спектра
плана, полагая, что факторы нормированы и, следовательно,
могут принимать значения только либо + 1, либо - 1.
Для составления матрицы спектра плана используется
следующее простое правило: в первой строке матрицы все
факторы равны - 1, в первом столбце знаки единиц меняются
поочередно; во втором столбце они чередуются через два; в
третьем — через 4; в четвертом — через 8 и т. д. по степеням
двойки.
При n = 2 число точек плана N = 22 = 4, а матрица
спектра плана имеет вид (4.7):
X
1 1
1 1
1 1
1 1
(4.7)
При n = 3 N=23 = 8, а матрица спектра плана имеет вид
(4.8):
33
1
1
1
1
X
1
1
1
1
1
1
1
1
1
1
.
1
(4.8)
1 1 1
1 1 1
1 1 1
i
1
2
3
4
Таблица 1
Факторы
x1
x2
-1
-1
+1
-1
-1
+1
+1
+1
Таблица 2
i
1
2
3
4
Факторы
x1 x2 x3
-1 -1 -1
+1 -1 -1
-1 +1 -1
+1 +1 -1
i
5
6
7
8
Факторы
x1 x2 x3
-1 -1 +1
+1 -1 +1
-1 +1 +1
+1 +1 +1
Точки плана ПФЭ2n располагаются в вершинах n—
мерного гиперкуба.
34
Рисунок 5
Посредством ПФЭ можно построить как простейшую
линейную модель технической системы вида (4.9):
y  b0  b1 x1  b2 x2  ...  bn xn ,
(4.9)
так и нелинейную.
Для этой модели система базисных функций очевидна:
f0(х) = 1; f1 (х) = x1; f2(х) = х2; ...; fn(x) = хn. Число базисных
функций в этом случае равно n+ 1.
4.4 План дробного факторного эксперимента
Полный факторный эксперимент имеет существенный
недостаток: увеличение количества факторов приводит к
быстрому росту числа опытов. Например, при n= 10 спектр
плана содержит N = 210 = 1024 опыта. Кроме того, необходимо
дублирование опытов.
Обычно при построении многофакторной регрессионной
модели ограничиваются парными или, в крайнем случае,
отдельными тройными взаимодействиями факторов. В этом
случае ПФЭ оказывается избыточным, так как число точек
спектра
плана
N
значительно больше
количества
коэффициентов регрессии NB. В результате возникает
возможность сокращения числа опытов.
Во многих случаях на начальной стадии моделирования
технической системы в связи с отсутствием необходимой
информации о влиянии на ее выходные параметры различных
факторов (внутренних или внешних параметров) строят
линейную модель. Например, при трех факторах выбирают
модель в виде (4.10):
y  b0  b1 x1  b2 x2  b3 x3 .
35
(4.10)
В этом уравнении четыре коэффициента регрессии, а при
n=3 спектр плана ПФЭ, содержит 8 точек, т. е.
предусматривает 8 опытов в различных точках факторного
пространства. Следовательно, четыре опыта оказываются
избыточными и их можно было бы исключить. При
построении
математических
моделей,
использующих
упрощенные уравнения регрессий, когда N >NB,применяют
дробные факторные эксперименты (ДФЭ). Наибольшее
распространение имеют регулярные планы ДФЭ типа 2n-p, т. е.
ДФЭ2n-p,где n— число факторов, р — степень дробности ДФЭ.
При построении матрицы спектра плана ДФЭ2n-p число
точек спектра плана определяется по формуле (4.11):
N = 2n-p
При выборе степени
выполняться условие (4.12):
дробности
N>NB.
(4.11)
ДФЭ
должно
(4.12)
Процедура построения спектра плана ДФЭ2n-p содержит
четыре этапа:
1) Выбор структуры уравнения регрессии и определение
степени дробности ДФЭ.
2) Выбор ведущих факторов и построение для них
матрицы спектра плана, определяющую программу их
изменения в ходе эксперимента. k = n – p
Для выбранных ведущих факторов х1, х2, …… хkстроят
план ПФЭ2k.
3)Построение матрицыспектра плана ДФЭ2n-p.
Часть этой матрицы составляет матрица спектра плана
ПФЭ2k, а во вторую должны войти столбцы матрицы для
остальных факторов хk+1, хk+2, …… хn, количество которых
равно p = n – k.
36
Столбцы матрицы X, соответствующие этим факторам,
определяют путем перемножения соответствующих столбцов
ведущих факторов. Для этого используют генерирующие
соотношения. Генерирующим соотношением называется
алгебраическое выражение, устанавливающее связь между
одним из факторов xk+1,xk+2 ,...,xn и произведением какой-либо
комбинации ведущих факторов x1,x2, •.., хk. Выбор
генерирующих соотношений, вообще говоря, произволен.
Однако в качестве генерирующих нельзя использовать те
произведения ведущих факторов, которые входят в состав
существенных переменных.
Генерирующее соотношение имеет вид (4.13):
xk+I = xjxixm…, i = 1….p,
(4.13)
где xk+1— фактор, не включенный в число ведущих (для
него определяется столбец матрицы Xспектра плана ДФЭ2n-p);
xj,xi,xm,... — ведущие факторы.
Количество
ведущих
факторов,
входящих
в
генерирующее соотношение, может быть произвольным, но
соотношения для всех Xji+iдолжны быть разными.
4) Проверка пригодности полученного спектра плана.
Для этого необходимо построить матрицу базисных
функций Fи проверить, нет ли в ней совпадающих или
полностью противоположных столбцов. Если в матрице Fнет
совпадающих или противоположных столбцов, полученный
спектр плана ДФЭ2n-p пригоден для решения поставленной
задачи. В противном случае выполняются последовательно
следующие процедуры до тех пор, пока не будет обеспечена
ортогональность:
– выбираются иные генерирующие соотношения;
– изменяется набор ведущих факторов;
– уменьшается степень дробности плана р.
При ограниченных возможностях проведения опытов
степень дробности плана сохраняют, а изменяют структуру
37
уравнения
регрессии
(например,
используют
иные
взаимодействия факторов или исключают какую-либо
базисную
функцию,
соответствующую
одному
из
взаимодействий
высшего
порядка).
Таким
образом,
регулярные план ДФЭ2n-p обладают теми же свойствами, что и
планы ПФЭ2n. Пример 1. Получить спектр плана ДФЭ,
предназначенного для оценки коэффициентов уравнения
регрессии вида (4.14):
y  b0  b1 x1  b2 x2  b3 x3 .
(4.14)
Так как число факторов в этом уравнении три (х1, x2, x3),
то при проведении ПФЭ количество точек спектра плана было
бы равно N = 23 = 8. В уравнении же всего четыре
коэффициента, поэтому можно использовать полуреплику, т.е.
ДФЭ23-1, спектр плана которой содержит четыре точки: N = 231 = 4. Число ведущих факторов k = n - р = 3 - 1 = 2. Выберем в
качестве ведущих факторов х1и x2. Значения элементов
векторов-столбцов этих факторов получим на основе плана
ПФЭ22 , используя метод чередования знаков. Для
определения
вектора-столбца
фактора
x3
примем
генерирующее соотношение в виде x3 = х1x2. Полученный
спектр плана ДФЭ23-1 выделен прямоугольником в табл. 3, в
которой приведена матрица базисных функций F.
Таблица 3
i
f0=1
f1=x1
f2=x2
f3=x3
1
+1
-1
-1
+1
2
+1
+1
-1
-1
3
+1
-1
+1
-1
4
+1
+1
+1
+1
В матрице F нет совпадающих столбцов, следовательно,
полученный спектр плана пригоден для решения поставленной
задачи.
38
5. СТАТИСТИЧЕСКИЙ АНАЛИЗ РЕЗУЛЬТАТОВ
АКТИВНОГО ЭКСПЕРИМЕНТА
5.1 Виды ошибок при статистическом анализе
Прежде чем определять оценки коэффициентов
регрессии, необходимо выполнить статистический анализ
результатов эксперимента с целью оценки их качества и
пригодности для построения регрессионной модели.
Статистический
анализ
включает
оценку
ошибок
параллельных опытов, отсеивание грубых ошибок, проверку
однородности дисперсий опытов и определение дисперсии
воспроизводимости эксперимента.
Одной из важнейших особенностей, связанных с
планированием
эксперимента,
является
повышенная
требовательность к точности измерения при фиксировании
факторов и при оценке значений критериев оптимизации в
отдельных опытах. Исследователь должен уметь правильно
определять и оценивать ошибки измерений.
Задачей измерения является не только определение
значения самой измеряемой величины, но и также и оценка
погрешности,
допущенной
при
измерении
(ошибки
измерения).
Различают несколько видов ошибок измерения:

грубые;

систематические;

случайные.
Грубые ошибки возможны из-за нарушения основных
условий измерения (неверные показания прибора и т.д.) или в
связи с недосмотром исследователя, его невнимательностью.
Результат, содержащий грубую ошибку, называют промахом.
Исследователь всегда должен проверить вероятность грубой
ошибки, если один из результатов измерений резко отличается
от других. Часто промахов можно избежать, если измерения
39
повторяются вторым исследователем, которому неизвестны
результаты, полученные первым. Аналогичный эффект
достигается, когда тот же исследователь повторяет измерения
спустя некоторое время после первых измерений, когда он
забыл ранее полученные результаты. При обнаружении грубой
ошибки рекомендуется сразу же отбросить соответствующий
результат измерения.
Систематические ошибки вызываются воздействием
факторов, которые проявляются одинаково при многократном
повторении одних и тех же измерений. Ошибки такого рода
имеют место, например, при измерениях прибором с
неправильной регулировкой, приведшей к смещению начала
отсчета. После выявления систематических ошибок (при
измерениях разными приборами или разными методами одних
и тех же величин) их можно легко устранить путем введения
необходимых поправок.
Различают несколько видов систематических ошибок:

поправки (ошибки известной природы и
известной величины);

ошибки
известного
происхождения,
но
неизвестной величины;

ошибки неизвестного происхождения.
Учет поправок обычно не вызывает затруднений. При
наличии других видов систематических ошибок задача
усложняется, но и здесь затруднений можно избежать, если
обеспечиваются условия, при которых систематические
ошибки переводятся в случайные, после чего учитывается
влияние случайных ошибок. Перевод систематических ошибок
в случайные производится методом рандомизации, который
рассмотрим позже.
При
проведении
исследований,
связанных
с
планированием
эксперимента,
до
начала
обработки
экспериментальных данных все возможные грубые и
систематические ошибки должны быть выявлены и устранены.
40
Случайные ошибки – это следствие воздействий, которые
неодинаковы при каждом измерении и не могут быть учтены в
отдельности. Подобные ошибки связаны с суммарным
эффектом влияния многих факторов, например, изменение
погодных условий, разница показателей различных партий
сырья и т.д.
Случайные
ошибки
обычно
характеризуются
определенным законом их распределения. Очень часто
распределение случайных величин, в том числе случайных
ошибок измерения, подчиняется закону Гаусса, который
относится к так называемому нормальному распределению.
5.2 Ошибки параллельных опытов.
B условиях наличия случайных помех с целью
уменьшения случайных погрешностей эксперимента и
повышения точности получаемой регрессионной модели
осуществляется дублирование опытов. Каждый опыт,
предусмотренный матрицей спектра плана, повторяется т =
2...5 раз. Рекомендуется число т принимать одинаковым для
всех N точек плана. В результате проводится L= Nmопытов, в
соответствии с матрицей плана, предусматривающей при этом
рандомизацию опытов.
Повторные опыты в одной и той же точке плана при
наличии помехи дают различные результаты при определении
функции отклика.
Разброс
результатов
относительно
оценки
математического ожидания функции отклика называют
ошибкой воспроизводимости опыта. Эту ошибку надо
оценить.
Для каждой точки плана по результатам параллельных
опытов находят выборочное среднее уi, равное среднему
арифметическому полученных опытных значений функции
отклика (5.1, 5.2):
41
yi 
1 m
 yiu ;
m u 1
(5.1)
i  1, N ;
(5.2)
где N — номер параллельного опыта; yi U — значение
функции отклика в u-м параллельном опыте i-ой точки спектра
плана.
Для оценки отклонения функции отклика от ее среднего
значения уiвычисляется дисперсия воспроизводимости опыта
по данным т параллельных опытов в каждой i -ой точке
спектра плана (5.3, 5,4):
2
1 m
2
Si 
(5.3)
 yiu  y i ;
m  1 u 1


i  1, N .
(5.4)
5.3 Отсеивание грубых ошибок
Формула для выборочного среднего уi справедлива лишь
при нормальном распределении случайной величины у. При
наличии грубых ошибок опыта распределение у отклоняется
от нормального, что противоречит предпосылкам,
положенным в основу регрессионного анализа. Поэтому
грубые ошибки надо вначале исключить, а затем определять уi
и S2i. Грубые ошибки — это брак повторных опытов. Для
обнаружения брака используют критерий Стьюдента (5.5):
t iu 
yiu  yi *
.
Si *
(5.5)
Полученное значение t-критерия сравнивается с
табличным tT при выбранном уровне значимости qи числе
степеней свободы k. Уровень значимости qхарактеризует
42
вероятность ошибки. Если t>tT, то это соответствует браку
данного опыта и результат его не может быть использован. В
этом случае опыт подлежит повторному проведению.
5.4 Рандомизация
Чтобы исключить влияние систематических ошибок,
вызванных внешними условиями (переменой температуры,
сырья, исполнителей и т.д.), рекомендуется случайная
последовательность при постановке опытов, запланированной
матрицей. Опыты необходимо рандомизировать во времени.
Термин «рандомизация» происходит от английского слова
random – случайный.
Рассмотрим
пример
рандомизации
условий
эксперимента. В полном факторном эксперименте 23
предполагается каждое значение параметра оптимизации
определять по двум параллельным опытам. Нужно случайно
расположить всего 16 опытов. Для этого используем таблицу
случайных чисел. Фрагмент таблицы помещен в приложении
2. В случайном месте таблицы выписываем числа с 1 по 16 с
отбрасыванием чисел больше 16 и уже выписанных. В нашем
случае, начиная с четвертого столбца, можно получить такую
последовательность:
2; 15; 9; 5; 12; 14; 8; 13; 16; 1; 3; 7; 4; 6; 11; 10.
С учетом того, что цифры с 1 по 8 соответствуют первым
опытам эксперимента, а с 9 по 16-повторным, получается, что
первым реализуется опыт № 2, вторым – опыт № 7 и т.д.
Случайный порядок проведения опытов приведен в таблице 4.
Таблица 4
Номер опыта
в матрице
1
2
3
43
4
5
6
7
8
Случайный
3
1
11
5
4
6
2
10
16
15 13
8
14 12
порядок
реализации
опытов
5.5 Проверка однородности дисперсий
7
9
Однородность дисперсии означает, что среди всех
дисперсии S2i нет таких, которые бы значительно превышали
все остальные. Для проверки однородности дисперсий во всех
точках спектра плана используется либо критерий Кохрена G,
либо критерий Фишера F.
Критерий Кохрена основан на распределении отношения
максимальной дисперсии S2imax к сумме всех дисперсий (5.6):
G
S i2 max
N
S
i 1
.
(5.6)
2
i
Критерий Кохрена применяется, если количество
сравниваемых дисперсий больше двух, а число повторных
опытов во всех точках плана одинаково. Определив число
степеней свободы k1 = т -1 и k2 = N (N— число точек спектра
плана, т — количество повторных опытов в каждой точке
плана), находят табличное значение критерия Кохрена GT.
Если G<GT, гипотеза об однородности
дисперсий и
воспроизводимости результатов принимается.
Следовательно, полученные результаты эксперимента
качественные и могут быть использованы для построения
регрессионной модели. В противном случае следует увеличить
число параллельных опытов или повторить эксперимент при
строгом соблюдении методики и схемы проведения опытов,
44
предприняв необходимые меры для исключения грубых
ошибок.
Если выяснится, что непостоянство дисперсии помехи
обусловлено внутренними
свойствами объекта, то
необходимы более сложные способы обработки результатов
эксперимента. Можно, например, вводить некоторую функцию
от у: Inу, √yи др.
Критерий Фишера можно применять при любом числе
дисперсии S2i. Он определяется из соотношения (5.7):
F
2
S max
.
2
S min
(5.7)
Дисперсии однородны, если F<FT, где FT— табличное
значение критерия Фишера, определяемое при числах
степеней свободы к1и к2 и принятом уровне значимости q.
Следует отметить, что уровень значимости qпо всем
критериям, применяемым в процессе статистического анализа
и обработки результатов эксперимента (Кохрена, Стьюдента,
Фишера) должен быть одинаков. Для технических систем
рекомендуется принимать q= 0,05.
5.6 Дисперсия воспроизводимости эксперимента
Если дисперсии S2i однородны, то их усредняют и
находят дисперсию воспроизводимости эксперимента (5.8):
S y2 
1 N 2
 Si .
N i 1
(5.8)
Дисперсия S2y представляет собой оценку дисперсии
помехи. Число степеней свободы, связанное с оценкой S2y,
вычисляется по формуле (5.9):
45
k  N (m  1).
(5.9)
Формула годится, если число повторных опытов во всех
точках спектра плана одинаково. Если число опытов различно,
используют формулу (5.10):
N
 Si ki
2
S k1  S k 2  ...  S k N i 1
S y2 
 N
; (5.10)
k1  k 2  ...  k N
 ki
2
1
2
2
2
N
i 1
где ki— число степеней свободы в i -ой точке спектра
плана; ki = mi- 1; mi — число параллельных опытов в этой
точке.
Определение коэффициентов регрессионной модели и
проверка их значимости
Параметрами
регрессионной
модели
являются
коэффициенты регрессии bj. Значения коэффициентов
регрессии можно получить, решив систему алгебраических
уравнений. Выражение для определения всех коэффициентов
уравнения регрессии одинаково и имеет простой вид (5.11):
bj 
 
1 N
 f j X i yi ;
N i 1
(5.11)
где N — число точек спектра плана; fj(Xi) — значение j ой базисной функции в i-ой точке спектра плана; y i —
выборочное среднее функции отклика в той же точке,
определяемое по формуле (5.11):
1 m
 yiu ;
m u 1
i  1, N ;
yi 
46
(5.11)
где и — номер параллельного опыта; yiu — значение
функции отклика в u-м параллельном опыте i-ой точки спектра
плана.
Значения базисных функций fj(Xi) для отдельных
факторов равны Xij, а для взаимодействия факторов —
ХikХilХim....
С учетом этого можно записать следующие формулы для
вычисления значений коэффициентов уравнения регрессии:
– для коэффициентов при факторах xj, включая также
свободный член уравнения (5.12):
bj 
1 N
 X ij yi ;
N i 1
(5.12)
j  0, n;
где n— количество факторов.
– для коэффициентов при взаимодействиях факторов
(5.13):
1 N
 X ik X il X im ...y i
N i 1
g  n  1, d ;
bg 
(5.13)
k , l , m  1, n;
k  l  m.
Погрешность определения bj оценивают дисперсией
S2bj.(5.14):
S 
2
bj
47
S y2
N m
;
(
5.14)
Где т — число повторных опытов (значение т должно
быть одинаковым для всех точек N спектра плана).
После определения коэффициентов регрессии bj
проверяют их значимость. Эта проверка осуществляется с
использованием t-критерия Стьюдента, значение которого
находят из соотношения (5.15):
tj 
bj
Sb
;
(5.15)
j
j  0, N B  1;
Где NB — общее число коэффициентов уравнения
регрессии, равное количеству используемых базисных
функций для построения регрессии.
Полученное значение tj для каждого коэффициента
регрессии bj сравнивают с табличным tт, определяемым при
принятом уровне значимостиqи числе степеней свободы k = N
(m - 1).
Если ti<tT , нулевая гипотеза о незначимости
коэффициента bj принимается и член уравнения регрессии,
включающий
этот
коэффициент,
исключается
из
математической модели. Если же tj>tT, полагают, что данный
коэффициент значимо (неслучайно) отличается от нуля и его
следует сохранить в регрессионной модели. В этом случае
значение коэффициента bj больше ошибки опыта, которую
можно оценить величиной доверительного интервала εbj.
Доверительный интервал находят по формуле (5.16):
 b  t T S b .
j
j
(5.16)
Следует, отметить, что дисперсия воспроизводимости
эксперимента Sy зависит от очень многих факторов: выбора
центра эксперимента, интервалов варьирования факторов,
48
наличия экстремумов функции отклика в области
планирования, соотношения величины отклика и помехи (так
называемое отношение сигнал-шум) и др. В этой связи при
небольшом различии между tjи tT следует весьма осторожно
относиться к оценке значимости коэффициентов регрессии.
Лучше такие коэффициенты сохранить в модели, а
влияние соответствующего фактора (или взаимодействия
факторов) проверить в дальнейшем на более сложной модели
или в иных условиях планирования эксперимента.
После
исключения
незначимых
коэффициентов
уравнение регрессии приобретает вид (5.17):
yˆ 
N B* 1
b
j 0
j
f j ( X );
(5.17)
Где N*B— количество значимых коэффициентов
регрессии.
Так как часть коэффициентов регрессии исключено из
модели, то N*B<NB .
Если все коэффициенты оказались значимыми,
суммирование в формуле осуществляется до NB– 1.
49
6 ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА
Тщательное, скрупулезное выполнение эксперимента,
несомненно, является главным условием успеха исследования.
Это общее правило, и планирование эксперимента не
относится к исключениям.
Однако не безразлично, как обработать полученные
данные. Необходимо извлечь из них всю информацию и
сделать соответствующие выводы.
Статистические методы обработки результатов позволяют нам не перейти разумной меры риска.
6.1 Метод наименьших квадратов
Начнем с простого случая: один фактор, линейная
модель. Интересующая нас функция отклика (которую мы
будем также называть уравнением регрессии) имеет вид (6.1):
y  b0  b1 x1.
(6.1)
Это хорошо известное уравнение прямой линии. Наша
цель – вычисление неизвестных коэффициентов b0 и b1. Мы
провели эксперимент, чтобы использовать при вычислениях
его результаты.
Если бы все экспериментальные точки лежали строго на
прямой линии, то для каждой из них было бы справедливо
равенство (6.2):
y  b0  b1 x1i  0 ,
(6.2)
где i= 1, 2, ..., N– номер опыта. Тогда не было бы никакой
проблемы. На практике это равенство нарушается и вместо
него приходится писать (6.3):
50
y  b0  b1 x1i  i ,
(6.3)
где  i – разность между экспериментальным и вычисленным по уравнению регрессии значениями y в i-й экспериментальной точке. Эту величину иногда невязкой.
Мы хотим найти такие коэффициенты регрессии, при
которых невязки будут минимальны. Это требование можно
записать по-разному. В зависимости от этого мы будем
получать разные оценки коэффициентов. Вот одна из
возможных записей (6.4):
N
U    i2  min ,
(6.4)
i 1
которая приводит к методу наименьших квадратов.
Когда мы ставим эксперимент, то обычно стремимся
провести больше (во всяком случае не меньше) опытов, чем
число неизвестных коэффициентов. Поэтому система
линейных уравнений (6.5):
yi  b0  b1 x1i  i
(6.5)
оказывается переопределенной и часто противоречивой
(т. е. она может иметь бесконечно много решений или может
не иметь решений). Пере определённость возникает, когда
число уравнений больше числа неизвестных; противоречивость – когда некоторые из уравнений несовместимы друг с
другом.
Только если все экспериментальные точки лежат на
прямой, то система становится определенной и имеет
единственное решение.
МНК обладает тем замечательным свойством, что он
делает определенной любую, произвольную систему
51
уравнений. Он делает число уравнений равным числу
неизвестных коэффициентов.
Для определения двух неизвестных коэффициентов
требуется два уравнения (6.6):
N
N
i 1
i 1
U    i2   ( yi  b0  b1 x1i ) 2  min
(6.6)
Минимум некоторой функции, если он существует,
достигается при одновременном равенстве нулю частных
производных по всей неизвестным, т. е. получаем систему
(6.7):
(6.7)
В явном виде это запишется (6.8, 6,9):
(6.8)
(6.9)
,.
52
Окончательные формулы для вычисления коэффициентов регрессии, которые удобно находить с помощью
определителей, имеют вид (6.10, 6.11):
(6.10)
(6.11)
N
N
i 1
i 1
^
N
Величина U    i2   ( yi  yi ) 2   yi2
называется
i 1
^
остаточной суммой квадратов ( y i – значение параметра
оптимизации, вычисленное из уравнения регрессии). МНК
гарантирует, что эта величина минимально возможная.
Обобщение на многофакторный случай не связано с
какими-либо принципиальными трудностями.
Воспользуемся тем, что матрицы планирования
ортогональны и нормированы, получаем (6.12, 6.13):
N
x
i 1
2
ji
и
53
N
(6.12)
N
x
i 1
x  0,
ji ui
j  u,
j , u  0,1,2,..., k
(6.13)
Для любого числа факторов коэффициенты будут
вычисляться по формуле (6.14):
N
bj 
y x
i 1
i
ji
N
(6.14)
В этой формуле j = 0, 1, 2 ..., k– номер фактора. Ноль
записан для вычисления b0.
Так как каждый фактор (кроме x0)варьируется на двух
уровнях +1 и –1, то вычисления сводятся к приписыванию
столбцу yзнаков соответствующего фактору столбца и
алгебраическому сложению полученных значений. Деление
результата на число опытов в матрице планирования дает
искомый коэффициент.
6.2 Регрессионный анализ
До сих пор мы пользовались МНК как вычислительным
приемом. Нам нигде не приходилось вспоминать о статистике.
Но, как только мы начинаем проверять какие-либо гипотезы о
пригодности модели или о значимости коэффициентов,
приходится вспоминать о статистике. И с этого момента МНК
превращается в регрессионный анализ.
А регрессионный анализ как всякий статистический
метод, применим при определенных предположениях,
постулатах.
54
Первый постулат. Параметр оптимизации y есть
случайная величина с нормальным законом распределения.
Дисперсия воспроизводимости – одна из характеристик этого
закона распределения.
В данном случае, как и по отношению к любым другим
постулатам, нас интересуют два вопроса: как проверить его
выполнимость и к чему приводят его нарушения?
При наличии большого экспериментального материала
(десятки параллельных опытов) гипотезу о нормальном распределении можно проверить стандартными статистическими
тестами (например,
– критерием). К сожалению,
экспериментатор редко располагает такими данными, поэтому
приходится принимать этот постулат на веру.
При нарушении нормальности мы лишаемся возможности установления вероятностей, с которыми справедливы те
или иные высказывания. В этом таится большая опасность.
Мы рискуем загипнотизировать себя численными оценками и
вероятностями, за которыми ничего не стоит. Вот почему надо
очень внимательно относиться к возможным нарушениям
предпосылок.
Второй постулат. Дисперсия yне зависит от абсолютной
величины y. Выполнимость этого постулата проверяется с
помощью критериев однородности дисперсий в разных точках
факторного пространства. Нарушение этого постулата недопустимо.
Всегда существует такое преобразование y,которое
делает дисперсии однородными. Увы, его не всегда легко
найти.
Довольно
часто
помогает
логарифмическое
преобразование, с которого обычно начинают поиски.
Третий постулат. Значения факторов суть неслучайные
величины. Это несколько неожиданное утверждение
практически означает, что установление каждого фактора на
заданный уровень и его поддержание существенно точнее, чем
сшибка воспроизводимости.
55
Нарушение этого постулата приводит к трудностям при
реализации матрицы планирования. Поэтому оно обычно
легко обнаруживается экспериментатором.
Существует еще четвертый постулат, налагающий ограничения на взаимосвязь между значениями факторов. У Нас
он выполняется автоматически в силу ортогональности
матрицы планирования.
6.3 Проверка адекватности модели
Первый вопрос, который нас интересует после вычисления коэффициентов модели, это проверка ее пригодности.
Назовем такую проверку проверкой адекватности модели.
Для характеристики среднего разброса относительно
линии регрессии вполне подходит остаточная сумма квадратов. Неудобство состоит в том, чтоона зависит от числа
коэффициентов в уравнении: введите столько коэффициентов,
сколько вы провели независимых опытов, и получите
остаточную сумму, равную нулю. Поэтому предпочитают
относить ее на один «свободный» опыт. Число таких опытов
называется числом степеней свободы f.
Числом степеней свободы в статистике называется
разность между числом опытов и числом коэффициентов
(констант), которые уже вычислены по результатам этих
опытов независимо друг от друга.
Остаточная сумма квадратов, деленная на число степеней
свободы, называется остаточной дисперсией, или дисперсией
2
адекватности S ад
(6.15):
N
2
S ад

 y
i 1
2
i
(6.15)
;
f
В статистике разработан критерий, который очень удобен
для проверки гипотезы об адекватности модели. Он
56
называется F-критерием Фишера и определяется следующей
формулой (6.16):
2
S ад
f  2
Sy
(6.16)
S2y – это дисперсия воспроизводимости со своим числом
степеней свободы.
Удобство использования критерия Фишера состоит в
том, что проверку гипотезы можно свести к сравнению с
табличным значением.
Если рассчитанное значение F-критерия не превышает
табличного,
то,
с
соответствующей
доверительной
вероятностью, модель можно считать адекватной. При
превышении табличного значения эту приятную гипотезу
приходится отвергать.
Этот способ расчета дисперсии адекватности, подходит,
если опыты в матрице планирования не дублируются, а
информация о дисперсии воспроизводимости извлекается из
параллельных
опытов
в
нулевой
точке
или
из
предварительных экспериментов.
Важны два случая: 1) опыты во всех точках плана
дублируются
одинаковое
число
раз
(равномерное
дублирование), 2) число параллельных опытов не одинаково
(неравномерное дублирование).
В первом случае дисперсию адекватности нужно
умножать на n, где n – число повторных опытов, после
умножения получим формулу (6.17):
N
2
S ад

n yi2
i 1
f
57
;
(6.17)
Такое видоизменение формулы вполне естественно. Чем
больше число параллельных опытов, тем с большей
достоверностью оцениваются средние значения. Поэтому
требования к различиям между экспериментальными и
расчетными значениями становятся более жесткими, что
отражается в увеличении F-критерия.
Во втором случае, когда приходится иметь дело с
неравномерным дублированием, положение усложняется.
Даже когда экспериментатор задумал провести равное число
параллельных опытов, часто не удается по тем или иным
причинам все их реализовать. Кроме того, иногда приходится
отбрасывать отдельные опыты как выпадающие наблюдения.
При
неравномерном
дублировании
нарушается
ортогональность матрицы планирования и, как следствие,
изменяются расчетные формулы для коэффициентов регрессии
и их ошибок, а также для дисперсии адекватности.
Для дисперсии адекватности можно записать общую
формулу (6.18):
2
S ад
2
^


ni   yi  y i 
 ;
 i 1 
f
N
(6.18)
где N – число различных опытов (число строк матрицы);
ni – число параллельных опытов в i-й строке матрицы;
yi – среднее арифметическое из ni параллельных опытов;
^
y i – предсказанное по уравнению значение в этом опыте.
Смысл этой формулы очень прост: различию между
экспериментальным и расчетным значением придается тем
больший вес, чем больше число повторных опытов.
Для b-коэффициентов нельзя записать универсальную
расчетную формулу. Все зависит от того, какой был план и как
дублировались опыты. Всякий раз приходится делать
58
специальные
квадратов.
расчеты,
пользуясь
методом
наименьших
6.4 Проверка значимости коэффициентов
Проверка значимости каждого коэффициента проводится
независимо.
Ее можно осуществлять двумя равноценными способами:
проверкой по t-критерию Стьюдента или построением
доверительного интервала. При использовании полного
факторного эксперимента или регулярных дробных реплик
доверительные интервалы для всех коэффициентов (в том
числе и эффектов взаимодействия) равны друг другу.
Прежде всего, надо найти дисперсию коэффициента
регрессии S2b j  .Она определяется по формуле (6.19):
S 2b j  
S2y
N
(6.19)
;
Из формулы видно, что дисперсии всех коэффициентов
равны друг другу, так как они зависят только от ошибки опыта
и числа опытов.
Теперь легко построить доверительный интервал (6.20)
b j  tsb j ;
(6.20)
Здесь t – табличное значение критерия Стьюдента при
числе степеней свободы, с которыми определялась S2y , и
выбранном
уровне
значимости
(обычно
0,05);
S2b j 
–
квадратичная ошибка коэффициента регрессии.
Коэффициент значим, если его абсолютная величина
больше
доверительного
интервала.
59
7. ПРИНЯТИЕ РЕШЕНИЙ ПОСЛЕ ПОСТРОЕНИЯ
МОДЕЛИ
7.1 Интерпретация результатов
Адекватная линейная модель, имеет вид полинома
первой степени. Коэффициенты полинома являются частными
производными функции отклика по соответствующим
переменным. Их геометрический смысл – тангенсы углов
наклона гиперплоскости к соответствующей оси. Больший по
абсолютной величине коэффициент соответствует большему
углу наклона и, следовательно, более существенному
изменению параметра оптимизации при изменении данного
фактора.
До сих пор мы употребляли абстрактный математический язык. Перевод модели на язык экспериментатора
называется интерпретацией модели.
Задача интерпретации весьма сложна. Ее решают в
несколько этапов. Первый этап состоит в следующем.
Устанавливается, в какой мере каждый из факторов влияет на
параметр оптимизации. Величина коэффициента регрессии –
количественная мера этого влияния. Чем больше
коэффициент, тем сильнее влияет фактор. О характере влияния
факторов говорят знаки коэффициентов. Знак плюс
свидетельствует о том, что с увеличением значения фактора
растет величина параметра оптимизации, а при знаке минус –
убывает. Интерпретация знаков при оптимизации зависит от
того, ищем ли мы максимум или минимум функции отклика.
Если
, то увеличение значений всех факторов,
коэффициенты которых имеют знак плюс, благоприятно, а
имеющих знак минус – неблагоприятно. Если же
то,
наоборот, благоприятно увеличение значений тех факторов,
знаки коэффициентов которых отрицательны.
60
Далее выясняется, как расположить совокупность
факторов в ряд по силе их влияния на параметр оптимизации.
Факторы, коэффициенты которых не значимы, конечно не
интерпретируются. Можно сказатьтолько, что при данных
интервалах варьирования и ошибке воспроизводимости они не
оказывают существенного влияния на параметр оптимизации.
Изменение интервалов варьирования приводит к изменению коэффициентов регрессии. Абсолютные величины
коэффициентов регрессии увеличиваются с увеличением
интервалов. Инвариантными к изменению интервалов
остаются знаки линейных коэффициентов регрессии. Однако и
они изменяться на обратные, если при движении По градиенту
мы «проскочим» экстремум.
В некоторых задачах представляет интерес построение
уравнения регрессии для натуральных значений факторов.
Уравнение для натуральных переменных можно получить,
используя формулу перехода. Коэффициенты регрессии
изменятся. При этом пропадает возможность интерпретации
влияния факторов по величинам и знакам коэффициентов
регрессии. Вектор-столбцы натуральных значений переменных
в матрице планирования уже не будут ортогональными,
коэффициенты определяются зависимо друг от друга. Если же
поставлена задача получения интерполяционной формулы для
натуральных переменных, такой прием допустим.
Теперь мы получили основу для перехода к следующему
этапу. На основе априорных сведений обычно имеются
некоторые представления о характере действия факторов.
Источниками таких сведений могут служить теория
изучаемого процесса, опыт работы с аналогичными
процессами или предварительные опыты и т.д.
Если, например, ожидается, что с ростом температуры
должно происходить увеличение параметра оптимизации, а
коэффициент регрессии имеет знак минус, то возникает
противоречие. Возможны две причины возникновения такой
ситуации: либо в эксперименте допущена ошибка, и он должен
61
быть подвергнут ревизии, либо неверны априорные
представления. Нужно иметь в виду, что эксперимент
проводится в локальной области факторного пространства и
коэффициент отражает влияние фактора только в этой
области. Заранее неизвестно, в какой мере наивно
распространить результат на другие области. Теоретические
же представления имеют обычно более общий характер. Кроме
того, априорная информация часто основывается на
однофакторных
зависимостях.
При
переходе
к
многофакторному пространству ситуация может изменяться.
Поэтому мы должны быть уверены, что эксперимент проведен
корректно. Тогда для преодоления противоречия можно
выдвигать
различные
гипотезы
и
проверять
их
экспериментально.
В тех, довольно редких, случаях, когда имеется большая
априорная информация, позволяющая выдвигать гипотезы о
механизме явлений, можно перейти к следующему этапу
интерпретации. Он сводится к проверке гипотез о механизме
явлений и выдвижению новых гипотез.
Получение информации о механизме явлений не является
обязательным в задачах оптимизации, но возможность такого
рода следует использовать. Здесь особое внимание приходится
уделять эффектам взаимодействия факторов.
Интерпретация эффектов взаимодействия не так
однозначна, как линейных эффектов. В каждом случае имеется
два варианта. Прежде всего, нужно учесть знаки линейных
эффектов
соответствующих
факторов. Если
эффект
взаимодействия имеет знак плюс и соответствующие
линейные эффекты отрицательны, то выбор однозначен:
сочетание –1 и –1. Однако возможен случай, когда знаки
линейных эффектов различны. Тогда приходится учитывать
численные значения коэффициентов и жертвовать самым
малым эффектом.
62
Иногда приходится учитывать технологические соображения: например, эксперимент в одной области факторного
пространства дороже (или труднее), чем в другой.
Интерпретация результатов – это перевод с одного языка
на другой. Такой перевод обеспечивает взаимопонимание
между статистиком и экспериментатором, работающим
совместно над задачами оптимизации. Интерпретация
уравнения регрессии важна не только для понимания процесса,
но и для принятия решений при оптимизации.
7.2 Принятие решений после построения модели процесса
Нам придется принимать решения в сложных ситуациях.
Решения зависят от числа факторов, дробности плана, цели
исследования (достижение оптимума, построение интерполяционной формулы) и т.д. Количество возможных
решений по примерной оценке достигает нескольких десятков
тысяч. Поэтому будем рассматривать только наиболее часто
встречавшиеся случаи и выделим «типичные» решения.
Положение здесь сложнее, чем в случае принятия решений о
выборе основного уровня и интервалов варьирования
факторов, где удалось рассмотреть все варианты. Ситуации
будем различать по адекватности и неадекватности модели,
значимости и незначимости коэффициентов регрессии в
модели, информации о положении оптимума.
Обсудим сначала принятие решения для адекватного
линейного уравнения регрессии.
Линейная модель адекватна. Здесь возможны 3 варианта.
1) Все коэффициенты регрессии значимы.
2) Часть коэффициентов регрессии значима, часть незначима.
3) Все коэффициенты регрессии незначимы.
В каждом варианте оптимум может быть близко, далеко
или о его положении нет информации (неопределенная
ситуация).
63
Рассмотрим первый вариант.
Если область оптимума близка, возможны три решения:
окончание исследования, переход к планам второго порядка и
движение по градиенту.
Переход к планированию второго порядка дает возможность получить математическое описание области оптимума и найти экстремум.
Движение по градиенту используется при малой ошибке
опыта, поскольку на фоне большой ошибки трудно установить
приращение параметра оптимизации.
Решение при неопределенной ситуации или удаленной
области оптимума одно и то же: движение по градиенту.
Второй вариант – часть коэффициентов регрессии значима, часть незначима. Движение по градиенту наиболее
эффективно, если коэффициенты значимы. Поэтому
выбираются решения, реализация которых приводит к
получению значимых коэффициентов. На этом этапе важно
выдвинуть гипотезы, объясняющие незначимость эффектов.
Это может быть и неудачный выбор интервалов варьирования,
и включение (из осторожности) факторов, не влияющих на
параметр оптимизации, и большая ошибка опыта, и т.д.
Решение зависит от того, какую гипотезу мы предпочитаем.
Наконец, если область оптимума близка, то возможно
принятие таких же решений, как и в случае значимости всех
коэффициентов регрессии.
Рассмотрим последний случай: линейная модель адекватна, все коэффициенты регрессии незначимы (кроме b0).
Чаще всего это происходит вследствие большой ошибки
эксперимента или узких интервалов варьирования. Поэтому
возможные решения направлены, прежде всего, на увеличение
точности
эксперимента
и
расширение
интервалов
варьирования. Увеличение точности может достигаться двумя
путями: благодаря улучшению методики проведения опытов
или вследствие постановки параллельных опытов.
64
Рисунок 6 - Схема принятия решения в задаче определения
оптимальных условий, линейная модель адекватна
Если
область
оптимума
близка, то
возможно
также
окончание
исследован
ия.
65
Линейная модель неадекватна. Если линейная модель
неадекватна, значит не удается аппроксимировать поверхность
отклика плоскостью. Формальные признаки (кроме величины
F-критерия), по которым можно установить неадекватность
линейной модели, следующие.
1.Значимость хотя бы одного из эффектов взаимодействия.
2.Значимость суммы коэффициентов регрессии при
квадратичных членах
. Оценкой этой суммы служит
разность между b0 и значением зависимой переменной в
центре плана y0. Если разность превосходит ошибку опыта, то
гипотеза о незначимости коэффициентов при квадратичных
членах не может быть принята. Однако надо учесть, что сумма
может быть незначима, и при значимых квадратичных
эффектах, если они имеют разные знаки.
Для неадекватной модели не будем делать различия
между случаями значимых и незначимых линейных коэффициентов регрессии, поскольку решения для них обычно
совпадают.
Решения, принимаемые для получения адекватной модели: изменение интервалов варьирования факторов, перенос
центра плана, достройка плана.
Наиболее распространенный прием – изменение интервалов варьирования. Он, конечно, требует постановки
новой серии опытов. Иногда отказываются от построения
адекватной модели, чтобы ценой нескольких опытов
проверить возможность движения по градиенту. Это решение
нельзя считать достаточно корректным. Движению по
градиенту обычно предшествует оценка кривизны поверхности отклика (по сумме коэффициентов при
квадратичных членах) и сопоставление величин линейных
эффектов и эффектов взаимодействия. Если вклад
квадратичных членов и эффектов взаимодействия невелик, то
решениео движении по градиенту представляется возможным.
66
Еще одно решение: включение в модель эффектов
взаимодействия и движение с помощью неполного полинома
второго порядка. Этот прием связан с получением и анализом
уравнений второго порядка. Направление градиента будет
меняться от точки к точке.
Если область оптимума близка, то возможны варианты
окончания исследования и перехода к построению плана
второго порядка.
Рисунок 7 - Схема принятия решенийв задаче определения
оптимальных условий, линейная модель неадекватна
7.3 Построение интерполяционной формулы, линейная
модель неадекватна
Первое, что следует сделать при решении этой задачи, –
включить в уравнение эффекты взаимодействия. Конечно,
такое решение возможно, если был применен ненасыщенный
план. После добавления эффектов взаимодействия может не
хватить степеней свободы для проверки гипотезы
адекватности и потребуется реализация ещё двух-трех опытов
внутри области эксперимента.
67
Все остальные способы построения интерполяционной
формулы связаны с необходимостью проведения новых
опытов. Один из них – достройка плана. Используются все те
же приемы, что и при устранении незначимости
коэффициентов регрессии: метод «перевала», достройка до
полного факторного эксперимента, до дробной реплики, для
которой ранее смешанные эффекты становятся «чистыми»,
достройка до плана второго порядка.
Наконец, если не удалось все же получить адекватную
модель, то остается разбить область эксперимента на
несколько подобластей и описать отдельно каждую из них.
Это требует уменьшения интервалов варьирования факторов.
Приведем блок-схему (рисунок 7) принятия решений в
задаче построения интерполяционной формулы для случая,
когда линейная модель неадекватна. Если линейная модель
адекватна, то задача решена.
Рисунок 8 - Схема принятия решений
68
ЗАКЛЮЧЕНИЕ
В учебном пособии рассмотрены основные понятия и
принципы планирования, построение плана эксперимента и
его виды.
В учебном пособии уделено внимание параметрам
оптимизации и факторам эксперимента. Рассмотрены
требования предъявляемые к ним.
Приведено математическое описание планов различных
экспериментов.
Рассмотрен
статистический
анализ
активного
эксперимента и методы обработки результатов.
69
ПРИЛОЖЕНИЕ 1
Критические значения коэффициента Стьюдента (t-критерия) для
различной доверительной вероятности p(%) и числа степеней
свободы v
Число
степеней
свободы, V
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Доверительная вероятность, р, %
80
90
95
98
99
99,5
99,8
99,9
3,0777 6,3138 12,7062 31,8205 63,6567 127,3213 318,3088 636,6192
1,8856 2,9200 4,3027 6,9646 9,9248 14,0890 22,3271 31,5991
1,6377 2,3534 3,1824 4,5407 5,8409 7,4533 10,2145 12,9240
1,5332 2,1318 2,7764 3,7469 4,6041 5,5976 7,1732 8,6103
1,4759 2,0150 2,5706 3,3649 4,0321 4,7733 5,8934 6,8688
1,4398 1,9432 2,4469 3,1427 3,7074 4,3168 5,2076 5,9588
1,4149 1,8946 2,3646 2,9980 3,4995 4,0293 4,7853 5,4079
1,3968 1,8595 2,3060 2,8965 3,3554 3,8325 4,5008 5,0413
1,3830 1,8331 2,2622 2,8214 3,2498 3,6897 4,2968 4,7809
1,3722 1,8125 2,2281 2,7638 3,1693 3,5814 4,1437 4,5869
1,3634 1,7959 2,2010 2,7181 3,1058 3,4966 4,0247 4,4370
1,3562 1,7823 2,1788 2,6810 3,0545 3,4284 3,9296 4,3178
1,3502 1,7709 2,1604 2,6503 3,0123 3,3725 3,8520 4,2208
1,3450 1,7613 2,1448 2,6245 2,9768 3,3257 3,7874 4,1405
1,3406 1,7531 2,1314 2,6025 2,9467 3,2860 3,7328 4,0728
1,3368 1,7459 2,1199 2,5835 2,9208 3,2520 3,6862 4,0150
1,3334 1,7396 2,1098 2,5669 2,8982 3,2224 3,6458 3,9651
1,3304 1,7341 2,1009 2,5524 2,8784 3,1966 3,6105 3,9216
1,3277 1,7291 2,0930 2,5395 2,8609 3,1737 3,5794 3,8834
1,3253 1,7247 2,0860 2,5280 2,8453 3,1534 3,5518 3,8495
1,3232 1,7207 2,0796 2,5176 2,8314 3,1352 3,5272 3,8193
1,3212 1,7171 2,0739 2,5083 2,8188 3,1188 3,5050 3,7921
1,3195 1,7139 2,0687 2,4999 2,8073 3,1040 3,4850 3,7676
70
24
25
26
27
28
29
30
32
34
36
38
40
42
44
46
48
50
55
60
65
70
80
90
100
110
120
130
1,3178 1,7109
1,3163 1,7081
1,3150 1,7056
1,3137 1,7033
1,3125 1,7011
1,3114 1,6991
1,3104 1,6973
1,3086 1,6939
1,3070 1,6909
1,3055 1,6883
1,3042 1,6860
1,3031 1,6839
1,3020 1,6820
1,3011 1,6802
1,3002 1,6787
1,2994 1,6772
1,2987 1,6759
1,2971 1,6730
1,2958 1,6706
1,2947 1,6686
1,2938 1,6669
1,2922 1,6641
1,2910 1,6620
1,2901 1,6602
1,2893 1,6588
1,2886 1,6577
1,2881 1,6567
2,0639
2,0595
2,0555
2,0518
2,0484
2,0452
2,0423
2,0369
2,0322
2,0281
2,0244
2,0211
2,0181
2,0154
2,0129
2,0106
2,0086
2,0040
2,0003
1,9971
1,9944
1,9901
1,9867
1,9840
1,9818
1,9799
1,9784
2,4922
2,4851
2,4786
2,4727
2,4671
2,4620
2,4573
2,4487
2,4411
2,4345
2,4286
2,4233
2,4185
2,4141
2,4102
2,4066
2,4033
2,3961
2,3901
2,3851
2,3808
2,3739
2,3685
2,3642
2,3607
2,3578
2,3554
2,7969
2,7874
2,7787
2,7707
2,7633
2,7564
2,7500
2,7385
2,7284
2,7195
2,7116
2,7045
2,6981
2,6923
2,6870
2,6822
2,6778
2,6682
2,6603
2,6536
2,6479
2,6387
2,6316
2,6259
2,6213
2,6174
2,6142
3,0905
3,0782
3,0669
3,0565
3,0469
3,0380
3,0298
3,0149
3,0020
2,9905
2,9803
2,9712
2,9630
2,9555
2,9488
2,9426
2,9370
2,9247
2,9146
2,9060
2,8987
2,8870
2,8779
2,8707
2,8648
2,8599
2,8557
3,4668
3,4502
3,4350
3,4210
3,4082
3,3962
3,3852
3,3653
3,3479
3,3326
3,3190
3,3069
3,2960
3,2861
3,2771
3,2689
3,2614
3,2451
3,2317
3,2204
3,2108
3,1953
3,1833
3,1737
3,1660
3,1595
3,1541
3,7454
3,7251
3,7066
3,6896
3,6739
3,6594
3,6460
3,6218
3,6007
3,5821
3,5657
3,5510
3,5377
3,5258
3,5150
3,5051
3,4960
3,4764
3,4602
3,4466
3,4350
3,4163
3,4019
3,3905
3,3812
3,3735
3,3669
140
150
160
170
180
190
1,2876 1,6558
1,2872 1,6551
1,2869 1,6544
1,2866 1,6539
1,2863 1,6534
1,2860 1,6529
1,9771
1,9759
1,9749
1,9740
1,9732
1,9725
2,3533
2,3515
2,3499
2,3485
2,3472
2,3461
2,6114
2,6090
2,6069
2,6051
2,6034
2,6020
2,8522
2,8492
2,8465
2,8441
2,8421
2,8402
3,1495
3,1455
3,1419
3,1389
3,1361
3,1337
3,3614
3,3566
3,3524
3,3487
3,3454
3,3425
71
200
250
300
350
1,2858 1,6525
1,2849 1,6510
1,2844 1,6499
1,2840 1,6492
1,9719
1,9695
1,9679
1,9668
2,3451
2,3414
2,3388
2,3370
2,6006
2,5956
2,5923
2,5899
2,8385
2,8322
2,8279
2,8249
3,1315
3,1232
3,1176
3,1137
3,3398
3,3299
3,3233
3,3185
400
450
500
550
600
1,2837 1,6487
1,2834 1,6482
1,2832 1,6479
1,2831 1,6476
1,2830 1,6474
1,9659
1,9652
1,9647
1,9643
1,9639
2,3357
2,3347
2,3338
2,3331
2,3326
2,5882
2,5868
2,5857
2,5848
2,5840
2,8227
2,8209
2,8195
2,8184
2,8175
3,1107
3,1084
3,1066
3,1051
3,1039
3,3150
3,3123
3,3101
3,3083
3,3068
72
ПРИЛОЖЕНИЕ 2
ФРАГМЕНТ ТАБЛИЦЫ СЛУЧАЙНЫХ ЧИСЕЛ
56 66 25 32 38 64 70 26 27 67 77 40 04 34 63 98 99 89 31 16 12 90 50 28 96
88 40 52 02 29 82 69 34 50 21 74 00 91 27 52 98 72 03 45 65 30 89 71 45 91
87 63 88 23 62 51 07 69 59 02 89 49 14 98 53 41 92 36 07 76 85 37 84 37 47
32 25 21 15 08 82 34 57 57 35 22 03 33 48 84 37 37 29 38 37 89 76 25 09 69
44 61 88 23 13 01 59 47 64 04 99 59 96 20 30 87 31 33 69 45 58 48 00 83 48
94 44 08 67 79 41 61 41 15 60 11 88 83 24 82 24 07 78 61 89 42 58 88 22 16
13 24 40 09 00 65 46 38 61 12 90 62 41 11 59 85 18 42 61 29 88 76 04 21 80
78 27 84 05 99 85 75 67 80 05 57 05 71 70 31 31 99 99 06 96 53 99 25 13 63
42 39 30 02 34 99 46 68 45 15 19 74 15 50 17 44 80 13 86 38 40 45 82 13 44
04 52 43 96 38 13 83 80 72 34 20 84 56 19 49 59 14 85 42 99 71 16 34 33 79
82 85 77 30 16 69 32 46 46 30 84 20 68 72 98 94 62 63 59 44 00 89 06 15 87
38 48 84 88 24 55 46 48 60 06 90 08 83 83 98 40 90 88 25 26 85 74 55 80 85
91 19 05 68 22 58 04 63 21 16 23 38 25 43 32 98 94 65 35 35 16 91 07 12 43
54 81 87 21 31 40 46 17 62 63 99 71 14 12 64 51 68 50 60 78 22 69 51 98 37
65 43 75 12 91 20 36 25 57 92 33 65 95 48 75 00 06 65 25 90 16 29 34 14 43
49 98 71 31 80 59 57 32 43 07 85 06 64 75 27 29 17 06 11 30 68 70 97 87 21
03 98 68 89 39 71 87 32 14 99 42 10 25 37 30 08 27 75 43 97 54 20 69 93 50
56 04 21 34 92 89 81 52 15 12 84 11 12 66 87 48 21 06 86 08 35 39 52 28 09
48 09 36 95 36 20 82 53 32 89 92 68 50 88 17 37 92 02 23 43 63 24 69 80 91
23 97 10 96 57 74 07 95 26 44 93 08 43 30 41 86 45 74 33 78 84 33 38 76 73
43 97 55 45 98 35 69 45 96 80 46 36 39 96 33 60 20 73 30 79 17 19 03 47 28
40 05 08 50 79 89 58 19 86 48 27 98 99 24 08 94 19 15 81 29 82 14 35 88 03
66 97 10 69 02 25 36 43 71 76 00 67 56 12 69 07 89 55 63 31 50 72 20 33 36
15 62 38 72 92 03 76 09 30 75 77 80 04 24 54 67 60 10 79 26 21 60 03 48 14
77 81 15 14 67 55 24 22 20 55 36 93 67 69 37 72 22 43 46 32 56 15 75 25 12
18 87 05 09 96 45 14 72 41 46 12 67 46 72 02 59 06 17 49 12 73 28 23 52 48
08 58 53 63 66 13 07 04 48 71 39 07 46 96 40 20 86 79 11 81 74 11 15 23 17 16
07 79 57 61 42 19 68 15 12 60 21 59 12 07 04 99 88 22 39 75 16 69 13 84
73
ПРИЛОЖЕНИЕ 3
Значения критерия Фишера (F-критерия) для уровня
значимости q = 5%. V1 - число степеней свободы большей
дисперсии; V2 - число степеней свободы меньшей дисперсии
V2
V1
1
2
3
4
5
6
7
8
9
10 15 20
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 245,9 248,0
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,43 19,45
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,70 8,66
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,86 5,80
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,62 4,56
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 3,94 3,87
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,51 3,44
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,22 3,15
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,01 2,94
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,85 2,77
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,72 2,65
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,62 2,54
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,53 2,46
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,46 2,39
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,40 2,33
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,35 2,28
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,31 2,23
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,27 2,19
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,23 2,16
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,20 2,12
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,18 2,10
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,15 2,07
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,13 2,05
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,11 2,03
74
25
26
27
28
29
30
4,24
4,23
4,21
4,20
4,18
4,17
3,39
3,37
3,35
3,34
3,33
3,32
2,99
2,98
2,96
2,95
2,93
2,92
2,76
2,74
2,73
2,71
2,70
2,69
2,60
2,59
2,57
2,56
2,55
2,53
2,49
2,47
2,46
2,45
2,43
2,42
2,40
2,39
2,37
2,36
2,35
2,33
2,34
2,32
2,31
2,29
2,28
2,27
2,28
2,27
2,25
2,24
2,22
2,21
2,24
2,22
2,20
2,19
2,18
2,16
2,09 2,01
2,07 1,99
2,06 1,97
2,04 1,96
2,03 1,94
2,01 1,93
Значения критерия Фишера (F-критерия) для уровня
значимости q = 2%. V1 - число степеней свободы большей
дисперсии; V2 - число степеней свободы меньшей дисперсии
V
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
V1
1
2
3
1012, 1249, 1350,
5 49,00
5 49,17
5
48,51
20,62 18,86 18,11
14,04 12,14 11,34
11,32 9,45 8,67
9,88 8,05 7,29
8,99 7,20 6,45
8,39 6,64 5,90
7,96 6,23 5,51
7,64 5,93 5,22
7,39 5,70 4,99
7,19 5,52 4,81
7,02 5,37 4,67
6,89 5,24 4,55
6,77 5,14 4,45
6,67 5,05 4,36
6,59 4,97 4,29
6,51 4,90 4,22
6,45 4,84 4,16
6,39 4,79 4,11
4
5
6
1405, 1440, 1464,
8 49,30
6 49,33
5
49,25
17,69 17,43 17,25
10,90 10,62 10,42
8,23 7,95 7,76
6,86 6,58 6,39
6,03 5,76 5,58
5,49 5,22 5,04
5,10 4,84 4,65
4,82 4,55 4,37
4,59 4,34 4,15
4,42 4,16 3,98
4,28 4,02 3,84
4,16 3,90 3,72
4,06 3,81 3,63
3,97 3,72 3,54
3,90 3,65 3,47
3,84 3,59 3,41
3,78 3,53 3,35
3,73 3,48 3,30
75
7
8
9
1481, 1495, 1505,
8 49,37
0 49,39
3
49,36
17,11 17,01 16,93
10,27 10,16 10,07
7,61 7,50 7,42
6,25 6,14 6,05
5,44 5,33 5,24
4,90 4,79 4,70
4,52 4,41 4,33
4,23 4,13 4,04
4,02 3,91 3,83
3,85 3,74 3,66
3,71 3,60 3,52
3,59 3,48 3,40
3,49 3,39 3,30
3,41 3,30 3,22
3,34 3,23 3,15
3,27 3,17 3,09
3,22 3,12 3,03
3,17 3,07 2,98
10 15
20
1513, 1539, 1551,
7 49,43
1 49,45
9
49,40
16,86 16,66 16,55
10,00 9,78 9,67
7,34 7,12 7,01
5,98 5,76 5,65
5,17 4,95 4,84
4,63 4,42 4,30
4,26 4,04 3,92
3,97 3,76 3,64
3,76 3,54 3,43
3,59 3,37 3,25
3,45 3,23 3,11
3,33 3,11 3,00
3,23 3,02 2,90
3,15 2,93 2,82
3,08 2,86 2,74
3,02 2,80 2,68
2,96 2,74 2,63
2,91 2,70 2,58
21
22
23
24
25
26
27
28
29
30
6,34
6,29
6,25
6,21
6,18
6,14
6,11
6,09
6,06
6,04
4,74
4,70
4,66
4,63
4,59
4,56
4,54
4,51
4,49
4,47
4,07
4,03
3,99
3,96
3,93
3,90
3,87
3,85
3,83
3,81
3,69
3,65
3,61
3,58
3,55
3,52
3,50
3,47
3,45
3,43
3,44
3,40
3,36
3,33
3,30
3,28
3,25
3,23
3,21
3,19
3,26
3,22
3,19
3,15
3,13
3,10
3,07
3,05
3,03
3,01
3,13
3,09
3,05
3,02
2,99
2,97
2,94
2,92
2,90
2,88
3,02
2,99
2,95
2,92
2,89
2,86
2,84
2,82
2,80
2,78
2,94
2,90
2,87
2,83
2,81
2,78
2,76
2,73
2,71
2,69
2,87
2,83
2,80
2,77
2,74
2,71
2,69
2,66
2,64
2,62
2,65
2,61
2,58
2,55
2,52
2,49
2,46
2,44
2,42
2,40
2,53
2,49
2,46
2,43
2,40
2,37
2,34
2,32
2,30
2,28
Значения критерия Фишера (F-критерия) для уровня
значимости q = 1%. V1 - число степеней свободы большей
дисперсии; V2 - число степеней свободы меньшей дисперсии
V
2
1
2
3
4
5
6
V1
7
8
9
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
4052,
2
98,50
34,12
21,20
16,26
13,75
12,25
11,26
10,56
10,04
9,65
9,33
9,07
8,86
8,68
8,53
4999,
5
99,00
30,82
18,00
13,27
10,92
9,55
8,65
8,02
7,56
7,21
6,93
6,70
6,51
6,36
6,23
5403,
4
99,17
29,46
16,69
12,06
9,78
8,45
7,59
6,99
6,55
6,22
5,95
5,74
5,56
5,42
5,29
5624,
6
99,25
28,71
15,98
11,39
9,15
7,85
7,01
6,42
5,99
5,67
5,41
5,21
5,04
4,89
4,77
5763,
6
99,30
28,24
15,52
10,97
8,75
7,46
6,63
6,06
5,64
5,32
5,06
4,86
4,69
4,56
4,44
5859,
0
99,33
27,91
15,21
10,67
8,47
7,19
6,37
5,80
5,39
5,07
4,82
4,62
4,46
4,32
4,20
5928,
4
99,36
27,67
14,98
10,46
8,26
6,99
6,18
5,61
5,20
4,89
4,64
4,44
4,28
4,14
4,03
5981,
1
99,37
27,49
14,80
10,29
8,10
6,84
6,03
5,47
5,06
4,74
4,50
4,30
4,14
4,00
3,89
6022,
5
99,39
27,35
14,66
10,16
7,98
6,72
5,91
5,35
4,94
4,63
4,39
4,19
4,03
3,89
3,78
76
10 15
6055, 6157,
8 99,43
3
99,40
27,23 26,87
14,55 14,20
10,05 9,72
7,87 7,56
6,62 6,31
5,81 5,52
5,26 4,96
4,85 4,56
4,54 4,25
4,30 4,01
4,10 3,82
3,94 3,66
3,80 3,52
3,69 3,41
20
6208,
7
99,45
26,69
14,02
9,55
7,40
6,16
5,36
4,81
4,41
4,10
3,86
3,66
3,51
3,37
3,26
17
18
19
20
21
22
23
24
25
26
27
28
29
30
8,40
8,29
8,18
8,10
8,02
7,95
7,88
7,82
7,77
7,72
7,68
7,64
7,60
7,56
6,11
6,01
5,93
5,85
5,78
5,72
5,66
5,61
5,57
5,53
5,49
5,45
5,42
5,39
5,18
5,09
5,01
4,94
4,87
4,82
4,76
4,72
4,68
4,64
4,60
4,57
4,54
4,51
4,67
4,58
4,50
4,43
4,37
4,31
4,26
4,22
4,18
4,14
4,11
4,07
4,04
4,02
4,34
4,25
4,17
4,10
4,04
3,99
3,94
3,90
3,85
3,82
3,78
3,75
3,73
3,70
4,10
4,01
3,94
3,87
3,81
3,76
3,71
3,67
3,63
3,59
3,56
3,53
3,50
3,47
77
3,93
3,84
3,77
3,70
3,64
3,59
3,54
3,50
3,46
3,42
3,39
3,36
3,33
3,30
3,79
3,71
3,63
3,56
3,51
3,45
3,41
3,36
3,32
3,29
3,26
3,23
3,20
3,17
3,68
3,60
3,52
3,46
3,40
3,35
3,30
3,26
3,22
3,18
3,15
3,12
3,09
3,07
3,59
3,51
3,43
3,37
3,31
3,26
3,21
3,17
3,13
3,09
3,06
3,03
3,00
2,98
3,31
3,23
3,15
3,09
3,03
2,98
2,93
2,89
2,85
2,81
2,78
2,75
2,73
2,70
3,16
3,08
3,00
2,94
2,88
2,83
2,78
2,74
2,70
2,66
2,63
2,60
2,57
2,55
ПРИЛОЖЕНИЕ 4
Критические значения коэффициента Кохрена (G-критерия)
для доверительной вероятности p = 95% и числе степеней
свободы v
Число
измере
ний, k
2
3
4
5
6
7
8
9
10
12
15
20
24
30
40
60
120
∞
1
2
3
9985
9669
9065
8412
7808
7271
6798
6385
6020
5410
4709
3894
3434
2929
2370
1737
0998
0000
9750
8709
7679
6838
6161
5612
5157
4775
4450
3924
3346
2705
2354
1980
1576
1131
0632
0000
9392
0797
6841
5981
5321
4800
4377
4027
3733
3264
2758
2205
1907
1593
1259
0895
0495
0000
Число степеней свободы, V
4
5
6
8 10
16
36
9057
7454
6287
5441
4803
4307
3910
3584
3311
2880
2419
1921
1656
1377
1082
0765
0419
0000
7341
5466
4366
3645
3135
2756
2462
2226
2032
1737
1429
1108
0942
0771
0595
0411
0218
0000
6602
4748
3720
3066
2612
2278
2022
1820
1655
1403
1144
0879
0743
0604
0462
0316
0165
0000
8772
7071
5895
5065
4447
3974
3595
7276
3029
2624
2195
1735
1493
1237
0968
0682
0371
0000
8534
6771
5598
4783
4184
3726
3362
3067
2823
2439
2034
1602
1374
1137
0887
0623
0337
0000
8159
6333
5175
4387
3817
3384
3043
2768
2541
2187
1815
1422
1216
1001
5950
0552
0292
0000
7880
6025
4884
4118
3568
3154
2829
2568
2353
2020
1671
1303
1113
0921
0713
0497
0266
0000
∞
5000
3333
2500
2000
1667
1429
1250
1111
1000
0833
0667
0500
0417
0333
0250
0167
0083
0000
Все значения G-критерия меньше единицы, поэтому в таблице
приведены лишь десятичные знаки, следующие после запятой,
перед которой при пользовании таблицей нужно ставить ноль
целых.
78
Например, при k = 6, V = 3 имеем G0,95 = 0,5321.
79
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1.
R.A. Fisher. The Design of Experiments. 6-th ed,
London, Оliver and Boyd, 1951.
2.
Ю.П. Адлер, Е.В. Маркова, Ю.В. Грановский.
Планирование эксперимента при поиске оптимальных
условий. М.: Наука, 1964.
3.
Клепиков Н.П., Соколов С.Н. Анализ и
планирование экспериментов методом максимума подобия.
М.: Наука, 1976.
4.
Федоров
В.В.
Теория
оптимального
эксперимента. М.: Наука, 1971.
80
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
0
1 ОСНОВНЫЕ ПОНЯТИЯ ПЛАНИРОВАНИЯ
ЭКСПЕРИМЕНТА
6
2 ОСНОВНЫЕ ПРИНЦИПЫ ПЛАНИРОВАНИЯ
ЭКСПЕРИМЕНТА
2.1 Виды параметров оптимизации
2.2 Требования к параметрам оптимизации
2.3Факторы
2.3.1 Требования к факторам эксперимента
2.3.2 Требования к совокупности факторов
12
15
18
20
21
22
3 ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
3.1 План эксперимента
3.2 Структура экспериментальной факторной модели
24
24
28
4. ПЛАНЫ ЭКСПЕРИМЕНТОВ И ИХ СВОЙСТВА
4.1 Виды экспериментов
4.2 План однофакторного эксперимента
4.3 План полного факторного эксперимента
4.4 План дробного факторного эксперимента
30
30
31
32
35
5. СТАТИСТИЧЕСКИЙ АНАЛИЗ РЕЗУЛЬТАТОВ
АКТИВНОГО ЭКСПЕРИМЕНТА
5.1 Виды ошибок при статистическом анализе
5.2 Ошибки параллельных опытов.
5.3 Отсеивание грубых ошибок
5.4 Рандомизация
5.5 Проверка однородности дисперсий
39
39
41
42
43
44
81
5.6 Дисперсия воспроизводимости эксперимента
45
6 ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА
6.1 Метод наименьших квадратов
6.2 Регрессионный анализ
6.3 Проверка адекватности модели
6.4 Проверка значимости коэффициентов
50
50
54
56
59
7. ПРИНЯТИЕ РЕШЕНИЙ ПОСЛЕ ПОСТРОЕНИЯ МОДЕЛИ
60
7.1 Интерпретация результатов
60
7.2 Принятие решений после построения модели процесса 63
7.3 Построение интерполяционной формулы, линейная модель
неадекватна
67
ЗАКЛЮЧЕНИЕ
69
ПРИЛОЖЕНИЕ 1
ПРИЛОЖЕНИЕ 2
ПРИЛОЖЕНИЕ 3
ПРИЛОЖЕНИЕ 4
70
73
74
78
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
80
82
Download