Лекц№1ПФЭ

advertisement
Введение
Математические методы планирования эксперимента – это новый кибернетический
подход к инженерным исследованиям, имеющим экспериментальный характер.
Внедрение математических методов планирования эксперимента позволяет в значительной степен исключить слепой хаотический поиск, заменить его научно обоснованной программой проведения экспериментального исследования, включающей объективную оценку результатов эксперимента на всех последовательных этапах исследования.
Отметим список задач, которыми занимается планирование эксперимента:
1. задача поиска оптимальных условий протекания процессов;
2. задача определения оптимальных составов различных веществ;
3. задача выявление наиболее влияющих факторов;
4. задача отыскания механизма процессов.
Даже при не полном знании о механизме процесса путём направленного эксперимента можно получить его математическую модель.
Можно сказать, что там, где есть эксперимент, имеет место и наука о его проведении – планирование эксперимента. На какие вопросы даёт ответ планирование эксперимента:



как обработать априорную информацию;
сколько и каких опытов надо провести;
как обработать результаты.
Следовательно, задача, которой занимается планирование эксперимента, может
быть сформулирована так: "Сколько и каких опытов следует провести и как обработать
их результаты, чтобы ответить на заранее заданный вопрос с заранее заданной точностью при минимальном возможном числе опытов". Эта вечная для экспериментатора
задача, которая решалась обычно интуитивными методами, теперь поставлена на
научную основу [1, с.].
Известно, что новая наука может возникнуть, если существует объективная необходимость ее появления и имеется предмет новой науки, представляющий общенаучный
интерес. Сказанное в полной мере относится и к теории планирования эксперимента.
Предмет исследования этого научного направления – эксперимент. Однако особенности планирования, постановки эксперимента рассматриваются и в физике, и в химии, и в
прикладных науках. Для того чтобы эксперимент стал предметом исследования отдельного научного направления, необходимо, чтобы он характеризовался некоторыми чертами,
общими для любого эксперимента независимо от того, в какой конкретной области знаний
эксперимент проводится. Такими общими чертами эксперимента является необходимость:
1) контролировать любой эксперимент, т.е. исключать влияние внешних переменных, не принятых исследователем по тем или иным причинам к рассмотрению;
2) определять точность измерительных приборов и получаемых данных;
3) уменьшать до разумных пределов число переменных в эксперименте;
4) составлять план проведения эксперимента, наилучший с той или иной точки зрения;
5) проверять правильность полученных результатов и их точность;
6) выбирать способ обработки экспериментальных данных и форму представления
результатов;
7) анализировать полученные результаты и давать их интерпретацию в терминах
той области, где эксперимент проводится[3, с. 5-6].
Планирование экспериментов имеет следующие цели:



сокращение общего времени моделирования при соблюдении требований к точности и достоверности результатов;
увеличение информативности каждого наблюдения;
создание структурной основы процесса исследования.
Таким образом, целью любого эксперимента является получение информации об
исследуемом объекте. План эксперимента на компьютере представляет собой метод получения с помощью эксперимента необходимой информации.
Таким образом, проблема проведения эксперимента с минимальными затратами и
высокоэффективным использованием средств вычислительной техники весьма актуальна.
Изучение сложных объектов, являющихся по своей природе стохастическими, возможна
лишь с помощью методов планирования и обработки результатов эксперимента.
1. История возникновения планирования эксперимента
Возникновение современных статистических методов планирования эксперимента
связано с именем Р. Фишера.
С 1918 г. он начал свою известную серию работ на Рочемстедской агробиологической станции в Англии. В 1935 г. появилась его монография «Design of Experiments Дизайн экспериментов», давшая название всему направлению.
Среди методов планирования первым был дисперсионный анализ (кстати, Фишеру
принадлежит и термин «дисперсия»). Фишер создал основы этого метода, описав полные
классификации дисперсионного анализа (однофакторный и многофакторный эксперименты) и неполные классификации дисперсионного анализа без ограничения и с ограничением на рандомизацию. При этом он широко использовал латинские квадраты и блок-схемы.
Вместе с Ф. Йетсом он описал их статистические свойства. В 1942 г. А. Кишен рассмотрел
планирование по латинским кубам, которое явилось дальнейшим развитием теории латинских квадратов.
Затем Р. Фишер независимо опубликовал сведения об ортогональных гипер-греколатинских кубах и гиперкубах. Вскоре после этого (1946-1947 гг.) Р. Рао рассмотрел их
комбинаторные свойства. Дальнейшему развитию теории латинских квадратов посвящены
работы X. Манна (1947-1950 гг.).
Исследования Р. Фишера, проводившиеся в связи с работами по агробиологии,
знаменуют начало первого этапа развития методов планирования эксперимента. Фишер
разработал метод факторного планирования. Йегс предложил для этого метода простую
вычислительную схему. Факторное планирование получило широкое распространение.
Особенностью полного факторного эксперимента является необходимость ставить сразу
большое число опытов.
В 1945 г. Д. Финни ввел дробные реплики от факторного эксперимента. Это позволило резко сократить число опытов и открыло дорогу техническим приложениям планирования. Другая возможность сокращения необходимого числа опытов была показана в
1946 г. Р. Плакеттом и Д. Берманом, которые ввели насыщенные факторные планы.
В 1951 г. работой американских ученых Дж. Бокса и К. Уилсона начался новый
этап развития планирования эксперимента.
Эта работа подытожила предыдущее. В ней ясно сформулирована и доведена до
практических рекомендаций идея последовательного экспериментального определения
оптимальных условий проведения процессов с использованием оценки коэффициентов
степенных разложений методом наименьших квадратов, движения по градиенту и отыскания интерполяционного полинома (степенного ряда) в области экстремума функции отклика («почти стационарной» области).
В 1954-1955 гг. Дж. Бокс, а затем Дж. Бокс и П. Юл показали, что планирование
эксперимента можно использовать при исследовании физико-химических механизмов
процессов, если априори высказаны одна или несколько возможных гипотез. Здесь планирование эксперимента пересекалось с исследованиями по химической кинетике. Интересно отметить, что кинетику можно рассматривать как метод описания процесса с помощью
дифференциальных уравнений, традиции которого восходят к И. Ньютону. Описание
процесса дифференциальными уравнениями, называемое детерминистическим, нередко
противопоставляется статистическим моделям.
Бокс и Дж. Хантер сформулировали принцип ротатабельности для описания «почти
стационарной» области, развивающейся в настоящее время в важную ветвь теории планирования эксперимента. В той же работе показана возможность планирования с разбиением
на ортогональные блоки, указанная ранее независимо де Бауном.
Дальнейшим развитием этой идеи было планирование, ортогональное к неконтролируемому временному дрейфу, которое следует рассматривать как важное открытие в
экспериментальной технике - значительное увеличение возможностей экспериментатора.
2.Подготовка и анализ данных
Опыт применения методов планирования и анализа данных показывает, что для достижения успеха в планировании экспериментов и анализе данных исследователь должен
одинаково хорошо ориентироваться в трёх областях:
1. в математическом (имитационном) моделировании, т.е. искусстве формализации
постановки реальной задачи и разработки её математической модели;
2. в математическом аппарате методов планирования экспериментов и анализа данных;
3. в существующих прикладных программах.
В ряде случаев, используя статистические методы, исследователь испытывает чувство неудовлетворённости, причины которого заключаются в увлечении формализованной
и эмпирической сторонами этих методов при относительно поверхностном знании предпосылок их применения, а также в том, что при исследовании недетерминированных объектов приходиться анализировать данные, имея неполные знания о механизме явлений,
происходящих в объекте.
Обычно процесс экспериментирования включает такие важные этапы, как постановка задачи, априорный анализ, эксперимент, интерпретация результатов. В каждый из
этих этапов входит такой необходимый шаг, как принятие решений.
Современная математическая теория требует, чтобы задача была формализована,
т.е. надо однозначно сформулировать цель исследования, выделить переменные, значения
которых определяют близость к поставленной цели, и установить некоторые соотношения
между целью и переменными, принять ограничения и т.п.
Вся совокупность имеющихся до начала эксперимента сведений принято называть
априорной (т.е. доопытной) информацией. Априорный анализ – сбор и анализ априорной
информации – позволяет уточнить постановку задачи и выбрать программу действий экспериментатора, т.е. учесть специфику решаемой задачи, что значительно повышает эффективность проведения и планирования экспериментов.
Методы планирования экспериментов позволяют осуществить перевод результатов
с языка математической модели на язык, которым владеет экспериментатор.
Принятие решений на каждом этапе экспериментирования приводит к циклическому повторению этапов, что придаёт гибкость и обеспечивает обратную связь всему процессу экспериментирования
Отметим, что информация, добытая в некотором эксперименте, является априорной
по отношению к следующему эксперименту. Процедуры, связанные с решением всего
обширного круга вопросов на пути от замысла к плану, называются предпланированием
эксперимента.
Основные определения теории вероятностей
1. Базовые определения
2. Распределения случайной величины
3. Основные характеристики случайной величины
4. Типовые законы случайных величин
Первичные методы анализа данных
В настоящее время в арсенале методов прикладной статистики есть много подходов для построения различных математических моделей. Среди них выделим те, которые
используются на начальных стадиях исследования и для которых типичны следующие задачи: нахождение неизвестных параметров эмпирических распределений; проверка статистических гипотез; определение закона распределения случайной величины по опытным
данным. Выборочный метод позволяет оценить параметры генеральной совокупности (генеральное среднее, генеральную дисперсию).
Так как исследователь зачастую имеет дело с объёмом малой выборки, то важными
требованиями к совокупности малого объёма является представительность анализируемого материала и достаточная достоверность имеющихся данных, с тем чтобы можно было
делать заключения о свойствах генеральной совокупности с максимально возможной вероятностью.
Для практических задач обычно используют выборочные данные.
3. Математическое планирование эксперимента в научных исследованиях
3.1 Основные понятия и определения
В настоящее время в экспериментальных исследованиях всё шире применяются
методы планирования эксперимента. Так как многие исследования требуют постановки
очень сложных и дорогостоящих экспериментов, необходимо значительно повысить эффективность и качество экспериментальных работ.
Как и в любом сформировавшемся научном направлении, в теории планирования
эксперимента выработалась определенная система основополагающих понятий и терминов. Приведем наиболее важные из них.
Объект исследования есть носитель некоторых неизвестных и подлежащих изучению свойств и качеств.
Планирование эксперимента – это процедура выбора числа и условий проведения
опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью[2, с. 14].
Для подробного изучения объекта исследования необходима его подробная модель.
Подходящей моделью является «черный ящик», введенный в кибернетике с целью изучения сложности. Его построение основано на принципе: оптимальное управление возможно при неполной информации. Ясная формулировка этого факта является важнейшим достижением кибернетики.
Под экспериментом будем понимать совокупность операций совершаемых над
объектом исследования с целью получения информации об его свойствах. Эта совокупность может быть весьма сложной, но её всегда можно разложить на отдельные элементы,
каждый из которых мы называем опытом. Эксперимент, в котором исследователь по своему усмотрению может изменять условия его проведения, называется активным экспериментом. Если исследователь не может самостоятельно изменять условия его проведения, а
лишь регистрирует их, то это пассивный эксперимент.
Важнейшей задачей методов обработки полученной в ходе эксперимента информации является задача построения математической модели изучаемого явления, процесса,
объекта. Ее можно использовать и при анализе процессов и при проектировании объектов.
Можно получить хорошо аппроксимирующую математическую модель, если целенаправленно применяется активный эксперимент. Другой задачей обработки полученной в ходе
эксперимента информации является задача оптимизации, т.е. нахождения такой комбинации влияющих независимых переменных, при которой выбранный показатель оптимальности принимает экстремальное значение.
Опыт – это отдельная экспериментальная часть.
План эксперимента – совокупность данных определяющих число, условия и порядок проведения опытов.
Математическая модель объекта исследования – это определённая фраза на языке
математики, содержательно отражающая те или иные свойства изучаемого объекта, в
частности структуру и количественные связи, его характеризующие. Методы планирования фактически предназначены для получения математических статистических моделей
объектов исследования.
Планирование эксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям, совокупность действий направленных на разработку стратегии экспериментирования (от получения априорной информации до получения работоспособной
математической модели или определения оптимальных условий). Это целенаправленное
управление экспериментом, реализуемое в условиях неполного знания механизма изучаемого явления.
В процессе измерений, последующей обработки данных, а также формализации результатов в виде математической модели, возникают погрешности и теряется часть ин-
формации, содержащейся в исходных данных. Применение методов планирования эксперимента позволяет определить погрешность математической модели и судить о ее адекватности. Если точность модели оказывается недостаточной, то применение методов планирования эксперимента позволяет модернизировать математическую модель с проведением дополнительных опытов без потери предыдущей информации и с минимальными
затратами.
Цель планирования эксперимента – нахождение таких условий и правил проведения опытов при которых удается получить надежную и достоверную информацию об объекте с наименьшей затратой труда, а также представить эту информацию в компактной и
удобной форме с количественной оценкой точности.
Пусть интересующее нас свойство (Y) объекта зависит от нескольких (n) независимых переменных (Х1, Х2, …, Хn) и мы хотим выяснить характер этой зависимости –
Y=F(Х1, Х2, …, Хn), о которой мы имеем лишь общее представление. Величина Y – называется «отклик», а сама зависимость Y=F(Х1, Х2, …, Хn) – "функция отклика".
Отклик должен быть определен количественно. Однако могут встречаться и качественные признаки Y. В этом случае возможно применение рангового подхода. Пример
рангового подхода – оценка на экзамене, когда одним числом оценивается сложный комплекс полученных сведений о знаниях студента.
Независимые переменные Х1, Х2, …, Хn – иначе факторы, также должны иметь количественную оценку. Если используются качественные факторы, то каждому их уровню
должно быть присвоено какое-либо число. Важно выбирать в качестве факторов лишь независимые переменные, т.е. только те которые можно изменять, не затрагивая другие факторы. Факторы должны быть однозначными. Для построения эффективной математической модели целесообразно провести предварительный анализ значимости факторов (степени влияния на функцию), их ранжирование и исключить малозначащие факторы.
Планирование эксперимента – это выбор числа опытов и условий их проведения
необходимых и достаточных для решения поставленной задачи с требуемой точностью.
Эксперимент, который ставится для решений задач оптимизации, называется экстремальным. Примерами задач оптимизации являются выбор оптимального состава многокомпонентных смесей, повышение производительности действующей установки, повышение качества продукции и снижение затрат на её получение. Прежде чем планировать эксперимент необходимо сформулировать цель исследования. От точной формулировки цели зависит успех исследования. Необходимо также удостовериться, что объект
исследования соответствует предъявляемым ему требованиям. В технологическом исследовании целью исследования при оптимизации процесса чаще всего является повышение
выхода продукта, улучшение качества, снижение себестоимости.
Большинство исследований связано с экспериментом. Он проводится в лабораториях, на производстве, на опытных полях и участках, в клиниках и т.д. Эксперимент может быть физическим, психологическим или модельным. Эксперимент может проводиться
непосредственно на объекте или на его модели. Модель отличается от объекта не только
масштабом, а иногда природой. Если модель достаточно точно описывает объект, то эксперимент на объекте может быть перенесён на модель. Для описания понятия "объект исследования" можно использовать представление о кибернетической системе, которая носит название чёрный ящик. Таким образом, любой объект исследования можно представить в виде "черного ящика" с определённым количеством входов и выходов. На рис. показана структурная схема объекта исследования с аддитивной помехой .
x1
x2
Чёрный ящик
f
y
xk

Рис. "Черный ящик" Модель изучаемого процесса
Рис. 1. Кибернетическое представление эксперимента
Стрелки справа изображают численные характеристики целей исследования и
называются выходными параметрами (y) или параметрами оптимизации. Их называют
также критерий оптимизации, целевая функция, выход "черного ящика" и т.д.
Для проведения эксперимента необходимо воздействовать на поведение чёрного
ящика. Все способы воздействия обозначаются через xi, i=1,2 …, n и называются входными параметрами или факторами (управляющие параметры). Их называют также независимыми переменными и входами "черного ящика". Каждый фактор может принимать в
опыте одно из нескольких значений, и такие значения называются уровнями. Фиксированный набор уровней и факторов определяет одно из возможных состояний чёрного
ящика, одновременно они являются условиями проведения одного из возможных опытов.
Результаты эксперимента используются для получения математической модели объекта
исследования. Использование для объекта всех возможных опытов приводит к абсурдно
большим экспериментам. В связи с этим эксперименты необходимо планировать.
При решении задачи будем использовать математические модели объекта исследования. Здесь под математической моделью мы понимаем уравнение, связывающее параметр оптимизации с факторами. Это уравнение в общем виде можно записать так:
y=f(x1,x2, … ,xn).
Такая функция называется функцией отклика. Поверхность, являющуюся геометрическим образом функции отклика, называют поверхностью отклика.
В самом общем случае, когда исследование ведётся при неполном знании механизма изучаемых явлений, естественно аналитическое выражение функции неизвестным. Поэтому приходиться ограничиваться представлением её полиномом. Например, полином
первого порядка (линейная модель):y(x, b)=b0+b1x1+…+bnxn с теоретическими коэффици-
ентами регрессии b0, b1, …,bn, т.е. функция задана с точностью до параметров (параметры
неизвестны и их требуется оценить по результатам эксперимента)
Пользуясь результатами эксперимента, можно определить только выборочные коэффициенты регрессии b0, b1, …,bn, которые являются лишь оценками для теоретических
коэффициентов регрессии.
План эксперимента, позволяющий вычислить коэффициенты линейного уравнения
регрессии, называют планом первого порядка.
План второго порядка – это план эксперимента, позволяющий вычислить коэффициенты полного уравнения регрессии второй степени.
Задачей планирования является выбор необходимых для эксперимента опытов, методов математической обработки их результатов и принятия решений. Частный случай
этой задачи - планирование экстремального эксперимента. То есть эксперимента поставленного с целью поиска оптимальных условий функционирования объекта. Таким образом, планирование экстремального эксперимента - это выбор количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий. При планировании эксперимента объект исследования должен обладать обязательными свойствами:
1. управляемым;
2. результаты эксперимента должны быть воспроизводимыми.
Эксперимент называется воспроизводимым, если при фиксированных условиях
опыта получается один и тот же выход в пределах заданной относительно небольшой
ошибки эксперимента (2%-5%). Эксперимент проводят при выборе некоторых уровней
для всех факторов, затем он повторяется через неравные промежутки времени. И значения
параметров оптимизации сравниваются. Разброс этих параметров характеризует воспроизводимость результатов. Если он не превышает заранее заданной величины, то объект
удовлетворяет требованию воспроизводимости результатов.
При планировании эксперимента активное вмешательство предполагает процесс и
возможность выбора в каждом опыте тех факторов, которые представляют интерес. Экспериментальное исследование влияния входных параметров (факторов) на выходные может производиться методом пассивного или активного эксперимента. Если эксперимент
сводится к получению результатов наблюдения за поведение системы при случайных изменениях входных параметров, то он называется пассивным. Если же при проведении
эксперимента входные параметры изменяются по заранее заданному плану, то такой эксперимент называется активным. Объект, на котором возможен активный эксперимент,
называется управляемым. На практике не существует абсолютно управляемых объектов.
На реальный объект обычно действуют как управляемый, так и неуправляемый факторы.
Неуправляемые факторы действуют на воспроизводимость эксперимента. Если все факторы неуправляемы, возникает задача установления связи между параметром оптимизации и
факторами по результатам наблюдений или по результатам пассивного эксперимента.
Возможна также плохая воспроизводимость изменения факторов во времени.
4. Факторы оптимизации
4.1 Определение фактора
Фактором называется измеряемая переменная величина, принимающая в некоторый момент времени определенное значение. Факторы соответствуют способам воздействия на объект исследования.
Так же, как и параметр оптимизации, каждый фактор имеет область определения.
Фактор считают заданным, если вместе с его названием указана область его определения.
Под областью определения понимается совокупность всех значений, которые в
принципе может принимать данный фактор.
Совокупность значений фактора, которая используется в эксперименте, является
подмножеством из множества значений, образующих область определения. Область определения может быть непрерывной и дискретной. Однако в основном, в задачах планирования эксперимента, используются дискретные области определения. Так, для факторов с
непрерывной областью определения, таких, как температура, время, количество вещества
и т.п., всегда выбираются дискретные множества уровней.
В практических задачах области определения факторов, как правило, ограничены.
Ограничения могут носить принципиальный либо технический характер.
Область значений факторов x, в которой находятся точки, отвечающие условиям
проведения опытов используемого плана эксперимента, называется областью планирования. Чаще всего область планирования задаётся интервалами возможного изменения
факторов ximin≤xi≤ximax, i=1, 2, …, n, и представляет собой гиперпараллелепипед.
Точка плана – это упорядоченная совокупность численных значений факторов, соответствующая условиям проведения опыта; точка факторного пространства, в которой
проводится эксперимент. Точке плана с номером i соответствует вектор xi=(x1i, …, xni)'.
Общая совокупность таких векторов xi, i=1, …, N, образует план эксперимента, а совокупность различных векторов – спектр плана.
Фиксированное значение фактора называют уровнем фактора. Обычно факторы
рассматривают в стандартизованном или натуральном масштабе изменения переменных.
Переход к стандартизованному масштабу может быть, например, осуществлён следующим образом:
𝑧𝑖 =
𝑥𝑖 −(𝑥𝑖𝑚𝑎𝑥 +𝑥𝑖𝑚𝑖𝑛 )/2
(𝑥𝑖𝑚𝑎𝑥 −𝑥𝑖𝑚𝑖𝑛 )/2
,
(1)
где xi – значение i-й переменной в натуральном масштабе измерения, i=1, 2, …,n. Как следует из формулы (1) в стандартизованном масштабе факторы Zi принимают значения -1,
0,+1.
Точку факторного пространства Z0, координаты которой выбираются с помощью
соотношения xi=(ximin+ximax)/2 (середина интервала, среднее значение), i=1, 2, …,n, принято
называть центром эксперимента. Её можно рассматривать как исходную точку для построения плана эксперимента. Построение плана эксперимента сводится к выбору экспериментальных точек, симметричных относительного нулевого уровня.
Координаты вектора z0=(𝑧10 , 𝑧20 , … , 𝑧𝑛0 )' задают так называемые основные (нулевые)
уровни факторов.
Величину ∆𝑥𝑖 , вычисляемую по формуле ∆𝑥𝑖 ,=(ximax-ximin)/2, , i=1, 2, …,n, будем
называть интервалом (шагом) варьирования (изменения) фактора. Интервалом изменения
факторов называется некоторое число (своё для каждого фактора), прибавление которого
к основному уровню даёт верхний, а вычитание – нижний уровень фактора. Другими словами, интервал изменения – это расстояние на координатной оси между основным и верхним (или нижним) уровнем. Для качественных факторов, имеющих два уровня, один уровень обозначается +I, а другой –I; порядок уровней не имеет значения (назад).
Методы планирования экспериментов для линейных моделей
Полиноминальные модели получили широкое распространение в практических исследованиях. Остановимся на наиболее часто использующихся полиномах первой и второй степеней от независимых переменных для некоторых типов планирования. Соответствующие планы эксперимента принято в этом случае называть планами первого и второго порядков.
Отметим, что для полиноминальных моделей первого порядка можно построить
планы эксперимента, которые одновременно обладают свойствами ортогональности и ротатабельности, для полиномов второго порядка найти такие планы не удаётся. В практических задачах критерию ротатабельности отдают некоторое предпочтение. К важным
свойствам ортогональности и ротатабельности можно добавить ещё свойство композиционности планов.
Композиционные планы второго порядка получаются добавлением некоторых точек к планам первого порядка. Такое свойство даёт возможность в прикладных исследованиях сначала попытаться построить модель первого порядка, а затем, если нужно, добавив наблюдения, перейти к модели второго порядка [2].
Полный факторный эксперимент
Полным факторным экспериментом (ПФЭ) называется такой эксперимент, при
реализации которого определяется значение функции цели для всех возможных сочетаний
варьирования (изменения) факторов. Эксперимент, в котором реализуются все возможные
сочетания уровней факторов, называется полным факторным экспериментом (ПФЭ).
Общее число различных комбинаций уровней в ПФЭ для k факторов можно вычислить как n=q1q2…qk , где qi– число уровней i-го фактора.
Если имеется k факторов, каждый из которых может устанавливаться на q уровнях,
то для осуществления полного факторного эксперимента необходимо поставить n=qk опытов. Дробным факторным экспериментом (ДФЭ) называется эксперимент, который не содержит всех различных опытов n=qk. План эксперимента называется симметричным, если
все факторы имеют одинаковое число уровней; равномерным, если уровни любого фактора встречаются в плане одинаковое для данного фактора число раз.
Наибольшее распространение получили эксперименты, в которых факторы варьируются на двух уровнях, т.е. эксперименты типа 2k.
Планирование, проведение и обработка результатов ПФЭ состоят из следующих
обязательных этапов:
1. кодирование факторов;
2.
3.
4.
5.
6.
составление плана матрицы эксперимента;
реализация плана эксперимента;
проверка воспроизводимости опытов;
оценка значимости коэффициентов регрессии;
проверка адекватности линейной модели.
Кодирование факторов необходимо для перевода натуральных факторов в безразмерные величины, чтобы иметь возможность построить стандартную ортогональную
план-матрицу эксперимента.
После выбора факторов для каждого из них устанавливается основной уровень (т.е.
исходное значение) и интервал варьирования (изменения). Прибавление интервала варьирования к основному уровню даёт верхний, а вычитание – нижний уровень фактора.
Удобно, чтобы верхний уровень соответствовал +1, нижний -1, а основной 0 (см. выше).
Для этого факторы кодируют так, чтобы их подобные значения Zi были связаны с натуральными xi соотношением (1). На интервал варьирования накладываются определённые
ограничения. Рекомендуется выбирать интервал, не превышающий удвоенный средний
квадратичной ошибки в определении данного фактора. Для перевода натуральных переменных в кодовые Zi заполняют таблицу кодирования переменных на двух уровнях. Затем
составляют план-матрицу эксперимента и приведённый план эксперимента. Проиллюстрируем это на простом примере [4, с. 127].
Пример 1. Исследовать процесс нагрева агрегата в зависимости от непрерывной работы.
Цель исследования – определить зависимость износа деталей от скорости и конечной температуры нагрева. Температура изменяется от 250 до 4500С, скорость нагрева – от 2 до 10
К/мин.
Решение. Кодируем факторы, сводя результаты в табл. 1.
Таблица 1. Исходные значения факторов и интервалы варьирования
Интервал варьирования
и уровень факторов
Температура x1,
0C
Скорость нагрева x2,
К/мин
Нулевой уровеньZi0=0
350
6
Интервал варьирования ∆Xi
50
2
Нижний уровень Zi=-1
300
4
Верхний уровень Zi=+1
400
8
Другая форма таблицы исходных значений факторов и интервалов варьирования
[3].
Таблица 1'. Исходные значения факторов и интервалы варьирования
Фактор,
xi
Уровни факторов
Zi=-1
Zi=0
Zi=+1
Интервал варьирования,
∆xi
Температура x1, 0С
300
350
400
50
Скорость нагрева x2,
4
6
8
2
К/мин
где Zi – нормированные значения xi (см. формулу 1).
Составляем план-матрицу (таблица 2). Отметим, что в примере изменяются только
два фактора x1 и x2, причём каждый – на двух уровнях +1, -1 (или +, -).
Таблица 2. План-матрица эксперимента
Номер опыта
z1
z2
1
-1
-1
2
+1
-1
3
-1
+1
4
+1
+1
Строки в таблице соответствуют различным опытам, а столбцы – значениям факторов. В первом опыте оба фактора находятся на нижнем уровне, во втором опыте фактор
x1 на верхнем, а фактор x2 – на нижнем уровнях и т.д. Такие таблицы называют матрицами планирования эксперимента.
Реализация плана эксперимента представлена в таблице 3.
Таблица 3. Реализация плана эксперимента
Номер
опыта
𝑦𝑛1
𝑦𝑛2
𝑦𝑛 =(𝑦𝑛1 + 𝑦𝑛2 )/2
+1
27,0
28,0
27,5
-1
-1
15,9
17,1
16,5
-1
+1
-1
22,1
22,9
22,5
+1
+1
+1
z1
z2
1
-1
-1
2
+1
3
4
z1 z2
13,4
13,6
13,5
Приведённый план эксперимента представляет собой расширенную матрицу, т.к.
введён столбец z1 z2, позволяющий оценить коэффициент регрессии при взаимодействии
факторов. Здесь 𝑦𝑛1 , 𝑦𝑛2 – износ деталей (см. пример 1).
Последовательность расчёта
и статистического анализа при использовании ПФЭ
1. Выбор основного уровня и интервалов варьирования (изменения) факторов. Для
этого составляют (см. таблицу 1).
2. Кодирование переменных (см. формулу 1).
3. Выбор плана.
4. Построение матрицы плана эксперимента (см. таблицу 2).
5. По выбранной матрице проводятся эксперименты на объекте.
6. Построение матрицы реализации плана эксперимента (сбор всех данных в таблицу).
7. Проверка однородности дисперсий.
8. Получение коэффициентов модели.
9. Проверка значимости коэффициентов.
10. Проверка адекватности модели. Проверка осуществляется по критерию Фишера.
11. В случае неадекватности модели, возвращаются к пункту изменения структуры
модели. Структуру модели можно изменить путём ввода взаимодействия между
факторами. Строим расширенную матрицу эксперимента.
12. Интерпретация полученной модели. Коэффициенты модели показывают количественную меру влияния факторов на выходную переменную. Значить все факторы
можно расположить в ряд предпочтительности, что важно при управлении. Если
уравнение применяется для дальнейших расчётов, то его преобразуют в раскодированные переменные.
Эффект фактора и эффекты взаимодействия
При варьировании факторами на двух уровнях можно получить математическую
модель объекта в виде полинома первого и неполного высшего порядка.
В зависимости от числа факторов в полином неполного высшего порядка кроме
линейных членов входят выражения, характеризующие эффекты взаимодействия. Например, для двух факторов может быть один двойной эффект b12x1x2 (см. таблицу 3). При трёх
факторах может быть три двойных и один тройной эффект b12x1x2, b13x1x3, b23x2x3,
b123x1x2x3.
Поясним понятия "эффект фактора" и "эффект взаимодействия". Вклад фактора в
величину параметра оптимизации при переходе от нижнего к верхнему уровню называется эффектом фактора (иногда его называют линейным, основным или главным эффектом). Он численно равен удвоенному коэффициенту полинома. Если эффект одного фактора зависит от уровня, на котором находится другой фактор, то говорят, что имеет место
эффект взаимодействия двух факторов (иногда говорят двойной или парный эффект взаимодействия (эффект взаимодействия первого порядка)). Также выясняется смысл тройного эффекта взаимодействия (эффект взаимодействия второго порядка) и т.д. Численно эффект взаимодействия равен удвоенному соответствующему коэффициенту полинома.
Дробный факторный эксперимент
С увеличением числа факторов количество опытов в полном факторном эксперименте резко возрастает. Так, при трёх факторах следует поставить 23=8 опытов, при пяти –
25=32 опыта, а уже при восьми – 256 опытов. Разность между числом опытов и числом коэффициентов во многих случаях оказывается очень велика, и возникает естественное желание сократить число необходимых опытов. Заманчиво сократить их число за счёт той
информации, которая несущественна при построении линейных моделей.
Итак, нам заранее известно, что объект описывается линейным уравнением (предполагается, что эффекты взаимодействия отсутствуют) или нас интересуют только линейные члены. Возникает вопрос: как построить ортогональный план, позволяющий определить коэффициенты линейного уравнения, который содержит меньше число опытов, чем
полный факторный эксперимент, т.е. целесообразно сократить число опытов за счёт информации, которую несут эффекты взаимодействия факторов и которая для построения
постулируемой линейной модели несущественна.
Попробуем построить такие планы для случая k=3 и k=4. Рассмотрим снова ПФЭ 22
(план этого эксперимента задан таблицей 5).
Таблица 5.
Номер опыта
z0
z1
z2
z1 z2=z3
1
+1
-1
-1
+1
y1
2
+1
+1
-1
-1
y2
3
+1
-1
+1
-1
y3
4
+1
+1
+1
+1
y4
y
По нему можно построить модель y=b0+b1z1+a2z2+b12z1z2. Пусть имеется достаточная уверенность, что в выбранных интервалах варьирования x1 и x2 значение b12 будет незначим. Тогда столбец z1z2 можно использовать для нового фактора z3. Проведя такой эксперимент, сможем сделать оценку четырёх коэффициентов, т.е. получить зависимость
y=a0+a1z1+a2z2+a3z3.
Рассмотрим теперь второй случай: k=4. План полного факторного эксперимента состоит из 16 точек. Как и в предыдущем примере рассмотрим ПФЭ 2 3 (k=3), представленный в табл. 6.
Таблица 6.
Номер
опыта
1
2
3
4
5
6
7
8
z1
z2
z3
z1 z2
z1 z3
z2 z3
z1z2z3
+1
+1
-1
-1
+1
+1
-1
-1
1
-1
1
-1
1
-1
1
-1
1
1
1
1
-1
-1
-1
-1
1
-1
-1
1
1
-1
-1
1
1
1
-1
-1
-1
-1
1
1
1
-1
1
-1
-1
1
-1
1
1
-1
-1
1
-1
1
1
-1
В связи с тем, что взаимодействия принимаются равными нулю, можно воспользоваться любым из столбцов, характеризующих эффекты взаимодействия для четвёртой переменной, например, столбец z1z2z3 (или - z1z2z3). Приняв для фактора z4 столбец z1z2z3 получим план, приведённый в табл. 7.
Таблица 7.
Номер
опыта
1
2
3
4
5
6
7
8
z1
z2
z3
z4
+1
+1
-1
-1
+1
+1
-1
-1
1
-1
1
-1
1
-1
1
-1
1
1
1
1
-1
-1
-1
-1
1
-1
-1
1
-1
1
1
-1
Рассмотренные планы содержат половину опытов ПФЭ и носят название полуреплики.
Таким образом, из всего множества точек полного факторного плана может быть
отобрана лишь некоторая часть, представляющая так называемый дробный факторный
план и содержащая подходящее число опытов.
Дробный факторный эксперимент составляет часть ПФЭ, которая называется дробной репликой. Используется ½ реплики (полуреплика), ¼ реплики, 1/8 реплики и т.д.
Условное обозначение реплик и количество опытов приведены в таблице 8.
Для построения дробного факторного плана типа 2k-p из множества k факторов отбирают k-p основных, для которых строят полный факторный план с матрицей Xk-p. Этот
план дополняют затем p столбцами (линейными эффектами), приравненных к эффектам
взаимодействия. Каждый из этих столбцов получается как результат поэлементного перемножения не менее двух и не более k-p определённых столбцов, соответствующих основным факторам.
Перед постановкой эксперимента по дробным репликам необходимо решить – каким взаимодействием можно пренебречь, и к какому это приведёт риску.
Таблица 8
Число
факторов,
Количество опытов
Дробная реплика
Обозначение
ДФЭ
ПФЭ
3
½ реплики от 23
23-1
4
8
4
½ реплики от 24
24-1
8
16
4
1/4 реплики от 24
24-2
4
16
5
½ реплики от 25
25-1
16
32
5
1/4 реплики от 25
25-2
8
32
Для определения способа образования каждого из p столбцов дробного плана вводится понятие генерирующего соотношения (генератор плана) – произведение основных
факторов, определяющих значение элементов каждого из дополнительных p столбцов
матрицы плана и определяющие контрасты. В случае плана типа 2k-p может иметься p генераторов.
Целесообразно сократить число опытов за счёт информации, которую несут эффекты взаимодействия факторов и которая для построения постулируемой линейной модели
несущественна.
Рассмотренная матрица составляет полуреплику от 23, т.е. полуреплику 23-1.
В рассмотренном случае ДФЭ типа 23-1 могут быть два генерирующих соотношения z3=z1z2 и z3=-z1z2.
Определяющий контраст получается умножением левой и правой частей генерирующих соотношений (ГС) на z3 (для нашего случая), т.е.
𝑧32 =1=z1z2z3 и 𝑧32 =-1=-z1z2z3.
Таким образом, произведения столбцов матрицы равные +1 или -1 называются
определяющими контрастами, которые помогают найти смешанные эффекты, не изучая
матрицу планирования, и позволяет установить разрешающую способность дробной реплики (см. далее).
Дробные реплики, содержащие 2k-p точек, называют регулярными. Существуют
также нерегулярные дробные реплики, содержащие количество точек не равное 2k-p,
3
например 4 2𝑘 .
При разработке технологических процессов дробные реплики очень широко используются на стадии крутого восхождения (при оптимизации), а также при математическом описании локальной области факторного пространства с узким интервалом изменения переменных (функцию на данном интервале можно заменить полиномом первого порядка, т.е. график функции заменить отрезком прямой). Существую задачи, где из физических (экономических или других) соображений ясно, что эффекты взаимодействия существовать не могут. Например, А.М. Кориков в книге [1, с. с. 15-18] приводит пример при
взвешивании трёх объектов, где можно не беспокоиться, что найденные величины являются совместными оценками для линейных эффектов и эффектов взаимодействия.
Разрешающая способность ДФЭ
Разрешающая способность ДФЭ задаётся системой смешивания данной реплики.
Она будет (разрешающая способность) максимальной, если линейные эффекты смешаны с
эффектами взаимодействия наибольшего возможного порядка.
Определяющий контраст позволяет определить систему смешивания дробной реплики. Для того чтобы определить, какой эффект смешан с данным, нужно помножить обе
части определяющего контраста на столбец, соответствующий данному эффекту.
Для этого нужно последовательно помножить независимые переменные на определяющий контраст.
В рассмотренном случае ДФЭ типа 23-1 могут быть два генерирующих соотношения z3=z1z2 и z3=-z1z2.
Определяющий контраст получается умножением левой и правой частей генерирующих соотношений (ГС) на z3 (для нашего случая), т.е.
𝑧32 =1=z1z2z3 и 𝑧32 =-1=-z1z2z3.
Для z1 имеем z1=𝑧12 𝑧2 𝑧3 = z2z3,
для z2 имеем z2=𝑧1 𝑧22 𝑧3 = z1z3,
для z3 имеем z3=𝑧1 𝑧2 𝑧32 = z1z2.
Полученные соотношения указывают на равенство столбцов в матрице планирования, например, столбцы для z1 и z2z3 одинаковы. Поэтому коэффициент b1 будет оценивать сумму β1+β23. Это записывается следующим образом:
b1→β1+β23, b2→β2+β13, b3→β3+β12.
ДФЭ, в котором основные эффекты смешаны с двойными эффектами взаимодействия, носят название планов с разрешающей способностью III (по наибольшему числу
факторов в определяющем контрасте).
Чтобы получить высокую разрешающую способность реплик, нужно стремиться к
такому их плану, чтобы линейные эффекты были смешаны с взаимодействиями более высокого порядка, т.к. они чаще бывают равными нулю.
Свойства полного и дробного факторных экспериментов
Полному и дробному факторным экспериментам присущи следующие свойства.
1. Симметричность относительно центра эксперимента: ∑𝑁
𝑢=1 𝑥𝑖𝑢 = 0, т.е. сумма
элементов любого столбца матрицы планирования равна нулю.
2
2. Нормировка: ∑𝑁
𝑢=1 𝑥𝑖𝑢 = 𝑁 , т.е. сумма квадратов элементов любого столбца рана числу опытов.
3. Ортогональность: ∑𝑁
𝑗=1 𝑥𝑖𝑢 𝑥𝑗𝑢 = 0, т.е. сумма почленных произведений любых
столбцов равна нулю.
4. Ротатабельность, т.е. способность математической модели, полученной в результате полного и дробного экспериментов, предсказывать значение параметра
y с одинаковой точностью на равных расстояниях от центра эксперимента независимо от направления.
Свойства 1, 2 следуют непосредственно из способов построения матриц планирования, в частности из того, что значения факторов в матрице равны только +1 и -1.
Матричное определение коэффициентов уравнения модели
Рассмотрим уравнение y=b0+b1x1+…+bkxk.
(1)
В матричной форме уравнение (1) можно записать в виде
Y=XB,
(2)
где X – матрица условий эксперимента:
𝑥01 ⋯ 𝑥𝑘1
⋱
⋮ ), k – число факторов; N – число опытов; B – вектор неизвестных
X=( ⋮
𝑥0𝑁 ⋯ 𝑥𝑘𝑁
коэффициентов регрессии: BT=(b0, b1, …, bk); Y – матрица результатов наблюдений: YT=(y1,
y2, …,yN).
Умножим равенство (2) на транспонированную матрицу XT;
XTXB=XTY,
затем обратную (XTX)-1. Получили
(XTX)-1(XTX)B=(XTX)-1(XTY), (XTX)-1(XTX)=E,
где E – единичная матрица. Следовательно,
B=(XTX)-1(XTY)
(3).
и матрица коэффициентов регрессии найдена.
Пример. Найти коэффициенты регрессии для ПФЭ с двумя факторами.
Решение. В этом случае линейная модель имеет вид y=b0+b1x1+b2x2, т.е. в матричной записи XA=Y, где
𝑦1
+1 + 1 + 1
𝑏0
𝑦
+1 − 1 + 1
2
X=(
) , B=(𝑏1 ); Y=(𝑦 ).
+1 + 1 − 1
3
𝑏2
𝑦
+1 − 1 − 1
4
Найдём матрицы XT и XTX:
+1 + 1 + 1 + 1
XT=(+1 − 1 + 1 − 1).
+1 + 1 + 1 + 1
+1 + 1 + 1
+1 + 1 + 1 + 1
400
+1 − 1 + 1
T
X X=(+1 − 1 + 1 − 1) (
)=(0 4 0).
+1 + 1 − 1
+1 + 1 + 1 + 1
004
+1 − 1 − 1
Матрицы (XTX)-1 и XTY имеют вид:
1⁄ 0 0
4
T -1
(X X) = 0 1⁄4 0 ,
1⁄
(0 0
4)
𝑦1
𝑦1 + 𝑦2 + 𝑦3 + 𝑦4
+1 + 1 + 1 + 1
𝑦2
T
X Y=(+1 − 1 + 1 − 1) (𝑦 )=(𝑦1 − 𝑦2 + 𝑦3 − 𝑦4 ).
3
𝑦1 + 𝑦2 − 𝑦3 − 𝑦4
+1 + 1 + 1 + 1
𝑦
4
1⁄ 0 0
4
𝑏0
𝑦1 + 𝑦2 + 𝑦3 + 𝑦4
1
По формуле (𝑏1 )= 0 ⁄4 0 (𝑦1 − 𝑦2 + 𝑦3 − 𝑦4 ),
𝑦1 + 𝑦2 − 𝑦3 − 𝑦4
𝑏2
1⁄
(0 0
)
4
𝑦1 +𝑦2 +𝑦3 +𝑦4
откуда b0=
4
𝑦1 −𝑦2 +𝑦3 −𝑦4
, b1=
4
𝑦1 −𝑦2 −𝑦3 −𝑦4
, b2=
4
.
Ортогональность столбцов исходной матрицы планирования X приводит к получению диагональной обратной матрицы (XTX)-1 , диагональные элементы которой определяют дисперсии коэффициентов регрессии: 𝑆𝑖2 = 𝑐𝑖𝑖 𝑆𝑦2, причём последние оказываются оди2
наковыми: 𝑆𝑖2 = 𝑆𝑦2 / ∑𝑁
𝑢=1 𝑥𝑖𝑢 .
Из равенства дисперсий следует свойство ротатабельности матрицы полного и
дробного факторных экспериментов.
Решим и исследуем задачу в примере 1(данные находятся в таблице 3).
Если сравнимое количество выборочных дисперсий больше двух и одна выборочная дисперсия значительно превышает остальные, то пользуются критерием Кохрена. Это
критерий пригоден для случаев, когда во всех точках имеется одинаковое число повтор-
ных опытов. Критерий Кохрена – это отношение максимальной выборочной дисперсии к
сумме всех выборочных дисперсий. Гипотеза об однородности выборочных дисперсий
подтверждается, если экспериментальное значение критерия Кохрена не превышает табличного (теоретического) значения.
Проведём проверку воспроизводимости параллельных опытов по критерию Кохрена
𝑆2
𝐺экс = ∑𝑛𝑛 наиб
≤ 𝐺теор (0,05; 𝑓𝑛 ; 𝑓𝑢 ),
𝑆2
(4)
𝑢=1 𝑢
∑𝑚
̅𝑢 )2
𝑝=1(𝑦𝑢𝑝 −𝑦
где 𝑆𝑢2 =
𝑚−1
– дисперсия, характеризующая рассеяние результатов опытов на u – м
сочетании уровней факторов; p=1,2, …, m – число параллельных опытов; 𝑆𝑛2 наиб –
наибольшая из дисперсий в строчках плана; Gтеор(0,05; 𝑓𝑛 ; 𝑓𝑢 ) – табличное значение критерия Кохрена при 0,05 уровне значимости; fn – число независимых оценок дисперсии (т.е.
равно числу опытов n); fu=m-1 – число степеней свободы каждой оценки, где m – число
параллельных опытов на каждом уровне. Следовательно, с учётом параллельных опытов
число всех экспериментов будет равно N=n×m.
Процесс считается воспроизводимым, если выполняется неравенство (4). При этом
дисперсия воспроизводимости (ошибка опыта) определяется по формуле
1
𝑆𝑦2 = 𝑛 ∑𝑛𝑢=1 𝑆𝑢2 .
Если неравенство (4) не выполняется, то необходимо уточнить измерения в опыте с
максимальной дисперсией.
Решение проводилось с использованием MS Excel (см. файл "Задача_10_1Р.xlsx").
В случае воспроизводимости процесса рассчитывают коэффициенты регрессии:
Первый вопрос, который нас интересует после вычисления коэффициентов модели,
это проверка её пригодности. Такую проверку называют проверкой адекватности модели.
С этой целью вычисляем остаточную сумму квадратов, делим её на число степеней
свободы f=n-k-1 и получаем остаточную дисперсию или дисперсию адекватности.
1
2
𝑆адек
= 𝑓 ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2 , где 𝑦̂𝑖 – величина, вычисленная (предсказанная) по уравне-
нию регрессии, а yi – экспериментальные значения.
Для проверки об адекватности модели используется F – критерий Фишера, т.е. вычисляется отношение
𝑆2
Fэкс= 𝑆ад2 ,
𝑦
и если рассчитанное значение Fэкс – критерия не превышает табличного, то, с соответствующей доверительной вероятностью модель можно считать адекватной.
2
𝑆адек
Fэкс=
𝑆𝑦2
≤Fтеор(0.05; fадек; fu), где fадек=n-k-1; fu=m-1.
Оценка значимости коэффициентов производится с помощью критерия Стьюдента. Коэффициент считается значимым, если выполняется неравенство
𝑆
|𝑏𝑖 | ≥ Δ𝑏𝑖 =t(0.05;fy) 𝑦 , где t(0.05;fy) – критерий Стьюдента, fy=n. Из таблицы находим
𝑛
√
t(0.05;fy)= t(0.05;4)=2.776.
𝑆𝑦
√
0.39
,=√
𝑛
4
.
Критерий Кохрена для уровня значимости 0.05
Gтеор(0,05; 𝑓𝑛 ; 𝑓𝑢 ): Gтеор(0,05; 4;1)=0,907; Gтеор(0,05; 8;1)=0,680.
Вопросы.
Задачи. Смотри файл "Практика_ПФЭ.docx"
Литература
1. А.М. Кориков. Математические методы планирования эксперимента. Учебное пособие. – Томск, Издательство Томского университета, 1973. с. 282.
2. Применение математических методов и ЭВМ. Планирование и обработка результатов эксперимента: Учеб. пособие/ А.Н. Останин, В.П. Тюленев, А.В. Романов, А.А.
Петровский; Под общ. ред. А.Н. Останина. – Мн. Выш. шк., 1989. – 218 с.: ил.
3. Матялис А.П. Математическое моделирование и оптимизация производственных и
технологических процессов. Учебное пособие. – Томск: Изд. ТПУ, 1999. – 94 с.
4. Микулик Н.А., Рейзина Г.Н. Решение технических задач по теории вероятностей и
математической статистике: Справочное пособие. – Мн.: Выш. шк., 1991. – 164 с.:
ил.
requested запрошенный
http://appmath.narod.ru/page7.html Теория планирования эксперимента 20.11.2012
Определяем нулевой уровень (середину интервала).
для температуры: (250+450)/2=700/2=350; интервал изменения: (450-250)/2=100;
для скорости: (2+10)/2=12/2=6.
Download