8_Лекция_статистич_модели

advertisement
Лекция
Большинство исследований проводимых в
химической технологии сводятся к решению
оптимальных задач.
 Существует два подхода к решению оптимальных
задач:

Для решения оптимальных задач необходимо
всестороннее исследование как механизма процесса,
так и физико-химических свойств явлений.
2. Экстремальная задача решается
экспериментальным путем, когда информации об
исследуемом объекте не достаточно или процесс
настолько сложен, что невозможно составить его
детерминированную модель.
1.
Для решения экстремальной задачи применяют
экспериментально - статистические методы:


при неизвестном механизме изучают зависимость
отклика системы на изменение входных параметров;
уравнения математического описания в этом случае
представляют собой систему эмпирических
зависимостей, полученных в результате
статистического обследования объекта;
Эти модели называются статистическими и имеют вид
корреляционных или регрессионных соотношений между
входными и выходными параметрами объекта.
Основным и необходимым источником
информации для построения статистических
моделей является эксперимент, а обработка
экспериментальных данных осуществляется
методами теории вероятности и
математической статистики.
z1
x1
x2
xn




z2
zn
y1
y2
yn
u1 u 2 un
xi – входные параметры;
yi – выходные параметры
zi – случайные воздействия, “шумы”
ui - управляющие воздействия
Рисунок 1- Схематическое изображение объекта
Математической моделью объекта будет
функция отклика параметра:
 y=F(x1,x2…W1,W2…)
 y=F(x1,x2…xn) – общий вид математической
модели
Независимые переменные x1…xn будем
называть факторами.
Пространство с координатами x1…xn –
факторное пространство.


Геометрическое изображение функции
отклика в факторном пространстве называют
функцией отклика.

Если исследование поверхности отклика
ведется при неполном знании механизма
процесса, аналитическое выражение
функции отклика неизвестно. В этом
случае математическая модель процесса
представляется в виде полинома
(многочлена)
-теоретические коэффициенты регрессии, характеризующие
соответственно линейные эффекты, эффекты взаимодействия и
квадратичные эффекты.

- теоретические коэффициенты
регрессии, характеризующие соответственно
линейные эффекты, эффекты взаимодействия
и квадратичные эффекты.


Результат эксперимента - случайная
величина. Значения выходной величины Y при
повторных измерениях отличаются друг от
друга.
Поэтому при обработке экспериментальных
данных можно определить только, так
называемые, выборочные коэффициенты
регрессии которые являются лишь оценками
теоретических коэффициентов -

Тогда уравнение регрессии :

Это уравнение используется для построения
статистических моделей объектов химической
технологии.


В экспериментах результаты повторных
измерений обычно отличаются друг от друга.
Такой исход эксперимента называется
случайным (стохастическим), а
соответствующие величины (параметры) –
случайными (стохастическими).


Под случайной величиной понимают
величину, значение которой
принципиально нельзя предсказать исходя
из условий опыта.
Истинное значение переменной – это такое
значение, которое получилось бы при
некотором измерении, если бы
отсутствовали элементы случайности,
связанные с измерением.

Случайные величины могут быть:
 дискретными
 непрерывными.

Дискретные переменные могут принимать
только отдельные значения, в некотором
интервале, которые можно заранее перечислить.

Значения непрерывной случайной величины
заранее посчитать нельзя. Они непрерывно
заполняют некоторый промежуток, т.е. могут
принимать любое значение из заданного
интервала.

Пусть проведена серия опытов, которая
включает n- экспериментов. При этом
непрерывное событие X (результат
измерений) произошло mi – раз, тогда
называется частотой появления события X.
Частота тоже величина случайная и при большом
числе опытов она может стабилизироваться около
некоторого значения P.
 Предел, к которому стремится отношение
, ,при
неограниченном возрастании числа экспериментов,
называется вероятностью случайного события x.

Вероятность – это отношение числа благоприятных
исходов события к полному числу при большой
продолжительности эксперимента.



Вероятность достоверного события всегда
равна 1, P(u)=1;
Вероятность невозможного события
всегда равна 0, P(V)=0;
Вероятность появления случайного
события неотрицательное значение 0P1
Кроме функции и плотности распределения,
существуют числовые характеристики случайных
величин.
Наиболее часто применяются на практике два
параметра:
 Математическое ожидание случайной
величины
 Дисперсия случайной величины
Математическое ожидание случайной величины – это
параметр, который характеризует центр рассеяния
(центр распределения) случайной величины. Принято
обозначать Mx, mx, m
 Иногда Mx называют «средневзвешенным»
значением случайной величины или «генеральным»
средним значением.
 Для случайной дискретной величины:

n
mx  M x    xi  pi

(1)
i 1
Для случайной непрерывной величины:
mx  M x  

x
i

 f x   dx
(2)




Математическое ожидание постоянной величины есть сама
эта величина.
Mc=C
Постоянный множитель можно выносить за знак
математического ожидания.
Mcx=cMx
Математическое ожидание суммы нескольких случайных
величин равно сумме их математических ожиданий.
Mx+y+z=Mx+My+ Mz
Математическое ожидание произведения равно
произведению математического ожидания.
Mxy=MxMy


Дисперсия – параметр, характеризующий степень
отклонения (рассеяния) случайной величины от ее
среднего значения. Т.е. это параметр, характеризующий
разброс значений этой величин.
Дисперсией случайной величины X называется
математическое ожидание квадрата разности случайной
величины от ее математического ожидания.

x  M X  M X ) 2


Dx  M  X  mx 
2
n
2
Для случайной дискретной величины: Dx   xi  M x  Pi
i 1


Для случайной непрерывной величины: x   xi  mx 2  f x   dx

Dx  ,  x , 
2
2




Дисперсия от постоянной величины равна
0.
DC=0;
Постоянную величину можно выносить за
знак дисперсии  в квадрат.
DCX=C2DX;
Дисперсия суммы случайной величины
равна сумме этих величин.
Dx1+x2+x3+…=Dx1+Dx2+…Dxn;
Пример:
В результате испытаний двух приборов (расходомеров)
установлена вероятность наблюдения помех, оцениваемая по 2-х
балльной системе
Первый расходомер
Второй расходомер
Балл (xi)
1
2
1
2
Вероятнос
ть
0.2
0.065
0.03
0.15
наблюдения
помех, Pi
m  0.2  1  0.065  2  0.33
x
1
m
 0.03  1  0.15  2  0.33
x
2
Т.о. средний уровень помех у расходомеров одинаков, и по
этому показателю нельзя выбрать лучший прибор. Определим
устойчивость показаний (разброс вокруг среднего) Dx. Посчитаем
дисперсию уровня помех:
D1x=1–0.3320.2+2–0.332 0.065=0.11
D2x1–0.332 0.03+2–0.332 0.15=0.43
Следовательно, лучшим является первый расходомер.
При аппроксимации результатов
эксперимента используются различные
законы, например:
 Экспоненциальное распределение
 Равномерный закон (равномерное
распределение).
 Нормальный закон распределения (закон
Гаусса).

Экспоненциальный закон (распределение)


x
f x     e
, x  0;


x
F ( x)  1  e
,   0;

Распределение, плотность вероятности которого
постоянна на некотором участке, а вне его равна 0,
называется непрерывным равномерным
распределением.
 c a xb
f ( x)  
0 x  a или x  b
f(x)
C
Так
как
площадь,
ограниченная
кривой
распределения, равна 1, то C (b–a)=1,
тогда
a
b
c
x
 1

,
f ( x)   b  a
0
1
;
ba
a xb
x  a или x  b
F (x)
1
0
а
b

 1 , a  x  b
f ( x)   b  a

0 x  a или x  b

х
 0
 x  a
F ( x)  
b  a
 1
при x  a
a xb
xb

Случайная непрерывная величина X называется
распределенной по нормальному закону, если ее плотность
распределения имеет вид:
f x  
1
2  x
  x  
2

x  mx 

e
2 x
2
; или
f x  
1
2 
 
 x  x 


2
 e 2
2
;
(1)
mx–математическое ожидание; 2–дисперсия случайной
величины Х – стандартное отклонение от математического
ожидания, симметричное m;  – среднеквадратичное
отклонение (стандартное);
  и 2 – характеризуют разброс данных, т.е. ошибку
измерений.
 Чем больше , тем больше ошибка.


График плотности распределения вероятности
называется нормальной кривой или кривой Гаусса.
Это кривая колоколообразного вида, симметричная
mx .
1
При x=mx, кривая имеет максимум равный
 2

Площадь под всей кривой выразится
интегралом:
 x m 


(2)
1
2
2
I


2 
e
2
 dx

Нормальное распределение при m=0 и =1
называется стандартным.
Если изменять m, то кривая будет
перемещаться вдоль оси x, сохраняя свою
форму.

При mx=0 будем иметь семейство нормальных кривых с
центром в начале координат, зависящих только от .
x2
f ( x,0,  )  y 
 2
1
 e 2 ;
2 
При уменьшении  ордината кривой растет,
одновременно происходит резкий спад ее к оси x,
поэтому S (площадь) всегда равна 1. При очень малых
 кривая похожа на иглу вдоль оси y.
Стохастической называется связь, при которой с
изменением одной величины изменяется другая.
 Исследователю часто требуется качественно или
количественно определить, существует ли между
двумя величинами некоторая связь. Поэтому,
кроме параметров mx и x важную роль играют
параметры, характеризующие степень
взаимозависимости переменных x и y. Для оценки
тесноты стохастической связи пользуются
показателями:

Ковариация

Коэффициент корреляции




Зависимость между случайными величинами
существует, если

 xy 


cov xy  M  X  mx Y  m y   0
Эта величина называется ковариацией covxy.
Коэффициент корреляции определяется:
cov xy


M  X  m x Y  m y 

 x  y
 x  y
Коэффициент показывает меру линейной
зависимости между x и y, где x и y –
среднеквадратичные отклонения величин x и y.




Генеральная совокупность - все допустимые значения
случайной величины.
Выборка – это конечный набор значений случайной
величины, полученный в результате наблюдений
(экспериментов). Число элементов выборки N называется
ее объемом. Это N объектов, которые извлекаются из
генеральной совокупности.
Смысл статистических методов заключается в том, чтобы
по ограниченной выборке (N) обоснованно судить о
свойствах генеральной совокупности.
Подобное суждение может быть получено путем
оценивания параметров генеральной совокупности при
помощи, так называемых, оценок.



Под генеральной совокупностью понимают все
допустимые значения случайной величины.
Выборка - конечный набор значений случайной
величины, полученный в результате
наблюдений. Это n-объектов, которые
извлекаются из генеральной совокупности, т.е.
числа элементов выборки (n) называется ее
объемом.
Эти n-объектов подвергаются детальному
исследованию по результатам которого
описывают всю генеральную совокупность.

Оценка математического ожидания - это
среднее арифметическое измеряемой
величины.

Оценка дисперсии (выборочная дисперсия)

- выборочная дисперсия n без единицы.

Каждый параметр, который входит в
формулу для вторичной характеристики и
определятеся объемом выборки
называется связью, а рзность между
объемом выборки n и числом связи
называется числом степеней свободы.

- (одна выборочная характеристика - )
Download