АЛГОРИТМЫ УЧЁТА НЕОПРЕДЕЛЁННОСТИ ИНФОРМАЦИИ ПРИ ТОЧЕЧНОМ ОЦЕНИВАНИИ ПОТОКОВ В СЕТЯХ

advertisement
АЛГОРИТМЫ УЧЁТА НЕОПРЕДЕЛЁННОСТИ ИНФОРМАЦИИ ПРИ
ТОЧЕЧНОМ ОЦЕНИВАНИИ ПОТОКОВ В СЕТЯХ
Ю.Е. Гагарин (к.т.н., доцент, КФ МГТУ им. Н.Э. Баумана)
Многочисленные
территориально
распределённые
системы
–
транспортные, информационные, энергетические и т.п. – обладают сетевой
структурой. Для описания таких коммуникационных сетей служит взвешенный
граф, рёбрам и вершинам которого приписывают "веса", соответствующие
пропускным способностям и потребностям. Формулируемые задачи для
взвешенных графов позволяют оценить значения функционалов, заданных на
этих графах, и при фиксированных весах вершин синтезировать такие веса на
рёбрах графа, чтобы реализовывалось решение между истоками и стоками
графа при достижении экстремума функционала, заданного на множестве рёбер
этого графа. Подобные задачи формулируются в терминах линейного
программирования,
но
удобнее
формулировать
задачи
линейного
программирования в терминах распределения потоков на графах.
Методы
линейного
программирования
являются
наиболее
эффективными и известными методами решения моделей исследования
операций и широко применяются в различных областях. Широкое
использование
этого
метода
подкрепляется
высокоэффективными
компьютерными алгоритмами линейного программирования, на которых
базируются алгоритмы более сложных типов моделей и задач исследования
операций,
включая
целочисленное,
нелинейное
и
стохастическое
программирование.
Условия, в которых определяется оптимальное решение задачи линейного
программирования, находят отражение в момент формирования модели. В
действительности условия, формирующие модель, не остаются неизменными.
Поэтому особое значение приобретает анализ устойчивости, т.е. возможность
оценить изменения в оптимальном решении, вызванные изменениями в
параметрах исходной модели: коэффициентах целевой функции, элементах
матрицы, составленной из коэффициентов при неизвестных, и правой части
условий-ограничений. Особенно важно знать, при каких изменениях
параметров задачи оптимальное решение этой задачи остаётся неизменным.
Параметры задачи линейного программирования можно варьировать за счёт
изменения условий функционирования описываемых объектов. Например, в
транспортных моделях может меняться количество транспорта, который
перемещается из одного пункта в другой пункт, или пропускная способность
между узлами транспортной сети. Эти изменяющиеся параметры влекут
неопределённость параметров задачи [1].
В других случаях параметры задачи линейного программирования
являются случайными величинами, и тогда важно знать, как может изменяться
решение задачи в зависимости от изменения исходных данных. При этом
необходимо иметь, по крайней мере, сведения о математическом ожидании и
дисперсии этих случайных величин, если нет возможности оценить их функции
распределения. В таком случае неопределённостям значений параметров
необходимо указать соответствующую им доверительную вероятность. Как
правило, в подобных случаях для получения оптимального решения
рассматривают серию прямых близких задач, изменяя значения параметров.
В задаче о максимальном потоке [2] каждая дуга сети характеризуется
некоторой пропускной способностью. Пусть узел s – источник, узел t – сток, v
– внешний поток, входящий в сеть в узле s и выходящий из сети в узле t .
Задачу о максимальном потоке можно записать как задачу линейного
программирования: найти максимум v при ограничениях
 f k   f k  0 , i  N   s, t  ;
kM Oi

kM Oi

kM Oi
kM Ti
fk 
fk 

fk  v  0;

fk  v  0;
kM Ti
kM Ti
0  v  vr ;
0  f k  ck , k  M ,
где N – множество узлов; M – список дуг; Oi и Ti – набор начальных и
конечных узлов; f k – поток по дуге k ; ck – пропускная способность дуги k ,
определяет верхнюю границу потока по дуге.
В стандартной постановке задачи о максимальном потоке поток сохраняет
свою величину при прохождении по дугам сети. Если f k является потоком в
начале дуги k , а f k' – поток в её конце, то f k'  f k .
В различных сетевых структурах величина потока f k или пропускная
способность ck дуги может меняться в некоторых пределах. Например, в
транспортных системах в разное время суток может меняться величина потока:
в часы пиковой нагрузки поток возрастает. В то же время пропускная
способность в часы пиковой нагрузки уменьшается. Таким образом, величина
потока и пропускная способность не будут определяться однозначно, а будут
иметь некоторую погрешность: f k  f k и ck  ck .
Учёт погрешности f k может привести к тому, что величина потока по
дуге сети уменьшится практически до нуля или даже станет отрицательной
величиной, т.е. поток поменяет своё направление. При учёте погрешности ck
пропускная способность может также снизиться до нуля.
Учёт неопределённости исходной информации приводит к изменению
условий ограничений, что, в свою очередь, может изменить множество
допустимых решений задачи линейного программирования и в результате
изменится оптимальное решение задачи.
Для оценивания погрешностей f k и ck существует ряд статистических
подходов, которые основаны на разных моделях "измерения с ошибками".
Наиболее часто [3] ставится задача определения оценок параметров
модели:
yi  f  xi ,    i , i  1, n ,
где i – случайная ошибка, имеющая нормальное распределение с параметрами


M  i   0 , D  i   i2 I , D i ,  j  0 , i, j  1, n .
Данная постановка является классической регрессионной задачей,
которая решается методом максимума правдоподобия или методом
наименьших квадратов (МНК).
Если i2  2 , i  1, n и значение  2 не задано, то оценку параметра
 2 можно найти по формуле:
ˆ 2 
n

 
где s   yi  f xi , ˆ
i 1
2
s
,
n p
, p – число параметров.
Регрессионный анализ предполагает, что переменные x являются
детерминированными. На практике это требование очень часто не выполняется,
поэтому возникает необходимость учёта погрешностей аргумента x .
Рассмотрим пассивный эксперимент определения оценок параметров
функции   f  ,   , где  – вектор неизвестных параметров. В процессе
наблюдения получаем набор значений xi и yi , определяемых как
 yi  i  i
,
i  1, n ,

 xi  i  i
где i и  i – ошибки значений функции и аргумента.
Предположим, что ошибки измерений i и  i – нормально
распределённые случайные величины с нулевыми средними значениями, с
дисперсиями 2  yi  и 2  xi  соответственно и коэффициентом корреляции
i  0 .
Рассмотрим несколько алгоритмов к решению данной задачи.
I. Один из алгоритмов подразумевает использование вместо истинных
значений  i , наблюдаемых xi при оценивании параметров МНК. При этом
ошибка  i игнорируется, и в результате имеем следующую модель:
y  f  x,    ошибка .
В основном, как показано в [4, 5], этот подход даёт несостоятельную
оценку с большим асимптотическим смещением.
В [5] рассмотрен случай, когда  – случайная величина, выбранная
независимо от i и  i , с характеристиками E      , cov      . Значения  i
аппроксимируются результатами измерений xi и при нормальном законе
распределения случайной величины  i
E   x   x    I    ,

где       2  x  I

1
Получаем модель:
 .
y  f  x    I    ,    ошибка .
Когда  и  неизвестны, то, используя исходную выборку xi , i  1, n ,
определяют оценки ̂ , ̂ и в итоге получают модель:
ˆ  ˆ I  
ˆ , ˆ  ошибка  f ˆ , ˆ  ошибка .
y  f x


 
 
Оценки параметров полученной модели могут быть определены МНК.
II. Поставленная задача может быть решена итеративным методом
наименьших квадратов с уточняемыми весами [6, 7]. Предполагается, что xi
является выборкой из некоторой генеральной совокупности с функцией
плотности распределения f  xi x0i  . При этом первые моменты функции
f  xi x0i  известны и конечны.
В этом случае для построения минимизируемого функционала F
необходимо знать вид функции плотности распределения f  yi x0i  или её
моменты.
Для их определения в [7] предлагается использовать разложение функции
f  xi ,   в ряд Тейлора в окрестности точки x0i . Тогда первый и второй
моменты функции плотности распределения f  yi x0i  будут определяться по
формулам:
E  yi x0i   f  x0i ,   ,
 f  xi ,  
 2
2  yi x0i    2  yi   
   xi  .
 xi

x

x
i
0
i


Итерационный процесс нахождения оценок параметров
следующим образом:
1. Составляется функционал
2
n


строится
F0   yi  E  yi x0i  wi0 , где wi0  2  yi  .
i 1
2
Находятся оценки параметров  0 , при которых достигается минимум F0 ,
т.е. решается регрессионная задача.
2. Подсчитываются величины w1i  2  yi x0i  .
n


3. Составляется сумма F1   yi  E  yi x0i  wi1 и определяются оценки
i 1
1 .
2
Операции 2 и 3 повторяются до тех пор, пока относительные изменения
параметров на соседних итерациях не будут меньше некоторой малой величины
:
max
0j  1j
0j
  , j  1, m .
III. В [8] предложен алгоритм, позволяющий учитывать ошибки
переменных xi для линейных моделей:
 yi  ai  b  i
i  1, n ,

x




i
i
 i
где i и  i – ошибки измеренных значений функции и аргумента.
Традиционными методами, например МНК, определяют оценки
параметров â и b̂ модели, считая, что xi – детерминированные величины. При
этом получаем модель с известными параметрами:
 yi  bˆ  aˆi  i
i  1, n ,

 xi  i  i
В матричном виде получим регрессионную модель:
 yi  bˆ   aˆ 
 i 

    i    ,
xi  1 
i 

где  i – неизвестный параметр, подлежащий оцениванию.
IV. Возможность оценивания параметров функций любого вида с учётом
погрешностей исходных данных дают методы конфлюентного анализа [1].
Доказано, что в методах конфлюентного анализа итерационные процедуры
нахождения оценок сходятся, а получаемые оценки параметров являются
несмещёнными.
При таком подходе исходная модель имеет вид:
 yi  i  i
i  1, n ,

x




i
i
 i
где  xi , yi  – наблюдаемые значения,  i , i  – точные значения,  i , i  –
ошибки измеренных значений.
Оценки параметров  находятся из условия минимума функционала:
2
2
xi  i  

1 n   yi  i 
.
F   2
 2
2 i 1    yi 

x



i

Сложность определения оценок параметров заключается в том, что
неизвестны истинные значения  i , а известны лишь их доверительные
интервалы. Поэтому перед тем, как определять оценки параметров  ,
необходимо оценить значения  i .
Истинные значения  i будут определяться из условия:
F
 0 , i  1, n .
i i  ˆ i
Задача минимизации функционала F эквивалентна решению системы
уравнений:
n
y   
 i2 ( y )i  i  0, t  1, s ,
t
i 1
i
xi  i yi  i i


 0,
i  1, n .
2 ( xi ) 2 ( yi ) i
Решение системы уравнений представляет собой итерационный процесс,
который заканчивается при выполнении одного из следующих условий:
1) на очередном шаге значение функционала F меньше заданного числа
;
2) на соседних итерациях значение функционала F и значения оценок
параметров ̂ отличаются незначительно, т.е.
F  F1
t  t1
 1 ; max
  2 , t  1, s ,
F
t
где 1 и  2 – заданные числа;
3) исчерпан лимит итераций.
Анализ рассмотренных алгоритмов учёта погрешностей исходных данных
показывает, что при моделировании транспортных сетей оценивание
параметров линейных функций с учётом погрешностей в исходных данных
сложностей не вызывает. Для нелинейных функций возникает проблема
вычислительного характера, поскольку для получения оценок параметров в
этом случае необходимо применять итерационные процедуры.
Исследования проведены при финансовой поддержке Российского фонда
фундаментальных исследований и правительства Калужской области (проект
№ 12-01-97528).
Список литературы
1. Грешилов А.А. Математические методы принятия решений. – М.: Изд-во
МГТУ им. Н.Э. Баумана, 2006. – 584 с.
2. Йенсен П., Барнес Д. Потоковое программирование. – М.: Радио и связь, 1984.
– 392 с.
3. Бард Й. Нелинейное оценивание параметров. – М.: Статистика, 1979. – 349 с.
4. Успенский А.Б., Фёдоров В.В. Вычислительные аспекты МНК при анализе и
планировании регрессионных экспериментов. – М.: Изд-во МГУ, 1975.– 168 с.
5. Gleser L.J. Improvements of the naive approach to estimation in nonliner errors-invariables regression models // Statist. Anal. Meas. Error Models and Appl.: Proc.
AMS-IMS-SIAM. It Summer Res. Conf. Arcata Calif. June 10–16, 1989. –
Providence, 1990. – P.99–114.
6. Фёдоров В.В. Теория оптимального эксперимента. – М.: Наука, 1971. – 312 с.
7. Schater D.W. Measurement error model estimation using iteratively weighted teast
squares // Statist. Anal. Meas. Error Models and Appl.: Proc. AMS-IMS-SIAM. It
Summer Res. Conf. Arcata. Calif. June 10–16, 1989. – Providence, 1990. – P.129–138.
8. Fuller W.A. Measurement error models. – New York ect.: Wiley, 1987. – 440 p.
Download