Нижние оценки трудоемкости одного класса марковских

advertisement
Нижние оценки трудоемкости одного класса
марковских алгоритмов случайного поиска
Тихомиров Алексей Сергеевич
Новгородский государственный университет
56-я научная конференция МФТИ
1/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Постановка задачи
Введение
Пусть целевая функция f : Rd 7→ R принимает минимальное значение в
единственной точке x∗ .
f
0
x*
x
Рассмотрим задачу поиска точки глобального минимума x∗ с заданной
точностью ε. Один из способов решения этой задачи состоит в
применении марковских алгоритмов случайного поиска. Такие методы
давно и успешно используются при решении сложных задач оптимизации.
В частности, алгоритм simulated annealing (алгоритм “имитации отжига”),
являющийся одним из самых знаменитых алгоритмов стохастической
глобальной оптимизации, принадлежит рассматриваемому семейству
методов.
2/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Постановка задачи
Введение
Данная работа посвящена теоретическому исследованию скорости
сходимости марковских алгоритмов случайного поиска экстремума.
В качестве характеристики скорости сходимости используем число
вычислений целевой функции, требуемое для достижения заданной
точности ε решения задачи. Одна из основных причин выбора такой
характеристики состоит в том, что именно вычисления целевой функции
составляют основной объем вычислительной работы при выполнении
исследуемых алгоритмов. Кроме того, такая характеристика удобна при
сравнении различных алгоритмов случайного поиска экстремума между
собой.
Получена нижняя оценка скорости сходимости марковских алгоритмов
случайного поиска экстремума функции. Показано, что для широкого
класса случайных поисков число вычислений целевой функции,
необходимое для достижения требуемой точности ε решения задачи (при
аппроксимации “по аргументу”), не может расти медленнее, чем | ln ε|.
Кроме того показано, что полученная оценка скорости сходимости
достаточно точна, и имеет правильный порядок зависимости от ε.
3/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Постановка задачи
Пространство оптимизации
Назовем пространством оптимизации множество оптимизации X,
снабженное метрикой ρ.
Рассмотрим X = Rd с метрикой
ρ(x, y) = ρ∞ (x, y) = max |xk − yk |,
16k6d
где x = (x1 , . . . , xd ) и y = (y1 , . . . , yd ).
Замкнутый шар радиуса r с центром в точке x обозначим как
Br (x) = {y ∈ Rd : ρ(x, y) 6 r}.
4/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Постановка задачи
Целевая функция
Целевая функция f : Rd 7→ R измерима и принимает минимальное
значение в единственной точке x∗ = arg min{f (x) : x ∈ Rd }.
f
0
5/15
Тихомиров Алексей Сергеевич
x*
x
Нижние оценки трудоемкости марковского случайного поиска
Постановка задачи
Марковский случайный поиск
Следуя книге
Zhigljavsky A., Z̆ilinskas A. Stochastic Global Optimization. Berlin:
Springer, 2008.
опишем исследуемый марковский случайный поиск {ξn }n>0 с помощью
алгоритма моделирования.
Алгоритм 1 (Общая схема марковских алгоритмов)
Шаг 1. Положить ξ0 ← x и n ← 1.
Шаг 2. Получить реализацию случайной величины ηn в Rd
с распределением Pn (ξn−1 , · ). Переходная функция Pn (ξn−1 , · ) может
зависеть от n и ξn−1 .
(
ηn
с вероятностью Qn ,
Шаг 3. Положить ξn ←
ξn−1 с вероятностью 1 − Qn .
Вероятность Qn принятия точки ηn может зависеть от ηn , ξn−1 , f (ηn ) и
f (ξn−1 ).
Шаг 4. Положить n ← n + 1 и вернуться к шагу 2.
6/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Постановка задачи
Simulated annealing (имитация отжига)
Различные правила задания вероятностей Qn и переходных функций
Pn (x, · ) приводят к различным вариантам марковских алгоритмов
случайного поиска.
В частности, если вероятности Qn задать следующим образом:
(
1,
если ∆n 6 0,
Qn =
exp(−βn ∆n ), если ∆n > 0,
(1)
где βn > 0 — параметры алгоритма, ∆n = f (ηn ) − f (ξn−1 ), то получим
знаменитый алгоритм “имитации отжига”.
Правило (1) выбора вероятностей Qn означает, что “хорошая” новая точка
ηn (для которой f (ηn ) 6 f (ξn−1 )) принимается безусловно. “Плохая” точка
ηn (для которой f (ηn ) > f (ξn−1 )) принимается с вероятностью
Qn = exp(−βn ∆n ).
7/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Постановка задачи
Марковский монотонный случайный поиск
Если вероятности Qn задать таким образом:
(
1, если f (ηn ) 6 f (ξn−1 ),
Qn =
0, если f (ηn ) > f (ξn−1 ),
то получим марковский монотонный случайный поиск.
Такой поиск является монотонным в том смысле, что неравенства
f (ξn ) 6 f (ξn−1 ) выполняются с вероятностью 1 при всех n > 0.
Алгоритм 2 (Марковский монотонный поиск)
Шаг 1. Положить ξ0 ← x и n ← 1.
Шаг 2. Получить реализацию случайной величины ηn в Rd
с распределением Pn (ξn−1 , · ).
Шаг 3. Если f (ηn ) 6 f (ξn−1 ), то положить ξn ← ηn , иначе положить
ξn ← ξn−1 .
Шаг 4. Положить n ← n + 1 и вернуться к шагу 2.
8/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Постановка задачи
Пробные переходные функции
В соответствии со структурой алгоритма 1, распределения Pn (ξn−1 , · )
будем называть пробными переходными функциями.
Будем рассматривать марковский случайный поиск, пробные переходные
функции которого обладают плотностями вида
pn (x, y) =
d
Y
pn,x,k (xk , yk ) =
k=1
d
Y
`
´
gn,x,k |xk − yk | ,
(2)
k=1
где x = (x1 , . . . , xd ) и y = (y1 , . . . , yd ), pn,x,k — плотности, а gn,x,k —
невозрастающие неотрицательные функции, определенные на множестве
(0, +∞).
pn,x,k(xk , yk)
xk
9/15
Тихомиров Алексей Сергеевич
yk
Нижние оценки трудоемкости марковского случайного поиска
Постановка задачи
Пробные переходные функции
Переходные функции такого вида широко используются на практике и
применяются в частности в методе сверхбыстрого отжига Л. Ингбера.
Ingber L. Very fast simulated re-annealing // Mathl. Comput. Modelling.
1989. V. 12. P. 967–973.
Лопатин А.С. Метод отжига // Стохастическая оптимизация в
информатике. 2005. Вып. 1. С. 133–149.
10/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Постановка задачи
Характеристики случайного поиска
Случайный поиск используем для отыскания точки минимума x∗
с заданной точностью ε (аппроксимация “по аргументу”). При
аппроксимации по аргументу нас будет интересовать попадание поиска в
шар Bε (x∗ ). Обозначим через
τε = min{n > 0 : ξn ∈ Bε (x∗ )}
момент первого попадания поиска в ε-окрестность x∗ .
Как правило предполагается, что для моделирования распределений Pn
не требуется вычислений функции f . Тем самым, при выполнении τε
итераций алгоритма 1 значения функции f вычисляются τε + 1 раз.
Таким образом, случайная величина τε дает нам достаточно полную
информацию о качестве случайного поиска.
Мы рассмотрим две характеристики скорости сходимости.
11/15
1
Вероятность “успеха” P(τε 6 n) для n ∈ N.
2
Трудоемкость случайного поиска определяется как E τε и имеет смысл
среднего числа шагов поиска до достижения им множества Bε (x∗ ).
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Нижняя оценка скорости сходимости случайного поиска
Нижняя оценка скорости сходимости марковского случайного поиска
Число вычислений целевой функции, необходимое марковскому
случайному поиску для достижения требуемой точности ε решения
задачи, не может расти медленнее, чем | ln ε|.
Теорема 1
Пусть целевая функция f : Rd 7→ R принимает минимальное значение
в единственной точке x∗ . Пусть марковский случайный поиск {ξn }n>0
имеет переходные функции с плотностями вида (2) и начинается в точке
x. Пусть 0 < ε < δ = ρ(x, x∗ ). Тогда справедливы неравенства
P(τε 6 n) 6
n−1
ε X lni (δ/ε)
δ i=0
i!
при n = 1, 2, 3, . . . ,
E τε > ln(δ/ε) + 1.
12/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
О точности полученной оценки
О точности полученной оценки
Рассмотрим одномерное пространство оптимизации R, простейшую
целевую функцию f (x) = |x| и марковский монотонный случайный поиск,
пробные переходные функции которого имеют вид P (x, · ) = U2|x| (x, · ),
где Ua (x, · ) — равномерное распределение в шаре радиуса a > 0 с
центром в точке x.
|x|
-x
13/15
0
Тихомиров Алексей Сергеевич
x
2x
3x
Нижние оценки трудоемкости марковского случайного поиска
О точности полученной оценки
Трудоемкость “быстрого” поиска
Лемма 1
Пусть пространство оптимизации X = R и f (x) = |x|. Пусть {ξn }n>0 —
марковский монотонный поиск, пробные переходные функции которого
имеют вид P (x, · ) = U2|x| (x, · ). Пусть x — начальная точка поиска и
0 < ε < |x|. Тогда
`
´
E τε = 2 ln |x|/ε + 2.
(3)
Оценка трудоемкости теоремы 1 для пространства оптимизации R и
x∗ = 0 имеет вид
`
´
E τε > ln |x|/ε + 1,
и лишь в два раза меньше правой части равенства (3).
Оценка трудоемкости теоремы 1 имеет правильный порядок зависимости
от ε.
14/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Литература
Литература
Zhigljavsky A., Z̆ilinskas A. Stochastic Global Optimization. Berlin:
Springer, 2008.
Ingber L. Very fast simulated re-annealing // Mathl. Comput. Modelling.
1989. V. 12. P. 967–973.
Лопатин А.С. Метод отжига // Стохастическая оптимизация в
информатике. 2005. Вып. 1. С. 133–149.
Тихомиров А.С. О быстрых вариантах алгоритма отжига (simulated
annealing) // Стохастическая оптимизация в информатике. 2009.
Вып. 5. С. 65–90.
Тихомиров А.С. Нижние оценки скорости сходимости марковского
симметричного случайного поиска // Журнал вычислительной
математики и математической физики. 2011. Т. 51. № 9. С. 1630–1644.
Тихомиров А.С. Нижняя оценка трудоемкости марковского
симметричного случайного поиска // Труды 54-й научной
конференции МФТИ “Проблемы фундаментальных и прикладных
естественных и технических наук в современном информационном
обществе”. 2011. Т. 1. С. 49–50.
15/15
Тихомиров Алексей Сергеевич
Нижние оценки трудоемкости марковского случайного поиска
Download