Uploaded by galachel

Обработка информации и математическое моделирование

advertisement
Сибирский государственный университет
телекоммуникаций и информатики
Сибирское научно-техническое общество
радиотехники, электроники и связи
им. А. С. Попова
Сибирское отделение
Международной академии информатизации
Российская (Сибирская) секция Международного института инженеров
по электротехнике и радиоэлектронике IEEE
ОБРАБОТКА ИНФОРМАЦИИ
И
МАТЕМАТИЧЕСКОЕ
МОДЕЛИРОВАНИЕ
РОССИЙСКАЯ
НАУЧНО-ТЕХНИЧЕСКАЯ
КОНФЕРЕНЦИЯ
МАТЕРИАЛЫ КОНФЕРЕНЦИИ
Новосибирск
2015
ISBN 978-5-91434-027-5
© ФГОБУ ВПО «Сибирский государственный университет телекоммуникаций и информатики» 2015
© Сибирское научно-техническое общество радиотехники, электроники и связи им. А.С.Попова, 2015
©Сибирское отделение Международной академии
информатизации, 2015
СОДЕРЖАНИЕ
ПЛЕНАРНОЕ ЗАСЕДАНИЕ
Канев В.С. СибГУТИ, Новосибирск. Адекватность и эффективность математического моделирования.
6
Секция 1. ИНФОРМАТИКА И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Подсекция 1.1. НГТУ
Агафонцев А.А. НГТУ, Новосибирск. Численное определение эффективных характеристик генерогенных материалов
11
Бебишева О.М., Попов А.А. НГТУ, Новосибирск. Сравнение критериев качества при построении
регресионной зависимости на основе нечётких систем
17
Блинов П.Ю., Лемешко Б.Ю. НГТУ, Новосибирск. О критериях проверки отклонения распределения
от равномерного закона
21
Блинов П.Ю., Лемешко Б.Ю. НГТУ, Новосибирск. О критериях проверки равномерности, использующих оценки энтропии
32
Веретельникова И.В., Лемешко Б.Ю. НГТУ, Новосибирск. О критериях проверки отсутствия тренда
в характеристиках рассеяния
42
Воронова И.Д., Лисицин Д.В. НГТУ, Новосибирск. Робастное оценивание параметров политомической логистической регрессии
54
Гладкова А.В., Попов А.А. НГТУ, Новосибирск. Выбор настраиваемых параметров алгоритма опорных векторов с квадратичной функцией потерь
62
Горлова Н.А., Гультяева Т.А. НГТУ, Новосибирск. Распознание эмоций по изображению лица с помощью скрытых марковских моделей
67
Гультяева Т.А., Лаушкина А.К. НГТУ, Новосибирск. Исследование метода, повышающего робастность скрытых Марковских моделей
75
Гультяева Т.А., Уваров В.Е. НГТУ, Новосибирск. Решение на GPU задач обучения скрытых Марковских моделей и распознания многомерных числовых последовательностей с их помощью
79
Долговых Е.М., Лисицин Д.В. НГТУ, Новосибирск. Робастное оценивание параметров многооткликовой регрессии по данным с пропусками
90
Домников П.А. НГТУ, Новосибирск. Исследование влияния выбора предобусловливания матриц СЛАУ
99
при конечноэлементном моделировании трехмерного магнитотеллурического поля
Епанчинцева Т.Б. НГТУ, Новосибирск. Разработка методов выполнения 3D–инверсий и способов
ругуляризации
102
Жигалов П.С., Рак Б.В. НГТУ, Новосибирск. Идиально согласованные слои
106
Иткина Н.Б., Марков С.И. НГТУ, Новосибирск. Определение эффективного тензора гидравлической
проницаемости гетерогенной слоистой среды
115
Киселев Д.С., Водостоева А.С. НГТУ, Новосибирск. Конечноэлементное моделирование трехмерных
гармонических электромагнитных полей с использованием технологии выделения части поля
126
Киселев Д.С. НГТУ, Новосибирск. Конечноэлементное моделирование процесса распостранения
упругой волны
129
Кочнев А В. НГТУ, Новосибирск Отбор ковариат в модели пропорциональных интенсивностей
132
Кокса
Кузьменок А.Ю., Кренделев С.Ф., Волкова В.М. НГТУ; НГУ, Новосибирск. Апериодический генератор псевдослучайных чисел, основанный на решении уравнений в р-адических числах и способы
увеличения скорости генерации
137
Кутищева А.Ю. НГТУ, Новосибирск. Решение уравнения Гельмгольца векторным многомасшатабным методом конечных элементов
140
Лиманский А. И. НГТУ, Новосибирск. Подход к 2D инверсии данных магнитотеллурических зондирований с использованием конечноэлементных аппроксимаций
146
Насонов Р.В., Саутин А.С. НГТУ, Новосибирск. Разработка программной системы для анализа достоверности фактов в информационном потоке новостных лент
154
Сандаков М.М., Трифонов К.Е., Кренделев С.Ф., Гультяева Т.А. НГТУ, Новосибирск. Создание
кроссплатформенного приложения по передаче секретных сообщений средствами e-mail
157
3
Сидоров А.В., Вагнер И.А. НГТУ, Новосибирск. Алгоритм построения двухмерных несогласованных
прямоугольниых сеток
163
Симанкович Н.В. НГТУ, Новосибирск. Исследование взаимоиндукции в системе мелких проводящих вкраплений
170
Трофимова С.А. НГТУ, Новосибирск. Применение разрывного метода Галёркина для решения
задачи Дарси
174
Филоненко П.А., Постовалов С.Н. НГТУ, Новосибирск. Исследование скорости сходимости непраметрической оценки функции надежности Каплана–Мейера к аналитическому распределению
184
Филоненко П.А., Постовалов С.Н. НГТУ, Новосибирск. Исследование скорости сходимости непараметрической оценки Каплана–Мейера к функции надежности
187
Черникова О.С., Анисимова К.Н. НГТУ, Новосибирск. Нахождение установившегося режима в задаче идентификации гауссовских линейных дискретных систем
190
Черникова О.С., Берикет Е.А. НГТУ, Новосибирск. Активная параметрическая идентификация
модели системы стабилизации летательного аппарата на основе планирования входных сигналов и
начальных условий
199
Чимитова Е.В., Ермилова Е.О. НГТУ, Новосибирск. Исследование свойств ОМП параметров распределения Вейбулла по усеченным слева данным
214
Чимитова Е.В., Самусенко В.И. НГТУ, Новосибирск. Построение деградационной гаммы-модели с
учетом внезапных отказов
225
Чимитова Е.В., Четвертакова Е.С. НГТУ, Новосибирск. Вопросы проверки адекватности деградационной гаммы-модели надежности
234
Вожжов С.С., Чимитова Е.В. НГТУ, Новосибирск. Сравнительный анализ алгоритмов построения
непараметрической оценки функции распределения по интервальным данным
242
Шевченко А.Н., Постовалов С.Н. НГТУ, Новосибирск. Разработка подсистемы построения контрольных карт Шухарта на платформе 1С: Предприятие 8.3
247
Шурина Э.П., М.И. Ряховский. НГТУ, Новосибирск. Решение уравнения диффузии методом виртуального элемента
257
Подсекция 1.2. СибГУТИ
Веловатый Е.А., ОАО «Ростелеком», Новосибирск; Треногин Н.Г. СибГУТИ, Новосибирск. Целевая
функция и граничные условия при выполнении оптимизации информационных систем с использованием тензорных методов анализа
266
Захаров Н.Ю., Полетайкин А.Н. СибГУТИ, Новосибирск. Информатизация составления плана повышения квалификации сотрудников высшего учебного заведения
270
Захарова Т.Э. СибГУТИ, Новосибирск. Преимущества медленных температурно-скоростных режимов деформирования
273
Кривцов Ю.В. СибГУТИ, Новосибирск. Восстановление двухмерной функции по интегралам вдоль
прямых
276
Милешко А. В. СибГУТИ, Новосибирск. Применение универсального кодирования для прогнозирования макроэкономических показателей
280
Нечта И.В. СибГУТИ, Новосибирск. Построение иерархического меню при помощи кодов сжатия
данных
285
Приставка П.А., Ключникова О.А., Климова И.В. СибГУТИ, Новосибирск. Оценека и повышение
эффективности сетей доставки данных
291
Ракитский А.А., Величко А. А. СибГУТИ, Новосибирск. Теоретическая оценка вычислительной
способности современных мобильных устройств с процессором
294
Темникова Е.А., Асламова В.С. ИрГУПС, Иркутск. Анализ временных рядов количества слушатлей ИДПО
299
Токтошов Г.Ы. ИВМиМГ СО РАН, Новосибирск. Системный подход к оптимизации сетевой инфраструктуры мегаполиса
308
Жусупбаев А.Ж. ИТиПМ НАН КР, Бишкек, Токтошов Г.Ы. ИВМиМГ СО РАН, Новосибирск. ОБ
одной задаче размещения элементов инженерных коммуникаций
314
4
Секция 2. ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ
Алейников М.А., Пазников А.А. СибГУТИ, Новосибирск. Анализ потокобезопасного неблокируемого стека на основе метода исключения парных операций
321
Берлизов Д.М., Позднышев М.А., Терешков Р.В., Пазников А.А. СибГУТИ, Новосибирск. Исследование эффективности потокобезопасных ассоциативных массивов на базе программно- и аппаратнореализуемой транзакционной памяти
324
Крамаренко К.Е., Молдованова О.В. СибГУТИ, Новосибирск. Анализ применимости искусственных
нейронных сетей в задачах самодиагностики распределённых вычислительных систем
330
Кулагин И.И., Курносов М.Г. СибГУТИ, Новосибирск. Анализ обнаружения ложных конфликтов в
приложениях с программной транзакционной памятью
335
Онищенко М.В. СибГУТИ, Новосибирск. Балансировка нагрузки агрегированных каналов сетевого
маршрутизатора
338
Павский В.А., Павский К.В. СибГУТИ, Новосибирск. Расчет моментов случайных величин при эрланговском времени обслуживания
339
Павский К.В. СибГУТИ, Новосибирск. Стохастическая модель функционирования распределенных
вычислительных систем с отказами и полным восстановлением
343
Перышкова Е.Н., Мамойленко С.Н. СибГУТИ, Новосибирск. Модификация системы управления
распределенными ресурсами TORQUE
349
Рощупкин Н.Г., Пазников А.А. СибГУТИ, Новосибирск. Исследование алгоритмов делегирования
выполнения критических секций на выделенных процессорных ядрах 354
Гусаров А.А., Фульман В.О., Смоляк А.С. СибГУТИ, Новосибирск. Функциональное тестирование
облачной платформы OpenStack
357
Смоляк А.С., Фульман В.О., Гусаров А.А. СибГУТИ, Новосибирск. Эвристические алгоритмы распределения виртуальных машин по узлам облачной вычислительной системы
359
5
Пленарное заседание
Адекватность и эффективность
математического моделирования
В.С. Канев
1
Даются «дисциплинирующие» рекомендации по правильному отношению к существенно
рациональным категориям адекватность и эффективность моделирования.
Ключевые слова: адекватность, эффективность моделирования, математическая модель,
экономико-математическая модель,принципы моделировани
…..Гора собранной информации и скрупулезно проведенного моделирования зачастую рождает мышь конечного когнитивного результата….
Не всегда математическое моделирование приводит к ожидаемым результатам. В последнее время это обстоятельство всѐ чаще происходит и реже осознается. Причин здесь несколько[1]. Любопытно и точно эту мысль формулирует автор [2]. «Гора собранной информации и скрупулезно проведенного моделирования зачастую рождает мышь конечного
когнитивного результата…». Почему? Если определить наиболее общую причину этого феномена, надо указать на расхожее представление о моделировании (математическом, в частности экономико-математическом), как палочки-выручалочки в исследованиях, реже в при
исследовании физических или инженерных задач, чаще в гуманитарных и особенно экономических задачах. Объяснением этому может быть не достаточно полное понимание того,
что само понятие модели в прикладном анализе имеет, конечно же, сугубо рациональный
характер. В этом отношении мы разделяем и придерживаемся точки зрения на такую диспозицию в этой семантике исследуемых категорий как это отражено в прекрасном пособии по
методологии математического моделирования в прикладных областях [3]. Можно сказать,
что рациональность рассуждений при оценке адекватности модели при моделировании в
прикладных задачах – это вынужденный здоровый компромисс между стремлением к объективизации прикладной исследовательской логики и дедуктивной логики.
Основной водораздел между теоретической и прикладной математикой лежит в характере применяемой логики. Хотя логика прикладной математики не является такой же канонизированной, как логика чистой математики, она имеет некоторые стихийно установившиеся
черты — способы доказательств, критерии достоверности и т. д.; при этом аналогичные способы и критерии, известные в теоретической математике, в приложениях зачастую оказываются лишними или попросту отказывают. Само собой разумеется, что прикладная математика, как, впрочем, и все дисциплины за исключением чистой математики, не может ограничиваться только дедуктивными рассуждениями. Стихийно выработался стиль рассуждений,
который составляет логическую основу прикладной математики и состоит в сочетании дедуктивных рассуждений и рассуждений, неприемлемых с точки зрения чистой математики,
но способных при разумном их применении приводить к правильным результатам2.
Во многих случаях без особой оговорки можно считать дедуктивные рассуждения особым, предельным, случаем рациональных.). Таким образом, содержание этого понятия близ1
Работа выполнена при поддержке гранта 2015 года Фонда фундаментальных и прикладных исследований СибГУТИ.
Словоупотребление «рациональный» нами используется исключительно не как антоним слову «иррациональный», но в смысле разумный, целесообразный, обоснованный
2
6
ко к тому, которое вкладывалось в термин «правдоподобные рассуждения», заимствованный
из книги Д. Пойа [3]
Говоря образно, можно сказать, что с позиций чистой математики все утверждения являются «черно-белыми», релейными: они могут быть точными или неточными; точные —
доказанными или недоказанными, верными или неверными. Чистая математика в этом как
бы следует известному евангелическому положению: «Но да будет слово ваше: «да, да»,
«нет, нет»; а что сверх этого, то от лукавого»3. В отличие от этого в прикладной математике
утверждения допускают «серые» оттенки любой густоты тона, которой и служит степень достоверности [3]
Вообще, многие дедуктивные теоремы и рассуждения значительно проигрывают в своей
эффективности из-за того, что они ориентированы на справедливость во всех случаях, в том
числе самых неблагоприятных. Это приводит к нежелательному смещению акцентов: патологические случаи приобретают большее значение, чем основные. Однако А. Эйнштейн сказал: «Господь бог изощрен, но не злонамерен». В отличие от некоторых людей, природа не
занимается построением противоречащих примеров с единственной целью опровергнуть рациональное утверждение.
Таким образом, в сложном рациональном рассуждении чисто дедуктивные элементы не
имеют преимуществ перед рациональными элементами с достаточно высокой степенью
достоверности: такие выражения, как «достоверно», «практически достоверно», «абсолютно достоверно» и т. п., только и могут означать, что вероятность противоположного события
в том или ином смысле пренебрежимо мала [3,4]. Насколько именно — это зависит от области, к которой относится утверждение, от соответствующих традиций, от возможных
последствий того, что утверждение окажется неверным, и т. п.
Очень важно поэтому на всех этапах моделирования формулировать определения и договорѐнности относительно всех вновь вводимых элементов рационального рассуждения. Поступим здесь так и мы.
Мы будем говорим, что объект М является моделью объекта А относительно некоторой системы S характеристик (свойств), если М строится (или выбирается) для имитации
А по этим характеристикам.
Модель может быть построена как для изучения указанных характеристик (исследовательские модели, которыми мы занимаемся), так и для их непосредственного использования
(рабочие модели: автопилот, протез, кукла, деньги и т. д.). Моделирование, т. е. построение
моделей, лежит в основе любой науки; впрочем, мы будем рассматривать лишь модели,
нацеленные на решение поставленной задачи средствами математики (ММ или ЭММ).
Из общих свойств моделей отметим, что поскольку модель строится лишь для имитации
и притом лишь части свойств исходного объекта, как правило, она оказывается в целом проще его. Для некоторых классов задач понятию математической модели можно придать чисто
дедуктивный характер, мы не будем здесь пользоваться подобными определениями, хотя в
ряде случаев они могут оказаться полезными. Вопрос об общих принципах, общих методах
построения математической модели очень сложен, мало разработан и здесь рассматриваться
не будет. Укажем только, "что уже после выбора схемы модели часто возникает задача, иногда называемая задачей об идентификации модели, об определении ее параметров (в том
числе, функциональных ), уточнении структуры и т. П. Эта задача может быть решена либо
путем непосредственных замеров и вычислений, либо косвенно, путем сравнения отдельных
свойств модели с известными данными. «Достроив» таким образом модель и изучая ее свойства, можно делать более точные выводы о свойствах моделируемого объекта.
На этом фоне важнейшим требованием к серьѐзности восприятия математической модели (ММ) и выводам, основанным на моделировании с еѐ использованием является требование ее адекватности изучаемому реальному объекту (процессу и т. д.) относительно выбранной системы его характеристик.
3
Евангелие от Матфея, гл.5, стих 37
7
После выбора типа математической модели оказываются возможными ее разнообразные
модификации. Так, очень существенным может оказаться выбор обобщенных координат, в
которых описывается модель; в привлекаемых к исследованию уравнениях можно оставлять
одни члены и отбрасывать другие; иногда можно нелинейные зависимости заменять линейными, сложные геометрические формы — более простыми и т.д. Обычно в прикладном исследовании, в котором применяется математика, последовательно строится несколько моделей. Эти модели могут относиться к различным компонентам или различным аспектам изучаемого явления, могут иметь разную степень абстракции.
В процессе исследования происходят переходы от одних моделей к другим, а иногда и
параллельное изучение нескольких моделей. Само понятие «изучить модель» существенно
сложней, чем это может показаться с первого взгляда; лишь в редких случаях это изучение
приводит к короткому ответу типа «да» или «нет» и т. п., который обычно является окончательной целью исследования. Гораздо чаще изучение модели еще подливает воды в море
информации, связанной с исследуемой проблемой, и может потребоваться новый взгляд на
ситуацию, который даст возможность «выудить» из этого моря необходимый результат. Исследование модели тем успешнее, чем больше принято во внимание при ее построении основательных соображений о предполагаемых свойствах изучаемого объекта; чтобы найти, надо
знать, что искать! Впрочем, это благое пожелание…
Тогда впору поставить вопрос. Что значит модель адекватна? Или Что значит модель
качественна, эффективна?
Всѐ зависит от степени проникновения «модельера» в проблему, уровня его профессионализма (или интеллектуальной настроенности).
Заметим, понятие адекватности модели непосредственно опирается на определение объекта моделирования, в то время как понятие эффективности - на цели моделирования.
Будем полагать, что ММ адекватна, если совершено [4]:
1. Критически достаточное качественное описание объекта по выбранным характеристикам
2. Разумно необходимое количественное описание объекта по выбранным характеристикам
3. Осознание ответственности рациональной, но не дедуктивной логики за степень адекватности ММ
И наконец, качество ММ тогда есть адекватность модели совместно с еѐ эффективностью.
Сама постановка вопроса о математическом моделировании какого-либо объекта предполагает и четкий план действий. Его можно условно разбить (здесь мы следуем наиболее
квалифицированному по этому поводу материалу[4]) на три этапа: модель — алгоритм —
программа (см. схему ниже).
1. На первом этапе выбирается (или строится) «эквивалент» объекта, отражающий в математической форме важнейшие его свойства законы, которым он подчиняется, связи,
присущие составляющим его частям, и т. д. Математическая модель (или ее фрагменты) исследуется теоретическими методами, что позволяет получить важные предварительные знания об объекте.
2. Второй этап — выбор (или разработка) алгоритма для реализации модели на компьютере. Модель представляется в форме, удобной для применения численных методов,
определяется последовательность вычислительных и логических операций, которые
нужно произвести, чтобы найти искомые величины с заданной точностью. Вычислительные алгоритмы должны не искажать основные свойства модели и, следовательно,
исходного объекта, быть экономичными и адаптирующимися к особенностям решаемых задач и используемых компьютеров.
3. На третьем этапе создаются программы, «переводящие» модель и алгоритм на доступный компьютеру язык. К ним также предъявляются требования экономичности и
адаптивности. Их можно назвать «электронным» эквивалентом изучаемого объекта,
8
9
10
Секция 1
ИНФОРМАТИКА И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Подсекция 1.1. НГТУ
Численное определение эффективных характеристик генерогенных материалов
Численное определение эффективных
характеристик гетерогенных материалов
А. А. Агафонцев
Разработана технология использования многомасштабного метода конечных элементов
для задач определения эффективных характеристик. Осуществлен подбор адекватной модели эффективной среды для гетерогенного материала «матрица C – ультрадисперсные
включения MgO». При подборе модели осуществлена попытка выделить и учесть те особенности формирования материала и его структуры, которые непосредственно влияют на
величину эффективного коэффициента. Рассмотрена иерархия моделей: скелет – мелкозернистые включения, слоистая среда с различными свойствами слоев, среда с щелеобразными прослойками воздуха. Определена область применимости рассмотренных моделей.
Ключевые слова: эффективный коэффициент теплопроводности, многомасштабный метод конечных элементов.
1. Введение
При проведении физических измерений для гетерогенных материалов, как правило, рассматриваются эффективные характеристики среды. Развитие технологий конструирования
композитных и нано-материалов, изучение физических свойств пористых сред, текстур
криолитозоны и других нативных объектов, делает актуальной разработку математических
методов определения эффективных величин сложных объектов
2. Аналитические и численные методы осреднения
На данный момент такие методы можно разделить на две основные группы: аналитические и численные. Существует много различных аналитических приближений (в т.ч. современных [1,2,3]), каждое из которых, является более или менее точным при различных условиях. Большое число моделей для различных ситуаций, жесткая привязка к раскладке и форме включений и разная точность формул, выведенных для одинаковых условий, приводят к
сложности использования и выбора аналитических методов осреднения. Таким образом, аналитические формулы могут быть использованы лишь в малом количестве реальных задач. В
свою очередь, численные методы осреднения лишены этих недостатков и могут быть применены для широкого спектра ситуаций, например, в случае многофазных сред, сред с высокой
степенью хаотичности структуры, при концентрациях, близких к порогу перколяции.
В силу ограниченности классических численных методов осреднения, решение такого
рода задач требует использования передового математического аппарата. Многомасштабные
методы, получившие широкое распространение в конце XX века, позволяют осуществить все
необходимые численные процедуры и учесть требуемые особенности разномасштабной среды моделирования
11
3. Многомасштабный метод конечных элементов
Данная работа посвящена процедуре адаптации многомасштабного метода конечных
элементов (ММКЭ) [4,5,6] для решения сложных прикладных задач. ММКЭ состоит из двух
основных частей: построения многомасштабных базисных функций и общей вариационной
формулировки, использующей эти функции. Вводятся два типа разбиения – грубое (макроэлементы) и мелкое (микроэлементы). Базисные функции формируются специальным образом с учетом многомасштабности решения. Глобальная формулировка строится так, чтобы
данные базисные функции обеспечивали необходимую точность и физичность численного
решения. В работе используется ММКЭ с параллелепипедальными макроэлементами и тетраэдральными микроэлементами
4. Описание задачи
Для определения эффективного коэффициента теплопроводности среды с микровключениями рассматривается стационарный тепловой процесс, описываемый уравнениями (1.1),
(1.2) в области, схематично представленной на рисунке 1, Ω1 – скелет, а Ω2 – включения,
имеющие контрастные теплофизические характеристики; Г1 – верхняя и нижняя, а Г2 – боковые грани области моделирования, на которых заданы разность потенциалов и условия непротекания тепла соответственно; λ – коэффициент теплопроводности, Т – температурное
поле.
(0.1)
div gradT
0
(1.1)
2,
1
T 1
Г1
Г1
Tg1 , T 2
Г1
T
n Г2
Г2,
(0.2)
(1.2)
Tg2 ,
0.
Рис. 1. Схематичный вид области моделирования
Для решения трехмерной стационарной задачи теплопроводности разработан программный комплекс на языке C++ на основе ММКЭ. Для построения конечноэлементных сеток
использованы свободно распространяемые пакеты GMSH и Salome. Численный алгоритм
определения эффективного коэффициента теплопроводности образца основан на следующем
соотношении, вытекающем из закона Фурье:
eff
q
q
T
T
12
1
2
2
2
1
.
2
Таким образом, эффективный коэффициент теплопроводности вычисляется как отношение L2-норм теплового потока и градиента теплового поля.
Осуществляется подбор адекватной модели эффективной среды для компактированного
под давлением гетерогенного материала «матрица C – ультрадисперсные включения MgO».
Ставится цель выявить степень влияния различных особенностей рассматриваемых моделей
на величину эффективного коэффициента, т.к. на данный момент отсутствует математическая классификация моделей эффективной среды, на основе которой можно было бы реализовать процесс поиска адекватной модели.
Полученные данные сравниваются с результатами физических измерений для образцов
(рисунок 2), созданных в Институте теоретической и прикладной механики им. С.А. Христиановича СО РАН. Размер образцов 10-2×10-2×10-2м, значения теплопроводности материалов
λС=1.6Вт/(мК), λMgO=36Вт/(мК). Средняя эффективная теплопроводность образцов
λeff=0.25Вт/(мК). Образцы имеют сильнопористую структуру (пористость 40-45%) с различными типами пор: мелкозернистыми, щелеобразными, кавернообразными.
Рис. 2. СЭМ-фотографии образцов
5. Иерархия моделей
Рассматривается следующая иерархия моделей (рисунок 4): матрица – мелкозернистые
включения, слоистая среда с различными свойствами слоев, среда с щелеобразными прослойками воздуха. Полученные результаты позволяют сделать ряд выводов: имеется слабое
влияние мелкозернистых пор на величину эффективного коэффициента. При рассмотрении
сред с пористостью до 10% и допустимой погрешностью вычислений в пределах 5%, целесообразно рассматривать среду как не имеющую пор. В случае эллипсоидных пор имеет место
сильное влияние ориентации эллипсоидов относительно потока тепла. Вид макроэлементов
для моделей с мелкозернистыми включениями представлен на рисунке 3.
Рис. 3. Вид макроэлементов с различными типами включений
13
Рис. 4. Иерархия моделей
Высокую степень влияния на величину эффективного коэффициента теплопроводности
имеют слои, пересекающие образец насквозь. Так, для случая расслаивающегося образца величина эффективного коэффициента отличается на два порядка относительно коэффициента,
полученного для модели со сферическими порами. Так, для слоистой среды при концентраций воздуха ϕ=12.50, λeff=0.0735Вт/(мК), а для среды со сферическими порами λeff=3.5303Вт/(мК ) при ϕ=10.42. Однако, использование модели со слоями, пересекающими
образец насквозь, ограничено предельными случаями.
Также высокую степень влияния на эффективный коэффициент теплопроводности (в т.ч.
для малых концентраций) имеют щелеобразные прослойки воздуха, не пересекающие область целиком. Так, для случая с 50 слоями, состоящими из параллельно расположенных щелей (h=0.125∙10-6м, расстояние между щелями 4∙10-6м), при варьировании ширины щелей,
получены результаты, представленные на рисунке 5.
Рис. 5. Зависимость λeff от ширины щелей
Имеется влияние сдвига щелей внутри четных слоев относительно щелей в нечетных
слоях. Изменение λeff не превышает 5%. Отсутствует влияние на величину эффективного коэффициента раскладки слоев с чередованием направленности щелей (направление в каждом
последующем случае перпендикулярно предыдущему, что дает раскладку «решеткой»).
14
В случае использования модели со случайно наклоненными, пересекающимися щелеобразными прослойками воздуха (рисунок 6), получены результаты, представленные на рисунке 7. Имеется высокая степень влияния на величину эффективного коэффициента, однако,
использование параллельных щелей позволяет добиться тех же результатов при меньших
концентрациях.
Рис. 6. Вид области моделирования с пересекающимися щелеобразными прослойками воздуха
Рис. 7. Зависимость λeff от концентрации воздуха для пересекающихся щелей
6. Заключение
В работе для решения трехмерной стационарной задачи теплопроводности в многомасштабной среде разработана и реализована вычислительная схема на основе многомасштабного метода конечных элементов с параллелепипедальными макроэлементами и тетраэдральными микроэлементами.
Осуществлен подбор адекватной модели эффективной среды для компактированного под
давлением гетерогенного материала «матрица C – ультрадисперсные включения MgO» стехиометрического состава. При подборе модели осуществлена попытка выделить и учесть те
особенности формирования материала и его структуры, которые непосредственно влияют на
величину эффективного коэффициента.
Построена иерархия моделей: скелет – мелкозернистые включения, слоистая среда с различными свойствами слоев, среда с щелеобразными прослойками воздуха, выделены области использования рассмотренных моделей.
Проведенные исследования показали необходимость дальнейшего усложнения модели
эффективной среды с одновременным использованием нескольких моделей: параллельных
щелеобразных прослоек воздуха и хаотично наклоненных, пересекающихся прослоек воздуха. На примере рассмотренной задачи видно, что использование передовых математических
15
методов позволяет реализовать исследование широкого спектра эффективных сред, однако,
требует адаптации к конкретной решаемой задаче.
Литература
1. Dias R.P., Fernandes C.S., Mota M., Teixeira J.A., Yelshin A. Permeability and effective thermal conductivity of bisized porous media // International Journal of Heat and Mass Transfer.
2007. № 50. P. 1295–1301.
2. Зарубин В.С., Кувыркин Г.Н. Сравнительный анализ оценок эффективного коэффициента
теплопроводности поликристаллического материала // Научное издание МГТУ им. Баумана Наука и Образование. 2013. № 3. C. 313-328.
3. Kole M., Tripathi D., Dey T.K. Percolation based enhancement in effective thermal conductivity of HDPE/LBSMO composites // Bull. Mater. Sci. 2012. V. 35, №4. P. 601–609.
4. Efendiev Y.R., Hou T.Y. Multiscale finite element methods. Theory and application. New York :
Springer, 2009. 234 p.
5. Hou T.Y., Wu X.H. A Multiscale finite element method for elliptic problems in com-posite materials and porous media. // Comput. Phys. - 1997. – 134. – P. 169-189.
6. Агафонцев А.А., Добролюбова Д.В., Кутищева А.Ю. Решение эллиптических краевых задач с контрастными коэффициентами многомасштабным методом Галеркина // Сборник
научных трудов Новосибирского государственного технического университета. 2013.
№ 1. С. 39–45.
Агафонцев Александр Александрович
магистр прикладной математики и информатики, аспирант кафедры Вычислительных
технологий НГТУ (630073, Новосибирск, пр-т К.Маркса, 20), инженер лаборатории электромагнитных полей ИНГГ СО РАН (630090, Новосибирск, пр-т Академика Коптюга, 3) тел. 8960-798-4208, e-mail: agfn@inbox.ru
Numerical determination of the effective characteristics of heterogeneous materials
Alexandr A. Agafontsev
The technology of multiscale finite element method for problems of determining effective values has been designed. An adequate model of an effective medium has been selected for the heterogeneous material “matrix C - ultrafine MgO inclusions”. A hierarchy of models which includes a matrix - microfine inclusions medium, a layered medium, layers with different properties, and a medium with slit-like layers of air has been built. The use of the considered models is
highlighted.
Keywords: effective thermal conductivity, multiscale finite elements method.
16
Сравнение критериев качества при построении регресионной зависимости на основе нечётких систем
Сравнение критериев качества при построении
регрессионной зависимости на основе нечѐтких
систем
О.М. Бебишева, А.А. Попов
В задачах построения зависимостей при моделировании сложных многофакторных объектов широко используются методы регрессионного анализа. В данной работе исследуются аппроксимирующие возможности регрессионных моделей, основанных на системе
нечѐтких правил Такаги-Сугено с использованием функций принадлежности, происходит
сравнение качества моделей.
Ключевые слова: модель, регрессионный анализ, критерий качества, функция принадлежности, система нечѐтких правил.
1. Введение
Для аппроксимации поверхности отклика применяются параметрические модели
различной сложности, например, линейные, квадратичные или кубические полиномы.
Область действия таких моделей определяется областью факторного пространства, в
котором проводились наблюдения. Проблему, когда характер зависимости отклика от
входных факторов существенно зависел от подобласти определения входных факторов,
пытались решать путѐм использования всѐ более сложных моделей (полиномов большей
степени). Один из подходов построения регрессионной зависимости в таких условиях
состоит в использовании размытых правил Takagi-Sugeno (TS) [1] с применением функций
принадлежности (в данном случае треугольных).
В рамках исследования происходит сравнение качества моделей по коэффициенту
детерминации и критерию скользящего контроля.
2. Модель
Вид правил Такаги-Сугено, описывающих систему с множественным входом и одним
выходом:


 ЕСЛИ  x1  A1i  и x2  A2 j и


q
(x), q 1, , M ,

ТО y 
и  xk  Akl 
(1)
где A ji – нечѐткое подмножество для переменной x j с функцией принадлежности
 A ji (x j )   0, 1 ; M
– число правил,  q (x) – функция, определяющая локальную
зависимость отклика y от набора регрессоров x  (x1,
отклика y определяется обычно по методу центра масс:
17
, xk )T . Прогнозное значение для
M
 q q (x)
yˆ(x) 
q 1
M
,
 q
(2)
q 1
где

q  A1i (x1)   A2 j (x2 )
 Akl
(xk ) [2].
Модель вида (1)-(2) будем называть FLR (Fuzzy Logic Regression) регрессионной
моделью.
Используемый подход позволяет получать достаточно сложные модели в условиях
использования зашумлѐнных входных данных, опираясь при этом на линейные модели
 q (x) .
Для выявления качества получаемых моделей и определения модели оптимальной
сложности при применении метода Такаги-Сугено сравним результирующие регрессионные
зависимости, полученные с использованием треугольных функций принадлежности (ФП), по
двум критериям: скользящего контроля (cross-validation, CV) и коэффициенту детерминации
 R2  .
3. Восстановление зависимости на основе рассматриваемого подхода
В данном исследовании в качестве  q (x) использовались линейные по входным
факторам модели. Сложность результирующей модели в данном случае в основном
определяется количеством разбиений областей определения факторов.
Рассмотрим задачу восстановления зависимости с одним фактором в следующих
условиях:
– количество наблюдений 100,
– интервал варьирования фактора [-1, 1],
– уровень шума 10%,
– модель, порождающая данные:
if  x  0  then y1 = x3 ,
if  x < 1 then y2 = x 2  0.01x.
Значения критериев качества при вариации количества партиций (разбиений области
определения фактора) представлены в таблице 1, визуализация моделей – на рисунке 1.
Также была посчитана относительная погрешность по формуле:
y (x)  yˆ (x)
 yˆ(x) 
yˆ (x)
.
Таблица 1. Значение критериев качества FLR моделей
Количество функций принадлежности (ФП)
Значение критерия
2
3
4
6
CV
2.562018e-002
2.065736e-002
1.749875e-002
1.819563e-002
2
9.096368e-001
9.433194e-001
9.532210e-001
9.532967e-001
4.566707e-001
3.518282e-001
3.158326e-001
3.171084e-001
R
Относительная
погрешность
18
Из результатов видно, что значение критерия скользящего контроля уменьшается до
момента, когда число партиций равно 4. Значение R 2 приближается к 1 при увеличении
числа партиций, следовательно, чем больше разбиений области определения фактора, тем
лучше регрессия описывает зависимость между объясняющими и зависимой переменными.
Относительная погрешность при данном количестве партиций минимальна.
а
в
б
Рис.1. TS зависимости отклика от входной переменной (а – 2 партиции, б – 3 партиции,
в – 4 партиции, г – 6 партиций)
Увеличение значения критерия CV при переходе от модели с 4 ФП к модели с 6 ФП
указывает на возникновение эффекта переобучения. И за модель оптимальной сложности,
опираясь на критерий CV, можно принять модель с 4 ФП.
4. Заключение
Результаты проведенных исследований показали, что коэффициент детерминации не
вполне подходит для решения поставленной задачи. Дело в том, что при включении дополнительных регрессоров в модель коэффициент детерминации всегда растѐт (строго говоря,
не убывает). Руководствуясь только им, мы не застрахованы от выбора модели с малой
обобщающей способностью. Однако же критерий скользящего контроля позволяет определить оптимальное количество функций принадлежности. По его значению можно определить, в какой момент, при каком количестве разбиений начинается переусложнение модели.
Литература
1. Takagi T., Sugeno M. Fuzzy Identification of Systems and Its Applications to Modeling and
Control // IEEE Trans. on Systems, Man and Cybernetics. 1985. V. 15. №. 1. P.116-132.
2. Пегат А. Нечеткое моделирование и управление / А.Пегат ; пер. с англ. – 2-е изд. – М. :
БИНОМ. Лаборатория знаний, 2013. – 798 с.
19
Бебишева Оксана Михайловна
магистрант факультета прикладной математики и информатики НГТУ (630066,
Новосибирск, улица Саввы Кожевникова 1/1, кв. 87), тел. 8-923-252-0994, e-mail:
oksanabm@mail.ru.
Попов Александр Александрович
д.т.н., профессор, с.н.с. кафедры теоретической и прикладной информатики НГТУ
(630073, Новосибирск, пр-т К.Маркса, 20), тел. (383) 3-460-600, e-mail: alex1207@ngs.ru.
Comparison of quality criteria in the construction of regression dependence on the basis of
fuzzy systems.
O.M. Bebisheva, A.A. Popov
In the task of building the dependencies in the modeling of complex multifactorial objects are
widely used regression analysis methods. In this paper we study the approximate capabilities of
regression models based on a system of fuzzy Takagi -, Sugeno using the membership function,
compares the quality of the models.
Keywords: model, regression analysis, quality criterion, membership function, the fuzzy system
rules
20
О критериях проверки отклонения распределения от равномерного закона
О критериях проверки отклонения
распределения от равномерного закона
П.Ю. Блинов, Б.Ю. Лемешко1
Новосибирский государственный технический университет
Рассматривается множество специальных критериев, предназначенных для проверки гипотез о принадлежности наблюдений равномерному закону. Исследуются распределения
статистик критериев, мощность критериев относительно различных конкурирующих гипотез. Рассматриваемые критерии ранжируются по мощности. Показываются достоинства и недостатки отдельных критериев. Показано, что значительная часть критериев,
традиционно используемых при проверке гипотез о равномерности, оказывается смещенной относительно некоторого вида конкурирующих гипотез. Подчеркивается, что в целом специальные критерии проверки равномерности не имеют явных преимуществ перед
непараметрическими критериями согласия, применяемыми для проверки равномерности.
Ключевые слова: равномерный закон, проверка гипотез, статистический критерий, мощность критерия
1. Введение
Проверке гипотез о принадлежности выборки равномерному закону распределения посвящено множество работ, в которых авторами предложен достаточно обширный перечень
статистических критериев. В определенной степени обилие критериев обусловлено тем интересом, который проявляется к использованию модели равномерного закона в различных
приложениях. Равномерный закон зачастую используется для описания ошибок измерений
некоторых приборов или измерительных систем.
Если случайные величины X1, X 2 ,..., X n принадлежат некоторому закону с функцией
распределения вероятностей F  x  , то случайные величины Yi  F  X i  , i  1, n распределены равномерно на интервале  0,1 . Поэтому во многих ситуациях вместо проверки гипотезы
о принадлежности выборки X1, X 2 ,..., X n закону с функцией распределения F  x  зачастую
переходят к проверке гипотезы о принадлежности Y1,Y2 ,..., Yn равномерному закону. Не будет
лишним заметить, что при подобном переходе использование классических критериев проверки равномерности, ориентированных на проверку простой гипотезы о принадлежности
выборки равномерному закону, корректно, если F  x  известно с точностью до значений параметров. Но если вектор параметров  распределения F  x,   оценивался по выборке
X1, X 2 ,..., X n , то при справедливости проверяемой гипотезы H 0 распределение статистики
любого критерия равномерности будет отличаться от имеющего место при проверке простой
гипотезы.
Наличие множества критериев ставит перед практиками не очень простую задачу выбора, так как имеющаяся в публикациях информация не позволяет однозначно отдать предпочтение какому-то определенному критерию.
В данной работе множество рассматриваемых критериев равномерности исследовалось
1
Работа выполнена при поддержке Министерства образования и науки РФ в рамках проектной части государственного задания (№ 2.541.2014/К).
21
методами статистического моделирования. При исследовании распределений статистик соответствующих критериев количество экспериментов, осуществляемых при статистическом
моделировании, как правило, принималось равным 1 660 000. Такое количество экспериментов позволяет, с одной стороны, проследить качественную картину, отражающую изменение
распределений статистик в зависимости от различных факторов, с другой – обеспечить приемлемую точность получаемых оценок мощности и искомых вероятностей.
При проверке гипотезы о принадлежности наблюдаемой случайной величины равномерному закону простая проверяемая гипотеза имеет вид H 0 : X  Rav  0,1 или H 0 : X 
Rav  a, b  , где a и b известны. Эту же гипотезу можно записать как H 0 : F ( x)  x , x [0,1]
xa
, x [a, b] . Проверяемая гипотеза будет сложной, если по данной выba
борке находится и область определения равномерной случайной величины.
Пусть X1, X 2 ,..., X n – выборка независимых наблюдений случайной величины X .
Для проверки гипотезы о принадлежности выборки независимых одинаково распределенных случайных величин X1, X 2 ,..., X n равномерному закону может использоваться ряд
критериев, построенных специально для проверки этой гипотезы, а также применяться совокупность классических непараметрических критериев согласия (Колмогорова, Купера, Кра-
или H 0 : F ( x) 
мера–Мизеса–Смирнова, Ватсона, Андерсона–Дарлинга, Жанга) и критерий согласия  2
Пирсона.
В данной работе мы останавливаемся только на множестве специальных критериев. В
большинстве критериев проверки равномерности опираются на оценки порядковых статистик величины X (элементы x(i ) вариационного ряда x(1)  x(2)  ...  x( n) , построенного по
выборке X1, X 2 ,..., X n ), которые в дальнейшем будем обозначать как U i (то есть, Ui  x(i ) ).
В множестве “специальных” критериев проверки гипотезы о равномерности можно выделить три группы. Статистики критериев первой группы предусматривают использование
разностей последовательных значений вариационного ряда
D
i Ui  Ui 1 ,
где U 0  0 , U n1  1 , n – объем выборки.
К критериям второй группы относятся различные модификации критериев, использующие разности оценок порядковых статистик, соответствующих анализируемой выборке, и
математических ожиданий этих порядковых статистик.
Третью группу составляют, так называемые, энтропийные критерии, опирающиеся на
различные оценки энтропии.
Как правило, специальные критерии ориентированы на проверку простой гипотезы H 0 .
С каждым из используемых для проверки гипотезы H 0 критериев связана соответствующая статистика S , которая в соответствии с некоторой мерой измеряет расстояние между
равномерным законом распределения вероятностей и эмпирическим законом, определяемым
выборкой. В силу случайности извлекаемых выборок случайными оказываются и значения
статистики S , вычисляемые в соответствии с этими выборками. При справедливости проверяемой гипотезы H 0 статистика S подчиняется некоторому распределению G( S H 0 ) .
С результатами проверки гипотез связывают ошибки двух видов: ошибка первого рода
состоит в том, что отклоняют гипотезу H 0 , когда она верна; ошибка второго рода состоит в
том, что принимают (не отклоняют) гипотезу H 0 , в то время как справедлива конкурирующая гипотеза H1 . Уровень значимости  задает вероятность ошибки первого рода.
Обычно, используя критерии проверки гипотез, не рассматривают конкретную конкурирующую гипотезу. В таком случае при проверке гипотез о виде закона можно считать, что
22
конкурирующая гипотеза имеет вид H1 : F ( x)  F ( x, 0 ) . Если же гипотеза H1 задана и
имеет, например, вид H1 : F
( x) F1( x, ) , то задание величины  для используемого критерия проверки гипотез определяет и вероятность ошибки второго рода  . Ошибка второго
рода заключается в том, что не отклоняется гипотеза H 0 , когда на самом деле справедлива
гипотеза H1 .
Мощность критерия представляет собой величину 1  . Очевидно, что чем выше мощность используемого критерия при заданном значении  , тем лучше он различает гипотезы
H 0 и H1 .
Естественно, что наиболее интересна способность критериев различать близкие конкурирующие гипотезы. Именно при анализе близких альтернатив удается выяснить тонкие моменты, характеризующие свойства критериев, выявить принципиальные недостатки или достоинства критериев.
В данной работе мощность всех рассмотренных критериев исследовалась относительно
3-х конкурирующих гипотез, которые соответствуют принадлежности наблюдаемой случайной величины семейству бета-распределений 1-го рода с функцией плотности

f ( x)
 x  3 
1


2(0 , 1 )  2 
0 1
 x  3 
1 

2 

1 1
,
где (0 , 1) (0 )(1) / (0  1) – бета-функция, 0 , 1  (0, ) – параметры формы,
2  (0, ) – масштабный параметр, 3  (, ) – параметр сдвига, x [0, 2 ] .
Обозначим функцию бета-распределения 1-го рода при конкретных значениях параметров как BI (0 , 1, 2 , 3 ) . Тогда три рассматриваемые и достаточно близкие к H 0 конкурирующие гипотезы H1 , H 2 , H 3 принимают следующий вид:
H1 : F ( x)  BI (1.5, 1.5, 1, 0) , x [0,1] ;
H 2 : F ( x)  BI (0.8, 1, 1, 0) , x [0,1] ;
H 3 : F ( x)  BI (1.1, 0.9, 1, 0) , x [0,1] .
Функции распределения вероятностей, соответствующие рассматриваемым гипотезам,
достаточно близки (см. рис. 1), а плотности существенно различаются..
Следует обратить внимание, что конкурирующей гипотезе H1 соответствует закон,
функция распределения которого пересекается с функцией распределения равномерного закона, а при H 2 и H 3 функции распределения законов лежат выше и ниже функции равномерного. И способности различать гипотезы H 0 и H1 , и гипотезы H 0 и H 2 или H 3 у критериев оказываются различными.
Заметим, что анализ мощности критериев относительно H1 позволил выявить неспособность отдельных критериев при малых объѐмах выборок n и малых уровнях значимости 
отличать эту гипотезу от H 0 , то есть показал смещѐнность соответствующих критериев
(мощность 1  оказывается меньше  ). Образно говоря, с позиции критерия закон, соответствующий гипотезе H1 представляется ему “более равномерным” чем равномерный.
23
Рис. 1. Функции распределения вероятностей, соответствующие конкурирующим гипотезам
Причем указанный недостаток оказался свойственным не только значительной части
специальных критериев проверки равномерности, но и большей части непараметрических
критериев согласия.
2. Результаты исследований специальных критериев равномерности
Как было сказано выше множество специальных критериев можно разбить на три группы
близких по свойствам критериев. К первой группе критериев, использующих разности
элементов вариационного ряда, относятся критерии Шермана [1, 2], Кимбелла [3] , Морана 1
[4], Морана 2 [5], критерии Кресси со статистиками Sn( m) и L(nm) [6], Пардо [7], Шварца [8].
Ко второй группе критериев, где рассматриваются отклонения порядковых статистик от
их математических ожиданий (от медиан и т.п.), относятся критерии Хегази–Грина со статистиками T1 и T2 [9], Фросини [10], Янга [11], Ченга–Спиринга [12], Гринвуда [13], Гринвуда–Кэсенберри–Миллера [14], критерии Неймана–Бартона со статистиками N 2 , N3 и N 4
[15].
К третьей группе относится энтропийный критерий Дудевича–ван дер Мюлена [16] и две
модификации, в статистиках которых используются другие оценки энтропии [17].
Соотношения, задающие вид статистик рассматриваемых критериев проверки равномерности, вынесены в таблицу 1.
В продолжение исследований [18, 19, 20] в процессе выполнения данной работы были
исследованы распределения статистик всех выше упомянутых критериев, расширены таблицы процентных точек, проверено насколько хорошо распределения нормализованных статистик описываются соответствующими асимптотическими законами. Исследована мощность
критериев относительно различных конкурирующих гипотез, в частности относительно H1 ,
H 2 и H 3 . Было показано, что ряд рассмотренных критериев оказался смещенным относи-
тельно относительно H1 .
В таблице 1 наряду с выражениями статистик критериев указаны недостатки и достоинства критериев, выявленные в процессе исследования свойств. Они могут служить рекомендациями по применению конкретных критериев.
24
Таблица 1. Особенности применения критериев проверки равномерности
№
п/п
Критерий
Статистика

n
1 n1
1
 Ui  Ui 1  n  1
2 i 1
1
Шермана
2
Кимбелла
A
3
Морана 1

B
4
Морана 2
5
Кресси 1
6
Кресси 2
7
Ченга–
Спиринга
n 1
1 


i 1 
 Ui  Ui1  n  1 
n1
 Ui  Ui1 
2
2
i 1
n1
Mn 
  ln (n  1)(U i  U i 1 )
i 1

Sn( m)
L(nm)

n1m
2
  n(Uim  Ui ) 
i 0
n1m

i 0
ln  n U i  m  U i  
n  1

U n  U1  n  1 
Wp   n
 U i  U 
2
i 1
25
2
Недостатки, достоинства,
рекомендации
При малых n и  критерий является смещѐнным относительно H1 .
Невысокая мощность.
Нормализованные статистики хорошо аппроксимируются нормальным законом.
Зависимость распределения статистики от объема выборки n и необходимость использования таблицы
процентных точек.
При малых n и  критерий является смещѐнным относительно H1 .
Мощность критерия не очень высокая, но выше мощности критерия
Шермана.
Критерий по мощности эквивалентен критерию Кимбелла.
Те же достоинства и недостатки.
Двусторонний критерий.
Имеющиеся аппроксимации модифицированных статистик  2 -распределением и нормальным законом заметно отличаются от действительных распределений статистик. Вследствие этого приходится
ориентироваться на таблицу процентных точек.
Очень низка мощность.
Не рекомендуется использовать.
Зависимость распределения статистики от n и необходимость использования таблиц процентных точек.
Неопределенность с выбором m .
При малых n и  критерий является смещѐнным относительно H1 .
Невысокая мощность.
Двусторонний критерий.
Зависимость распределения статистики от n и необходимость использования таблицы процентных точек.
Неопределенность с выбором m .
Очень низка мощность.
Не рекомендуется использовать.
Двусторонний критерий.
Зависимость распределения статистики от n , необходимость использования таблицы процентных точек.
Высокая мощность относительно
гипотезы H1 . Практически неспособен отличать гипотезы вида H 3 .
Применять совместно с другими.
Продолжение таблицы 1
№
п/п
8
Критерий
Статистика
M
Янга
1n
 min( Di , Di1) ,
l i 1
D1  U1 , D
i Ui  Ui 1 , Dn1  1  U n
n1
G
 n  1  Ui  Ui 1 
9
Гринвуда
10
Гринвуда–
Кэсенберри–
Миллера
2
i 1
Q
n 1
 U i  U i 1 
2

i 1
n
  U i 1  U i U i  U i 1 
i 1
11
Шварца

An*
2
n n  U i 1  U i 1 1 
  ,

2 i 1 
2
n
где U 0  U1 , U n1 2  U n
12
Хегази–Грина
T1
13
Хегази–Грина
T2

T1

T2
1 n
 Ui  i
n i 1
1 n
2
 Ui  i 
n i 1
26
Недостатки, достоинства,
рекомендации
Критерий двусторонний.
Нормализованная статистика хорошо аппроксимруется стандартным
нормальным законом.
Показывает очень низкую мощность.
Не рекомендуется использовать.
Приходится пользоваться таблицей
процентных точек, так как распределения статистики очень медленно
сходятся к нормальным.
При малых n и  критерий является смещѐнным относительно H1 .
Низкая мощность относительно
других конкурирующих гипотез.
Зависимость распределения статистики от объема выборки n и необходимость использования таблицы
процентных точек.
При малых n и  критерий является смещѐнным относительно H1 .
Невысокая мощность.
Зависимость распределения статистики от объема выборки n и необходимость использования таблицы
процентных точек.
Благодаря имеющимся отличиям от
критерия Кимбелла, обладает преимуществом в мощности по сравнению с группой близких критериев
(Шермана, Кимбелла, Морана,
Гринвуда, Янга).
Зависимость распределения статистики от объема выборки n и необходимость использования таблицы
процентных точек.
При малых n и  критерий является смещѐнным относительно H1 .
Модификация статистики T1* некоторое преимущество даѐт только
относительно H1 .
Критерии обладают достаточно высокой мощностью относительно
других конкурирующих гипотез.
Те же достоинства и недостатки,
что и у критерия со статистикой T1 .
Как правило, чуть уступает в мощности критерию со статистикой T1 .
Продолжение таблицы 1
№
п/п
14
Критерий
Недостатки, достоинства,
рекомендации
Приходится пользоваться таблицей
процентных точек.
При n  50 можно использовать аппроксимацию в виде бета-распределения 1-го рода.
При малых n и  критерий является смещѐнным относительно H1 .
Обладает достаточно высокой мощностью относительно других конкурирующих гипотез.
При малых n и  наблюдается
смещение критериев относительно
H1 .
При n  20 распределения стати-
Статистика

Bn
Фросини
1 n
i  0.5
 Ui  n
n i 1
K
N K   V j2 ,
j 1
15
Неймана–
Бартона
где V j 
1 n
  j Ui  0.5 ,
n i 1

1  y  
2 3 y ; 2  y

3 
y


5 6 y  0,5 ;
3

7 20 y  3 y ;
4
2
4  y
 3 70 y  15 y  0,375
16
Дудевича–ван
дер Мюлена

2

1 n  n

H  m, n  
  ln  U i  m  U i m   ,
n i 1  2m

n
где m  целое и m  ; если i  m  n , то
2
Ui m  U n , и если i  m  1 , то Ui m  U1
n


U i  m  U i m
HY1   ln 
,
 Fˆ U
ˆ

F
U
 i m  
im 
i 1 
17
18
Модификация
1 энтропийного критерия
Модификация
2 энтропийного критерия
где
U  U i 1 
1
n 1 
 i
i 
,
n(n  1)  n  1 U i 1  U i 1 

i 2,..., n  1 ,
1
1  Fˆ U n  
Fˆ U1  
(n  1)
Fˆ U

i
n


U i  m  U i m
 ln 
HY2 

 Fˆ U
ˆ
F
U

 i m  
im 
i 1 


 Fˆ U i  m   Fˆ U i m 
 n
ˆ
  Fˆ U
j  m  F U j m
 j 1

 


27








стик хорошо аппроксимируется  2K
-распределениями.
Критерии демонстрируют хорошую
мощность.
Наиболее предпочтителен критерий
со статисткой N 2 .
Зависимость распределения статистики от объема выборки n и необходимость использования таблицы
процентных точек.
Некоторая неопределенность при
выборе m .
Обладает высокой мощностью относительно гипотезы H1 и неплохой мощностью относительно других гипотез.
Зависимость распределения статистики от объема выборки n и необходимость использования таблицы
процентных точек.
Некоторая неопределенность при
выборе m .
По мощности эквивалентен критерию Дудевича–ван дер Мюлена.
Имеет те же недостатки и достоинства, что и модификация 1.
Превосходит в мощности модификацию 1 относительно H1 , но уступает – относительно гипотез H 2 и
H3 .
Окончание таблицы 1
№
п/п
19
Критерий
Пардо
Статистика
Em,n 
1 n
2m

n i 1 n U i  m  U i m 
Недостатки, достоинства,
рекомендации
Зависимость распределения статистики от объема выборки n и необходимость использования таблицы
процентных точек.
Неопределенность с выбором m , от
которого зависят распределения
статистики.
Отсутствует смещение относительно гипотез вида H1 .
В среднем неплохая мощность.
Рассмотренные специальные критерии проверки равномерности в таблице 2 упорядочены по убыванию мощности относительно конкурирующих гипотез H1 , H 2 и H 3 . (по величине мощности 1  , проявленной при n  100 и уровне значимости  0.1 ).
В столбце для H1 темным цветом выделены критерии, которые относительно H1 при
малых объѐмах выборок n обладают сильно выраженной смещѐнностью.
Этот недостаток не отмечен только у некоторых критериев: у энтропийного критерия
Дудевича–ван дер Мюлена и его модификаций, у критериев Ченга–Спиринга, Шварца и
Пардо.
В меньшей степени смещѐнность относительно H1 проявляется у критериев Неймана–
Бартона со статистиками N 2 и N3 .
Критерий Неймана–Бартона со статистикой N 2 показывает высокую мощность относительно H1 и сравнительно высокие результаты относительно H 2 и H 3 .
Стабильно неплохую способность отличать конкурирующие гипотезы от равномерного
закона демонстрируют критерии и другие второй группы (критерии Хегази–Грина и Фросини).
Энтропийный критерий Дудевича–ван дер Мюлена и модификации, имеющие высокую
мощность относительно H1 , по отношению к конкурирующим гипотезам H 2 и H 3 показывают достаточно средние результаты. В то же время они успешно конкурируют с критериями
второй группы.
Наиболее низкую мощность демонстрируют критерии первой группы, в статистиках которых суммируются модули или квадраты разностей Ui  Ui 1 значений последовательных
порядковых статистик (критерии Шермана, Кимбелла, Морана, Гринвуда, Гринвуда–
Кэсенберри–Миллера и, особенно, Янга).
3. Заключение
Параллельно с настоящим исследованием относительно рассматриваемых конкурирующих гипотез H1 , H 2 и H 3 были получены оценки мощности непараметрических критериев
согласия (Колмогорова, Купера, Крамера–Мизеса–Смирнова, Ватсона, Андерсона–Дарлинга,
Жанга статистиками Z K , ZC и Z A ) при проверке равномерности. Было показано, что из этих
критериев только критерии Купера и Ватсона оказались несмещѐнными относительно H1 .
При этом для критериев согласия Колмогорова, Крамера–Мизеса–Смирнова и Андерсона–
Дарлинга факт “смещѐнности” был отмечен вообще впервые. И в то же время по сравнению
с лучшими представителями специальных критериев равномерности критерии согласия про28
демонстрировали, по крайней мере, сравнимую мощность.
Таблица 2. Ранжирование критериев равномерности по мощности
№
п/п
1
2
3
4
5
Относительно H1
1 
Относительно H 2
1 
Относительно H 3
1 
Модификация 2 энтропийного критерия
0.883
Хегази-Грина T1
0.610
Хегази-Грина T1
0.522
0.852
Фросини
0.603
Фросини
0.522
Кресси
L(nm)
Неймана–Бартона N 2
Дудевича–ван дер
Мюлена
Модификация 1 энтропийного критерия
6
Неймана–Бартона N3
7
8
9
Неймана–Бартона N 4
*
0.837
Хегази-Грина T2
0.602
Хегази-Грина T1
0.520
0.790
Неймана–Бартона N 2
0.597
Хегази-Грина T2
0.508
0.789
Хегази-Грина T1*
0.595
Хегази-Грина T2*
0.506
*
0.766
Хегази-Грина T2
0.585
Неймана–Бартона N 2
0.447
Ченга-Спиринга
Шварца
0.739
0.722
0.583
Неймана–Бартона N3
Неймана–Бартона N 4
Пардо
0.577
0.557
0.463
0.416
0.381
0.291
10
Хегази-Грина T1*
0.443
Кресси Sn( m)
0.344
11
*
Хегази-Грина T2
0.409
12
Пардо
0.408
Неймана–Бартона N3
Неймана–Бартона N 4
Пардо
Дудевича–ван дер
Мюлена
Модификация 1 энтропийного критерия
Модификация 2 энтропийного критерия
0.266
Шварца
0.206
0.244
Гринвуда–
Кэсенберри–Миллера
0.186
0.308
0.226
0.290
Шермана
0.204
Кимбелла
0.165
0.279
0.279
0.215
0.151
0.126
0.115
0.006
Кимбелла
Морана
Ченга-Спиринга
0.201
0.201
0.168
0.163
0.137
0.134
0.108
Кресси L(nm)
Шермана
Гринвуда
Морана 2
Ченга-Спиринга
Янга
Морана
0.165
0.158
0.154
0.122
0.110
0.106
0.104
13
Фросини
0.384
14
Хегази-Грина T1
0.322
15
16
17
18
19
20
21
22
23
Хегази-Грина T2
Гринвуда–
Кэсенберри–Миллера
Кимбелла
Морана
Шермана
Гринвуда
Морана 2
Янга
Кресси Sn( m)
0.275
Модификация 1 энтропийного критерия
Дудевича–ван дер
Мюлена
Модификация 2 энтропийного критерия
Гринвуда–
Кэсенберри–Миллера
Шварца
Кресси L(nm)
Гринвуда
Морана 2
Янга
0.328
0.327
Кресси
Sn( m)
0.275
0.267
0.178
Когда для проверки гипотезы о принадлежности анализируемой выборки некоторому
конкретному закону распределения разработано множество специальных критериев, то среди
этого множества, как правило, находятся критерии, применение которых при ограниченных
объемах выборок связано с заметными преимуществами в мощности, например, по сравнению с общими критериями согласия.
В данном случае (при проверке равномерности) такого преимущества относительно непараметрических критериев согласия не наблюдается: очень неплохо показывают себя критерии Жанга со статистиками Z A и ZC и критерий Андерсона–Дарлинга.
Из анализа свойств всего множества критериев, которые могут использоваться для проверки гипотезы о принадлежности выборки равномерному закону, вытекает, что корректного
использования какого-то одного из критериев для формирования “надежного” статистического вывода зачастую может оказаться недостаточно. Для большей объективности стати29
стических выводов предпочтительней воспользоваться некоторым рядом критериев, обладающих определѐнными достоинствами. Использование совокупности критериев, опирающихся на различные меры отклонения эмпирического распределения от теоретического, повышает качество статистических выводов.
В дальнейшем на базе результатов проведенных исследований планируется подготовить аналогичное работам [21, 22] руководство по применению критериев проверки гипотез о принадлежности
анализируемых данных равномерному закону распределения вероятностей.
Литература
1. Sherman B. A random variable related to the spacing of sample values / B. Sherman // The Annals of Mathematical Statistics. – 1950. – V.21, №3. – P. 339-361.
2. Sherman B. Percentiles of the wn statistic / B. Sherman // The Annals of Mathematical Statistics. – 1957. – V.28, №1. – P. 257-261.
3. Kimball B. F. Some basic theorems for developing tests of fit for the case of the non-parametric
probability distribution function./ B. F. Kimball // The Annals of Mathematical Statistics. –
1947. – V.18, №1. – P. 540-548.
4. Moran P. A. P. The random division of an intervals / P. A. P. Moran // J. R. Statist. Soc. –
1947. – Ser. B. V.9. No. 1. – P. 92-98.
5. Moran P. A. P. The random division of an intervals. II / P. A. P. Moran // J. R. Statist. Soc. –
1951. – Ser. B. V.13. No. 2. – P. 147-150.
6. Cressie N. An optimal statistic based on higher order gaps // Biometrika. – 1979. – V.66. – P.
619–627.
7. Pardo M. C. A test for uniformity based on informational energy // Statistical Papers. – 2003. –
V.44. – P. 521–534.
8. Swartz T. Goodness-of-fit tests using Kullback–Leibler information // Communications in Statistics – Theory and Methods. – 1992. – V.21. – P.711–729.
9. Hegazy Y. A. S. Some new goodness-of-fit tests using order statistics / Y. A. S. Hegazy,
J. R. Green // Applied Statistics. – 1975. – V.24, №3. – P. 299-308.
10. Frosini B. V. On the distribution and power of goodness-of-fit statistic with parametric and
nonparametric applications, “Goodness-of-fit” / Ed. by Revesz P., Sarkadi K., Sen P.K.
//Amsterdam-Oxford-New York: North-Holland Publ. Comp. – 1987. – P. 133-154.
11. Young D. L. The linear nearest neighbour statistic / D. L. Young // Biometrika. – 1982. – V.69,
№2. – P. 477-480.
12. Cheng S. W. A test to Identify the uniform distribution with applications / S. W. Cheng,
F. A. Spiring // IEEE Trans. Reliability. – 1987. – V. R-36. – P. 98-105.
13. Greenwood V. The statistical study of Infection disease / V. Greenwood // J. R. Statist. Soc.. –
1946. – Ser. A. V.109. – P. 257-261.
14. Quesenberry C. P. Power studies of some tests for uniformity. / C. P. Quesenberry, F. L. Miller
// Journal of Statistical Computation and Simulation. – 1977. – V.5. – P. 169-191.
15. Neyman J. “Smooth” tests for goodness-of-fit / J. Neyman // Scandinavisk Aktuarietidskrift. –
1937. – V.20. – P. 149-199.
16. Dudewics E. J., van der Meulen E. C. Entropy-based test of uniformity // J. Amer. Statist. Assoc. – 1981. – V.76. No. 376. – P. 967-974.
17. Zamanzade E. Testing uniformity based on new entropy estimators // Journal of Statistical
Computation and Simulation. – 2014. DOI: 10.1080/00949655.2014.958085.
18. Блинов П. Ю., Лемешко Б. Ю. О мощности критериев, используемых для проверки гипотез о принадлежности выборок равномерному закону // Материалы Российской НТК
“Обработка информационных сигналов и математическое моделирование”, Новосибирск. 2013. – С.35-38.
30
19. Blinov P. Yu., Lemeshko B. Yu. A review of the properties of tests for uniformity // 2014 12th
Iinternational Conference on Actual Problems of Electronics Instrument Engineering (APEIE)
34006 Proceedings. Vol. 1. Novosibirsk, 2014. – P.540-547.
20. Блинов П. Ю., Лемешко Б. Ю. Обзор свойств критериев равномерности // Труды
XII международной конференции “Актуальные проблемы электронного приборостроения” АПЭП-2014. Т.6, Новосибирск, 2014. – С.29-36.
21. Лемешко Б. Ю. Непараметрические критерии согласия: Руководство по применению /
Б. Ю. Лемешко.– М.: НИЦ ИНФРА-М, 2014. – 163 с.
22. Лемешко Б. Ю. Критерии проверки отклонения распределения от нормального закона:
Руководство по применению / Б. Ю. Лемешко. – М.: НИЦ ИНФРА-М, 2015. – 160 с. –
(Научная мысль). – www.dx.doi.org/10.12737/6086.
Лемешко Борис Юрьевич
Д.т.н., профессор, г.н.с. кафедры теоретической и прикладной информатики НГТУ
(630073, Новосибирск, просп. Карла Маркса, 20), e-mail: lemeshko@ami.nstu.ru
Блинов Павел Юрьевич
Аспирант кафедры теоретической и прикладной информатики НГТУ (630073, Новосибирск, просп. Карла Маркса, 20), e-mail: blindizer@ya.ru.
The tests used for testing deviation from a uniform distribution
P. Yu. Blinov, B. Yu. Lemeshko
The set of special tests intended for testing uniformity are considered. Distributions of test statistics, power of tests under different competing hypotheses are studied. Considered test are
ranked by test power. Advantages and disadvantages of individual tests were shown. It has
been shown that large part of the tests traditionally used for testing uniformity have the bias under some kind of competing hypotheses. Underlines that special uniformity tests haven’t clear
advantage over nonparametric goodness-of-fit tests used for testing uniformity in general.
Key words: uniform distribution, hypothesis testing, test statistic, test power
31
О критериях проверки равномерности, использующих оценки энтропии
О критериях проверки равномерности,
использующих оценки энтропии
П.Ю. Блинов, Б.Ю. Лемешко1
Новосибирский государственный технический университет
Рассматриваются критерии проверки гипотезы о принадлежности выборки равномерному
закону распределения, базирующиеся на непараметрических оценках энтропии. Исследуются распределения статистик критериев, мощность критериев относительно различных конкурирующих гипотез. Опираясь на результаты исследований, даны рекомендации
по применению критериев. Рассмотрена проблема выбора размера окна.
Ключевые слова: равномерное распределение, оценка энтропии, критерий, статистика
критерия, мощность, размер окна.
1. Введение
Для проверки гипотезы о равномерности наблюдаемых случайных величин предложено
множество специальных критериев. Это обусловлено интересом, который проявляется к использованию модели равномерного закона в различных приложениях. Частота применения
модели равномерного закона в задачах статистического анализа не в последнюю очередь
определяется тем, что использование такой простой модели во многих ситуациях позволяет
найти решение задачи с опорой только на аналитические методы. Если применение модели
равномерного закона обосновано, то многие статистические выводы оказываются проще.
Пусть случайные величины X1, X 2 ,..., X n принадлежат некоторому закону с функцией
распределения вероятностей F  x  , тогда случайные величины Yi  F  X i  , i  1, n распреде-
лены равномерно на интервале  0,1 . В связи с этим во многих случаях задачу проверки ги-
потезы о принадлежности выборки X1, X 2 ,..., X n некоторому непрерывному закону распределения можно заменить задачей проверки гипотезы о принадлежности выборки Y1,Y2 ,..., Yn
равномерному закону.
При проверке гипотезы о принадлежности наблюдаемой случайной величины равномерному закону простая проверяемая гипотеза имеет вид H 0 : X  Rav  0,1 или H 0 : X 
Rav  a, b  , где a и b известны. Эту же гипотезу можно записать как H 0 : F ( x)  x , x [0,1]
xa
или H 0 : F ( x) 
, x [a, b] . Проверяемая гипотеза будет сложной, если по данной выba
борке находится и область определения равномерной случайной величины.
Со статистической проверкой гипотез связаны два вида ошибок. Ошибка 1-го рода, вероятность которой  (уровень значимости), как правило задаѐтся, заключается в отклонении
справедливой проверяемой гипотезы H 0 . Если выдвигается и некоторая конкурирующая гипотеза H1 , то с ней связывают ошибку 2-го рода (и еѐ вероятность  ), которая заключается в
том, что при справедливости H1 не отклоняется проверяемая гипотеза H 0 . Естественно желание, чтобы при проверке гипотезы вероятности  и  были минимальны, но при выдви1
Работа выполнена при поддержке Министерства образования и науки РФ в рамках проектной части государственного задания (№ 2.541.2014/К).
32
жении конкретной гипотезы H1 задание одной из вероятностей определяет и другую (для
данного критерия и объѐма выборки n ).
С вероятностью  ошибки 2-го рода связана мощность критерия 1  . Понятно, что при
выборе критерия, если есть такая возможность, предпочтение следует отдать критерию с
наибольшей мощностью. Естественно, что наибольший интерес вызывает способность критериев различать близкие альтернативы, то есть, отличать от H 0 близкие конкурирующие
гипотезы.
В данной работе в качестве конкурирующих рассматриваются три гипотезы H1 , H 2 и
H 3 , соответствующие бета-распределению 1-го рода BI (0 , 1, 2 , 3 ) с функцией плотности
 x  3 
1


2(0 , 1 )  2 
при различных значениях параметров:

f ( x)
0 1
 x  3 
1 

2 

1 1
H1 : F ( x)  BI (1.5, 1.5, 1, 0) , x [0,1] ;
H 2 : F ( x)  BI (0.8, 1, 1, 0) , x [0,1] ;
H 3 : F ( x)  BI (1.1, 0.9, 1, 0) , x [0,1] .
Функции распределения вероятностей, соответствующие рассматриваемым гипотезам,
достаточно близки. При этом конкурирующей гипотезе H1 соответствует закон, функция
распределения которого пересекается с функцией распределения равномерного закона, а при
H 2 и H 3 функции распределения законов лежат выше и ниже функции равномерного. В то
же время плотности законов существенно отличаются от равномерного (см. рис. 1).
Следует отметить, что для многих критериев проверки равномерности, в том числе и для
непараметрических критериев согласия, камнем преткновения оказывается различени е H 0 и
H1 при малых объѐмах выборок n .
В данной работе рассматриваемые критерии проверки равномерности, как и в предшествующих работах [1–3], исследовались методами статистического моделирования. При исследовании распределений статистик критериев количество экспериментов, осуществляемых
при статистическом моделировании принималось равным 1 660 000. Такое количество экспериментов позволяет, с одной стороны, проследить качественную картину, отражающую
изменение распределений статистик в зависимости от различных факторов, с другой – обеспечить приемлемую точность получаемых оценок мощности и искомых вероятностей.
2. Энтропийные критерии проверки равномерности
Пусть X1, X 2 ,..., X n – выборка независимых наблюдений случайной величины X с
функцией плотности f  x  , тогда энтропия H  f  этой величины, предложенная Шенноном
[4], имеет вид:
H( f )  

 ln  f  x   f  x  dx .

(1)
Впервые оценку энтропии предложил Васичек [5], используя тот факт, что (1) можно
привести к виду:
1
d

H ( f )   ln  F 1  p  dp .
dp

0 
33
Рис. 1. Плотности распределения законов, соответствующие конкурирующим гипотезам
В конечном виде предложенная им оценка описывается формулой:
1 n  n
(2)

H
 ln 
Ui m  Ui m  ,
n i 1  2m

n
где 1  m  целочисленный параметр, называемый размером окна; 
Ui X (i )  i -й элемент
2
вариационного ряда, построенного по выборке X1, X 2 ,..., X n ; Ui m  U1 , если i  m  1 , и
m
Ui m  U n , если i  m  n . В [5] было доказано, что если n, m   и  0 то H  H  f  .
n
Васичек использовал оценку (2) в качестве статистики критерия для проверки нормальности. Использовать данную оценку в качестве статистики критерия проверки равномерности предложили Дудевич и ван дер Мюлен [6]. Они отметили, что при любых выборках, распределенных на интервале  0,1 , всегда выполняется неравенство H  0 , и предложили для
проверки равномерности правосторонний критерий со статистикой:
1 n  n
H  m, n  
  ln 
(3)
Uim  Uim  .
n i 1  2m

Во многих источниках (3) называется энтропийным критерием Дудевича–ван дер Мюлена.
В таблице 1 приведены процентные точки критерия со статистикой (3), расширенные и
уточнѐнные нами в ходе исследований.
Ибрагими [7] на основе (2) предложил собственную оценку энтропии:
1 n  n

(4)

Hc
 ln  U i  m  U i m   ,
n i 1  cm

где
1  (i  1) / m, i  m,

c  2,
m  1  i  n  m,
1  (n  i ) / m, i  n  m  1.

34
Таблица 1. Критические значения критерия со статистикой H (m, n)
n
10
20
30
40
50
m
1
2
3
4
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
15
1
2
3
4
5
6
7
8
9
1 
0.8
0.700
0.547
0.542
0.575
0.505
0.350
0.322
0.325
0.339
0.359
0.383
0.410
0.439
0.437
0.283
0.248
0.242
0.246
0.256
0.269
0.285
0.301
0.319
0.403
0.249
0.211
0.200
0.200
0.205
0.213
0.223
0.234
0.246
0.316
0.382
0.229
0.188
0.175
0.172
0.174
0.179
0.186
0.194
0.85
0.758
0.592
0.584
0.617
0.538
0.375
0.345
0.346
0.360
0.380
0.404
0.431
0.459
0.462
0.301
0.264
0.257
0.261
0.271
0.283
0.299
0.315
0.333
0.423
0.264
0.224
0.212
0.211
0.216
0.224
0.234
0.245
0.257
0.326
0.399
0.241
0.199
0.185
0.181
0.183
0.188
0.195
0.203
0.9
0.835
0.653
0.642
0.673
0.582
0.409
0.376
0.376
0.388
0.408
0.432
0.459
0.487
0.494
0.326
0.286
0.277
0.281
0.290
0.303
0.317
0.334
0.351
0.449
0.283
0.241
0.228
0.226
0.231
0.238
0.248
0.259
0.271
0.341
0.421
0.258
0.214
0.198
0.194
0.195
0.200
0.206
0.214
35
0.95
0.960
0.754
0.735
0.765
0.651
0.463
0.426
0.423
0.435
0.454
0.477
0.504
0.532
0.544
0.364
0.321
0.310
0.313
0.321
0.333
0.348
0.364
0.382
0.490
0.314
0.268
0.254
0.251
0.255
0.262
0.272
0.282
0.294
0.364
0.456
0.283
0.236
0.219
0.214
0.215
0.219
0.226
0.234
0.99
1.225
0.971
0.942
0.969
0.795
0.579
0.532
0.525
0.535
0.554
0.576
0.603
0.631
0.648
0.445
0.395
0.381
0.381
0.389
0.401
0.415
0.431
0.448
0.573
0.378
0.327
0.309
0.305
0.307
0.314
0.322
0.333
0.345
0.413
0.526
0.337
0.284
0.265
0.258
0.258
0.261
0.267
0.274
Окончание таблицы 1
n
50
100
m
10
15
20
1
2
3
4
5
6
7
8
9
10
15
20
30
40
1 
0.8
0.203
0.256
0.315
0.337
0.186
0.142
0.123
0.115
0.111
0.110
0.111
0.113
0.116
0.138
0.164
0.222
0.283
0.85
0.212
0.264
0.324
0.348
0.194
0.149
0.129
0.120
0.116
0.115
0.116
0.118
0.121
0.142
0.169
0.227
0.288
0.9
0.223
0.276
0.335
0.362
0.204
0.157
0.137
0.128
0.123
0.122
0.123
0.125
0.127
0.148
0.175
0.233
0.295
0.95
0.242
0.294
0.354
0.384
0.220
0.171
0.150
0.139
0.135
0.134
0.133
0.135
0.138
0.158
0.184
0.242
0.305
0.99
0.283
0.335
0.394
0.427
0.251
0.199
0.175
0.164
0.158
0.156
0.156
0.157
0.159
0.179
0.205
0.263
0.325
В [7] показано, что оценка (4) быстрее чем (2) сходится к (1), и доказано равенство:
 m  1! 
2
H c  H   m ln 2m  ln
(5)
.
n
(2m  1)!
Так как существует прямая зависимость вида (5) между оценками, замена 2 на коэффициент c в статистике (3) не повлияет на мощность критерия.
Совсем недавно было предложено два критерия, использующих другие оценки энтропии:

U i  m  U i m
1 n 
(6)
HY1    ln 
,

ˆ
ˆ
n i 1  F U i  m   F U i m  



  Fˆ U i  m   Fˆ U i m  
n
U i  m  U i m
(7)
HY2    ln 
,
 n

ˆ
ˆ
i 1  F
 U i  m   F U i m     Fˆ U j  m  Fˆ U j m 
 j 1

 



где
U  U i 1 
1
n 1 
 i
Fˆ U i  
i 
 , i  2,..., n  1,
n(n  1)  n  1 U i 1  U i 1 
1
.
Fˆ U1   1  Fˆ U n  
(n  1)
Несколько ранее в [8] была представлена оценка (7), а позже в [9] было предложено использовать оценки (6) и (7) в качестве статистик критериев проверки равномерности.
Некоторая неопределенность при использовании энтропийных критериев со статистиками (3), (6) и (7) связана с выбором размера окна m , так как от этого зависят не только распределения статистик при справедливости проверяемой гипотезы H 0 , но и мощность критериев.
36
В [9] был рекомендован выбор m (см. табл. 2) в зависимости от объѐмов выборки n .
Именно рекомендованные значения m* были использованы при исследовании мощности
критериев.
Таблица 2. Оптимальные значения m* [9]
n
n5
6 n8
9  n  18
n
19  n  29
30  n  39
40  n  100
m*
1
2
3
m*
4
5
6
3. Исследование мощности критериев
В ходе работы был проведен сравнительный анализ мощности трѐх критериев. Оценки
мощности критериев со статистиками (3) и (7), полученные в ходе моделирования, можно
увидеть в таблицах 3-5. Мощности критерия со статистикой (6) в таблицы не включены, так
как они отличаются от мощности критерия со статистикой (3) на величину не более погрешности моделирования. Оценки мощности получены при m  m* (см. табл. 2).
Рассмотренные критерии показывают очень высокую мощность относительно конкурирующей гипотезы H1 . Причем бòльшую мощность показывает критерий со статистикой (7).
В то же время относительно конкурирующих гипотез H 2 и H 3 критерий со статистикой
(7) демонстрирует меньшую мощность по сравнению с критериями со статистиками (3) и (6).
Как упоминалось выше, многие из критериев равномерности страдают следующим недостатком: при малых n и малых  они оказываются смещѐнными относительно конкурирующей гипотезы H1 . Этого недостатка не отмечается у критериев (3), (6), (7), использующих
оценки энтропии.
Таблица 3. Мощности критериев относительно гипотезы H1 при m*
n
10
20
30
40
50
100
Статистика

*
H m ,n
HY2

H m* , n
HY2

H m* , n
HY2

H m* , n
HY2

H m* , n
HY2

H m* , n
HY2







0.15
0.1
0.05
0.025
0.01
0.347
0.254
0.145
0.080
0.035
0.362
0.265
0.151
0.083
0.036
0.464
0.361
0.228
0.140
0.071
0.515
0.407
0.262
0.163
0.082
0.562
0.459
0.311
0.204
0.112
0.636
0.532
0.373
0.250
0.143
0.648
0.548
0.395
0.273
0.160
0.733
0.638
0.481
0.346
0.211
0.696
0.601
0.449
0.324
0.199
0.789
0.704
0.557
0.421
0.274
0.853
0.790
0.669
0.546
0.399
0.925
0.883
0.793
0.687
0.540
37
В целом критерии показывают неплохую мощность и относительно H 2 и H 3 , но уступают многим, как непараметрическим критериям согласия, так и специальным критериям
равномерности (например, критериям Хегази–Грина [10], Фросини [11], Неймана–Бартона
[12]). Подчеркнѐм, что относительно конкурирующей гипотезы H 2 для всех 3-х критериев
отмечается небольшая смещѐнность при объемах выборок n  10 .
Таблица 4. Мощности критериев относительно гипотезы H 2 при m*
n
Статистика

*
H m ,n
10
HY2

*
H m ,n
20
HY2

H m* , n
30
HY2

H m* , n
40
HY2

H m* , n
50
HY2
100

H m* , n






HY2

0.15
0.1
0.05
0.025
0.01
0.144
0.097
0.050
0.026
0.011
0.140
0.095
0.049
0.025
0.011
0.166
0.115
0.062
0.033
0.015
0.154
0.106
0.056
0.030
0.013
0.192
0.136
0.076
0.042
0.020
0.169
0.118
0.065
0.036
0.017
0.217
0.158
0.092
0.053
0.026
0.184
0.131
0.074
0.042
0.020
0.252
0.188
0.113
0.069
0.035
0.210
0.153
0.089
0.052
0.026
0.407
0.327
0.224
0.151
0.088
0.340
0.266
0.174
0.113
0.063
Таблица 5. Мощности критериев относительно гипотезы H 3 при m*
n
10
20
30
40
50
100
Статистика

*
H m ,n
HY2

H m* , n
HY2

H m* , n
HY2

H m* , n
HY2

H m* , n
HY2

H m* , n
HY2







0.15
0.1
0.05
0.025
0.01
0.169
0.115
0.060
0.031
0.013
0.168
0.114
0.059
0.030
0.013
0.192
0.134
0.071
0.038
0.017
0.191
0.133
0.071
0.038
0.016
0.215
0.152
0.084
0.046
0.021
0.212
0.150
0.082
0.045
0.020
0.237
0.172
0.098
0.055
0.026
0.233
0.167
0.094
0.053
0.024
0.260
0.191
0.111
0.064
0.031
0.254
0.185
0.107
0.061
0.029
0.355
0.275
0.175
0.110
0.058
0.347
0.267
0.169
0.105
0.055
38
4. Выбор размера окна m
Выбор оптимального размера окна m для рассмотренных критериев представляет собой
актуальную проблему. Большинство авторов предлагают использовать такие m , при которых значения непараметрических оценок энтропии ближе к теоретическому. Но размер окна
m влияет также на мощность критериев. Причѐм оптимальное m зависит и от конкурирующей гипотезы.
В данной работе нами были получены оптимальные значения m , при которых критерий
Дудевича–ван дер Мюлена (3) показывает наибольшую мощность относительно конкурирующих гипотез H1 , H 2 и H 3 . Полученные результаты относительно гипотез H 2 и H 3 пред-
ставлены в таблицах 6 и 7. А относительно гипотезы H1 мощность всегда возрастает при
увеличении m , другими словами максимальная мощность в этом случае всегда будет при
 n  1
.
m
 2 
Таблица 6. Оптимальные значения m относительно гипотезы H 2
n
m
n
m
n  17
17  n  34
35  n  54
1
2
3
55  n  71
72  n  89
89  n  100
4
5
6
Таблица 7. Оптимальные значения m относительно гипотезы H 3
n
m
n
m
5  n  10
11  n  21
22  n  30
31  n  38
2
3
4
5
39  n  50
51  n  60
61  n  72
73  n  100
6
7
8
9
Аналогичные исследования были выполнены для других критериев. Для критерия со статистикой (6) результаты оказались идентичными полученным для критерия Дудевича–ван
дер Мюлена со статистикой (3).
Однако для критерия со статистикой (7) результаты отличаются. Относительно гипотезы
H1 (как и в случае других критериев) мощность всегда возрастает при увеличении m . Но
относительно гипотез H 2 и H 3 мощность достигает максимального значения при других
размерах окна m .
Некоторые оценки мощности критерия со статистикой (7) относительно конкурирующих
гипотез H 2 и H 3 при  0.05 представлены в таблице 8.
5. Заключение
Критерии, базирующиеся на оценках энтропии, представляют собой достаточно эффективные критерии проверки гипотез о принадлежности наблюдений равномерному закону. В
частности они, как правило, существенно превосходят критерии равномерности, в которых
используются разности последовательных порядковых статистик [13–15] (например, критерии Шермана [16], Кимбелла [17], Янга [18]).
39
Относительно конкурирующих гипотез вида H 2 или H 3 эти критерии несколько уступают в мощности критериям типа Хегази–Грина [10], Фросини [11], Неймана–Бартона [12], но
у них отсутствует смещѐнность относительно конкурирующих гипотез вида H1 и, даже более того, относительно такого рода гипотез они имеют преимущество в мощности перед
большинством критериев, включая непараметрические критерии согласия, особенно при
больших размерах окна m .
Таблица 8. Оценки мощности критерия со статистикой (7) относительно гипотез H 2 и H 3
n
1
10
20
30
40
50
100
0.057
0.072
0.085
0.097
0.108
0.155
10
20
30
40
50
100
0.059
0.068
0.075
0.081
0.087
0.111
Размер окна m
2
3
4
Относительно H 2
0.052
0.049
0.046
0.067
0.062
0.056
0.082
0.076
0.070
0.0968
0.092
0.086
0.111
0.108
0.102
0.176
0.1836
0.184
Относительно H 3
0.060
0.059
0.058
0.071
0.072
0.071
0.081
0.0834
0.0835
0.090
0.094
0.0953
0.098
0.104
0.1072
0.133
0.148
0.159
5
6
–
0.052
0.065
0.080
0.095
0.180
–
0.049
0.060
0.074
0.089
0.174
–
0.069
0.082
0.0953
0.1075
0.165
–
0.068
0.081
0.094
0.1073
0.169
Но так как при слишком больших m с использованием этих критериев хуже распознаются другие гипотезы (вида H 2 или H 3 ), рекомендуется применять критерий при нескольких
размерах окна m или использовать критерий совместно с рядом других критериев, хорошо
отличающих равномерное распределение от законов, соответствующих H 2 и H 3 (например,
наряду с критериями равномерности Неймана–Бартона, Хегази–Грина, Фросини или критерием согласия Андерсона–Дарлинга).
С точки зрения оценивания энтропии лучше использовать оценки (4), (6) и (7) с авторскими рекомендациями по выбору размера окна, поскольку они принимают более близкие
значения к величине H  f  чем оценка (2).
Литература
Лемешко Б. Ю. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход : монография / Б.Ю. Лемешко,
С.Б. Лемешко, С.Н. Постовалов, Е.В. Чимитова. – Новосибирск : Изд-во НГТУ, 2011. –
888 с.
2. Лемешко Б. Ю. Непараметрические критерии согласия: Руководство по применению /
Б. Ю. Лемешко.– М.: НИЦ ИНФРА-М, 2014. – 163 с.
3. Лемешко Б. Ю. Критерии проверки отклонения распределения от нормального закона:
Руководство по применению / Б. Ю. Лемешко. – М.: НИЦ ИНФРА-М, 2015. – 160 с. –
(Научная мысль). – www.dx.doi.org/10.12737/6086.
4. Shannon C. E. A mathematical theory of communications / C. E. Shannon // Bell System Technical Journal. – 1948. – V.27. – P. 379-423, 623-656.
1.
40
5. Vasicek O. A test for normality based on sample entropy. / O. Vasicek // J. R. Statist. Soc. –
1976. – Ser. B. V.38. – P. 54-59.
6. Dudewics E. J., van der Meulen E. C. Entropy-based test of uniformity // J. Amer. Statist. Assoc. – 1981. – V.76. No. 376. – P. 967-974.
7. Ebrahimi N., Pflughoert K., Soofi E. Two measures of sample entropy // Statistics & Probability Letters. – 1994. – V.20. – P. 225-234.
8. Yousefsadeh F., Arghami N. R. Testing exponentiality based on type II censored data and a new
CDF estimator. // Communications in Statistics - Simulation and Computation. – 2008. – V.37.
– P. 1479-1499.
9. Zamanzade E. Testing uniformity based on new entropy estimators // Journal of Statistical
Computation and Simulation. – 2014. DOI: 10.1080/00949655.2014.958085.
10. Hegazy Y. A. S. Some new goodness-of-fit tests using order statistics / Y. A. S. Hegazy,
J. R. Green // Applied Statistics. – 1975. – V.24, №3. – P. 299-308.
11. Frosini B. V. On the distribution and power of goodness-of-fit statistic with parametric and
nonparametric applications, “Goodness-of-fit” / Ed. by Revesz P., Sarkadi K., Sen P.K.
//Amsterdam-Oxford-New York: North-Holland Publ. Comp. – 1987. – P. 133-154.
12. Neyman J. “Smooth” tests for goodness-of-fit / J. Neyman // Scandinavisk Aktuarietidskrift. –
1937. – V.20. – P. 149-199.
13. Блинов П. Ю., Лемешко Б. Ю. О мощности критериев, используемых для проверки гипотез о принадлежности выборок равномерному закону // Материалы Российской НТК
“Обработка информационных сигналов и математическое моделирование”, Новосибирск. 2013. – С.35-38.
14. Blinov P. Yu., Lemeshko B. Yu. A review of the properties of tests for uniformity // 2014 12th
Iinternational Conference on Actual Problems of Electronics Instrument Engineering (APEIE)
34006 Proceedings. Vol. 1. Novosibirsk, 2014. – P.540-547.
15. Блинов П. Ю., Лемешко Б. Ю. Обзор свойств критериев равномерности // Труды XII
международной конференции “Актуальные проблемы электронного приборостроения”
АПЭП-2014. Т.6, Новосибирск, 2014. – С.29-36.
16. Sherman B. A random variable related to the spacing of sample values / B. Sherman // The Annals of Mathematical Statistics. – 1950. – V.21, №3. – P. 339-361.
17. Kimball B. F. Some basic theorems for developing tests of fit for the case of the non-parametric
probability distribution function./ B. F. Kimball // The Annals of Mathematical Statistics. –
1947. – V.18, №1. – P. 540-548.
18. Young D. L. The linear nearest neighbour statistic / D. L. Young // Biometrika. – 1982. – V.69,
№2. – P. 477-480.
Лемешко Борис Юрьевич
Д.т.н., профессор, г.н.с. кафедры теоретической и прикладной информатики НГТУ
(630073, Новосибирск, просп. Карла Маркса, 20), e-mail: lemeshko@ami.nstu.ru
Блинов Павел Юрьевич
Аспирант кафедры теоретической и прикладной информатики НГТУ (630073, Новосибирск, просп. Карла Маркса, 20), e-mail: blindizer@ya.ru.
The uniformity tests based on entropy estimators
P. Yu. Blinov, B. Yu. Lemeshko
The uniformity tests based on entropy estimators are considered. Distributions of test statistics,
power of tests under different competing hypotheses are studied. We provide recommendations
for using tests based on results of studies. Problem of choosing a values of window size is considered. Underlines that this type of uniformity tests has clear advantage in some cases.
Key words: uniform distibution, entropy estimator, test, test statistic, test power, window size
41
О критериях проверки отсутствия тренда в характеристиках рассеяния
О критериях проверки отсутствия тренда
в характеристиках рассеяния
И. В. Веретельникова, Б. Ю. Лемешко1
Методами статистического моделирования исследованы распределения статистик множества параметрических и непараметрических критериев, предназначенных для проверки
гипотез о случайности или об отсутствии тренда в характеристиках рассеяния. Соответствующие исследования проводились при справедливости проверяемой гипотезы в зависимости от объемов выборок. Предложена и реализована процедура интерактивного моделирования распределений статистик критериев, что позволило корректно применять
соответствующие критерии в условиях нарушения стандартных предположений. Приводятся результаты сравнительного анализа мощности критериев по отношению к конкурирующим гипотезам с различными моделями линейного, периодического и смешанного
тренда в характеристиках рассеяния, делаются выводы о предпочтительности использования тех или иных критериев.
Ключевые слова: тренд, гипотеза о случайности, статистическое моделирование, мощность критерия.
1. Введение
Для проверки гипотезы о случайности или об отсутствии тренда как в математическом
ожидании, так и в характеристиках рассеяния в разное время предложено множество параметрических и непараметрических критериев. Однако имеющиеся источники не позволяют
судить о преимуществах тех или иных критериев. Существующие работы не содержат четких рекомендаций, очерчивающих область применения и предпосылки, выполнение которых
обеспечивает корректность статистических выводов при использовании рассматриваемых
критериев. Основной предпосылкой, обеспечивающей корректное применение параметрических критериев, как правило, является предположение о нормальном законе распределения
шума, что далеко не всегда выполняется на практике. Использование непараметрических
критериев опирается на асимптотические распределения статистик этих критериев. При
ограниченных объемах выборок распределения статистик параметрических и непараметрических критериев могут существенно отличаться от соответствующих предельных распределений статистик, используемых в процедуре проверки гипотезы. В случае непараметрических критериев проблема зачастую усугубляется из-за ярко выраженной дискретности статистики. В таких ситуациях использование при проверке гипотезы предельного (асимптотического) распределения статистики вместо «истинного» распределения этой статистики может
приводить к неверному выводу.
В данной работе методами статистического моделирования исследовались распределения статистик и мощность ряда статистических критериев, ориентированных на проверку
гипотез об отсутствии тренда в характеристиках рассеяния (в дисперсии) наблюдаемой последовательности случайных величин (результатов измерений).
1
Работа выполнена при поддержке Министерства образования и науки РФ в рамках проектной части государственного задания (№ 2.541.2014/К).
42
2. Общие сведения о проверяемых статистических гипотезах
При проверке отсутствия тренда в характеристиках рассеивания задача формулируется
следующим образом. Предполагается, что наблюдается временной ряд значений x1 , x2 ,..., xn
взаимно независимых случайных величин. Проверяется гипотеза H 0 : i  , i  1, 2, ... , n , о
том, что все выборочные значения принадлежат к одной генеральной совокупности со среднеквадратическим отклонением  , против конкурирующей гипотезы о наличии тренда
Hl : i 1  i
 0 , i 1, 2, ... , n  1.
При проверке отсутствия сдвига в дисперсии (в характеристиках рассеяния) предполагается, что наблюдаемая последовательность измерений x1 , ..., xn имеет одно и то же среднее
 . Проверяется гипотеза H 0 : 12 ... n2 02
гипотезы
( 02 неизвестно) против конкурирующей
Hl : 12 22 ... 2k 02 ; 2k 1 2k  2 ... 2n 02  ; (  0) ,
утверждающей, что значение дисперсии меняется в некоторой неизвестной точке, то есть k
неизвестно ( 1  k  n  1).
Анализ мощности критериев проводился для ситуации принадлежности наблюдаемых
случайных величин нормальному закону. Проверяемой гипотезе H 0 соответствует выполнение предположения о независимости наблюдаемых случайных величин (отсутствие тренда).
В качестве конкурирующих гипотез рассматривались различные ситуации, соответствующие
наличию тренда в дисперсии.
Для критериев обнаружения изменения дисперсии в неизвестной точке при анализе
мощности критериев в качестве конкурирующих гипотез (при нормальном распределении
случайных величин) рассматривались близкие к H 0 гипотезы, когда в некоторый момент
стандартное отклонение увеличивалось на 5, 10, 15%:
H1 : 12 ... 2k 1; 2k 1 ... 2n 1.1025,
H 2 : 12 ... 2k 1; 2k 1 ... 2n 1.21,
H3 : 12 ... 2k 1; 2k 1 ... 2n 1.3225,
где k  n 2 .
В качестве более далекой рассматривалась конкурирующая гипотеза
H 4 : 12 ... 2k 1; 2k 1 ... 2n 4 .
Поскольку временной ряд, соответствующий гипотезе Н1 , визуально не отличим от
ядов, соответствующих гипотезам Н 2 , Н3 , на рис. 1 для сравнения приведен только временной ряд при Н1 .
Наличие линейного тренда в характеристиках рассеяния наблюдаемого ряда случайных
величин (изменение масштабного параметра) на интервале t  [0,1] может моделироваться в
соответствии с соотношением
xi 
i (1  cti ) ,
(1)
где c  (1, ) , ti  (i  1)t , t 1 / n Справедливой проверяемой гипотезе Н 0 соответствует значение параметра c  0 .
В случае наличия периодического тренда в характеристиках рассеяния случайные величины могут моделироваться, например, в соответствии с соотношением
xi 
 i (1  d  sin(2k ti ))
(2)
при d  1 . В случае смешанного тренда – в соответствии с выражением
43
xi 
 i (1  cti  d sin(2k ti )) ,
(3)
при d  1 , если c  0 , и при d  1  c , если c (1, 0) . Отсутствию периодической составляющей тренда соответствует значение параметра d  0 , а отсутствию линейной – c  0 .
Рис. 1. Тренд, соответствующий гипотезам Н0 , Н1 , Н 4
При анализе мощности относительно линейного, периодического и смешанного тренда в
характеристиках рассеяния (в дисперсии) случайной величины рассматривались конкурирующие гипотезы:
H5 : xi 
i (1  cti ), c 
1;
H6 : xi  i (1  d  sin(2k ti )), d 0.8, k 2;
H7 : xi 
 i (1  cti  d sin(2k ti )), c 
1, d 
0.8, k 
2;
Вид соответствующих процессов демонстрируется на рис. 2 – 4.
Рис. 2. Линейный тренд в характеристиках рассеяния при H 5
44
Рис. 3. Периодический тренд в характеристиках рассеяния при H 6
Рис. 4. Смешанный тренд в характеристиках рассеяния при H 7
Рассматриваемые ниже критерии сравнивались по мощности относительно конкурирующих гипотез H1  H 7
3. Критерии обнаружения тренда в характеристиках рассеяния
3.1. Критерий Фостера–Стюарта
В зависимости от вида используемой статистики этот непараметрический критерий может применяться для проверки гипотез об отсутствии тренда в средних значениях или в дисперсиях (в характеристиках рассеяния). Критерий, используемый для обнаружения тренда в
характеристиках рассеяния, имеет вид [1]:
n
S   Si ,
где Si ui  li ;
ui  1 , если xi  xi 1 , xi 2 , ..., x1 , иначе ui  0 ;
li  1 , если xi  xi 1 , xi 2 , ..., x1 , иначе li  0 .
Очевидно, что 0  S  n  1 .
i 2
45
(4)
где
При отсутствии тренда нормализованные статистики:
S 
t
,
ˆ S
(5)
1
 2ln n  3, 4253 ,
i2
приближенно описываются распределением Стьюдента с   n степенями свободы. Проверя1
i 2 i
n
n
  2 , ˆ S   4
i 2
емая гипотеза об отсутствии соответствующего тренда отклоняется при больших по модулю
значениях статистик (5).
На самом деле областью определения статистики t является область дискретных значений. Исследование распределений статистики показало, что даже при достаточно больших
объемах выборок порядка n  100, 200 дискретные распределения статистики критерия существенно отличаются от распределения Стьюдента с n степенями свободы [2]. Функции распределения статистики t показаны на рис. 5.
Рис. 5. Функции распределения статистики (5) критерия
Фостера–Стюарта в зависимости от объѐмов выборок
Отсюда следует, что использование для вычисления достигнутого уровня значимости (pvalue) вместо действительных (дискретных) распределений статистик асимптотических t распределений Стьюдента может приводить к существенным ошибкам.
3.2. Критерий Кокса–Стюарта
Критерий Кокса–Стюарта при проверке гипотезы об отсутствии тренда в дисперсии (в
характеристиках рассеяния) строится следующим образом.
Исходная выборка x1 ,..., xn разбивается на [n / k ] подвыборок объемом k элементов
x1 ,..., xk ; xk 1 ,..., x2 k ; x2 k 1 ,..., x3k ; ...; xnk 1 ,..., xn (если n не делится на k , отбрасывается необходимое число измерений в центре). Для каждой i -й подвыборки находится размах wi
( 1  i  r , r   n k  ). Далее полученная последовательность размахов wi проверяется на
наличие тренда в средних значениях критерием со статистикой
S  E[ S1 ]
,
S1*  1
D[ S1 ]
где
46
(7)

S1
 n 2
 (n  2i  1)hi, n  i 1 , E[S1 ] 
i 1
n(n2  1)
n2
, D[ S1 ] 
,
24
8
где hi, j  1 , если x  x , и hi, j  0 , если xi  x j ( i  j ). При справедливости проверяемой
гипотезы об отсутствии тренда распределение (7) приближенно описывается стандартным
нормальным законом.
Величину k в [3] рекомендуется выбирать из следующих соотношений:
4;
n  90  k 
5 ; 64  n  90  k 
48  n  64  k 
3 ; n  48  k 
2.
Дискретность распределения статистики S1* при обнаружении тренда в дисперсии заметно выше дискретности распределения статистики Кокса–Стюарта для тренда в средних. Это
естественно, так как анализируемая выборка размахов содержит лишь [n / k ] элементов. При
использовании критерия Кокса–Стюарта для обнаружения тренда в дисперсиях отличием
дискретного распределения статистики от стандартного нормального закона можно практически пренебречь лишь при n  170 [4].
i
j
3.3. Критерии Хсу обнаружения «сдвига дисперсии» и определения точки сдвига
В данном критерии отклонение проверяемой гипотезы о случайности (об отсутствии
тренда) может свидетельствовать об обнаружении “сдвига дисперсии”. Статистика критерия
Хсу имеет вид [5]
n
 (i  1)( xi  mx )2
H  i 1
, 0  H  1,
n
(n  1)  ( xi  mx )
(8)
2
i 1
где mx  медиана вариационного ряда. В предположении, что математические ожидания последовательности случайных величин имеют одно и то же значение, проверяется гипотеза о
неизменности дисперсий. В качестве конкурирующей гипотезы может рассматриваться изменение дисперсии наблюдаемых величин в некоторый (неизвестный) момент (начиная с некоторого элемента выборки). Критерий двусторонний: проверяемая гипотеза об отсутствии
сдвига в дисперсии отклоняется при малых и больших значениях статистики (8).
Обычно критерий используется в нормализованной форме
H 1 / 2
H* 
,
(9)
D[ H ]
n 1
где D[ H ] 
.
6(n  1)(n  2)
Статистика (9) при справедливости гипотезы об отсутствии изменения дисперсии в
асимптотике подчиняется стандартному нормальному закону.
Результаты моделирования показали [6], что при n  30 распределение статистики достаточно хорошо согласуется со стандартным нормальным законом.
Распределения статистики (9) сильно зависят от закона распределения, которому принадлежат случайные величины. При этом наибольшее отклонение от стандартного нормального закона наблюдается в случае принадлежности случайных величин законам с тяжелыми
хвостами. Существенно влияет на распределение статистики и асимметричность закона.
Критерий, позволяющий определить точку изменения дисперсии (в случае принадлежности наблюдений нормальному закону), предложен в [5]. Статистика этого критерия строится
следующим образом. Пусть
для k 1, 2,..., n  1
47

wk
k
 ( xi  mx )2 ,
i 1
w  wk k
Wk  n
,
wk
nk
где k соответствует искомой точке изменения дисперсии. В случае принадлежности xi нормальному закону величины 
Wk , k 1, 2,..., n  1 , принадлежат соответствующим Fn  k , k (W ) распределениям Фишера с n  k и k степенями свободы.
Далее по соответствующим функциям распределения находим  k 
Fn  k , k (Wk ) , где при
отсутствии «сдвига в дисперсии»  k должны подчиняться равномерному закону.
Статистика G-критерия имеет вид

G
1 n 1
  k , 0  G  1.
n  1 k 1
(10)
Гипотеза об отсутствии изменения дисперсии отклоняется с уровнем значимости  , если
G  G / 2 или G  G1 / 2 . В этом случае значение k , которому соответствует максимальная
величина  k  1 2 , дает оценку искомой точки изменения значения дисперсии в наблюдаемом ряду. При x1  mx значение w1  0 , значит W1   и 1 
1.
Изменение распределения статистики (10) в зависимости от объема выборки для случая
выполнения предположения о нормальности анализируемых выборок иллюстрирует рис. 6.
В первоисточниках вид предельного распределения статистики (10) не приводится, даны
лишь процентные точки.
На основе результатов статистического моделирования нами было показано, что хорошей моделью предельного распределения статистики (10) является бета-распределение 1-го
рода с плотностью
 x  3 
1


2 (0 , 1 )  2 
0 1
 1
 x  3  1
1 

2 

1 , 3 
2.7663 , 1 2.7663 , 2 
0 . Опираясь на этот закон
и значениями параметров 0 
можно находить процентные точки G / 2 и G1 / 2 или значения p-value.
f ( x)

Рис. 6. Сходимость распределения статистики (10) G-критерия
к бета-распределению 1-го рода
48
G-критерий также относится к параметрическим критериям. Поэтому распределения его
статистики существенно зависят от вида наблюдаемого закона.
В случае нарушения стандартного предположения о нормальности xi законами величин

Wk , k 1, 2,..., n  1 , не будут распределениями Фишера. Для корректного применения критерия в нестандартных условиях должны быть найдены и использоваться при вычислении  k
Wk , k 1, 2,..., n  1 (что предпочтительней, так как
действительные распределения величин 
распределение G-статистики будет то же), либо могут использоваться Fn  k , k (W ) -
распределения Фишера, но тогда в этих условиях должно находиться неизвестное распределение G-статистики (что менее предпочтительно, но проще при реализации, так как надо
найти только одно распределение).
3.4. Ранговые критерии обнаружения «сдвига дисперсий» Клотца и Сэвиджа
Ранговые критерии обнаружения изменения параметра масштаба (характеристики рассеяния) в неизвестной точке опираются на использование семейства ранговых статистик вида
[7]
n
S R   ian ( Ri ) ,
(11)
i 1
где Ri – ранги выборочных значений в упорядоченном ряду измерений.
Критерии различаются используемыми метками an . Их вид и определяет название критерия. Часто используются:
 метки Клотца a1n (i)  Ui2(n 1) , где U  –  -квантиль стандартного нормального закона;
 метки Сэвиджа a2n (i ) 
При
справедливости
n
S R, j   ia jn ( Ri ) ,
i 1
E[ S R, j ] 
i
1
 n  j 1.
j 1
проверяемой
гипотезы
H0
критерии
со
статистиками
j  1, 2 свободны от распределения и симметричны относительно
n 1 n
 a jn (i) .
2 i 1
Обычно используются нормализованные критерии со статистиками вида
*
SR
,j 
где
E[ S R,1 ] 

D[ S R,1 ]
S R, j  E[ S R, j ]
D[ S R, j ]
,
n(n  1)
n 1 n 2
;
, E[ S R,2 ] 
U
2
2 i 1 i ( n 1)
2
n(n  1) n 4
1
 E[ S R,1 ] ;

U
12 i 1 i (n 1) 3n  3 

D[ S R,2 ]
n
n(n  1)
1
(n   ) .
12
j
j 1
49
(12)
Статистики (12) приближенно подчиняются стандартному нормальному закону. Сходимость распределений статистик к стандартному закону исследовалась в [Ошибка! Источник
ссылки не найден.Ошибка! Источник ссылки не найден.].
Исследование методами статистического моделирования распределений статистики критерия с метками Клотца показало (см. рис. 7), что при n  20 распределение достаточно хорошо приближается стандартным нормальным законом. Распределения статистики критерия
с метками Сэвиджа также хорошо согласуются со стандартным нормальным законом, но при
n  30 (см. рис. 8).
Рис. 7. Сходимость к стандартному нормальному закону распределения статистики S R* ,1
рангового критерия с метками Клотца
*
Рис. 8. Сходимость к стандартному нормальному закону распределения статистики S R
,2
рангового критерия с метками Сэвиджа
Как можно видеть, дискретностью распределений статистик можно практически пренебречь при n  20
4. Анализ мощности критериев
В ходе работы методами статистического моделирования (для вероятностей ошибок первого рода   0.15, 0.1, 0.05, 0.01 ) были получены оценки мощности исследуемых критери50
ев относительно конкурирующих гипотез H1 , H 2 , H 3 и H 4 , соответствующих сдвигу величины дисперсии. Была исследована мощность критериев относительно конкурирующих гипотез H 5 , H 6 , H 7 , соответствующих наличию линейного или нелинейного тренда в характеристиках рассеяния анализируемых процессов.
Для сравнительного анализа мощности в табл. 1 вынесены оценки мощности только при
уровне значимости   0.1 и объеме выборок n=100. Критерии расположены в порядке убывания мощности 1   .
При близких конкурирующих гипотезах критерии Хсу с H и G статистиками, а также
критерий Клотца показали наиболее высокую мощность относительно рассмотренного множества конкурирующих гипотез. Они показали способность обнаружить тренд в характеристиках рассеяния при его 10% увеличении.
Критерии Хсу с H- и G-статистиками и критерий Клотца также хорошо отличают нулевую гипотезу от конкурирующих, которым соответствует наличие линейного или периодического тренда в характеристиках рассеяния (от гипотез H 5 , H 6 ).
В то же время критерии Кокса–Стюарта, Сэвиджа, Фостера–Стюарта не могут достаточно надежно обнаружить периодический тренд в дисперсии (мала мощность относительно
рассмотренной гипотезы H 6 ).
К сожалению, ни один из рассмотренных критериев не показал способности обнаружить
смешанный тренд в дисперсии (относительно рассмотренной гипотезы H 7 показали чрезвычайно малую мощность).
Таблица 1. Сравнительный анализ мощности всех критериев проверки случайности и отсутствия тренда в дисперсиях (n=100,   0.1 )
№
п/п
Относительно H1
1 
Относительно H 2
1 
Относительно H 3
1 
1
2
3
4
5
6
Хсу Н
Клотца
Хсу G
Кокса–Стюарта
Сэвиджа
Фостера–Стюарта
0.156
0.151
0.147
0.123
0.110
0.106
Хсу Н
Клотца
Хсу G
Кокса–Стюарта
Фостера–Стюарта
Сэвиджа
0.304
0.287
0.269
0.188
0.130
0.129
Хсу Н
Клотца
Хсу G
Кокса–Стюарта
Фостера–Стюарта
Сэвиджа
0.500
0.469
0.430
0.284
0.165
0.159
№
п/п
Относительно H 4
1 
Относительно H 5
1 
Относительно H 6
1 
Хсу Н
Клотца
Кокса–Стюарта
Хсу G
Фостера–Стюарта
Сэвиджа
1
1
0.997
0.993
0.625
0.610
Хсу Н
Хсу G
Клотца
Кокса–Стюарта
Фостера–Стюарта
Сэвиджа
0.836
0.818
0.807
0.489
0.346
0.246
Хсу Н
Клотца
Хсу G
Сэвиджа
Кокса–Стюарта
Фостера–Стюарта
0.711
0.678
0.545
0.196
0.143
0.048
Относительно H 7
1 
Хсу Н
Сэвиджа
Фостера–Стюарта
Хсу G
Кокса–Стюарта
Клотца
0.162
0.095
0.082
0.057
0.052
0.104
1
2
3
4
5
6
№
п/п
1
2
3
4
5
6
51
5. Заключение
Таким образом, методами статистического моделирования исследованы распределения
статистик множества параметрических и непараметрических критериев случайности и отсутствия тренда в характеристиках рассеивания; для ситуации нарушения стандартных предположений в рамках развиваемого программного обеспечения ISW реализован интерактивный
режим исследования распределений статистик. Проведен сравнительный анализ мощности
критериев относительно некоторых конкурирующих гипотез, что позволяет судить о предпочтительности применения тех или других критериев. Отмечены недостатки отдельных
критериев.
Литература
1. Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников / А. И. Кобзарь. – М. : Физматлит, 2006. – 816 с.
2. Веретельникова И.В., Лемешко Б.Ю. Аналитический обзор критериев проверки случайности и отсутствия тренда // Труды XII международной конференции “Актуальные проблемы электронного приборостроения” АПЭП-2014. Т.6, Новосибирск, 2014. – С.16-23.
3. Cox D.R., Stuart A. Quick sign tests for trend in location and dispersion // Biometrika. 1955.
V.42. P.80–95.
4. Веретельникова И.В., Лемешко Б.Ю. О применении критериев проверки гипотез о случайности или об отсутствии тренда // Высокие технологии, фундаментальные исследования, инновации : сборник статей Семнадцатой международной научно-практической
конференции «Фундаментальные и прикладные исследования, разработка и применение
высоких технологий в промышленности и экономике», 22-23 мая 2014 г., СанктПетербург, Россия / научные редакторы А.П. Кудинов, М.А. Кудинов. – СПб.: Изд-во
Политехн. ун-та, 2014. – С.33-37.
5. Hsu D. A. Test for variance shift at an unknown time point / D. A. Hsu // Appl. Statist., 1977.
V.26, № 3. P.279–284.
6. Лемешко Б.Ю., Комиссарова А.С., Щеглов А.Е. Применение некоторых критериев проверки гипотез случайности и отсутствия тренда // Метрология. 2010. № 12. – С. 3-25.
7. Лемешко Б.Ю., Комиссарова А.С., Щеглов А.Е. Свойства и мощность некоторых критериев случайности и отсутствия тренда // Научный вестник НГТУ. – 2012. – № 1(46). – С.
53-66.
Лемешко Борис Юрьевич
д.т.н., профессор, г.н.с. кафедры теоретической и прикладной информатики НГТУ
(630073, Новосибирск, просп. Карла Маркса, 20), e-mail: lemeshko@ami.nstu.ru
Веретельникова Ирина Викторовна
аспирантка кафедры теоретической и прикладной информатики НГТУ (630073, Новосибирск, просп. Карла Маркса, 20), e-mail: ira-veterok@mail.ru.
About the tests for checking of the absence of a trend in the characteristics of the scattering
52
I.V. Veretelnikova, B. Yu. Lemeshko
The statistic distributions of a variety of parametric and nonparametric tests designed to test hypotheses of randomness or absence of a trend in variance were investigated with Monte-Carlo
algorithm, corresponding to the truth of the hypothesis under test in accordance with sample
sizes. Procedure of interactive simulation of statistic distributions tests is proposed and implemented that allowed to apply the relevant test correctly in conditions of violation of standard assumptions. The results of comparative analysis of power of the tests against competing hypotheses with different models of linear, periodic, mixed trend, conclusions about preferability of using a particular test are made.
Keywords: trend, hypothesis of randomness, Monte-Carlo simulation, power of the test.
53
Робастное оценивание параметров политомической логистической регрессии
Робастное оценивание параметров политомической
логистической регрессии
И. Д. Воронова, Д. В. Лисицин
В работе теория робастного оценивания параметров по многомерным неоднородным неполным данным применяется к модели политомической (мультиномиальной) логистической регрессии. В основе теории лежит синтез подхода Ф. Хампеля, связанного с функцией влияния, и подхода А.М. Шурыгина, связанного с байесовским точечным засорением распределения. Оценки обеспечивают устойчивость к отклонению распределения
наблюдений от постулированного. В работе рассматриваются способы вычисления оценок, приводятся результаты исследования методом Монте-Карло.
Ключевые слова: оценивание параметров, робастность, функция влияния, политомическая логистическая регрессия, номинальный отклик.
1. Введение
Классические статистические процедуры опираются на ряд предположений, которые на
практике могут не выполняться. В таких условиях многие распространенные статистические
процедуры, например, основанные на методе максимального правдоподобия (ММП), теряют
свои положительные качества. Для решения этой проблемы могут использоваться робастные
оценки [1, 2].
Теория робастности развита, в основном, для моделирования непрерывных случайных
величин. Моделированию качественных переменных уделяется гораздо меньше внимания, а
имеющиеся подходы базируются на эвристических суждениях. Последнее подтверждается,
например, немногими имеющимися работами, посвященными робастному оцениванию параметров регрессионной модели с политомическим (мультиномиальным), т.е. имеющим более двух значений, качественным откликом [3–5].
В [6] описана достаточно общая теория оптимального оценивания неизвестных параметров модели по многомерным неоднородным неполным данным, которая применима, в том
числе, и для политомической регрессионной модели [7, 8]. Данная теория основана на синтезе подхода Ф. Хампеля [1], связанного с функцией влияния, и подхода А.М. Шурыгина [2],
связанного с байесовским точечным засорением модельного распределения. Оценки обеспечивают устойчивость к отклонению распределения наблюдений от постулированного.
В данной работе, являющейся продолжением работ [7, 8], рассматриваются способы вычисления оценок параметров и описываются результаты исследования оценок методом Монте-Карло.
2. Элементы теории робастного оценивания параметров
Пусть распределение дискретной случайной величины  t в t -м наблюдении задаѐтся
набором модельных вероятностей

P  t j
| xt ,   j ( xt , ) , t  1,..., N , j  1,..., J ,
где xt – вектор детерминированных входных переменных,  – вектор параметров.
54
М-оценка ̂ вектора параметров  находится по наблюдениям zt случайных величин
 t как решение системы уравнений
N
  ( zt , xt , ˆ )  0 ,
t 1
(1)
где  ( zt , xt , ˆ ) – векторная оценочная функция, удовлетворяющая для всех t условию
J
  j ( xt , ) ( j, xt , )  0 .
j 1
(2)
Одним из основных показателей робастности оценки является функция влияния [1], которая в рассматриваемом случае при некоторых условиях регулярности имеет вид
IF( z, x,  )  M 1 ( z, x,  ) ,
N
J
где M     ( j , xt , )

 j ( xt , ) .
 T
Показателем качества выбирается квадрат весовой L2 -нормы функции влияния
t 1 j 1
N
J
 s ( ) 
  IFT ( j, xt , )W IF( j, xt , ) s j ( xt , ) ,
t 1 j 1
T
, sJ ) , s j ( xt , )  0 – весовая функция, W  W ( ) – некоторая симметричная
положительно определѐнная весовая матрица.
Также данный показатель можно проинтерпретировать в соответствии с моделью байесовского точечного засорения, когда первый аргумент функции влияния в t -м наблюдении
является случайной величиной с набором вероятностей s j ( xt , ) , j  1,..., J . Тогда
где s  (s1,
N
 s ( ) 
 Est IFT ( j, xt , )W IF( j, xt , )  ,
t 1
где E st – математическое ожидание по распределению {s j ( xt ,  ), j  1,..., J } .
Оптимальная оценочная функция является решением оптимизационной задачи:

 s arg min  s ( )

при ограничениях (2), и имеет вид
 
  ( x, )
 s ( z, x
, ) C  ln  z ( x,  )    z 
 
 sz ( x, )


2



(
x
,

)
s
(
x
,

)

j
j
  z ( x,  ) ,
 C
ln  j ( x,  )  jz 
J

 s ( x,  )
2
j 1 
  l ( x, ) sl ( x, )  z

l 1


J
(3)
где C  C ( ) – невырожденная матрица, зависящая от W и несущественная для оценивания,
вектор    ( x,  ) обеспечивает выполнение условия (2),  jz – символ Кронекера [7, 8].
55
Важным частным случаем оценок являются обобщѐнные радикальные оценки, соответ1 
ствующие выбору
s j ( x, )  j ( x, ) 

J
1 
величина ( x, ,  ) 
  l ( x, )
l 1
( x, ,  ) , где  – параметр робастности (   0 ),
используется для обеспечения условия нормировки
набора вероятностей. Заметим, что ММП-оценке соответствует выбор   0 .
Для моделирования зависимости номинального отклика от входных переменных часто
используется политомическая (мультиномиальная) логистическая регрессия, вероятности для
которой задаются формулой
 j  x,   
exp T ( x) j 


J 1
1   exp T ( x) k 


k 1
,
где ( x) – вектор регрессоров (функций входных переменных),  j – подвектор вектора 
(подвекторы
 j , j 1, 2,..., J  1 , не пересекаются),  J – нулевой вектор.
Обобщѐнная радикальная оценка подвектора  j в модели политомической логистической регрессии задаѐтся оценочной функцией [7, 8]


1  




(
x
,

)



 j

 j ( z , x,  ) 
 jz  J
  z ( x, )  ( x,  ,  )( x) .
1



  l ( x, ) 

l 1

3. Оптимизационные формулировки
На практике возможно наличие нескольких решений системы оценочных уравнений (1).
Поиск решения удобно осуществлять методом Ньютона или квазиньютоновскими методами
(мы используем метод Бройдена [9]), для которых важным является выбор начального приближения. Часто, но далеко не всегда, хорошим выбором здесь является ММП-оценка.
Другим способом является переход к оптимизационной формулировке
N
ˆ  arg min   ( zt , xt ,  ) ,

t 1
где  – функция потерь.
В [10] указана возможность такого перехода при некоторых условиях для скалярного параметра и непрерывных одинаково распределенных наблюдений. В нашем случае функция
потерь по скалярной оценочной функции вида (3) определяется формулой
 ( z, x,  ) 
 sign C ( )  ( z, x,  )d  C ,
где C – произвольная постоянная, с точностью до которой определяется функция потерь, а
sign C( ) предполагается постоянной для всех  .
Случай векторного параметра более сложный, поскольку оценочная функция не обязана
быть градиентом какой-либо функции. Однако в регрессионных моделях функция  обычно
зависит от вектора коэффициентов уравнения регрессии через скалярную функциюпредиктор  ( x,  ) . В этом случае возможно представление
56
 ( z, x,  )   ( z, ( x,  ))
 ( z, )
где 
 ( x,  )
,

(4)
 
  ( )
 ( z, )
– скалярная функция. Тогда функция
 C ( )  ln  z ( )   ( )  z

 
 sz ( )
потерь имеет вид  ( z, ) 
 sign C ( )  ( z, )d  C , а оптимизируемая функция –
N
N
  ( zt , xt ,  )    ( zt , ( xt ,  )) .
t 1 t 1
Такой подход может быть использован для дихотомической логистической регрессии,
т.е. при наличии двух возможных значений отклика и   1 . Выбрать в качестве функции
 ( x,  )
 ( x) .
 ( x,  ) естественно T ( x) , тогда

Вообще, рассмотренный подход не зависит от шкалы, в которой представлены наблюдения, в том числе, он возможен и для непрерывных переменных. Например, он был успешно
использован для оценивания регрессии Пуассона (см. [11, 12]). Подобный принцип получения оптимизационной формулировки возможен не только для оценочных функций вида (3),
но и для других, для которых справедлива факторизация (4).
Если для векторного параметра представление оценочной функции как градиента некоторой функции потерь невозможно, но оно возможно для отдельных подвекторов вектора
параметров, то удобно использовать метод покомпонентного оценивания.
Согласно данному методу множество параметров разбивается на ряд подмножеств. Решение находится итеративно, при этом итерация включает несколько этапов, каждый из которых состоит в нахождении очередного приближения оценок для одного подмножества параметров при фиксированных значениях параметров остальных подмножеств. На соответствующих этапах каждой итерации данного метода можно использовать решение оптимизационной задачи для соответствующих подвекторов.
Можно проинтерпретировать такой подход как решение системы оценочных уравнений
блочным нелинейным методом Гаусса–Зейделя [13]. Решение оптимизационной задачи при
этом можно рассматривать как способ выбора в процессе решения одного из корней системы, имеющего определѐнные свойства.
Заметим, что указанное разбиение возможно в любом случае, поскольку вектор всегда
можно разбить на скалярные подвекторы.
Вновь рассмотрим регрессионную задачу. Пусть вектор параметров разбит на подвекторы  
j , j 1,..., J  1, и существуют функции  j ( x,  j ) , такие что оценочная функция для
подвектора  j имеет вид
 j ( z, x,  j )   j ( z, j ( x,  j ))
 j ( x,  j )
 j
,
 
  z ( j )
 j ( z, j ) C j ( j ) 
ln  z ( j )   j ( j ) 

где
–
скалярная
функция


 j
 sz ( j )
 j   j ( x,  j ) , тогда функция потерь для оценивания подвектора  j имеет вид
(5)
и
 j ( z, j ) 
 sign C j ( j )  j ( zi , j )d j  C j
(зависимость всех приведенных функций от фиксированных подвекторов вектора параметров не указана).
57
Имеем на j -м этапе u -й итерации покомпонентного оценивания задачу
N
 (ju )  arg min   j ( zt , j ( xt ,  j )) .
j
t 1
Такой подход применим для политомической логистической регрессии, в этом случае
 j ( x, j )
используем  j ( x, j )  T ( x) j и
 ( x) .
 j
Обычно целевые функции не имеют аналитического представления, поэтому для минимизации удобно использовать градиентные методы. Градиент на j -м этапе итерации покомпонентного оценивания имеет вид

N
N
  j ( zt , j ( xt ,  j ))   sign C j ( j )   j ( zt , xt ,  j )
 j t 1 t 1

и, таким образом, с точностью до константы представляет собой левую часть оценочного
уравнения. Здесь удобно использовать квазиньютоновские методы (мы используем метод
Бройдена–Флетчера–Голдфарба–Шано), поскольку они не требуют высокоточного определения длины шага вдоль направления. Более того, можно применять модификации, в которых
вообще не используются значения целевой функции.
Заметим, что минимизируемые функции являются «локальными» целевыми функциями,
определѐнными лишь в пределах одного этапа одной итерации покомпонентного оценивания
(они зависят от номера итерации и номера этапа из-за своей зависимости от приближений
фиксированных подвекторов). По этой причине задача сравнения различных решений исходной системы оценочных уравнений в рамках данного подхода напрямую не решается.
Тем не менее, стартуя с некоторого не слишком плохого начального приближения (например, с ММП-оценки), такие процедуры зачастую находят удовлетворительные решения.
4. Оценивание индивидуализированных регрессий
Хотя рассмотренный в предыдущем пункте подход позволяет снизить требования к
начальному приближению, в ряде случаев он оказывается неудовлетворительным. В частности, когда помимо решения, имеющего высокое качество, имеется близкое к начальному
приближению (например, к ММП-оценке). Однако, при получении нескольких решений изза отсутствия «глобальной» целевой функции их невозможно сравнить между собой.
Для политомической логистической регрессии возможным решением в таких ситуациях
может быть использование индивидуализированных регрессий [14]. Данный подход основан
на соотношении
ln
 j ( x,  )
 J ( x,  )
 T ( x)
j , j 1,..., J  1,
исходя из которого можно оценить J  1 отдельных (индивидуализированных) дихотомических регрессий с парами категорий ( j, J
) , j 1,..., J  1 по соответствующим подвыборкам.
Имеем модель
1( j ) ( x) 
exp T ( x) j 
1

 ,  ( j ) ( x) 
,
2
1  exp T ( x) j 
1  exp T ( x) j 




58
причѐм 
j , j 1,..., J  1 – это одни и те же параметры (  j   j ), и, кроме
j , j 1,..., J  1, и 
того, в истинной модели ММП-оценка для  j асимптотически несмещенная и часто близкая
к асимптотически эффективной. Для конечных выборок рекомендуется выбирать в качестве
базовой категории (у нас ей является J -я категория) имеющую наибольшее число наблюдений в выборке для обеспечения наименьших потерь эффективности.
Таким образом, альтернативой ММП-оценке как начальному приближению для покомпонентной процедуры оптимизации является робастная оценка параметров  j . В предыдущем пункте уже отмечалось, что для дихотомической модели есть оптимизационная постановка робастного оценивания. В результате робастную оценку для  j можно находить путѐм
использования глобальной оптимизации.
5. Исследование оценок методом Монте-Карло
С целью проверки работоспособности обобщѐнных радикальных оценок было проведено
исследование методом Монте-Карло, основанном на многократном генерировании выборки
с последующим нахождением по ней оценок параметров.
Использовалась политомическая логистическая модель со следующими характеристика-

1, x, x 2
ми: J  3 , ( x) 

T
, 1 
 8, 2,1 , 2   5, 4,1 . Наборы данных состояли из 1000
наблюдений, входная переменная изменялась в диапазоне –10…10. Реальное распределение
наблюдений представляло собой смесь модельного и вырожденного в точке j  3 распределений, вес вырожденного распределения в смеси был равен 0.05. При вычислении оценок
использовалось начальное приближение, полученное покомпонентным методом, стартующим из ММП-оценки.
На рисунке приведена зависимость от параметра робастности меры, отражающей качество оценок вероятностей: среднего по 1000 испытаний значения величины


1 N J
  ( j ( xt , )   j ( xt ,ˆ ))2 .
NJ t 1 j 1
Результаты исследований свидетельствуют о преимуществе робастных оценок перед
оценками по методу максимального правдоподобия. Наилучшее качество в эксперименте
имела оценка с параметром робастности 1.75.
0.1
0
0.5
1
0.01
0.001
0.0001
0.00001
Рисунок
59
1.5
2
6. Заключение
В работе исследованы предложенные ранее робастные оценки параметров политомической логистической регрессии, а также приведены методы их вычисления. Результаты исследования показали преимущество робастные оценок перед оценками по методу максимального правдоподобия. В дальнейшем предполагается продолжить исследование оценок.
Литература
1. Робастность в статистике. Подход на основе функций влияния / Ф. Хампель, Э. Рончетти,
П. Рауссеу, В. Штаэль. М.: Мир, 1989. 512 с.
2. Шурыгин А.М. Прикладная стохастика: робастность, оценивание, прогноз. М.: Финансы
и статистика, 2000. 224 с.
3. Bianco A. M., Yohai V. J. Robust estimation in the logistic regression model // Robust Statistics,
Data Analysis, and Computer Intensive Methods / Rieder H., eds. – New York: Springer, 1996.
P. 17–34.
4. Flores E., Garrido J. Robust logistic regression for insurance risk classification // Universidad
Carlos III de Madrid Working Papers, Business Economics Series 13. 2001. Working Paper 0164. 20 p.
5. Kalina J. Highly robust methods in data mining // Serbian Journal of Management. 2013. V. 8.
P. 9–24.
6. Лисицин Д. В. Устойчивое оценивание параметров модели по многомерным неоднородным неполным данным // Научный вестник НГТУ. 2013. № 1(50). С. 17–30.
7. Калинин А. А., Лисицин Д. В. Робастное оценивание параметров регрессионных моделей с
качественным откликом // Российская научно-техническая конференция «Информатика и
проблемы телекоммуникаций». Новосибирск, 21 – 22 апреля, 2011. Т. 1. С. 69–72.
8. Kalinin A. A., Lisitsin D. V. Robust estimation of qualitative response regression models // The
International Workshop «Applied Methods of Statistical Analysis. Simulations and Statistical
Inference» (AMSA’2011). Novosibirsk, Russia, 20 – 22 September, 2011. P. 303–309.
9. Дэннис Дж., Шнабель Р. Численные методы безусловной оптимизации и решения нелинейных уравнений. – М.: Мир, 1988. 440 с.
10. Лисицин Д. В., Гаврилов К. В. О некоторых свойствах М-оценок // Сборник научных трудов НГТУ. 2011. Вып. 2(64). С. 61–68.
11. Довгаль С. Ю., Лисицин Д. В. Робастные методы оценивания параметров регрессионной
модели со счетным откликом // Российская научно-техническая конференция «Информатика и проблемы телекоммуникаций». Новосибирск, 21 – 22 апреля, 2011. Т. 1. С. 64–67.
12. Dovgal S. Yu., Lisitsin D. V. Robust estimation of count response regression models // The International Workshop «Applied Methods of Statistical Analysis. Simulations and Statistical Inference» (AMSA’2011). Novosibirsk, Russia, 20 – 22 September, 2011. P. 318–321.
13. Ортега Дж., Рейнболдт В. Итерационные методы решения нелинейных систем уравнений со многими неизвестными. М.: Мир, 1975. 560 c.
14. Begg C. B., Gray R. Calculation of polychotomous logistic regression parameters using individualized regressions // Biometrika. 1984. V. 71. P. 11–18.
60
Воронова Ирина Дмитриевна
магистрант факультета прикладной математики и информатики Новосибирского государственного технического университета (630073, Новосибирск, пр. К.Маркса, 20) тел. (383)
3-460-600, e-mail: voron.sp@gmail.com.
Лисицин Даниил Валерьевич
д.т.н., профессор кафедры теоретической и прикладной информатики Новосибирского
государственного технического университета (630073, Новосибирск, пр. К.Маркса, 20) тел.
(383) 3-460-600, e-mail: lisitsin@ami.nstu.ru.
Robust Parameter Estimation of Polytomous Logistic Regression
I. D. Voronova, D. V. Lisitsin
In paper the theory of robust parameter estimation from the multivariate nonhomogeneous incomplete data is applied to polytomous logistic regression model. The basis of the theory is
constructed with use of F. Hampel’s approach connected with influence function and with use
of A.M. Shurygin’s approach connected with Bayesian point-mass contamination of distributions. Estimators provide robustness against deviation of observations distribution from postulated distribution. In paper the ways of estimation calculation are considered, Monte Carlo
study is described.
Keywords: parameter estimation, robustness, influence function, polytomous logistic regression, nominal response.
61
Выбор настраиваемых параметров алгоритма опорных векторов с квадратичной функцией потерь
Выбор настраиваемых параметров алгоритма
опорных векторов с квадратичной функцией потерь
А.В. Гладкова, А.А. Попов
Объектом исследования в данной работе является метод непараметрического восстановления регрессионной зависимости с использованием алгоритма опорных векторов с квадратичной функцией потерь. Особое внимание уделяется подбору настраиваемых параметров алгоритма через минимизацию заданных критериев качества, что позволяет получать не переобученные регрессионные модели.
Ключевые слова: восстановление зависимостей, непараметрическое оценивание, алгоритм опорных векторов с квадратичной функцией потерь, LS SVM, критерий выбора модели.
1. Введение
Непараметрические методы оценки регрессии широко используются в прикладных исследованиях и применяются, когда обычные параметрические спецификации не подходят
для решения поставленной задачи. В частности они работают в случае структурной неопределѐнности. В этом случае формирование структуры модели идет под управлением самими
данными.
В рамках исследования был выбран один из методов непараметрического оценивания регрессионных зависимостей – метод опорных векторов с квадратичной функцией потерь (LS
SVM) [1]. Задачей исследования ставилось изучение возможности получения модели с хорошей обобщающей способностью путем подбора настраиваемых параметров алгоритма.
2. Алгоритм LS SVM
1,, n объѐма n независиДана обучающая выборка n 
( xk , yk ) : xk  X , yk Y ; k 
мых наблюдений с неизвестным распределением. Ключевая составляющая метода опорных
векторов заключается в следующем: он отображает входной вектор в пространство признаков высокой размерности  через некоторое нелинейное отображение  [1,2]. В нѐм рассматривается класс функций:


: f ( x)
f 
 T  ( x )  b :  : X  ,  
nf
,b
,

yk m( xk )  ek , k  1,, n ,
X x
– независимо и одинаково распределѐнная ошибка с E ek | 
k 0 и
где ek 
Var ek
  ,
2
m( x)  
–
неизвестная
действительная
E  yk 
| x x
k  m( xk ) .
Задачу оптимизации нахождения вектора  и b 
щей задачи:
min ,b,e 
( , e)
функция
и
можно свести к решению следую-
1 T
1 n
     ek2 ,
2
2 k 1
62
гладкая
где при минимизации функции затрат
относительная значимость слагаемых которой
определяется положительной действительной константой  , тогда
yk  T  ( xk )  b  ek , k  1,, n .
Результирующая LS SVM модель для оценки функции имеет вид:
n

mˆ n ( x)  ˆ k K ( x, xk )  bˆ ,
k 1
где â , b̂ являются решением системы:
0

1
 n
1Tn 
  b  0
1     ,
   n    y 
 
 (1,,  n ) , k , l  1,

y ( y1,, yn )T , 1n (1,,1)T ,
,n ,
T

kl  ( x
k )  ( xl ) K ( xk , xl ) – элемент матрицы ядра.
3. Оценивание и выбор модели
В LS SVM на точность получаемой модели оказывает влияние ряд задаваемых внутренних параметров метода [3], к которым относят тип ядерной функции с собственным набором
параметров и коэффициент  , опосредовано влияющий на гладкость получаемых зависимостей.
В проводимых исследованиях задействовано RBF-ядро, которое на сегодняшний день
является наиболее популярным типом ядра, используемого в методе опорных векторов [4]:
 xz 2 
.
, z ) exp  
K ( x

2 2 

В качестве настраиваемого параметра ядра выступает  2 , влияющий на гладкость получаемых решений.
При решении задачи выбора «наилучшей» модели регрессии из числа построенных при
различных наборах задаваемых внутренних параметров, возникает необходимость использования того или иного критерия качества.
Одним из критериев, который часто используется при построении регрессионных зависимостей, является процедура скользящего контроля (CV): фиксируется некоторое множество разбиений исходной выборки на обучающую и контрольную. Для каждого варианта
разбиения выполняется настройка алгоритма по обучающей подвыборке, затем оценивается
его средняя ошибка на объектах контрольной подвыборки. В работе рассматривается частный случай CV – контроль по отдельным объектам, когда контрольная подвыборка состоит
из одного элемента (LOO CV). Недостатком LOO является большая ресурсоѐмкость, поэтому
в качестве ускорения используется вариант быстрого контроля по отдельным объектам (fast
LOO).
Другим рассмотренным критерием является модификация критерия регулярности, по которому осуществляется многократное тестирование модели на контрольных выборках заданного объѐма. Его можно рассматривать как частный случай обобщѐнного критерия CV, поскольку полного перебора всех возможных контрольных выборок заданного объѐма не производится. Назовем этот критерий обобщѐнным критерием регулярности (ОКР).
63
sin(x)
при объѐме выборки 100 наблюx
дений, результаты подбора параметров при использовании LOO CV и обобщѐнного критерия
регулярности, а также значение среднеквадратической ошибки (MSE) приведены в табл.1:
В качестве исследуемой функции используется
Таблица 1. Подбор параметров при использовании уровня шума 10%
Тестовая
выборка,
объѐм в (%)
Критерий
LOO CV
1
2
5
10
20
25
ОКР
3.16228
3.16228
31.62280
31.62280
3.16228
3.16228
Значение
критерия
MSE
1.08551E-02
4.88549E-02
3.69479E-02
3.52747E-02
4.56626E-02
4.10784E-02
9.39581E-04
3.70548E-03
2.07691E-03
2.10700E-03
1.55262E-03
1.42143E-03
Параметр 
Параметр ядра
8.95176
0.573336
8645.09
8345.47
1.19338
1.30741
Выбор пары настраиваемых параметров в случае использования обобщѐнного критерия
регулярности для различных наборов тестовой выборки нельзя назвать однозначным. Если
провести сравнение с LOO CV, то из табл. 1 можно наблюдать, что даже при совпадающем
значении  2 выбор  разнится: параметр  , выбранный с помощью скользящего контроля,
оказался в несколько раз больше. Из этого можно сделать вывод, что применение LOO CV
предполагает большую ориентацию на минимизацию ошибок на обучающей выборке, что
может в конечном итоге сказаться на обобщающих способностях получаемых моделей.
Визуально оценить качество получаемых моделей с использованием обоих критериев
позволяет рис. 1:
а
б
Рис. 1. Модели, полученные для выборки объѐмом 25% (a –шум 10%, б – шум 60%)
Далее постараемся определить, каким образом результаты работы рассмотренных критериев зависят от выбора тех или иных параметров алгоритма. Для этого зафиксируем значение параметра ядра и проследим, как будут изменяться значения критериев при варьировании параметра  .
Таблица 2. Значения критериев при уровне шума 10% и  2 = 3.16228

0.1
0.5
1
1.3
ОКР (для различных объѐмов тестовой выборки)
2%
5%
10%
20%
25%
0.0645903
0.0489362
0.0499645
0.0510643
0.0662312
0.0504774
0.0509719
0.051755
0.0642294
0.0454644
0.0451043
0.0457311
0.0683367
0.0477257
0.0457267
0.0456758
0.066828
0.043896
0.041252
0.041078
64
LOO CV
0.0392084
0.0150397
0.0122612
0.0117607
MSE
0.0280985
0.0044291
0.0018723
0.0014291
1.5
1.7
2
2.5
3
3.5
4
4.5
5
5.5
6
6.5
7
7.5
8
8.5
9
10
50
100
0.0517618
0.0524119
0.0532956
0.0545505
0.0555863
0.0564552
0.0571955
0.0578351
0.0583943
0.0588883
0.0593287
0.0597243
0.0600823
0.060408
0.0607062
0.0609804
0.0612336
0.0616871
0.0667457
0.0681584
0.0522549
0.0527196
0.0533472
0.0542285
0.0549462
0.0555414
0.0560437
0.0564742
0.0568479
0.057176
0.0574669
0.057727
0.0579612
0.0581734
0.0583669
0.0585441
0.0587072
0.0589978
0.0620248
0.0627712
0.0461852
0.0466313
0.047263
0.0481961
0.0489904
0.0496699
0.0502572
0.05077
0.0512222
0.0516243
0.0519848
0.05231
0.0526054
0.0528749
0.0531222
0.05335
0.0535607
0.0539383
0.0579208
0.0587404
0.0457511
0.0458617
0.0460532
0.0463766
0.0466714
0.0469304
0.0471563
0.0473539
0.0475277
0.0476816
0.0478188
0.0479419
0.048053
0.0481538
0.0482458
0.0483301
0.0484077
0.0485459
0.050012
0.0504014
0.041117
0.041213
0.041409
0.041777
0.04214
0.042475
0.04278
0.043055
0.043304
0.04353
0.043735
0.043923
0.044096
0.044255
0.044403
0.04454
0.044667
0.044898
0.047699
0.048609
0.0115634
0.0114241
0.0112801
0.0111341
0.0110473
0.0109909
0.010952
0.0109242
0.0109038
0.0108887
0.0108775
0.0108693
0.0108634
0.0108594
0.0108568
0.0108554
0.0108551
0.0108567
0.0111716
0.0113961
0.0012598
0.0011442
0.0010308
0.0009278
0.0008783
0.0008552
0.0008465
0.0008461
0.0008508
0.0008587
0.0008685
0.0008796
0.0008914
0.0009036
0.000916
0.0009284
0.0009408
0.0009649
0.0013797
0.0015055
Таблица 3. Значения критериев при уровне шума 60% и  2 = 3.16228

1
0.1
0.5
1
1.3
1.5
1.7
2
2.5
3
3.5
4
4.5
5
5.5
6
6.5
7
7.5
8
8.5
9
10
50
100
ОКР (для различных объѐмов тестовой выборки)
2%
5%
10%
20%
25%
2
0.114125
0.102999
0.105261
0.106778
0.107695
0.108533
0.109658
0.11124
0.112543
0.113641
0.114581
0.1154
0.116122
0.116765
0.117343
0.117868
0.118346
0.118786
0.119191
0.119567
0.119917
0.12055
0.128509
0.131114
3
0.113352
0.102263
0.104468
0.105824
0.106617
0.107328
0.108261
0.109538
0.110562
0.111407
0.11212
0.112734
0.113271
0.113746
0.114172
0.114556
0.114906
0.115226
0.115522
0.115797
0.116052
0.116516
0.122751
0.125154
4
0.110857
0.097509
0.0990996
0.100388
0.101185
0.101921
0.102916
0.104324
0.105489
0.106473
0.107317
0.108053
0.108702
0.109281
0.109802
0.110274
0.110706
0.111102
0.111469
0.111808
0.112125
0.112698
0.119791
0.121847
5
0.115891
0.10008
0.0990465
0.0991992
0.0993543
0.0995192
0.0997625
0.100131
0.100448
0.100722
0.100962
0.101174
0.101366
0.101541
0.101702
0.101851
0.101992
0.102124
0.102249
0.102368
0.102482
0.102696
0.106884
0.109019
6
0.113344
0.0915215
0.0647741
0.0645059
0.06442
0.0643687
0.0643259
0.0642959
0.0642874
0.0642888
0.0642964
0.0643086
0.0643247
0.0643443
0.0643669
0.0643921
0.0644195
0.0644489
0.06448
0.0645124
0.064546
0.0646159
0.0653449
0.0669005
65
LOO CV
MSE
7
0.0883604
0.0668072
0.0647741
0.0645059
0.06442
0.0643687
0.0643259
0.0642959
0.0642874
0.0642888
0.0642964
0.0643086
0.0643247
0.0643443
0.0643669
0.0643921
0.0644195
0.0644489
0.06448
0.0645124
0.064546
0.0646159
0.0669005
0.0682898
8
0.0314534
0.00746963
0.00501903
0.00466313
0.00455125
0.00449162
0.00445944
0.00448559
0.00455858
0.00465233
0.00475536
0.00486198
0.00496917
0.00507519
0.00517907
0.00528025
0.00537841
0.0054734
0.00556517
0.00565374
0.00573917
0.00590097
0.0083614
0.0090842
Данные, приведѐнные в табл. 2 и табл. 3 демонстрируют, что зависимости критериев по
параметру  представляет собой U-образные графики. Проведя сравнение по MSE качества
получаемых моделей при использовании различных критериев, можно сказать, что минимум
обобщѐнного критерия регулярности ближе к левой части интервала оптимальных значений
(значение, после которого MSE перестает значительно уменьшаться), а минимум LOO CV –
ближе к правой границе, где значение MSE уже начинает увеличиваться. Использование
LOO может давать переобученную модель. Например, в табл. 3 наблюдаем, что минимальное
значение MSE при достигается при   2 , в то время как при использовании LOO в качестве
оптимального выбирается  близкий к 3.
4. Заключение
Использование критерия скользящего контроля по отдельным объектам приводит к построению модели с большей ориентацией на минимизацию ошибок обучения, что может
привести к ситуации переобучения. Качество получаемых с использованием обобщѐнного
критерия регулярности моделей достаточно хорошее, тенденции на выбор переусложнѐнных
моделей не просматривается. Это позволяет рекомендовать его к практическому использованию наряду с широко известным критерием LOO, учитывая при этом выявленные особенности их поведения.
Литература
1. J. A. K. Suykens, J. Vandewalle Least squares support vector machine classifiers // Neural processing letters. 1999. V. 9, I. 3. P. 293-300.
2. Suykens, J. A. K. [et al.] Least Squares Support Vector Machines. Leuven (Heverlee): K.U.
Leuven, 2002. 84 p.
3. C. M. Vong, P. K. Wong, Y. P. Li Prediction of automotive engine power and torque using least
squares // Engineering Applications of Artificial Intelligence. 2006. V. 19(3). P. 227-297.
4. Kernel Functions for Machine Learning Applications [Электронный ресурс]. URL:
http://crsouza.blogspot.ru/2010/03/kernel-functions-for-machinelearning.html (дата обращения: 24.02.20014).
Гладкова Алла Владимировна
магистрант факультета прикладной математики и информатики НГТУ (630108, Новосибирск, улица Котовского 32, кв. 157), тел. 8-952-934-4576, e-mail: Lilo2296@yandex.ru.
Попов Александр Александрович
д.т.н., профессор, с.н.с. кафедры теоретической и прикладной информатики НГТУ
(630073, Новосибирск, пр-т К.Маркса, 20), тел. (383) 3-460-600, e-mail: alex1207@ngs.ru.
The choice of adjustable parameters of the least squares support vector machine
A. V. Gladkova, A. A. Popov
The object of the research in this work is the method of nonparametric regression based recovery using least squares support vector machine. Particular attention is paid to the selection of
customizable algorithm parameters by minimizing the set of quality criteria, which allows to obtain not retrained regression models.
Keywords: recovery dependencies, nonparametric estimation, least squares support vector machines, LS SVM, model selection criterion.
66
Распознание эмоций по изображению лица с помощью скрытых марковских моделей
Распознавание эмоций по изображению лица
с помощью скрытых марковских моделей
Н. А. Горлова, Т. А. Гультяева
В данной статье рассматривается определение эмоции по изображению лица человека с
помощью скрытых марковских моделей. В качестве последовательности наблюдений используются коэффициенты, посчитанные по особым точкам лица. Приведены результаты
тестирования для различных эмоций.
Ключевые слова: распознавание эмоций, скрытые марковские модели, особые точки лица.
1. Введение
Люди испытывают и выражают эмоции в повседневной жизни, при взаимодействии с
другими людьми. Эмоции часто отражаются на лице, в жестах, в голосе. Системы автоматического распознавания эмоций по изображению лица могут найти применение в различных
отраслях. Их можно использовать для тестирования программных интерфейсов, определяя
реакцию пользователя на то или иное действие приложения, в рекламе — для оценки впечатления, которое производит реклама на потребителей. Но это далеко не все применения, которые могут быть у подобных систем.
2. Распознавание эмоции
2.1. Этапы и основные подходы распознавания эмоции
Анализ эмоции на лице включает в себя как измерение движения частей лица, так и распознавания выражения лица человека. Как правило, автоматический анализ эмоции по изображению состоит из трѐх этапов: обнаружение лица на изображении, выделение необходимых данных и определение эмоции.
Первый шаг, обнаружение лица – это процесс автоматического нахождения области, содержащей лицо человека, на входном изображении или последовательности изображений.
Это может быть обнаружение лица на каждом отдельном кадре последовательности или обнаружение на первом кадре и отслеживании его расположения на видео последовательности.
Следующий шаг – это выделение и представление в нужном виде данных, связанных с
особенностями лица при конкретной эмоции. Существуют два основных метода: метод, основанный на геометрических особенностях лица, и метод, обрабатывающий изображение в
целом. Геометрическое особенности лица представляют собой форму и расположение отдельных частей лица (глаз, рта, бровей и др.). Особые точки лица или некоторые значения,
посчитанные по ним, представляют геометрию лица при выражении той или иной эмоции.
Методы, обрабатывающие изображение в целом, фильтры изображений, такие как вейвлетыГабора (Gaborwavelets) [1], применяются ко всему изображению лица или отдельным его
частям для получения набора значений. Выбор метода зависит от того, каким способом будет проводиться дальнейший анализ.
На последнем этапе по набору полученных значений происходит определение эмоции.
Для решения этой задачи существует множество различных подходов. Некоторые из них
анализируют эмоции человеческого лица в целом, чтобы затем найти разницу между разными изображениями: метод главных компонент (PrincipalComponentAnalysis) [2], метод независимых компонент (IndependentComponentAnalysis) [3], скрытые марковские модели
67
(HiddenMarkovModels) [4], генетический алгоритм (Geneticalgorithms) [5], нечеткие классификаторы (Fuzzyclassifiers) [6]. Методы локальных распознаваний анализируют отдельные
части лица, например рот, брови и глаза. Типичные методы: система кодирования лицевых
движений (FacialActionsCodeSystem) [7], кривые Безье [8] и нейронные сети [9]. Другие методы анализируют движение отдельных частей лица, когда меняются различные выражения:
активные модели формы (ActiveShapeModel)[10].
2.2.Обнаружение лица и выделение необходимых данных
Для обнаружения лица и выделения на нем особых точек была использована библиотека
OpensourceActiveShapeModellibrary1. С еѐ помощью определяются координаты 68 особых точек на изображении. На рис. 1 приведена используемая модель с расположением особых точек.
Рис. 1. Активная модель формы
На рис.2 (а, б) показан пример определения расположения точек на изображениях, взятых из базы данных Cohn–KanadeDatabase2.
По полученным координатам точек были вычислены 16 коэффициентов, представляющих собой расстояния между отдельными частями лица, размер частей лица.
Некоторые из этих коэффициентов:
 расстояние между внутренними уголками бровей (D_b);
 расстояния от центра глаза до верхнего (he1) и нижнего века (he2);
 расстояния от линии глаз до уголков бровей (blo, bli);
 расстояния от уголков губ до линии глаз (Dmc);
 ширина рта (w);
 расстояния от верхней (Dmt) и нижней губы (Dmb) до линии глаз;
 высота рта (hm1, hm2).
Некоторые расстояния приведены на рис. 3.
1
2
https://code.google.com/p/asmlib-opencv
T. Kanade, J. Cohn, Y. Tian.Comprehensive database for facial expression analysis, 2000.
68
а)
б)
Рис. 2. Пример расположения точек.
Рис. 3. Расстояния, вычисляемые по особым точкам
модели.
Для того чтобы полученные расстояния не зависели от размера изображения и от размера
лица на изображении,пронормируем их, поделив на ширину лица.
2.3. Теория скрытых марковских моделей
Скрытый марковский процесс представляет математическую модель данных, являющуюся двухкомпонентным случайным процессом ( X , Y ) со скрытой компонентой X и
наблюдаемой компонентой Y . Случайный процесс X является марковским случайным процессом.
Текущее состояние марковской цепи xt 1, 2,..., N  интерпретируют как скрытое состояние источника данных (исследуемого явления), а моменты измерения состояния – как
69
дискретные события в ходе развития исследуемого явления. Последовательность скрытых
состояний, моделируемая такой цепью (т.е. реализация скрытого процесса), обозначается как
Q  q1, q2 ,..., qT  , где T – длина наблюдаемой последовательности. Последовательность
O  o1, o2 ,..., oT  является последовательностью наблюдаемых состояний (т.е. это реализация наблюдаемого процесса). Случайный процесс связан со скрытым процессом условной вероятностью: P ot qt  i .
Для задания СММ необходимо определить следующие параметры [11]:

 i P
1) вектор вероятностей начальных состояний   i  , i  1, N , где
q1 si  ,
множество скрытых состояний S  {s1, s2 ,..., sN } , N – количество скрытых состояний в модели;
 


aij P
qt s j 
qt 1 si ;
2) матрица вероятностей переходов A  aij , i, j  1, N , где
3) функции плотности вероятностей распределения элементов последовательности
наблюдений B  bi  t  , где bi (t ) – это плотности условных вероятностей P ot qt  si  , ot –
элемент из последовательности наблюдений, наблюдаемый в момент t  1, T .
В работе рассматривается случай, когда плотности условных вероятностей наблюдаемых элементов являются смесями нормальных вероятностных распределений:
M
1
m 1
(2 ) im
bi (t )    im
T
1
e0.5(ot  im ) im (ot  im ) ,
где  im – это вес m -й компоненты смеси в i -м скрытом состоянии, M – число компонент в
смеси для каждого скрытого состояния si , i ,m - вектор математических ожиданий, i ,m ковариационная матрица.
Таким образом, СММ задается ненаблюдаемой (скрытой) марковской цепью, распределениями вероятностей наблюдений и вероятностями начальных состояний:    A, B,   .
Для получения описания исследуемого процесса или объекта в виде СММ по имеющимся наблюдаемым последовательностям необходимо оценить параметры этой модели.
Для этого решается задача обучения, состоящая в подборе параметров модели  так, чтобы


она правильно распознавала последовательность мультинаблюдений O*  O1, O2 ,..., O K ,
где K – это число наблюдаемых последовательностей. Для обучения будем максимизировать функцию правдоподобия наблюдений, т. е. максимизировать вероятность
K
L(O* |  )   P(O k |  ) , варьируя параметры модели  . Для этого будем использовать алгоk 1
ритм, в общей ситуации называемый EM (EM – expectationmaximization; максимизация ожидания) или, применительно к СММ, алгоритмом Баума-Велша [11].
Пусть у нас есть несколько СММ. По обучающим последовательностям мультинаблюдений построим для этих СММ оценки. Для новой последовательности наблюдений O принадлежность к какой-то из этих моделей можно определить по значению вероятности
P(O |  ) . К модели, для которой это значение будет выше, и будет принадлежать последовательность O .
70
2.4. Использование СММ для распознавания эмоций
Последовательность наблюдений O представляет собой коэффициенты, посчитанные по
точкам одного изображения. Таким образом, количество наблюдений в последовательности
T= 16.
Пример последовательности наблюдений для изображения на рис.2(а): О = {14.2 9.1 8.3
4.5 4.5 10.96.4 3.6 3.6 51.7 4.9 12.4 38.4 38.2 52.7 35.4}.
Для каждой эмоции, которую хотим определить, будем использовать отдельную СММ.
Для каждой модели на обучающей выборке найдем оценки параметров модели, после чего
для каждой новой последовательности наблюдений вычислимфункцию правдоподобия. Та
модель, для которой значение будет максимальным, будет определять эмоцию, т.е. номер
эмоции на изображении будет находиться как arg max P(O | c ) , где n–количество эмоций,
1 c  n
которые будем распознавать.
На рис.4 показана последовательность действий для распознавания эмоции по изображению с использованием скрытых марковских моделей.
Рис. 4. Схема распознавания эмоции.
3. Результаты
Для тестирования классификатора использовалась база данных изображений Cohn–
KanadeDatabase, состоящей из 593 последовательности кадров для 123 человек. Все последовательности начинаются с нейтрального лица и заканчиваются пиком выражения некоторой
эмоции.
71
Проводились следующие эксперименты: были отобраны изображения людей, выражающих три эмоции: «радость», «гнев» и «удивление». На рис.5 представлены примеры изображений для этих эмоций.
«Радость»
«Гнев»
«Удивление»
Рис. 5. Примеры изображений с различными эмоциями
Были заданы три моделисо следующими параметрами: количество скрытых состояний
N = 6, число компонент смеси M = 2. Для обучения использовались по 50 изображений на
каждую модель с разными людьми, разной степенью выраженности эмоции. Для тестирования были выбраны другие 100 изображений для каждой эмоции. В табл. 1 представлены
проценты верно и ошибочно классифицированных изображений для двух эмоций.
Таблица 1. Результаты тестирования для двух эмоций.
Истинный класс
«Радость»
«Удивление»
Классы, к которым были отнесены изображения
«Радость»
«Удивление»
98%
2%
12%
88%
Таким образом, процент верно классифицированных эмоций составил 93% для двух
эмоций.
В табл.2 представлены результаты тестирования для трех различных эмоций.
Таблица 2. Результаты тестирования для трех эмоций.
«Радость»
«Удивление»
«Гнев»
«Радость»
87%
11%
30%
«Удивление»
2%
88%
0%
«Гнев»
11%
1%
70%
Таким образом, мы видим, что для трех классов точность определения эмоции составила 81%, что не хуже, чем в опубликованных другими авторами исследованиях [12, 13]на той
же базе данных изображений.
В дальнейшем мы планируем перейти к использованию многоуровневых скрытых макровских моделей для повышения точности классификации эмоций.
72
Литература
1. T. S. Lee.Image representation using 2D Gabor wavelets // IEEE Trans. Pattern Analysis and
Machine Intelligence, 18(10), 1996.
2. Ajit P. Gosavi, S. R. Khot. Facial expression recognition using principal component analysis //
International Journal of Soft Computing and Engineering (IJSCE) ISSN: 2231-2307, Volume-3,
Issue-4, September 2013.
3. AapoHyvarinen, ErkkiOja. Independent component analysis: algorithms and applications. URL:
http://www.cs.helsinki.fi/u/ahyvarin/papers/NN00new.pdf(дата обращения:
10.02.2015).
4. Ira Cohen, AshutoshGarg, Thomas S. Huang. Emotion recognition from facial expressions using Multilevel HMM. URL:
http://www.ifp.illinois.edu/~ashutosh/papers/NIPS_emotion.pdf(дата обращения: 15.02.2015).
5. RohiniPatil, C.G.Patil. Automatic face emotion recognition and classification using Genetic
Algorithm.URL: http://iosrjournals.org/iosr-jeee/Papers/Vol9issue5/Version-2/H09526368.pdf(дата обращения: 15.02.2015).
6. Emotion
detection
algorithm
using
frontal
face
image.
URL:
http://cms.kunsan.ac.kr/user/raic/mycodyimages/lab-3-3_079.pdf(дата обращения: 05.02.2015).
7. Jihun Hamm, Christian G. Kohler, Ruben C. Gur,RaginiVerma. Automated Facial Action Coding System for Dynamic Analysis of Facial Expressions in Neuropsychiatric Disorders. URL:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3402717/
(дата обращения:
15.02.2015).
8. Detection and Recognition of Facial Emotionusing Bezier Curves. URL:
http://isyou.info/inpra/papers/inpra-v1n2-02.pdf(дата
обращения:
15.02.2015).
9. L. Franco, A. Treves.A Neural Network Facial Expression Recognition System using Unsupervised
Local
Processing.
URL:
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.28.6622&rep=r
ep1&type=pdf(дата обращения: 15.02.2015).
10. GhassanHamarneh.Active Shape Models, modeling shape variations and gray level information
and
an
application
to
image
search
and
classification.
URL:
http://www.cs.sfu.ca/~hamarneh/ecopy/s2iag1998_1.pdf(дата
обращения:
15.02.2015).
11. L. Rabiner.A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition //L.R Rabiner; IEEE. – Fellow: IEEE, 1989. – 30 p. – (Proceedings of the IEEE ; 77).
12. Recognizing Facial Expression: Machine Learning and Application to Spontaneous Behavior.
URL:
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.128.5508&rep=
rep1&type=pdf(датаобращения: 24.02.2015).
13. Facial Expression Recognition Based on Facial Components Detection and HOG Features.
URL:
http://conf-scoop.org/ACV-2014/3.Z.Chi_ACV.pdf(датаобращения:
24.02.2015).
73
Горлова Надежда Александровна
студентка факультета прикладной математики и информатики НГТУ (630073, Новосибирск, пр. Карла Маркса, 20, тел. (383) 3-460-600), e-mail: bogdanova.nadezhda.a@gmail.com.
Гультяева Татьяна Александровна
к.т.н., доцент кафедры теоретической и прикладной информатики НГТУ (630073, Новосибирск, пр. Карла Маркса, 20, тел. (383) 3-460-600), e-mail: t.gultyaeva@corp.nstu.ru.
Facial emotion recognition using hidden Markov models
N. Gorlova, T. Gultyaeva
Emotion recognition by hidden Markov modelsusing the image of a human face is presented in
this paper. As the sequence of observing states we are using variables calculated by the facial
feature points. Also we listed results which have been calculated for the couple different emotions.
Keywords: emotion recognition, hidden Markov models, feature points.
74
Исследование метода, повышающего робастность скрытых Марковских моделей
Исследование метода, повышающего робастность
скрытых Марковских моделей
Т.А. Гультяева, А. К. Лаушкина
В данном докладе рассмотрено использование распределения Стьюдента применительно
к скрытым марковским моделям в качестве не нарушающей их «общности» альтернативы
нормальному распределению.
Ключевые слова: скрытые марковские модели, распределение Стьюдента.
1. Введение
Целью данной работы является разработка и исследование метода, повышающего робастность скрытых Марковских моделей (СММ). На сегодняшний день существует несколько подходов к решению проблемы повышения дискриминирующих способностей СММ. Рассмотрим несколько наиболее известных.
Первый подход связан с выбором пространства состояний наблюдаемого процесса: для
каждой прикладной задачи производится выбор своего пространства, что является существенным недостатком. Второй подход предполагает усложнение структуры Марковской цепи с целью увеличения уровня детализации информации, зачастую при этом нарушая
«обобщенность» модели. Некоторые подходы используют некий классификатор в пространстве признаков, инициированных СММ. В данном докладе будет подробно рассмотрено использование в качестве функции плотности распределений наблюдений распределения, отличного от нормального, в качестве метода, повышающего робастность модели.
2. Теоретические основы скрытых Марковских моделей
Согласно [1], случайный процесс X t , t  T называется Марковским случайным процессом, если для всех t1  t2  ...  tn  T , n  1 его условное распределение вероятностей в момент t n не зависит от значений, которые процесс принимает в моменты t1, t2 ,..., tn  2 , а определяется только значением процесса в момент tn 1 , т. е.:
f  xn , tn | xn1, tn1   f  xn , tn | x1, t1, x2 , t2 ,..., xn1, tn1 
.
Данное свойство называется свойством марковости (или Марковским свойством). Функции f ( xn , tn | xn 1, tn 1 ) называют вероятностями перехода из состояния x n 1 в состояние xn .
Скрытый Марковский процесс представляет собой математическую модель, являющуюся двухкомпонентным случайным процессом ( X ,Y ) со скрытой компонентой X и наблюдаемой компонентой Y . Случайный процесс X является Марковским случайным процессом.
СММ является частным случаем скрытого Марковского процесса в случае, когда процесс X – это Марковская цепь с конечным множеством состояний, определяемая матрицей
переходных вероятностей.
СММ полностью задают следующие параметры [2]:
1) вектор вероятностей начальных состояний    i , i  1, N , где  i  q1  si  , множество скрытых состояний S  s1, s2 ,..., sN , N – количество скрытых состояний в модели;
75
2) матрица вероятностей переходов A  aij , i, j  1, N , где aij  P{qt  s j | qt 1  si } ;
3) функции условной плотности распределений наблюдений B  bi (t ) , где bi (t ) – это
условные плотности вероятностей P{ot | qt  si } , ot – наблюдение из последовательности O ,
фиксируемое в момент t  1, T .
Для того, чтобы повысить робастность модели, в работе [2] было предложено вычисление функции плотности наблюдений O  Ot Tt1 по формуле:
  q  1 / 2
( i )  q / 2
 i
i
2 

,
p(Ot ; i )  t (Ot ; i , i , i ) 
(1)
(  q ) / 2
d (Ot ; i , i )  i
( i / 2)1 


i

где q – размерность вектора наблюдений Ot ,  i ,  i , i - математическое ожидание, ковариационная матрица и степень i -ого свободы скрытого состояния модели, d (Ot ; i , i ) – расстояние Махаланобиса.
Оценивание параметров модели происходит с использованием ЕМ алгоритма. Формулы,
по которым производятся вычисления на Е-шаге и М-шаге приведены в [3].
3. Результаты исследований
Исследования проводились для последовательности с количеством наблюдений T  50 ,
количеством скрытых состояний N  4 , количеством последовательностей M  10 , матрицей вероятностей перехода
0.4 0.3 0 0.3
 0 0.3 0.2 0.5
,
A
0.5 0 0.2 0.3


 0.1 0.2 0.3 0.4
размерностью вектора наблюдений q  1 , значениями дисперсий  2  1 1 1 1 , математических ожиданий    15 0 15 30 , вектором степеней свободы  1 1 1 1 .
На рисунке 1 представлены гистограммы распределения частот появления наблюдений в
скрытых состояниях и соответствующие этим скрытым состояниям плотности распределения Стьюдента с истинными параметрами, заданными выше
76
Рис.1
На рисунке 2 представлены гистограммы распределения частот появления наблюдений в
скрытых состояниях, найденных по алгоритму Витерби [2], и соответствующие этим скрытым состояниям плотности распределения Стьюдента с параметрами, оцененными по ЕМалгоритму.
Рис.2
При этом при проверке простой гипотезы о согласии полученных выборок с распределением Стьюдента были получены следующие значения уровня значимости: для первого скрытого состояния- 0.51, для второго- 0.47, для третьего- 0.82, для четвертого- 6.84e-5.
Исходя из результатов исследований, можно сделать вывод о том, что предложенная в
[3] альтернатива нормальному закону, проявила себя достаточно хорошо на исследуемых
данных. Однако оценки, полученные на этапе обучения, оказались недостаточно точны (см.
77
состояние 4 на рис.2). Для решения этой проблемы необходимо увеличить количество
наблюдаемых последовательностей и(или) длину этих последовательностей, использующихся на этапе обучения СММ с помощью ЕМ-алгоритма.
Следовательно, распределение Стьюдента можно использовать в качестве альтернативы
нормальному закону в СММ, не нарушающей общности модели и не требующей перестроения модели для каждого случая. В дальнейшем планируется провести анализ утвержденной в
[3] робастности предложенной модели и, в зависимости от результата, рекомендовать применение распределение Стьюдента в СММ для повышения робастности таких моделей.
Литература
1. Гихман, И.И., А.В. Скороход Теория случайных процессов // Москва: Наука, 1971. – 1 т. –
665 с.
2. L. Rabiner, A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition // Proceedings of the IEEE. – 1989. – Vol. 77 (2).
3. S. Chatzis, T. Varvarigou, A Robust to outliers hidden Markov model with application in textdependent speaker identification // Signal Processing and Communications 2007. – ICSPC –
p. 804 – 807
Лаушкина Анастасия Константиновна
студент НГТУ, факультет прикладной информатики
stacy.laushkina@gmail.com., тел: 89232227807
и
математики,
e-mail:
Гультяева Татьяна Александровна
к.т.н., доцент кафедры теоретической и прикладной информатики НГТУ (630073, Новосибирск, Карла Маркса 20), email: t.gultyaeva@corp.nstu.ru, тел: (383) 3460600
Applying of the Student’s t-distribution as an increasing the robustness of hidden Markov
models method
T. Gultyaeva, A. Laushkina
In this manual applying of the Student’s t-distribution will be reviewed in the context of hidden
Markov models as an alternative of normal distribution, which does not violates their “commonality”.
Keywords: hidden Markov models, Student’s t-distribution.
78
Решение на GPU задач обучения скрытых Марковских моделей и распознания
многомерных числовых последовательностей с их помощью
Решение на GPU задач обучения скрытых
Марковских моделей и распознавания
многомерных числовых последовательностей с их
помощью
Т. А. Гультяева, В. Е. Уваров
С помощью технологии параллельных вычислений на GPU1 была произведена оптимизация вычислений на этапах обучения скрытых Марковских моделей и распознавания многомерных числовых последовательностей с их помощью. Было произведено сравнение
времени исполнения последовательного метода на CPU2 и оптимизированного на GPU,
которое показало, что оптимизация позволила получить значительное ускорение при увеличении числа последовательностей.
Ключевые слова: GPU, скрытые Марковские модели, машинное обучение.
1. Введение
Скрытые Марковские модели (СММ) были достаточно подробно изучены ещѐ в
1960-1970 годах [1-4], но представляют большой интерес и в наше время благодаря развитию
вычислительных технологий. Одно из применений СММ – задача машинного обучения, которая рассматривается в данной статье. Несмотря на достоинства этих моделей, их использование предполагает проведение значительных вычислений, особенно на этапе обучения, которые делают последовательные вычисления на CPU достаточно затратными по времени. На
помощь приходят новейшие технологии, предполагающие использование параллельных вычислений на GPU для проведения ресурсозатратных вычислений.
Попытки использовать GPU для параллелизации алгоритмов, используемых для работы с
СММ уже предпринимались различными авторами (см., например, [5]). Данные алгоритмы
используются для обучения моделей с помощью последовательностей, а затем распознавания
новых последовательностей. Особенность разрабатываемого метода заключается, во-первых,
в том, что элементами последовательностей являются многомерные вектора вещественных
чисел, а не символы и не одномерные числа. Во-вторых, используется метод масштабирования для того, чтобы можно было работать с длинными последовательностями [6]. В-третьих,
в качестве основной библиотеки используется более универсальная OpenCL3, а не часто используемая CUDA4.
Ранее по данной теме авторами уже велась работа, но было решено усовершенствовать
разработанный метод, так как существенного ускорения получить не удалось [7]. Выводы,
полученные в результате проведѐнных исследований, были учтены, и удалось разработать
гораздо более эффективный метод.
1
GPU – графический процессор (видеокарта)
CPU – центральный процессор (ЦПУ)
3
OpenCL – универсальная технология параллельных вычислений на GPU, разрабатываемая Khronos Group
4
CUDA – технология параллельных вычислений на GPU, произведенных компанией NVidia
2
79
2. Постановка задачи
Была поставлена задача применения технологии параллельных вычислений на GPU для
оптимизации вычислений, возникающих на этапе обучения СММ и на этапе распознавания
многомерных числовых последовательностей с помощью обученных СММ.
3. Теория СММ
Марковским процессом называют случайный процесс, который в каждый момент времени t 1,...,T находится в одном из состояний s {s1,...,s N } и переходит в новое состояние в
соответствии с вероятностями переходов aij , i, j  1..N . В случае СММ данные состояния
скрыты от наблюдателя, и доступны лишь последовательности наблюдений, генерируемых в
данных скрытых состояниях. В нашем случае наблюдения представляют собой Z-мерные
вектора вещественных чисел. Наблюдения распределены по некоторым вероятностным законам. В данном случае в качестве функции плотности вероятностей распределения элементов последовательности наблюдений используется смесь нормальных распределений с различными параметрами.
Таким образом, можно выделить основные элементы (параметры) СММ:
 i P
1) Вектор вероятностей начальных состояний
q1 si  , i  1..N где q1 – первое
скрытое состояние, в котором находится будет процесс, а si – одно из возможных N скрытых состояний.
 


aij P
qt s j 
qt 1 si . Здесь
2) Матрица вероятностей переходов A  aij , i, j  1, N , где
si , s j – одни из возможных N скрытых состояний, а qt 1 , qt – скрытые состояния в которых процесс будет в моменты времени t  1 и t соответственно.
3) Функции плотности вероятностей распределения элементов последовательности наблю
B bi 
t  , i 1,
N , t 1..T , где bi (t ) – это плотности условных вероятностей
дений
P ot qt  si  . Здесь ot – элемент последовательности, наблюдаемый в момент времени t .
Число моментов времени обозначено T . Символом qt обозначено скрытое состояние в котором процесс будет находиться в момент времени t . Символом si обозначено одно из возможных N скрытых состояний, в котором может находиться процесс.
Мы рассматриваем случай, когда плотности условных вероятностей наблюдаемых элементов являются смесями вероятностных распределений:

bi (t )
M
  im g (ot ; im , im ), где
m 1
 im – это вес m -й компоненты смеси в i -м скрытом состоянии, M – число компонент в
смеси для скрытого состояния si . Здесь ot – элемент последовательности, наблюдаемый в
момент времени t . Символом im обозначены математические ожидания распределений, а
символом im – ковариационная матрица.
Следовательно, чтобы полностью определить СММ  мы должны знать следующие параметры:  i , aij ,  im , im и im , i, j  1..N , m  1..M . Одной из надѐжных и эффективных
процедур оценивания этих параметров на этапе обучения СММ является итеративный алгоритм Баума-Велша [1]. Он будет описан в следующем разделе.
80
4. Метод решения
Любая GPU-реализация неразрывно связана с параллелизацией, а потому предполагает
выявление в исходном алгоритме вычислений, которые не зависят друг от друга и могут выполняться параллельно. Чем больше число таких параллельных потоков удастся выделить,
тем эффективнее будет реализация по сравнению с последовательной, исполняемой на
CPU [8]. В нашем случае можно выделить следующие параллельные вычисления.
4.1. Общие вычисления для этапов обучения и распознавания
Из приведѐнных в данном пункте вычислений целиком состоит этап распознавания, но
на этапе обучения – это лишь часть (причем наименее ресурсозатратная) вычислений.
Изначально нам дано одно или несколько начальных приближений каждого из параметров СММ:  i , aij ,  im , im и im i, j  1..N , m  1..M .
Сначала для каждой из K последовательностей вычисляются плотности условных вероятностей наблюдений B  bi  t  :
M
bi (t )   im g (ot ; im , im ),
m 1
i
1..N , t 
1..T .
(1)
Каждый элемент матрицы B для каждого скрытого состояния и момента времени вычисляется независимо. Таким образом имеем K  N  T параллельных вычислений. Кроме того, все значения функции g можно вычислить заранее и независимо по формуле (2): итого
ещѐ K  N  M  T одновременно выполняемых вычислений. В качестве функции g используется плотность нормального распределения:
T
1
1
g (ot ; im , im
e0.5(ot  im ) im (ot  im ) , 
i 1..N ,
t 1..T .
)
(2)
Z
(2 ) im
Далее
вычисляются
промасштабированные
прямые
(forward)
вероятности

t  i  P
 o1 o2 ot , qt si |   для каждой из K последовательностей по следующему алгоритму:
1) инициализация:
2) индукция:

1 (i) 
i bi  o1  , i 1, N ;
(3)
N

 j 1

 t 1(i)  bi (ot 1)   t' ( j )a ji  , где
t' 
i
 t i 
N
  t n
n 1

, i 1, N ,
t 1, T  1 .
Здесь можно одновременно выполнить N  K вычислений. По моментам времени T распараллелить данные вычисления невозможно, так как следующая прямая вероятность рекурсивно зависит от предыдущей. В данном случае можно воспользоваться следующим приѐмом. Построим трѐхмерную вычислительную сетку по K , T и N (см. Рис. 1). Так как по T
имеется зависимость, мы можем параллельно исполнять лишь вычисления в плоскости
K  N (обозначено зелѐным цветом на Рис. 1). Исполним последовательно вычисления в
данных плоскостях вдоль измерения T для вычисления всех прямых вероятностей.
81
(4)
Рис. 1. Трехмерная вычислительная сетка.
Параметры маштаба для каждой из K последовательностей вычисляются следующим
образом:
1
N

ct     t (i)  , t  1, T .
(5)
 i 1

Здесь можно одновременно выполнить K  T вычислений.
На этапе классификации рассматривается некая последовательность O , относительно
которой нужно принять решение, какой моделью она была порождена. Для принятия решения будем использовать логарифм функции правдоподобия. В этом случае считается, что
P(O | 1)
наблюдаемая последовательность порождена моделью 1 , если: ln
 0 , иначе – эта
P(O | 2 )
последовательность порождена моделью 2 .
С помощью параметров масштаба можно вычислить логарифм функции правдоподобия,
т. е. логарифм вероятности того, что последовательность была сгенерирована данной моделью, по следующей формуле:
T
ln  P  O|      ln ct .
t 1
(6)
На этом заканчивается этап распознавания. Поскольку формулу (6) надо вычислять для
каждой из K последовательностей, то на этом этапе можно выполнить K параллельных вычислений.
На этапе обучения во время поиска параметров, дающих глобальный максимум функции
правдоподобия, также используется формула вычисление логарифма функции правдоподобия, но уже по формуле (7).
K T
ln  P  O|       ln ctk
k 1t 1
Вычисления по формуле (7) невозможно распараллелить без применения технологии двумерной редукции, поэтому они выполняются последовательно уже на CPU.
Как видно, на этапе распознавания больше всего вычислений удалось распараллелить по
K последовательностям. Также в отдельных местах можно распараллелить по N и T . Но
увеличение T увеличит и непараллельные вычисления прямой вероятности (3)-(4). Можно
предположить, что наибольшее ускорение параллельная реализация на GPU даст при больших N и K по сравнению с последовательной на CPU.
82
(7)
4.2. Вычисления, необходимые только для этапа обучения
После вычислений из пункта 4.1, вычисления на этапе обучения продолжаются. Промасштабированные обратные (backward) 
вероятности t (i) P
(ot 1, ot  2 ,..., oT | qt si ,  ) для
каждой из K последовательностей вычисляются следующим образом:
1) инициализация:
'
(8)

i 1, N ;
T (i) 1,
2) индукция:
t 1(i)  ct 1t' 1(i),
N
t' (i)   t 1( j )a jib j (ot 1) , i  1, N , t T  1,1 .
j 1
(9)
Инициализация (8) может быть распараллелена по N и K , как и вычисления по формуле (9). По T распараллелить вычисления по формуле (9) невозможно, так как вычисления
рекурсивно зависимы по T . Применим такой же метод вычислительной сетки, как при вычислении прямой вероятности (см. Рис. 1), только будем следовать по измерению T в обратную сторону.
Далее необходимо для каждой из K последовательностей вычислить промасштабиро(qt si | O,  ) и  t (i
ванные вероятности 
, m) P
(qt i,
it m | O,  ) :
t (i) P
 t' (
i) t' (i) t' (i), 
i 1, N , 
t 1, T 1 ,
(10)






N
(
o
,

,
)
t im im
.
 t' (i, m)   t' (i)  M im
(11)
 i

   im N (ot , im , im ) 
 m 1

Как видно, вычисления (10) можно распараллелить по K , T , N , а вычисления (11) по
K, T, N, M .
Далее
вычисляется
ещѐ
одна
промасштабированная
вероятность
t (i
, j ) P
(qt si , q
t 1 s j | O,  ) для каждой из K последовательностей:
t' (i, j )  t (i)aij b j (ot 1) t1( j ) ,
(12)
i,
j 1, N , 
t 1, T  1 .
Получаем ещѐ N  N , T , K параллельных вычислений.
Для того, чтобы избежать лишних расчетов, произведем предварительный расчет величин, которые в дальнейшем понадобятся несколько раз:
K T k 1
 'sum (i)     't(k ) (i) ,
K T k 1

k 1 t 1
 'sum
N , m 1..M .
 i, m     't(k ) (i, m), i 1..

k 1 t 1
(13)
(14)
Данные вычисления можно распараллелить по N и N , M соответственно. Далее идет
повторное оценивание вектора вероятностей начальных скрытых состояний:
1 K (k )

i

(15)
  ' (i), i 1..N .
K k 1 1
Здесь мы можем параллельно посчитать только N сумм. Затем заново вычисляется матрица вероятностей переходов:
83
K T k 1
(k )
   't (i, j )
1 t 1
(16)

aij k
,
i, j 1..N .
 'sum (i)
В формуле (16) параллельно исполняются N  N вычислений. После этого производится
повторное оценивание коэффициентов смесей распределений:
 'sum  i, m 
(17)



 im
,
i 1..
N , m 1..M .
 'sum (i)
Имеем N  M параллельных потоков. Далее происходит вычисление математических
ожиданий смесей:
K T k 1
(k )
   't (i, m)otk
(18)



 im k 1 t 1
, i 1..
N , m 1..M .
 'sum  i, m 
По формуле (18) возможно выполнять N  M параллельных вычислений. Осталось пересчитать последний параметр – дисперсии смесей:
K T k 1
(k )
(k )
(k )
   't (i, m)(ot   im )(ot   im )T

im k 1 t 1
 'sum  i, m 

, i 1..N
, m 1..M.
(19)
По формуле (19) также возможно одновременно выполнять N  M расчетов. На это вычисления в рамках одной итерации заканчиваются. Если условия останова не выполняются,
следует вернуться и произвести вычисления заново, начиная с (1), использовав в качестве
новых начальных приближений полученные оценки (15)-(19).
Как видно, в основном производительность параллельной версии на этом этапе увеличится за счет увеличения числа скрытых состояний N .
5. Результаты
5.1. Способ проведения исследования
Исследование проводилось следующим образом. Сначала с помощью двух различных заданных СММ были сгенерированы два набора обучающих последовательностей, а также два
набора тестовых последовательностей.
Установим количество последовательностей в каждом наборе K  100 , каждая длиной
T  100 (если не указаны другие K и T ). Число скрытых состояний моделей N  3 , число
компонент смеси нормальных распределений для каждого скрытого состояния M  3 , размерность наблюдений Z  8 .
Далее с помощью двух наборов обучающих данных (т. е. два набора по K  100 последовательностей длиной T  100 ) были получены две оценѐнные СММ (этап обучения – первый
замер времени).
После этого для каждой модели и каждого набора тестовых последовательностей (т. е.
для двух моделей и двух наборов по K  100 последовательностей длиной T  100 ) были посчитаны вероятности того, что последовательность из набора была сгенерирована данной
моделью (этап распознавания – второй замер времени).
Далее предполагается для каждой последовательности из наборов сравнивать вероятности того, что она была сгенерирована первой и второй моделью и относить к той модели, для
которой эта вероятность больше. Поскольку мы знаем, какая последовательность была сгенерирована какой моделью, мы можем посчитать процент правильно распознанных последовательностей.
84
Две исходные СММ различаются лишь матрицами вероятностей переходов:
0.2 
 0.1  dA 0.7  dA



A  0.2
0.2  dA 0.6  dA  .
 0.8  dA
0.1
0.1  dA 

Так у первой модели dA  0 , а у второй dA  0.2 .
На этапе обучения в алгоритме Баума-Велша для поиска глобального максимума логарифма функции правдоподобия было использовано 5 различных начальных приближений.
5.2. Способ замера времени и оборудование
Замер времени на этапе обучения включает в себя время обучения первой и второй модели. Замер времени на этапе распознавания включает в себя расчет вероятностей для первой
модели по 1-му и 2-му тестовому набору и для второй модели по 1-му и 2-му тестовому
набору. Время предварительной загрузки данных на GPU не учитывается. Также не учитывается время, затраченное на сравнение вероятностей для каждой последовательности на этапе
распознавания – только расчет этих вероятностей.
При расчетах использовалось оборудование, параметры которого приведены в табл. 1.
Таблица 1 – Параметры используемого при исследованиях оборудования
Компонент
Спецификация
CPU
Intel Core i7-4790 Haswell (3600MHz)
GPU
Intel HD Graphics 4600 (1100MHz)5
Точность вычислений – одинарная (float).
5.3. Полученные результаты
В первом исследовании менялось число последовательностей K для каждой модели при их
фиксированной длине T  100 на этапе обучения (см.
Рис. 2) и на этапе распознавания (см. Рис. 3).
Рис. 2. Сравнение времени проведения расчетов на этапе обучения на CPU и GPU при изменении
числа последовательностей
5
Во время проведения исследования данный видеочип не использовался для вывода изображения на экран.
85
По
Рис. 2 можно увидеть, что с ростом числа последовательностей K обе реализации показали линейный прирост времени, а их графики находятся довольно близко друг к другу. Таким
образом, с увеличением K ускорение, даваемое GPU методом, будет увеличиваться довольно
медленно. Так при K  100 оно составило 1.38 раза, а при K  1000 только 1.5 раза.
Рис. 3 Сравнение времени проведения расчетов на этапе распознавания на CPU и GPU при изменении
числа последовательностей
Анализ Рис. 3 показал, что при увеличении числа последовательностей K время исполнения CPU и GPU методов будет возрастать линейно. Однако, ускорение, которое дает GPU
метод, увеличивается достаточно быстро с ростом K. Так при K  100 оно составило 3.76 раза, а при K  1000 уже 6.5 раз.
86
Во втором исследовании менялась длина последовательностей T для каждой из моделей
при их фиксированном количестве K  100 для обеих моделей на этапе обучения (см. Рис. 4)
и на этапе распознавания (см. Рис. 5).
Рис. 4. Сравнение времени проведения расчетов на этапе обучения на CPU и GPU при изменении
длины последовательностей
Анализ Рис. 4 показал, что при увеличении длины последовательностей T время исполнения CPU и GPU методов будет возрастать линейно. Ускорение, которое дает GPU метод,
увеличивается достаточно медленно ростом T. Так при T  100 оно составило 1.38 раза, а
при T  1000 только 1.45 раз.
Рис. 5. Сравнение времени проведения расчетов на этапе распознавания на CPU и GPU при изменении длины последовательностей
По Рис. 5 можно заметить, что при увеличении длины последовательностей T время исполнения CPU и GPU методов будет возрастать линейно. Ускорение, которое дает GPU ме87
тод, не увеличивается. Так при T  100, 500, 1000 GPU метод оказался эффективнее в 3.76
раза.
Отметим, что во всех экспериментах доля верно распознанных последовательностей составляла от 97% до 100%.
5.4. Обсуждение результатов
На этапе обучения при изменении количества последовательностей K алгоритм на GPU
оказался быстрее последовательного алгоритма на CPU в 1.5 раза. При увеличении K время
исполнения обоих методов возрастало линейно.
На этапе распознавания при увеличении K увеличивалось и ускорение, которое давал алгоритм на GPU – начиная от 3.76 раз при K  100 , заканчивая 6.54 раз при K  1000 .
При изменении длины последовательностей T на обоих этапах время исполнения увеличивалось линейно и эффективность GPU-метода составила 1.4 и 3.7 раза соответственно на
этапе обучения и распознавания.
Таким образом можно заключить, что наиболее эффективно удалось распараллелить вычисления на этапе распознавания и наибольший прирост производительности будет при
большом количестве последовательностей K.
6. Заключение
Разработанный метод распараллеливания на GPU оказался эффективнее последовательного на CPU. Однако, при данных размерностях параметров СММ на этапе обучения не было
получено значительного прироста производительности. Ускорение составило только 1.5 раза. Это можно объяснить тем, что этап обучение хуже поддается распараллеливанию, чем
этап распознавания. Прирост эффективности GPU метода на этапе обучения возможно проявит себя при значительном увеличении числа скрытых состояний N – необходимо провести данное исследование в будущем.
На этапе распознавания был получен более значительный прирост производительности –
вплоть до ускорения в 6.5 раз. Особенно эффективным GPU-вариант оказался при большом
количестве последовательностей (при большом K ): при увеличении K увеличивалось и
ускорение. При увеличении длины последовательностей T время исполнения на CPU и GPU
увеличивались линейно и ускорение не увеличивалось.
На практике быстродействие более критично на этапе распознавания – обучение можно
провести и заранее, а распознавать приходится «на лету», поэтому на данном этапе результаты можно считать удовлетворительными.
В дальнейшем предполагается проанализировать эффективность GPU-метода при большем количестве скрытых состояний СММ (при большем N ), а также продолжить совершенствовать алгоритм распараллеливания.
Литература
1. Rabiner L. R. A Tutorial on Hidden Markov Models and Selected Applications in Speech
Recognition// Proceedings of the IEEE, 1989, vol. 77, no. 2, pp 257-285.
2. Винцюк, Т.К. Распознавание слов устной речи методами динамического программирования / Т.К. Винцюк // Кибернетика. – М., 1968. – № 1. – С. 15-22.
3. Ковалевский, В.А. Оптимальный алгоритм распознавания некоторых последовательностей изображений / В.А. Ковалевский // Кибернетика. – 1967. – № 4. – С. 75-80.
88
4. Baum, L.Е. A Maximization Technique Occurring in the Statistical Analysis of Probabilistic
Functions of Markov Chains / L.Е. Baum [et. al.] // The Annals of Mathematical Statistics. –
1970. – Vol. 41, № 1. – P. 164-171.
5. Chuan Liu cuHMM: a CUDA Implementation of Hidden Markov Model: Training and Classication [Электронный ресурс], 2009 — Режим доступа: https://liuchuan.org/pub/cuHMM.pdf.
6. Gultyaeva T. A. Classification of multidimensional observation sequences described by Hidden
Markov Models / T. A. Gultyaeva, V. V. Kokoreva // Actual problems of electronic instrument
engineering (APEIE–2014) : in 7 volumes – Novosibirsk : Published by NSTU, 2014. – v. 1. –
p. 556-561.
7. Gultyaeva T. A. Graphics processing unit implementation of Hidden Markov models / T. A.
Gultyaeva, A. S. Sautin, V. E. Uvarov // Actual problems of electronic instrument engineering
(APEIE–2014) : in 7 volumes – Novosibirsk : Published by NSTU, 2014. – v. 1. – p. 571-573.
8. Aaftab Munshi OpenCL Programming Guide / Aaftab Munshi, Benedict R. Gaster, Timothy G.
Mattson. – Boston, MA, USA : Addison-Wesley Professional, 2011. – 648 p.
Гультяева Татьяна Александровна
к.т.н., доцент факультета прикладной математики и информатики НГТУ, 630073, Новосибирск, п-т Карла Маркса 20, т. 346-06-00, email: t.gultyaeva@corp.nstu.ru
Уваров Вадим Евгеньевич
студент 5 курса факультета прикладной математики и информатики НГТУ, 630073, Новосибирск,
п-т
Карла
Маркса
20,
т.
346-06-00,
т.
8-913-792-43-58,
email: uvarov.vadim42@gmail.com
GPU implementation of Hidden Markov Models for multidimensional sequences: learning and classification stage
Т. А. Гультяева, В. Е. Уваров
Optimization of calculations on learning and classification stages for multidimensional sequences that are described by Hidden Markov Models was made with the use of parallel computational techniques on GPU. Computational times on CPU and GPU were compared and it
was stated that optimization had proved to be successful, especially when number of sequences
is high.
Keywords: GPU, Hidden Markov Models, machine learning.
89
Робастное оценивание параметров многооткликовой регрессии по данным с пропусками
Робастное оценивание параметров
многооткликовой регрессии
по данным с пропусками
Е.М. Долговых, Д.В. Лисицин
В работе теория робастного оценивания параметров по многомерным неоднородным неполным данным применяется к многооткликовой нормальной регрессии при наличии
пропущенных данных и игнорировании механизма порождения пропусков. В основе теории лежит синтез подхода Ф. Хампеля, связанного с функцией влияния, и подхода А.М.
Шурыгина, связанного с байесовским точечным засорением распределения. Оценки
обеспечивают устойчивость к отклонению распределения наблюдений от постулированного. В работе даѐтся вид оценок, обсуждаются вопросы их вычисления, приводятся результаты исследования методом Монте-Карло.
Ключевые слова: оценивание параметров, робастность, функция влияния, многооткликовая регрессия, пропущенные данные.
1. Введение
При изучении сложных объектов их состояние может описываться вектором характеристик. Если в наблюдениях характеристик не всегда можно зафиксировать их значения, то
данные являются неполными, содержат пропуски. С такой ситуацией часто сталкиваются
при моделировании многомерных данных [1], в том числе при использовании многооткликовой регрессионной модели.
Если постулирована параметрическая модель, то оценивание еѐ параметров может производиться по методу максимального правдоподобия. Однако, в условиях отклонения реального распределения переменных от постулированного (модельного) такие оценки часто оказываются неустойчивыми. Для решения этой проблемы используются робастные процедуры
[2–5]. Однако теория робастности разработана, в основном, для моделирования по полным
данным.
Для случая пропусков в многомерных данных в работах [6–13] предлагаются робастные
методы оценивания параметров сдвига и масштаба модели многомерной, главным образом,
нормальной случайной величины или параметров регрессионной модели, при этом базируются данные методы на эвристических суждениях.
В данной работе достаточно общая теория оптимального оценивания неизвестных параметров модели по многомерным неоднородным неполным данным [5] применяется к многооткликовой нормальной регрессии при наличии пропущенных данных и игнорировании механизма порождения пропусков. В основе указанной теории лежит синтез подхода Ф. Хампеля [2], связанного с функцией влияния, и подхода А.М. Шурыгина [3], связанного с байесовским точечным засорением модельного распределения. Получаемые методы оценивания
являются устойчивыми к отклонению реального распределения наблюдений от постулированного. Ранее данные методы были применены для случаев неоднородных количественных
(в том числе, счетных), качественных и разнотипных данных [14–20].
90
2. Элементы теории робастного оценивания параметров
Пусть независимые n -мерные случайные величины  i  ( i1,
,  in )T , i  1,..., N , имеют
модельные распределения с плотностями gi ( zi |  ) , zi  R n , относительно некоторой  конечной меры  и вектором параметров  размера p .
M -оценку ˆ вектора параметров модели  определим по наблюдениям  i , i  1, , N ,
случайных величин  i , i  1,..., N , путѐм решения системы оценочных уравнений
N
  i  i , ˆ   0 ,
i 1
где  i ( i , ˆ) – p -мерная оценочная функция, удовлетворяющая условию
E i ( zi ,  )  0 , i  1,
,N ,
(1)
E – оператор математического ожидания.
В теории робастного оценивания конструируются оценки, имеющие высокое качество не
только при постулируемом распределении ошибок, но и при отклонении от него [2]. Одним
из показателей качества оценки в теории робастности является функция влияния.
В рассматриваемом случае для M -оценок при некоторых условиях регулярности функция влияния для i -го наблюдения имеет вид
IFi ( zi , )  M11 i ( zi ,  ) ,
N 
N
g ( z |  )


E i ( zi ,  )
, TN )T , M1 
   i ( zi ,  ) i iT d  – невырожT
n


1
i
i 1 
R
 
где   (1T ,
денная матрица размера p  p .
Показателем качества выберем квадрат весовой L2 -нормы функции влияния
N
 s ( ) 
  IFiT ( zi , ) W IFi ( zi , ) si ( zi |  )d  ,
i 1 R n
где s  (s1, , sN )T , si ( zi |  )  0 – весовая функция, W  W ( ) – некоторая симметричная
положительно определенная весовая матрица размера p  p .
Также данный показатель можно проинтерпретировать в соответствии с моделью байесовского точечного засорения, когда первый аргумент функции влияния является случайной
величиной с плотностью si ( zi |  ) , zi  R n , относительно меры  . Тогда
N
 s ( ) 
 Esi IFiT ( zi , ) W IFi ( zi , )  ,
i 1
где E si – математическое ожидание по плотности si ( zi |  ) .
Оптимальная оценочная функция является решением оптимизационной задачи:

 s arg min  s ( )

при ограничениях (1), и имеет вид
91

 g (z | )
,
 s,i ( zi ,  ) C  ln gi ( zi |  )  i  i i




 si ( zi |  )
где C  C ( ) – невырожденная матрица (зависящая от W ), с точностью до которой определяются оценочные функции, i  i ( ) – константа, определяемая из условия (1).
Изложенная общая теория может быть применена к случаю неполных данных.
Предположим, что для каждого наблюдения допустим ряд структур пропусков, отражающих присутствие или отсутствие отдельных элементов; пронумеруем их некоторым образом. Будем считать номера структур пропусков наблюдений случайными величинами [1].
Обозначим i – такую случайную величину для i -го наблюдения, i – еѐ наблюдаемое значение, а соответствующий аргумент в плотностях, оценочных функциях и т.п. будем обозначать ri .
r
r
Для ri -й структуры пропусков введѐм векторы  i,iobs и  i,imis , состоящие соответственно
из наблюдаемых и отсутствующих элементов вектора  i и имеющие плотности относительr
r
но  -конечных мер i,iobs и i,imis , таких что мера  является их произведением. В результате реально нам доступны векторы  i,obs , i  1,..., N , наблюдений случайных векторов

 ir,iobs , i  1,..., N . Таким образом, выборку составляют векторы  iT,obs , i

T
, i  1,..., N .
В общем случае решение задачи оптимального оценивания зависит от механизма порождения пропусков – распределения случайной величины i . Однако часто переменная i является мешающей, и заниматься еѐ моделированием нежелательно. В [5] найдены условия,
при которых механизм порождения пропусков можно игнорировать.
Первым условием является известное условие ОПС – «отсутствующие данные отсутствуют случайно, присутствующие данные присутствуют случайно» [1] (англоязычная аббревиатура MCAR – missing completely at random), когда случайная величина i не зависит
от случайного вектора  i . Условие ОПС по отношению к плотностям gi ( zi , ri |  ) , si ( zi , ri |  )
в предположении, что распределение i не зависит от оцениваемых параметров модели  ,
приводит к представлению gi (ri | zi )  gi (ri ) , si (ri | zi )  si (ri ) . Остальные условия имеют вид
gi (ri )  si (ri ) и
R
r
r
r
  i ( zi,iobs , ri ,  ) gi ( zi,iobs |  )d i,iobs  0 ,
(2)
nr
i
r
где nri – размер вектора  i,iobs . Последнее условие при этом заменяет (1).
В результате оценочная функция принимает вид
r
i

 gi ( zi,obs |  )

 i ( zir,iobs , ri ,  ) C  ln gi ( zir,iobs |  )  iri 
,
 
 si ( zir,iobs |  )
r
r
r
где gi ( zi,iobs |  ) , si ( zi,iobs |  ) маргинальные плотности, соответствующие вектору  i,iobs , и
r
для каждой ri -й структуры пропусков определяется собственный вектор i i из условия (2).
92
3. Оценивание параметров регрессионной модели по данным с
пропусками
Многооткликовая регрессионная модель имеет вид

yi F ( xi )  ei , i  1,..., N ,
где yi – i -е n -мерное наблюдение за вектором количественных откликов, F ( xi ) – матрица
регрессоров (функций вектора детерминированных входных переменных) размера n  t , xi –
вектор входных переменных i -го наблюдения,  – t -мерный вектор параметров, ei – вектор
ошибок, имеющий многомерное нормальное распределение с нулевым вектором математического ожидания и ковариационной матрицей  . Отклики наблюдаются с пропусками.
Маргинальное распределение вектора откликов в i -м наблюдении при m -й структуре
пропусков является нормальным с плотностью
1 2
g ( yim, obs | xi ,m )  (2 )nm 2 m, obs





T
 1

 exp  yim,obs  Fm,obs ( xi ) m1,obs yim,obs  Fm,obs ( xi )  ,
 2

где yim,obs – nm -мерный вектор наблюдаемых откликов, m – вектор параметров маргинального распределения, nm – количество наблюдаемых элементов вектора откликов, m,obs –
подматрица матрицы  , соответствующая вектору наблюдаемых откликов, Fm,obs ( xi ) –
матрица размера nm  t , которая состоит из строк матрицы F ( xi ) , соответствующих наблюдаемым элементам вектора откликов.
Одним из частных случаев оптимальных оценок являются обобщѐнные радикальные с
плотностью
1
s( yim, obs | xi ,m )   g ( yim, obs | xi , m ) 


 ,m ,
 2
 nm 2
(1   )nm 2 m, obs
где 0    1 – параметр робастности,   ,
– множитель,
m (2 )
нормирующий плотность. Значению   0 соответствует оценка по методу максимального
правдоподобия. При приближении значения параметра  к 1 множитель   ,m сильно увели-
чивается,
поэтому
 nm 2
  , m  (2 )
(1   )
удобно
( n  nm ) 2
m, obs
 2
использовать
эквивалентный
множитель
.
Обозначим

w( yim, obs , xi , )

g ( yim, obs | xi ,m )
  g ( yim, obs | xi , m )    , m .
m


s( yi, obs | xi ,m )
Другой частный случай – оценки максимальной устойчивости, соответствующие
s( yim, obs | xi ,m )  1 и w( yim, obs , xi , )  g ( yim, obs | xi ,m ) , их можно представить как разновидность обобщѐнных радикальных с   1 , но при   , m  1.
Для вектора параметров регрессии  имеем систему оценочных уравнений
93
M

1
ˆ
   w( yim, obs , xi ,ˆ) FmT, obs ( xi )ˆ m
, obs Fm, obs ( xi )   
 m 1iJ m

M
m
1
   w( yim, obs , xi , ˆ) FmT, obs ( xi )ˆ m
0,
, obs yi , obs 
m 1iJ m
где M – количество структур пропусков в наборе данных, J m – множество номеров наблюдений с m -й структурой пропусков.
Поскольку матрица  является симметричной положительно определѐнной, представим
еѐ в виде разложения Холецкого  SS T , где S – нижняя треугольная матрица с положительной диагональю. Для обеспечения в процессе вычислений положительности диагонали
параметризуем диагональные элементы как S jj   jj , где  jj – параметр. Хотя для сохранения оптимальности оценок при преобразовании параметров (это преобразование должно
быть однозначным и дифференцируемым [21]) необходимо наложить условие  jj  0 , в
процессе вычислений его удобно не учитывать.
Для унификации обозначений недиагональные ненулевые элементы матрицы S обозначим  jk , j  k . В результате вектор всех параметров модели  примет вид

   T ,11 , 21,..., nn

T
.
T
Заметим, что матрица m,obs имеет представление m,obs 
, где Sm – матрица
Sm Sm
размера nm  n , составленная из тех строк матрицы S , которые соответствуют наблюдаемым
при m -й структуре пропусков элементам вектора откликов.
Для элемента  jk , j  k , имеем оценочное уравнение

mJ obs
j
nm
  Sˆm vk  Bˆm v,( j )  0 ,
(3)
v 1
где J obs
– множество номеров структур пропусков, в которых наблюдается j -й элемент
j
– элемент v -й строки и k -го столбца оценки матрицы Sm ,
вектора откликов, Sˆm
 vk
 Bˆm v,( j) – элемент v -й строки и столбца, соответствующего
j -му элементу вектора откли-
ков, симметричной матрицы размера nm  nm , имеющей вид

T
1 ˆ 1
1
m
m
ˆ m
ˆ 1
m, obs  w( yim, obs , xi , ˆ) ,
Bˆm 
ˆ m
, obs   w( yi , obs , xi ,  )eˆi , obs eˆi , obs   m, obs 
1 
iJ m

iJ m


m
m
ˆ
eˆ
i, obs yi, obs  Fm, obs ( xi ) – остаток.
Для вычисления оценок удобно использовать покомпонентную процедуру, согласно которой множество параметров разбивается на ряд подмножеств. Решение находится итеративно, при этом итерация включает несколько этапов, каждый из которых состоит в нахождении очередного приближения оценок для одного подмножества параметров из соответствующей подсистемы оценочных уравнений при фиксированных значениях параметров
остальных подмножеств.
94
В нашей задаче выделим два подмножества – вектор  и множество { jk , j  k} . Для 
удобно использовать итеративный метод наименьших квадратов [22], для { jk , j  k} – решать соответствующую подсистему уравнений методом Бройдена [23].
Вместо уравнения (3) можно использовать оценочное уравнение для исходных элементов
ковариационной матрицы –  jk , j  k , вектор параметров тогда имеет вид

 T , 11, 21,..., nn 
T
. Оценочное уравнение для элемента  jk имеет вид

mJ obs
jk
 Bˆm ( j )(k )  0 ,
(4)
где J obs
jk – множество номеров структур пропусков, в которых одновременно наблюдаются
j -й и k -й элементы вектора откликов, Bˆ
– элемент строки, соответствующей j -му
 m ( j)(k )
элементу вектора откликов, и столбца, соответствующего k -му элементу вектора откликов,
матрицы Bˆ m .
Уравнение (4) на соответствующем этапе покомпонентной процедуры удобно решать с
помощью ER-алгоритма [13], в данном случае представляющего собой итеративный процесс,
на (u  1) -й итерации которого вычисляется очередное приближение оценки ковариационной
матрицы:
(u 1)
N
1 
N
 
 (u ) (u ) T

1
ei
C (u ) ,

1   i 

 w( yim, obs , xi , (u ) ) ei
 w( yim, obs , xi , (u ) ) i 1
i 1
(u )
yi(u )  F ( xi ) (u ) ,
где  (u ) – приближение оценки вектора параметров на u -й итерации, e
i




yi(u )  E yi | yi, obs , (u ) , Ci(u )  cov yi | yi, obs , (u ) , cov – ковариационная матрица. Заме-
тим, что матрица 
но определенной.
(u )
на всех итерациях ER-алгоритма является симметричной положитель-
4. Исследование оценок методом Монте-Карло
С целью проверки работоспособности обобщѐнных радикальных оценок было проведено
исследование методом Монте-Карло, основанном на многократном генерировании выборки
с последующим нахождением по ней оценок параметров.
 j1   j 2 xi  e ji , где y ji – знаОтклики генерировались в соответствии с моделью y ji 
чение j -го отклика в i -м наблюдении, 
j1 
j 2 1 , e ji – значение ошибки j -го отклика в
наблюдении,
входная
переменная
изменялась
в
диапазоне
N  400 ,
i -м
0.40562884…4.64692985. Модельное распределение ошибок было многомерным нормальным с нулевым математическим ожиданием и ковариационной матрицей, диагональные элементы которой равны 1.3976080836321538, а недиагональные равны 0.6988040418160769.
Искажение модельного распределения осуществлялось путѐм увеличения отдельных наблюдений отдельных откликов на величину 3.54661426612613. Общее количество искажѐнных
наблюдений для всех откликов было равно 60, что составляет 5% всех наблюдений. Пропуски генерировались независимыми от значений откликов и входных переменных для каждого
отклика отдельно с различными вероятностями.
95
3
2
Мерой, отражающей качество оценок, являлась величина   ( jk  ˆ jk )2 . Еѐ средние
j 1 k 1
значения, полученные по 2000 экспериментов, приведены на рисунке. По оси абсцисс отложены значения параметра робастности (максимальное значение было взято равным 0.98),
разным кривым соответствуют разные вероятности пропусков.
0.6
0.5
0.4
0.05
0.2
0.4
0.3
0.2
0.1
0
0
0.2
0.4
0.6
0.8
1
Рисунок
Результаты исследований свидетельствуют о преимуществе робастных оценок с малым
значением параметра робастности (0.1…0.4) перед оценками по методу максимального
правдоподобия. Наилучшее качество получено при параметре робастности 0.1. При увеличении вероятности пропусков качество оценивания падает.
5. Заключение
В работе предложены робастные оценки параметров многооткликовой нормальной регрессии по данным с пропусками при игнорировании механизма порождения пропусков. Исследование методом Монте-Карло показало определѐнное преимущество данных оценок перед оценками по методу максимального правдоподобия. В дальнейшем предполагается продолжить исследование оценок.
Литература
1. Литтл Р. Дж. А., Рубин Д. Б. Статистический анализ данных с пропусками. М.: Финансы
и статистика, 1991. 336 с.
2. Робастность в статистике. Подход на основе функций влияния / Ф. Хампель, Э. Рончетти,
П. Рауссеу, В. Штаэль. М.: Мир, 1989. 512 с.
3. Шурыгин А. М. Прикладная стохастика: робастность, оценивание, прогноз. М.: Финансы
и статистика, 2000. 224 с.
4. Лисицин Д. В. Устойчивые методы оценивания параметров и выбора структуры многооткликовой линейно параметризованной модели // Научный вестник НГТУ. 2001. № 2(11).
С. 53–66.
5. Лисицин Д. В. Устойчивое оценивание параметров модели по многомерным неоднородным неполным данным // Научный вестник НГТУ. 2013. № 1(50). С. 17–30.
96
6. Little R. J. A., Smith P. J. Editing and imputing for quantitative survey data // Journal of the
American Statistical Association. 1987. V. 82. P. 58–68.
7. Little R. J. A. Robust estimation of the mean and covariance matrix from data with missing values // Applied Statistics. 1988. V. 37. P. 23–38.
8. Cheng T.-C., Victoria-Feser M.-P. High breakdown estimation of multivariate location and
scale with missing observations // British Journal of Mathematical and Statistical Psychology.
2002. V. 55. P. 317–335.
9. Copt S., Victoria-Feser M.-P. Fast algorithms for computing high breakdown covariance matrices with missing data // Theory and applications of recent robust methods / Hubert M. et al.,
eds. Basel: Birkhauser, 2004. P. 71–82.
10. Frahma G., Jaekel U. A generalization of Tyler’s M-estimators to the case of incomplete data //
Computational Statistics and Data Analysis. 2010. V. 54. P. 374–393.
11. Danilov M., Yohai V. J., Zamar R. H. Robust estimation of multivariate location and scatter in
the presence of missing data // Journal of the American Statistical Association. 2012. V. 107. P.
1178–1186.
12. Sinha S. K. Robust analysis of longitudinal data with nonignorable missing responses //
Metrika. 2012. V. 75. P. 913–938.
13. Yuan K.-H., Chan W., Tian Y. Expectation-robust algorithm and estimating equations for means
and dispersion matrix with missing data // Annals of the Institute of Statistical Mathematics.
2014. doi: 10.1007/s10463-014-0498-1
14. Лисицин Д. В. Конструирование робастных оценок параметров регрессии при неоднородных наблюдениях // Научный вестник НГТУ. 2004. № 3(18). С. 43–55.
15. Лисицин Д. В., Форманчук Д. С. Робастное оценивание параметров гетероскедастичной
регрессии // Доклады АН ВШ РФ. 2007. № 2(9). С. 17–23.
16. Калинин А. А., Лисицин Д. В. Робастное оценивание параметров регрессионных моделей с
качественным откликом // Российская научно-техническая конференция «Информатика и
проблемы телекоммуникаций». Новосибирск, 21 – 22 апреля, 2011. Т. 1. С. 69–72.
17. Kalinin A. A., Lisitsin D. V. Robust estimation of qualitative response regression models // The
International Workshop «Applied Methods of Statistical Analysis. Simulations and Statistical
Inference» (AMSA’2011). Novosibirsk, Russia, 20 – 22 September, 2011. P. 303–309.
18. Довгаль С. Ю., Лисицин Д. В. Робастные методы оценивания параметров регрессионной
модели со счетным откликом // Российская научно-техническая конференция «Информатика и проблемы телекоммуникаций». Новосибирск, 21 – 22 апреля, 2011. Т. 1. С. 64–67.
19. Dovgal S. Yu., Lisitsin D. V. Robust estimation of count response regression models // The International Workshop «Applied Methods of Statistical Analysis. Simulations and Statistical Inference» (AMSA’2011). Novosibirsk, Russia, 20 – 22 September, 2011. P. 318–321.
20. Lisitsin D. V. Robust estimation of mixed response regression models // The International
Workshop ««Applied Methods of Statistical Analysis. Applications in Survival Analysis, Reliability and Quality Control» (AMSA’2013). Novosibirsk, Russia, 25 – 27 September, 2013. P.
139–144.
21. Лисицин Д. В. Свойства инвариантности при оценивании параметров модели в условиях
байесовского точечного засорения // Доклады АН ВШ РФ. 2010. № 1(14). С. 18–25.
22. Демиденко Е. З. Линейная и нелинейная регрессии. – М.: Финансы и статистика, 1981.
302 с.
23. Дэннис Дж., Шнабель Р. Численные методы безусловной оптимизации и решения нелинейных уравнений. – М.: Мир, 1988. 440 с.
Долговых Екатерина Михайловна
магистрант факультета прикладной математики и информатики Новосибирского государственного технического университета (630073, Новосибирск, пр. К.Маркса, 20) тел. (383)
3-460-600, e-mail: katdolgov@ya.ru.
97
Лисицин Даниил Валерьевич
д.т.н., профессор кафедры теоретической и прикладной информатики Новосибирского
государственного технического университета (630073, Новосибирск, пр. К.Маркса, 20) тел.
(383) 3-460-600, e-mail: lisitsin@ami.nstu.ru.
Robust Parameter Estimation of Multivariate Regression from Data with Missing Values
E. M. Dolgovykh, D. V. Lisitsin
In paper the theory of robust parameter estimation from the multivariate nonhomogeneous incomplete data is applied to multivariate normal regression in the presence of missing data and
conditions which make the missing-data mechanism ignorable. The basis of the theory is constructed with use of F. Hampel’s approach connected with influence function and with use of
A.M. Shurygin’s approach connected with Bayesian point-mass contamination of distributions.
Estimators provide robustness against deviation of observations distribution from postulated
distribution. In paper the form of estimators is given, questions of their calculation are discussed, Monte Carlo study is described.
Keywords: parameter estimation, robustness, influence function, multivariate regression, missing data.
98
Исследование влияния выбора предобусловливания матриц СЛАУ
при конечноэлементном моделировании трехмерного магнитотеллурического поля
Исследование влияния выбора предобусловливания
матриц СЛАУ при конечноэлементном моделировании трехмерного магнитотеллурического поля
П. А. Домников1
В работе описан эксперимент по применению различных вариационных формулировок
при решении задачи моделирования трехмерного магнитотеллурического поля векторным методом конечных элементов. Проведены вычислительные эксперименты по применению различных предобусловливателей при решении соответствующих конечноэлементных систем линейных алгебраических уравнений.
Ключевые слова: метод конечных элементов, 3D-моделирование, электромагнитное поле,
итерационные методы.
1. Введение
Задачи численных расчетов трехмерных электромагнитных полей в неоднородных средах являются вычислительно трудоемкими и требуют достаточно много машинного времени
даже на современных компьютерах [1]. Уменьшение времени решения таких задач, несомненно, является актуальной задачей.
В данной работе рассматривается использование векторного метода конечных элементов
(МКЭ) [2] для моделирования трехмерного гармонического электромагнитного поля в задачах магнитотеллурического зондирования, возникающих при электромагнитных зондированиях Земли [3]. Поскольку при использовании МКЭ основные вычислительные затраты приходятся на решение соответствующих систем линейных алгебраических уравнений (СЛАУ),
одним из наиболее эффективных путей повышения вычислительной эффективности в данном случае является уменьшение времени решения СЛАУ. В данной работе исследуется
влияние использование различных конечноэлементных постановок и предобусловливателей
матриц конечноэлементных СЛАУ с целью сокращения вычислительных затрат.
2. Математическая модель
Распределение магнитотеллурического поля в трехмерной среде описывается векторным
дифференциальным уравнением (1)
1
(1)
rot rotAa  iωAa  (σ  σ n ) E n ,
μ0
где   ( x, y, z) удельная проводимость среды с включенными в нее трехмерными неодно2
– круговая частота , E n  iAn – напряженность электрического поля во
родностями,
вмещающей горизонтально-слоистой среде (нормальное поле), которое считается предварительно. Суммарное поле от трехмерной модели, состоящей из горизонтально-слоистой среды
с включенными в нее трехмерными неоднородностями вычисляется как сумма A  An  Aa .
1
ции.
Работа проводилась при финансовой поддержке Министерства образования и науки Российской Федера-
99
Индукция магнитного поля B a и напряженность электрического поля E a , соответствующие
аномальному полю, определяются соотношениями: Ba  rot Aa , E a  iAa .
Рассмотрим различные вариационные постановки для уравнения (1) в форме Галеркина. Первую из них будем называть A-постановкой, она имеет следующий вид:
1
μ0
a  rot ψ dΩ  i σAa  ψ dΩ 
 rot A



 (σ  σ
n ) E n  ψ dΩ ,
(2)

где пробная вектор-функция  принадлежит пространству H0 (rot, ) [2].
Если дополнительно ввести в рассмотрение скалярный потенциал V a , такой что
тогда для уравнения (1) можно выписать следующую вариационную постановку:
E a  iAa  grad V a ,
1
μ0
a  rot ψ dΩ  i σ(Aa  grad V a )  ψ dΩ 
 rot A



a
i  σ(Aa  grad V )  grad  dΩ 

 (σ  σ
n
 (σ  σ
n ) E n  ψ dΩ ,

n
) E  grad  dΩ ,
(3)
(4)

где   H 10 . Вариационную постановку (3)-(4) будем называть A-V-постановкой. Ранее были
проведены исследования [1], показавшие, что применение A-V-постановки имеет преимущество перед А-постановкой при моделировании трехмерных магнитотеллурических полей на
низких частотах. В данной работе данное направление исследований расширяется за счет
применения различных предобусловливателей при решении СЛАУ, возникающих при использовании A- и A-V-постановок.
3. Вычислительный эксперимент
Для проведения эксперимента возьмем следующую геоэлектрическую модель, состоящую из вмещающей среды с проводимостью 0.01 См/м, содержащую верхний слой с проводимостью 0.001 См/м и два трехмерных объекта: первый с проводимостью 1 См/м и размерами 40000 20000 5000 м 3 размещенный на глубине 20000 м от дневной поверхности и
второй с проводимостью 2 См/м и размерами 4000 4000 500 м 3 , размещенный на глубине
2000 м от дневной поверхности соосно с первым объектом. Построенная конечноэлементная
сетка содержит 22192 узла. Для решения СЛАУ использовался метод COCR [4] со сглаживанием невязки [5].
Приведем время решения конечноэлементных СЛАУ, полученных при использовании
A- и A-V-постановок и использовании диагонального и SSOR-предобусловливания [6]
(табл. 1).
Таблица 1. Количество итераций и время решения конечноэлементных СЛАУ
, Гц
0.001
0.01
1
10
100
0.001
0.01
1
10
100
направление
тока
(Х или Y)
X
X
X
X
X
Y
Y
Y
Y
Y
A-постановка, AV-постановка,
диагональное
диагональное
A-постановка, AV-постановка,
SSOR
SSOR
7136, 209 с
3552, 104 с
1038, 31 с
322, 10 с
68, 2 с
7386, 216 с
3691, 108 с
996, 30 с
393, 12 с
109, 4 с
3051, 149 с
1708 ,84 с
429, 21 с
121, 6 с
25, 2 с
2928, 143 с
1534, 75 с
334, 17 с
131, 7 с
30, 2 с
289, 15 с
282, 15 с
201, 11 с
115, 6 с
59, 4 с
267 ,14 с
266 ,14 с
203, 11 с
126, 7 с
62 ,4 с
100
114, 10 с
122, 11 с
63, 6 с
38, 4 с
16, 2 с
111, 10 с
102, 9 с
63, 6 с
41, 4 с
16, 2 с
5. Заключение
Использование A-V постановки позволяет значительно сократить время решения задач
трехмерных расчетов трехмерных магнитотеллурических полей по сравнению с использованием А-постановки. Данный эффект увеличивается с уменьшением частоты электромагнитного поля. Применение SSOR-предобусловливания позволяет добиться дополнительного
ускорения, в среднем до 1.5 раз.
Литература
1. П. А. Домников, С. В. Киреева, М. Г. Персова, Ю. Г. Соловейчик. Конечноэлементное
моделирование трехмерных магнитотеллурических полей с применением технологии
деревьев-кодеревьев и постановки с совместным использованием векторного и скалярного потенциалов // Научный вестник НГТУ. ─ 2011. ─ №3. ─ С. 43-52.
2. Соловейчик Ю.Г., Рояк М.Э., Персова М.Г. Метод конечных элементов для решения скалярных и векторных задач: учеб. пособие. – Новосибирск: Изд-во НГТУ, 2007. – (Сер.
«Учебники НГТУ»).
3. Жданов М.С. Теория обратных задач и регуляризации в геофизике // М.: Научный мир,
2007. – 712 с.
4. Sogabe T., S.-L. Zhang. A COCR method for solving complex symmetric linear systems //
Journal of Computational and Applied Mathematics, 199(2007), pp. 297-303.
5. Zhou L. Residual smoothing techniques for iterative methods / L. Zhou, H. Walker // SIAM J.
Sci. Computing, vol. 15, no. 2, 1994, pp. 297-312.
6. Saad Y., Iterative methods for sparse linear systems – 2nd ed. – SIAM, Philadelphia, – 2003, –
528 pp.
Домников Петр Александрович
к.т.н., научный сотрудник кафедры Прикладной математики НГТУ (630073, Новосибирск,
пр. К. Маркса, 20) тел. (383)346-27-76, e-mail: p_domnikov@mail.ru.
Investigation of the effect of the preconditioner choice for the SLAE matrices in finiteelement modeling of three-dimensional magnetotelluric field
P.A. Domnikov
In this paper an experiment on the use of various variational formulations for solving the problem of three-dimensional magnetotelluric field modeling by vector finite element method is described. Computational experiments on the use of various preconditioners for solving the related
finite element systems of linear equations are carried out.
Keywords: finite element method, 3D-modeling, electromagnetic field, iterative methods.
101
Разработка методов выполнения 3D–инверсий и способов ругуляризации
Разработка методов выполнения 3D-инверсий
и способов регуляризации
Т. Б. Епанчинцева
В работе рассматривается подход к 3D-инверсии данных зондирования стационарным
электромагнитным полем, который заключается в подборе удельной электрической проводимости в ячеистых структурах. Этот подход основан на использовании сетки, на которой решается прямая задача, для выполнения инверсий.
Ключевые слова: 3D-инверсия, геоэлектроразведка, ГЭЛ.
1. Введение
Основой геоэлектроразведки является задача восстановления параметров проводимости,
а так же определение глубины залегания и размеров локальных неоднородных объектов с
помощью моделирования электромагнитных полей. При решении нефтепоисковых задач
применение технологий 3D-инверсий на этапе разведки новых месторождений позволяет локализовать геоэлектрические неоднородности, обусловленные скоплением углеводородов,
оценить их глубину залегания, а также спрогнозировать объѐмы добычи и подготовить новое
месторождение к разработке. Повышение эффективности геологоразведочных работ – одна
из стратегических целей многих компаний, что определяет необходимость разработки и программной реализации новых, высокоточных методов и технологий выполнения 3D-инверсий,
а так же сопутствующих технологий моделирования геоэлектромагнитных полей.
Источник типа ГЭЛ получил широкое применение при проведении геофизичеких исследований структуры среды. Этот источник представляет собой систему из токовой линии и
двух заземленных электродов и возбуждает преимущественно горизонтальные токи, характерные широким латеральным распространением. Таким образом на дневной поверхности
получается отклик от всей толщи вмещающей среды.
В данной работе представляется подход реализации 3D-инверсии, основанный на методе
Гаусса-Ньютона, для восстановления распределения удельного электрического сопротивления в мелких ячейках, на которые разбивается исследуемая область, с использованием одной
и той же сетки для решения прямой и обратной задач [1, 2]. В данном методе на каждом шаге
3D-инверсии вычисление полей влияния для каждой ячейки не требуется, но решается последовательность прямых задач. Использование ячеистых структур – стандартный подход
при реализации алгоритмов 3D-инверсии данных электромагнитных зондирований. Однако
главной проблемой развития и внедрения этих алгоритмов в практику электроразведочных
исследований является их вычислительная трудоѐмкость, и поэтому чаще всего при их реализации используют упрощѐнные математические модели, что может негативно влиять на
результаты инверсии.
2. Математическая модель для расчѐта трѐхмерного стационарного электрического поля ГЭЛ
Рассмотрим схему моделирования стационарного электромагнитного поля для источника
ГЭЛ. Такая модель используется для интерпретации данных при работе на постоянном токе,
то есть при обработке данных полевых работ, в которых при включенном токе в ГЭЛ было
измерено электрическое поле в приѐмниках [3, 4].
102
Применим операцию div к обеим частям уравнения
(1)
Учитывая, что во вмещающей горизонтально-слоистой (или осесимметричной) среде
), получим
электрическое поле полностью описывается потенциалом (
(2)
где
– удельная электрическая проводимость среды (как правило, в задачах геоэлектрики – кусочно-постоянная функция).
В случае ГЭЛ источник
представляет собой сумму двух сосредоточенных в точке
источников (электроды и , через которые ток или втекает в среду, или вытекает из неѐ),
то есть необходимо решить следующую краевую задачу:
(3)
(4)
и
– точечные источники,
где
– величина тока в ГЭЛ, , , – координаты точки , , ,
– координаты точки ,
– дельта-функция Дирака.
Цилиндрическая расчѐтная область  показана на рис. 1. Область  ограничена грани, а также дневной поверхностью , удалѐнной
цей , определяемой соотношением
вертикальной границей
и горизонтальной границей , являющейся либо удалѐнной границей, либо границей между средой и фундаментом.
Рис. 1. Пример расчѐтной области
Задача (3), (4) решалась методом конечных элементов с использованием трилинейных
базисных функций на прямоугольниках.
3. 3D-интерпретация данных
В качестве параметров обратной задачи будем рассматривать значения удельной проводимости в заданном наборе ячеек, на которые разбивается исследуемая область.
Будем считать, что в приѐмниках регистрируются сигналы
– значения поля в k-м приѐмнике,
, – номер положения установки,
. Эти сигналы формируются из
электрического поля ГЭЛ.
Обозначим за
искомые параметры удельной проводимости в локальных объектах,
,а
- параметры референтной модели, к которой производится сглаживание.
103
Значения
могут быть найдены в результате минимизации функционала
(5)
где – оператор, переводящий конечноэлементное решение в значения в приѐмниках,
– некоторые веса,
– коэффициент регуляризации для m-го объекта, которые выбираются
такими, чтобы не находились отрицательные или слишком большие значения удельной проводимости.
Для поиска минимума функционала (5) выполняется линеаризация
(6)
где – матрица Якоби;
– конечноэлементное решение, полученное для начального рас– вектор приращений удельной
пределения параметров или на предыдущей итерации;
проводимости в ячейках.
Для формирования элементов матрицы Якоби рассмотрим СЛАУ прямой задачи моделирования стационарного электрического поля ГЭЛ (3), (4):
(7)
где и – матрица и вектор, полученные в результате конечноэлементной аппроксимации, а
– конечноэлементное решение.
Продифференцировав обе части уравнения (7) по параметру , получим:
(8)
Тогда элементы матрицы Якоби могут быть вычислены по формуле
(9)
где
– вектор значений удельной проводимости в ячейках на предыдущей итерации .
В формуле (9) производные матрицы по параметру вычисляются аналитически. В результате минимизация функционала (5) сводится к решению СЛАУ вида
(10)
При этом для решения СЛАУ (10) используется итерационный метод – ЛОС, где на каждой итерации умножение матрицы СЛАУ (10) на вектор
выполняется последовательным
. В свою очередь, и
умножением матрицы на этот вектор, затем – матрицы на вектор
умножение матриц и
на соответствующие векторы выполняется последовательным
умножением матриц, входящих в соотношение и определяющих компоненты . И самое
на соответствующий вектор матрица , естеглавное, при вычислении произведения
ственно, не обращается, а решается соответствующая СЛАУ с этой матрицей – фактически
решается прямая задача.
104
4. Заключение
Рассмотрен алгоритм решения обратных задач, а так же вычислительная схема конечноэлементного моделирования геоэлектромагнитных полей от источника ГЭЛ.
Применение данного подхода окажется выгодным для восстановления параметров в
большом наборе ячеек порядка нескольких тысяч. Однако так как обратная задача является
неустойчивой, важную роль при еѐ решении играет регуляризация. Применение регуляризации в рассматриваемом методе 3D-инверсии существенно увеличивает вычислительные и
временные затраты, так как при каждом изменении параметра регуляризации запускается
новый итерационный процесс, потому что матрица СЛАУ обратной задачи не собрана в явном виде, и необходим новый расчѐт с учѐтом текущих параметров, а значит дополнительное
решение последовательности прямых задач. Дальнейшее развитие связано с выбором соответствующих способов регуляризации, позволяющих сгладить получаемое распределение
электрофизических параметров геологической среды.
Литература
1. Cox L., Wilson G., Zhdanov M. 3D inversion of airborne electromagnetic data. Geophysics,
2012. V. 77, №4, P. WB59-WB69.
2. Oldenburg D., Haber E., Shekhman R. Three dimensional inversion of multisource time domain electromagnetic data. Geophysics, 2013. V. 78, №1, P. E47-E57.
3. Персова М.Г., Соловейчик Ю.Г. Тригубович Г.М. Компьютерное моделирование геоэлектромагнитных полей в трехмерных средах методом конечных элементов // Физика Земли.
2011. №2. С. 3-14.
4. Соловейчик Ю.Г., Рояк М.Э., Моисеев В.С., Васильев А.В. Математическое моделирование на базе метода конечных элементов трехмерных электрических полей в задачах электроразведки // Физика Земли. 1997. №9. С.67-71.
Епанчинцева Татьяна Борисовна
аспирант кафедры прикладной математики НГТУ, тел. 8 (960) 789-19-22, e-mail: etb-
tatiana@mail.ru
Development of 3D-inversion and regularization methods
T. Epanchintseva
The main issue considered in this paper is the 3D-inversion technique for stationary electromagnetic exploration data, which is capable of handling the conductivity selection in the cellular
structure. The technique is based on using the same mesh on which the direct problem is solved.
Keywords: 3D-inversion, geoelectric prospecting, GEL.
105
Идиально согласованные слои
Идеально согласованные слои
П. С. Жигалов, Б. В. Рак
В настоящей работе приводятся исследования возможности применения идеально согласованных слоѐв при решении уравнения Гельмгольца векторным методом конечных элементов.
Ключевые слова: уравнение Гельмгольца, идеально согласованные слои, векторный метод
конечных элементов.
1. Введение
Non-Maxwellian PML – PML, представленный путѐм модификации оператора набла. К
данному типу относятся PML, представленные через растяжение координат, the complex
frequency shifted PML (CFS-PML), the Convolutional PML (CPML), the Near PML (NPML).
В 1994 году Chew и Weedon предложили альтернативный подход реализации PML [1]
для сокращения неограниченной области моделирования. Применение комплексного растяжения координат для изменения оператора набла добавляет степени свободы, которые позволяют поглощающему слою иметь нулевое отражение от границы между расчѐтной областью моделирования и поглощающим слоем при любом угле падения. Данный подход был
применѐн для 3-D FDTD метода для системы уравнений Максвелла во временной области
моделирования с частотой 1ГГц. Так же стоит отметить, что данный подход может быть эффективно применѐн для метода конечных элементов.
В 1996 году W. C. Chew and J. M. Jin [2] рассмотрели проблемы численного отражения от
границы между расчѐтной областью и PML применительно не только к методу конечных
разностей, но и к методу конечных элементов. При этом авторы выяснили, что численные
ошибки отражения существуют. Численная схема с использованием метода конечных элементов была разработана для оптимизации PML в отношении его параметров. Приведены
примеры, которые демонстрируют производительность оптимизированной схемы PML и еѐ
применение к методу конечных элементов для задач рассеяния.
В 2000 году J. Alan Roden и Stephen D. Gedney представили реализацию идеально согласованного слоя (PML) для FDTD метода [3]. Реализация основана на комплексном растяжении координат, используя оператор свѐртки. Данный подход называется свѐрточным PML
(CPML). CPML предлагает целый ряд преимуществ по сравнению с традиционными реализациями PML. В частности, применение CPML является полностью независимым от рассматриваемой среды. Таким образом, при применении данного подхода не требуется изменять алгоритм, будь то неоднородная среда, среда с потерями, анизотропная или нелинейная
среда. Во-вторых, как показано CFS-PML достаточно эффективно поглощает затухающие
волны, а также может обеспечить значительную экономию памяти при моделировании электромагнитного поля для удлинѐнных волновых конструкций, острых углов или низкочастотных возбуждений.
В 2003 году S. A. Cummer представил новую формулировку PML [4]. Эта формулировка
разработана таким образом, чтобы дифференциальные уравнения в PML были идентичны
тем, которые находятся в расчѐтной области для любого линейного электромагнитного материала. Это делает этот метод особенно простым в реализации, особенно для диспергирующих и анизотропных материалов. Автор назвал этот метод почти идеально согласованный
слой (NPML), потому что он использует переменные изменения, которые строго определяют
зависимость проводимости PML от пространства. В данной работе было представлено срав106
нение c CPML для диэлектрической среды Лоренца. Стоит отметить, что NPML является
столь же эффективным, как и CPML.
2. Математическая модель
2.1. Математическая модель
Электромагнитное поле описывается системой уравнений Максвелла[5]:
B
– закон Фарадея,
t
(1)
D
  E  J – закон Ампера,
t
(2)
 E  
 
H
  B  0 – закон Гаусса для магнитной индукции,
  D   – закон Гаусса для электрической индукции,
где E – напряжѐнность электрического поля [В/м], H – напряжѐнность магнитного поля
[А/м], B   H – магнитная индукция [Тл], D   E – электрическая индукция [Кл/м2],  –
плотность электрических зарядов [Кл/м3],  – электрическая проводимость [См/м],  – диэлектрическая проницаемость [Ф/м],  – магнитная проницаемость [Гн/м], J – плотность
стороннего электрического тока [А/м2].
На границе  между материалами с различными физическими свойствами выполняются
следующие условия:
 E  n  
0 – тангенциальная компонента E непрерывна,

 B  n  
0 – нормальная компонента B непрерывна,

 H  n  
J  – тангенциальная компонента H разрывна,

 D  n  
 – нормальная компонента D разрывна.

Используя представление решения в виде гармонической зависимости exp(it ) , получим
из (1) и (2):
 E  i B ,
(3)

H i D   E  J .
(4)
Выполним следующие преобразования над (3):
 E  i H ,
 1 E  i H ,


  1 E  i H .
Подставим в (5) (4):



(5)

  1 E  i i E   E  J ,
107


  1

E  2 E  i E  i J ,


  1 E  k 2 E  i J ,
(6)
где 
k 2 i   2 . Уравнение (6) называют уравнением Гельмгольца.
Краевые условия для уравнения (6) можно записать следующим образом:
En
S1
 E n

Eg ,
S2
(7)

0.
(8)
Подействуем оператором   на уравнение (2):
 D

   H    
 E  J  .
 t



D
 E
 
   i E , и так как для замкнутой петли с тоt
t
ком выполняется   J  0 , получим закон сохранения заряда:



Так как    H  0 ,  

    i  E  0 .
(9)
2.2. Вариационная постановка
Введѐм следующие пространства:
3
3

H  rot,      L2    :   v   L2     ,






  H  rot,  : v  n  0 .
H0  rot,  
Эти пространства имеют скалярное произведение и норму:
 u , v    u  v *d  ,

u   u  u *d  ,

где индекс * обозначает комплексное сопряжение.
Скалярно умножим (6) на некоторую пробную функцию v  H 0  rot,   :
  

  
1
 

 E , v  k 2 E, v   i J , v ,

1
*
2
*
  i J  v *d  .
    E  v d    k E  v d  



Воспользовавшись первой векторной формулой Грина:
*
  u  v *d     n  u   v *d  ,
  u  v d 



получим:
108


1
*
1
*
2
*
*
   E  v d    n    E  v d    k E  v d     i J  v d  .






Применим тождества a  b  c   a  c   b и a  b b  a :


1
*
2
*
*
*
1
   E  v d    k E  v d     i J  v d    v  n    E d  .




(10)
Так как v  H 0  rot,   , то из свойств пространства H 0  rot,   второй интеграл в правой
части равен нулю, тогда уравнение (10) примет вид:
1
*
2
*
*
   E  v d    k E  v d     i J  v d  .


(11)

Рассмотрим ещѐ одно пространство:
3


H 0  grad,     L2    :    L2     ,    0




В соответствии с комплексом Де Рама (DeRham):



H  grad,   
 H  rot,    H  div,    L2    ,
будет иметь место вложение   H0  rot,   ,   H0  grad,   . Возьмѐм v  , тогда (11)
примет вид:
*
*
*
1
2
  i J     d  .
   E     d    k E     d  



 
Использовав свойство дивергенции    F    F    F и применив формулу Остроградского-Гаусса, получим:
*
*
1
2
d   i *  Jd    i J  nd  .
   E     d    k E    




0 ,    0 , то получим:
Поскольку      0 , J 
*
2
 k E     d  0 ,

следовательно, решение вариационной задачи (11) удовлетворяет закону сохранения заряда
(9) в слабом смысле.
2.3. Дискретная вариационная постановка
Разобьѐм область  на m непересекающихся элементов (тетраэдров):


m
k 1
k , i  j i   j   .
Введѐм конечномерные подпространства:
H 0h  rot,    H 0  rot,   , H 0h  grad,    H 0  grad,   .
109
Для дискретных подпространств H 0h  rot,   и H 0h  grad,   комплекс Де Рама также будет верен, а закон сохранения заряда также будет выполнен в слабом смысле.
Пространство H 0h  rot,   является прямой суммой подпространств:

H 0h  rot,

  N0h  rot,    N0h  rot,  
где N0h  rot,   – ядро rot-оператора,
 N0h  rot, 



,
– его ортогональное дополнение. Для
выполнения условий непрерывности, необходимо использовать полный базис [6], то есть состоящий из роторных базисных функций, принадлежащих пространству
 N0h  rot, 

и
обеспечивающих непрерывность тангенциальных компонент поля E , и градиентных базис-

ных функций из пространства N0h  rot,  


, отвечающих за скачок нормальной компонен-
ты поля E и выполнения закона сохранения заряда.
Представим векторнозначную функцию E h в виде разложения по базисным функциям
 j  H 0h  rot,   :
n
E h   q j j .
j 1
В качестве тестовой функции выберем базисную функцию  i  H 0h  rot,   , тогда конечноэлементная аппроксимация вариационного уравнения (11) примет вид:


    1  j   i d    k 2 j  i d  q j    i J  i d  .
j




2.4. Граничные PML-условия
Однородные краевые условия (7) обычно требуется располагать на довольно большом
расстоянии от источника поля. Чтобы избежать подобной проблемы и сократить размеры
расчѐтной области, можно применить поглощающие краевые условия, например, идеально
согласованные слои (perfectlymatchedlayers, PML). Одним из способов их задания является
следующая комплексная замена переменных:
x
y
z
0
0
0
x   sx (t )dt , y   s y (t )dt , z   sz (t )dt ,
где s
j ( )
 1j ( )  i 2j ( ) – непрерывная функция, удовлетворяющая следующему условию:
 1j ( )  1 ,  2j ( )  0 – вне PML-условия,
 1j ( )  1,  2j ( )  0 – внутри PML-условия.
Таким образом, s j в PML-слое также может быть задана в виде:
110
m
 d ( ) 
s j ( ) 
1  
 , m  1,
  
где d ( ) – расстояние в j -м направлении от границы PML-слоя,  – толщина PML-слоя.
Оператор  в новых координатах примет вид:
1  1  1 
,
,
 
.
 sx x s y y sz z 
3. Результаты
В качестве расчѐтной области был выбран однородный куб, с длиной каждой стороны
1200 м. Внутри куба были заданы следующие физические параметры:   0 ,    0 ,   0.2
. Вокруг этого куба со всех сторон был задан PML слой толщиной 100м. В качестве эталонного решения было использовано решение при длине каждой стороны куба в 3000 м. В качестве источника поля в центре области была задана петля радиусом 50 м с током частотой 10
Гц. Схематичное представление сечения расчѐтной области представлено на рис. 1.
Относительные погрешности полученных решений в норме L2 при различных значениях
параметров приведены в табл. 1.
Таблица 1. Относительные погрешности при различных параметрах
m
3
2
3
3
3
3
3
3
3
3
3
3
3
2
3
 Re
4
2
3
4
3
5
4
5
5
6
3
2
2
3
6
Отн. погрешность
 Im
3
1
3
2
2
3
4
2
4
3
4
3
2
1
4
0.0396909
0.0422647
0.0437849
0.047938
0.04806
0.0487681
0.0561604
0.058275
0.058801
0.0622177
0.0632365
0.0637031
0.0660946
0.0667236
0.067283
Как видно из таблицы, при оптимальных значениях параметров разница между эталонным полем и полем при использовании PMLусловий составляет менее 5%.
111
Рис. 1. Схематичное представление сечения расчѐтной области
Далее на рисунках приведено графическое представление поля E в сечении z  0 . При
этом слева изображено эталонное поле,справа – поле при использовании PMLусловий с оптимальными параметрами.
Рис. 2. Действительная часть компоненты E x
Рис. 3. Действительная часть компоненты E y
112
Рис. 4. Действительная часть ( Ex , E y )
8. Заключение
Результаты исследований показали высокую целесообразность применения идеально согласованных слоѐв. При значительном уменьшении размерности СЛАУ удалось добиться
разницы с решением без PMLменее 5%.
В дальнейшем планируется рассмотреть другие способы построения идеально согласованных слоѐвв различных областях моделирования.
Выражение благодарности
Авторы выражают искреннюю признательность и глубокую благодарность научному руководителю д.т.н., профессору Элле Петровне Шуриной.
Литература
1. ChewW. C., WeedonW. H.A 3D perfectly matched medium from modified Maxwell’s equations
with stretched coordinates // Microw. Opt. Technol. Lett. 1994.Vol. 7–13.P. 599–604.
2. ChewW. C., Jin J. M.Perfectly matched layer in the discretized space: an analysis and optimization // Electromagnetics.1996. Vol. 16. P. 325–340.
3. Roden J. A., GedneyS. D.Convolutional PML (CPML): An efficient FDTD implementation of
the CFS-PML for arbitrary media // Microw. Opt. Technol. Lett. Dec. 2000. Vol. 27. P. 334–
339. doi:10.1002/1098-2760(20001205)27:5<334::AID-MOP14>3.0.CO;2-A
4. CummerS. A.A simple, nearly perfectly matched layer for general electromagnetic media //
IEEE Microw. Wirel. Lett.2003.Vol. 13.No. 3.P. 128–130. doi:10.1109/LMWC.2003.810124
5. ЭповМ. И.,
ШуринаЭ. П.,
АрхиповД. А.Параллельныеконечноэлементныевычислительныесхемывзадачахгеоэлектрики//
Вычислительные технологии. – 2013. –Том 18, No2. – С. 94-112.
6. Webb
J. P.Hierarchalvectorbasisfunctionsofarbitraryorderfortriangularandtetrahedralfiniteelements //
IEEE transactions on antennas and propagation. – 1999. – Vol. 47. – P. 1244-1253.
113
Жигалов Петр Сергеевич
студент 1 курса магистратуры кафедры Вычислительных технологий НГТУ (630073, г.
Новосибирск, пр-т К.Маркса, 20) тел. (383) 346-27-76, e-mail: peter.zhigalov@gmail.com
Рак Богдан Вадимович
аспирант 2 года обучения кафедры Вычислительных технологий НГТУ (630073, г. Новосибирск, пр-т К.Маркса, 20) тел. (383) 346-27-76, e-mail: bogdan.v.rak@yandex.ru
Perfectly Matched Layers
P. S. Zhigalov, B. V. Rak
The provided research show possibility of using perfectly matched layers for Helmholtz equation which solved by the vector finite element method.
Keywords: Helmholtz equation, perfectly matched layers, vector finite element method.
114
Определение эффективного тензора гидравлической проницаемости гетерогенной слоистой среды
Определение эффективного тензора гидравлической
проницаемости гетерогенной слоистой среды
Н. Б. Иткина, С. И. Марков
В настоящей работе приводится методика определения эффективного тензора гидравлической проницаемости гетерогенной слоистой среды. Приводится сравнительный анализ
результатов решения задачи просачивания с помощью разрывного метода Галѐркина в
гетерогенной слоистой среде и в однородной среде с эффективным тензором проницаемости.
Ключевые слова: задача Дарси, тензор проницаемости, разрывный метод Галѐркина.
1. Введение
Одной из проблем математического моделирования процессов, происходящих в гетерогенных (неоднородных) средах, является сложность дискретизации расчѐтной области. В
связи с этим возникает задача о замене сложной гетерогенной среды на некоторую однородную среду со свойствами, эквивалентными исходной (процесс гомогенизации).
Одним из методов гомогенизации является теория эффективных сред. Теория эффективных сред позволяет перейти от свойств среды, зависящих от координат, к свойствам, характеризующим среду в целом.
При исследовании транспортных свойств материала, в частности гидравлической проницаемости, теория эффективных сред применима, если масштаб рассмотрения проблемы много больше размера неоднородностей. Неоднородности среды могут быть представлены порами, трещинами и разнообразными микровключениями.
Как правило, такие композитные материалы обладают анизотропией физических
свойств. Причинами анизотропии физических свойств могут являться преимущественная
ориентация неоднородностей с контрастными свойствами по отношению к другим включениям (например, преимущественная ориентация трещин) и слоистость среды.
В работе рассматриваются вопросы вычисления эффективного тензора гидравлической
проницаемости высококонтрастных слоистых материалов. Численная гомогенизация основана на решении задачи просачивания (закон Дарси) в гетерогенной слоистой среде с помощью
разрывного метода Галѐркина со стабилизатором Арнольда в несимметричной IPпостановке. Приводится сравнительный анализ результатов решения задачи Дарси в неоднородной среде и в однородной среде с эффективным тензором проницаемости.
2. Задача Дарси и определение тензора гидравлической проницаемости
2.1. Постановка задачи Дарси
Пусть   R3 – область, представленная в виде объединения подобластей 
n
i1
i с
межинтерфейсными границами  ij . Скорость фильтрации в   R3 области выражается законом Дарси и описывается системой уравнений
115

u   K  x, y, z  p,


  u  f ,
(1)
p  g,
(2)
D
где u – вектор скорости [ м/с ], p – давление [Па], g – давление [Па] на границе Г D , K –
положительно-определѐнный ограниченный симметричный тензор гидравлической проницаемости, для которого верно
c j  T    T K  x    C j  T  ,  
3
, x  .
(3)
Физически адекватные условия на интерфейсе  ij имеют вид
p  p ,
i
j
(4)
u   ni  u   n j .
i
j
Будем предполагать, что   R3 – выпуклая область. Введем разбиение области

K , под K понимается тетраэдр.
 : h 
{K} с границей 
K 
2.2. Метод решения задачи Дарси
Определим решение задачи в виде линейной комбинации полиномов на каждом конечном элементе. Для каждого K  h обозначим через m наивысшую локальную степень полиномов. Таким образом, конечно-элементные пространства определим в виде [2]

Vh

h
v v  L   : v|
2
K
   L  :|
2
Pm ( K ),deg Pm ( K )  m, K h  ,
3
K

[ Pm ( K )]3 ,deg Pm ( K )  m, K  h .
(5)
(6)
Решение u внутри каждого конечного элемента представляется непрерывной функцией
u ( x, y
, z)
n
 q  ( x, y, z) ,
i 1
i
i
(7)
где i ( x, y, z ) - базисная функция, ассоциированная с i-ым узлом.
Чтобы связать след и значение функции на границе конечного элемента, вводятся два
оператора – среднего и скачка [1].
Операторы среднего:
{v}=
1
(vi  v j ) на eint ,
2
{v}= vi на ebnd ,
1
{ }= ( i   j ) на eint ,
2
116
(8)
(9)
(10)
{ }= i на ebnd .
(11)
Операторы скачка:
=
[v] vi ni  v j n j на eint ,
(12)
[v]
= vi ni на ebnd ,
(13)
=
[ ]  i ni   j n j на eint ,
(14)
[=
 ] vi ni на ebnd .
где
eint
– внутреннее ребро,
ebnd
(15)
– внешнее ребро конечного элемента.
Соотношение (16) называют вариационной постановкой разрывного метода Галѐркина в
общем виде для системы уравнений (1),
 K 

h
ph  h vd     p  ph   K  h v  K p  [v ] dS 

   p  ph   K  h v   v[ K p ]
dS
0
 fvd  .
(16)

В зависимости от вида численных потоков можно получить вычислительную схему с
определенными свойствами. Определим «численные потоки» в вариационной постановке
(16) в форме "внутреннего штрафа" или IP - постановки
{ p }, на  0 ,
p h
g D , на Г D ,
0

{ph }   j ([ ph ])на  ,
K p  

 ph   j ([ ph ])на Г D ,
где
(17)
(18)

 [ ph ],   .
j [ ph ]
(19)
Подставим соотношения для потоков в (16) и запишем вариационную постановку разрывного метода Галѐркина в форме внутреннего штрафа [2]
 K p vd      p   K v  K p  [v] dS    [ p][v] 

l0 l


 fvd    g  K  n v  dS .

(20)
D
В зависимости от параметра  можно получить симметричную (   1 ) или несимметричную (   1 ) постановку разрывного метода Галѐркина в форме Internal Penalty. В рамках
данной работе будет рассмотрена несимметричная постановка (при   1 ).
2.3. Определение тензора гидравлической проницаемости
Для вычисления эффективного тензора проницаемости (далее K eff ) предлагается следующий подход. Из системы уравнений (1) для однородной среды имеем
u   K eff p ,
117
(21)
где K eff
eff
 K XX

 0
 0

0
eff
KYY
0
0
0
eff
K ZZ


 – эффективный тензор проницаемости.


Представим векторное уравнение (21) в виде системы скалярных уравнений
 p 
 
K
0
0   x 
uX 

  p 
 
eff
0   ,
 0
KYY
 uY  
y
eff
u 
 0
0
K ZZ   
 Z

 p 
 
 z 
eff
XX
(22)
откуда при условии, что тензор проницаемости не зависит от пространственных координат, получаем
eff
XX

K
 u 
2
d
eff


, KYY
2
 p 
  x  d 

X
 u 
2
d
eff


, K ZZ
2
 p 
  y  d 

Y
 u 
2
Z

2
d
 p 
  z  d 

.
(23)
Обратим внимание, что формулы (23) не используются совместно! Элементы тензора
могут определены только в определѐнном направлении. Так, для определения z-компоненты
тензора проницаемости необходим градиент давления, направленный вдоль оси Oz. Аналогично для других компонент. Рисунок 1 иллюстрирует направления градиента давления в зависимости от оцениваемой компоненты
Рис. 1. Возможные направления градиента давления при определении (слева направо) компонент
eff
eff
eff
, KYY
, K ZZ
тензора проницаемости K XX
3. Результаты: образец с горизонтальными слоями
Исследуемый образец – куб с размерами [0,1]  [0,1]  [0,1]  м  и тензором проницаемости
K1, нижний слой – [0,1]  [0,1] [0.2,0.25]  м  и тензором проницаемости K3, верхний слой –
[0,1]  [0,1]  [0.6,0.65] м и тензором проницаемости K2 (см. рис. 2, 3).
Для определения z-компоненты тензора проницаемости задаѐтся давление 1 (Па) на нижней границе расчѐтной области ( z  0 ), на верхней границе ( z  1 ) задаѐтся давление 0 (Па).
Для определения y-компоненты тензора проницаемости задаѐтся давление 1 (Па) на задней границе расчѐтной области ( y  1), на передней границе ( y  0 ) задаѐтся давление 0 (Па).
118
Для определения x-компоненты тензора проницаемости задаѐтся давление 1 (Па) на правой границе расчѐтной области ( x  0 ), на левой границе ( x  1 ) задаѐтся давление 0 (Па).
Объѐм образца Vобр.  1 м3  , объѐм каждого слоя Vслоя  0.05  м3  , что даѐт отношение
объѐмов
0.05  м3   0.05  м3 
Vслоѐв
100% 
100% 
0.1100% 
10% .
Vобр.
1 м 3 
Дополнительно проведено исследование расхождения решений задачи для неоднородной
среды и для однородной эффективной среды (с эффективным тензором проницаемости) в
норме пространства L2
  p  p  K   d
eff



2
  p  d
2
100% ,

где p - давление для неоднородной среды, p  K eff  - давление для эффективной среды.
Рис. 2. Структура образца
119
(24)
Рис. 3. Размеры образца
На рис. 4 изображена триангуляция с 13872 элементами, 3013 узлами, что соответствует
12052 неизвестным при решении СЛАУ. Для решения СЛАУ использован решатель
BiCGStab с LU-факторизацией. Коэффициент стабилизирующего члена Арнольда равен 5.
Все результаты (за исключением таблиц) приведены для разрывного квадратичного базиса.
Рис. 4. Триангуляция расчѐтной области
120
1 0 0

1. Рассмотрим случай
для K1 

0 1 0  , K2
0 0 1


0 
0 
 0.8 0
 0.1 0




0

0.8
0
,
K
0
0.1
0

 3 
.
 0

 0

0
0.8
0
0.1




На рис. 5 представлено распределение давление по объѐму для неконтрастных тензоров
проницаемости для градиента давления, направленного вдоль оси Oz.
eff
Рис. 5. Поле давления для определения K ZZ
-компоненты
Скорость потока вдоль оси Oz: u Z  0.13  м/с  .
0
0 
 0.98

Эффективный тензор проницаемости: K eff   0
0.98
0 .
 0
0
0.77 

  p  p  K   d
eff
Расхождение решений:

2
  p  d
2
100% 
3.24%.

Таблица 1. Условие непрерывности движения:
   u  d   0

13.872 элемента
Базис
   u  d 
h

линейный разрывный
квадратичный разрывный
9.63e-4
1.42e-4
110.976 элементов
   u  d 
h /2

6.54e-6
9.14e-6
Условие непрерывности движения позволяет проверить численно выполнение закона сохранения массы. В данном случае условие непрерывности движения выполняется с точностью до 4 знака на грубой сетке при использовании линейного базиса. Можно утверждать,
что вычислительная схема даѐт физичный результат.
121
1 0 0

2. Рассмотрим
случай K1 

0 1 0  , K2
0 0 1


0 
0 
 0.1 0
 0.8 0




0

0.1
0
,
K
0
0.8
0
3



.
 0


0 0.1
0 0.8 

 0
На рис. 6 представлено распределение давление по объѐму для градиента давления,
направленного вдоль оси Oz.
eff
Рис. 6. Поле давления для определения K ZZ
-компоненты, вынесено сечение y  0.5
Скорость потока вдоль оси Oz: u Z  0.68  м/с  .
0
0 
 0.98

Эффективный тензор проницаемости равен: K eff   0
0.98
0 .
 0
0
0.91

  p  p  K   d
eff
Расхождение решений:

2
  p  d
2
100% 
2.24%.

Таблица 2. Условие непрерывности движения:
   u  d   0

13.872 элементов
Базис
   u  d 
h

линейный
разрывный
квадратичный
разрывный
110.976 элементов
   u  d 
h /2

8.12e-4
5.93e-6
2.39e-4
8.56e-6
122
1 0 0


3. Случай контрастных тензоров
K1 
0 1 0  , K2

0 0 1


105 0
0 
0 
 0.8 0




5
0
0.8
0
,
K
0
10
0 .


 3 
 0
 0
0 0.8 
0 105 


На рис. 7 представлено распределение давление по объѐму для неконтрастных тензоров
проницаемости для градиента давления, направленного вдоль оси Oz.
eff
Рис. 7. Поле давления для определения K ZZ
-компоненты, вынесено сечение y  0.5
Скорость потока вдоль оси Oz: u Z  0.0002  м/с  .
0
0 
 0.97

Эффективный тензор проницаемости равен: K eff   0
0.97
0 .
 0
0
0.74 

  p  p  K   d
eff
Расхождение решений:

2
  p  d
2
100% 
89.1%.

Таблица 3. Условие непрерывности движения:
   u  d   0

13.872 элементов
Базис
   u  d 
h

линейный
разрывный
квадратичный
разрывный
110.976 элементов
   u  d 
h /2

5.82e-7
8.43e-8
2.61e-7
3.49e-8
123
4. Заключение
По результатам проведѐнных исследований можно сделать вывод, что формулы для
оценки эффективного тензора проницаемости (23) дают физически релевантный результат
только для слоѐв с соизмеримыми тензорами проницаемости. Так получено расхождение
решений для однородной и неоднородной сред менее 4% для первого исследования и менее
3% – для второго исследования.
Расхождение решений в третьем случае составляет более 89%. Объясняется это следующим образом. Слой с тензором проницаемости K 3 выступает в роли "экрана", за который
поле давления практически не распространяется (см. рис. 7). Однако под слоѐм находится
зона (окрашена в красный цвет), которая имеет высокие градиент давления и компоненту
тензора проницаемости K ZZ . Таким образом, при использовании формулы (23) суммируются
eff
как малые, так и большие величины разных порядков, что даѐт коэффициент K ZZ
 0.74 и не
соответствующую ему компоненту скорости u Z  0.0002  м/с  .
Значительное влияние на величину эффективной оценки оказывает поперечное сечение
включения, которое препятствует движению градиента поля. Так, для x- и y-компонент тензора проницаемости слои оказывают небольшое влияние по сравнению с z-компонентой.
Литература
1. D.N.Arnold, F.Brezzi, B.Cocburn, D.Marini. Unified analysis of discontinuous Galerkin methods for elliptic problems //SIAM J. Numer. Anal. 2002. V.39.
2. B.Cocburn. Discontinuous Galerkin methods for convection-dominated problems //In High –
Order Methods for Computational Physics, v.9, 2005, Springer, pp.69-224.
3. C.E.Baumann and J.T.Oden. A discontinuous hp finite element method for convection-diffusion
problems //Comput. Methods Appl. Mech. Eng., 175, 2000, pp311-341.
4. Lions J.`L. Problems aux limites non homogenes a donees irregulieres: Une methode
d’approximation // Numerical Analysis of Partial Differential Equations. 1968.
5. Oden J.T., Babuska I., Baumann C.E. A discontinuous hp finite element method for diffusion
problems // Journal of computational physics. 1998. no.146.
6. Brezzi F., Cockburn B., Marini L.D., Suli E. Stabilization mechanisms in Discontinuous Galerkin finite element methods //www.imati.cnr.it/brezzi/papers/bcms.pdf
7. Sudirham J.J., Van der Vegt J.J.W.V., Damme R.M.J.V. A study on discontinuous Galerkin finite element methods for elliptic problems. Memorandum No. 1690 .// University of Netherlands. 2003.
124
Иткина Наталья Борисовна
к.т.н., доцент кафедры Вычислительных технологий НГТУ (630073, г. Новосибирск, пр-т
К.Маркса, 20) тел. (383) 346-27-76, e-mail: shurina@online.sinor.ru
Марков Сергей Игоревич
аспирант кафедры Вычислительных технологий НГТУ (630073, г. Новосибирск, пр-т
К.Маркса, 20) тел. (383) 346-27-76, e-mail: www.sim91@list.ru
Determining an effective hydraulic permeability tensor of a heterogeneous layered medium
N. Itkina, S. Markov
A method of determining an effective hydraulic permeability tensor of a heterogeneous layered
medium is given in this paper. A seepage problem is solved using the Discontinuous Galerkin
method. Comparative analysis of solutions in a heterogeneous layered medium and a homogeneous medium with the effective hydraulic permeability tensor is provided.
Keywords: the Darcy problem, hydraulic permeability tensor, Discontinuous Galerkin method.
125
Конечноэлементное моделирование трехмерных гармонических электромагнитных полей
с использованием технологии выделения части поля
Конечноэлементное моделирование трехмерных
гармонических электромагнитных полей
с использованием технологии выделения части поля
Д. С. Киселев, А. С. Водостоева
Рассматривается проблема разработки ПО моделирования трехмерных электромагнитных
полей с использованием технологии выделения части поля. Задача решается методом конечных элементов. Реализовано моделирование электромагнитных полей в двумерной и
трехмерной области. Проведено сравнение полученных результатов с пакетом Helmholtz3D.
Ключевые слова: электромагнитное поле, частотная область, уравнение Гельмгольца, метод Галеркина.
1. Введение
Моделирование электромагнитных полей имеет множество применений. Одно из них –
задачи георазведки, в которых необходимо проводить моделирование электромагнитного
поля от различных источников. Нередко при исследовании верхних слоев Земли приходится
иметь дело с горизонтально слоистой средой. Однако, при включении объектов, нарушающих осевую симметрию, моделирование поля как осесимметричного становится невозможным.
Целью данной работы являлась разработка программного обеспечения моделирования
электромагнитных полей с использованием технологии выделения части поля и сравнения
результатов численных экспериментов с пакетом Helmholtz3D, разработанного канд. физ.мат. наук Д.С. Бутюгиным (ИВМиМГ) [1]. В качестве источника поля используется одиночный виток с током (генераторная петля).
2. Постановка задачи
Поведение электромагнитного поля может быть описано через векторный потенциал
магнитной индукции:
1
A
2 A
rot rotA  
 2 
J ст
(1)
t
t

где B  rotA , J ст – сторонние токи,  – магнитная проницаемость среды,  – проводимость среды,  – диэлектрическая проницаемость среды.
Технология выделения части поля заключается в том, что исходное поле А представляется в виде суммы двух полей – нормального А0 и аномального А :
(2)

A А  А0
0
где А – осесимметричное поле от источника, А – аномальное поле от объекта.
Тогда при условии, что магнитная проницаемость остается неизменной, можно записать
уравнение для аномального поля:
1
A
 2 A
A0
 2 A0
rot rotA  

 ( 0   )
 ( 0   ) 2
(3)
2
t
t
t
t

126
Уравнение 3 решается в частотной области с помощью узлового метода конечных элементов (МКЭ) для вычисления поля A0 и векторного МКЭ для вычисления A с использованием вариационной постановки в форме Галеркина [2].
3. Сравнение разработанного ПО с пакетом Helmholtz3D
Для сравнения полученных результатов воспользуемся тестовой моделью, имеющей следующие параметры:
Расчетная область расположена в кубе  25, 25   25, 25   25, 25 , объект имеет координаты
 10,10  10,10  7, 2 .
Проводимость земли  ср  1 , проводимость воздуха
 возд  0 , проводимость объекта  об  0.01 . Генераторная петля установлена на земной поверхности, радиус петли R  2.57 м . Частота тока равна 10 кГц.
Измерения проводились на поверхности Земли, на линии с координатами
 x,0,0 , x  1,8 .
Далее, на рисунках 1 и 2, приведены графики зависимости действительной и мнимой
компоненты поля A от координаты x , полученной с использованием выделения части поля
(decomp) и с помощью пакета Helmholtz3D (Helmholtz). На рисунке 3 приведены графики относительной разности полученных решений (относительно Helmholtz3D).

Рис. 1. График зависимости Ay ,re от координаты x

Рис. 2. График зависимости Ay ,im от координаты x
127
Рис. 3. График зависимости разницы полученных Ay,re и Ay,im от координаты x
4. Заключение
В ходе работы было разработано программное обеспечение для моделирования гармонических электромагнитных полей в трехмерной области. Проведено сравнение результатов
численных экспериментов по моделированию электромагнитного поля, созданного генераторной петлей, разработанным ПО и пакетом Helmholtz3D.
Литература
1. Бутюгин Д. С. Методы моделирования гармонических электромагнитных полей // диссертация на соискание ученой степени кандидата физико-математических наук, Новосибирск – 2013.
2. Соловейчик Ю. Г., Рояк М. Э., Персова М. Г. Метод конечных элементов для решения
скалярных и векторных задач, 2007. С. 364-401
Киселев Дмитрий Сергеевич
магистрант НГТУ факультета прикладной математики и информатики, тел. 8-913-2017762, e-mail: harlequin_00@mail.ru
Водостоева Анна Сергеевна
магистрант НГТУ факультета прикладной математики и информатики, тел. 8-913-731-0523, e-mail: vodostoeva_anna@mail.ru
Научный руководитель – Персова Марина Геннадьевна
д.т.н., профессор кафедры прикладной математики НГТУ, ведущий научный сотрудник
(630073, Новосибирск, пр. Карла Маркса, 20) тел. (383) 346-27-76, e-mail: perso-
va@ami.nstu.ru
128
Конечноэлементное моделирование процесса распостранения упругой волны
Конечноэлементное моделирование процесса
распространения упругой волны
Д. С. Киселев
Рассматривается проблема разработки ПО моделирования процесса распространения
упругих волн путем решения задачи упругости. Задача решается методом конечных элементов. Реализовано решение задачи в двумерной области для задач с осевой симметрией
и в трехмерной для задач без осевой симметрии.
Ключевые слова: упругая волна, смещение, уравнения равновесия, метод Галеркина.
1. Введение
Сейсморазведка является распространенным методом в геофизических исследованиях
верхних слоев Земли. В этом методе изучается реакция геологических тел на искусственно
вызванные упругие колебания. Эти колебания фиксируются на различных удалениях от источника с помощью сейсмоприемников.
Волна, распространяющаяся от источника, попадает на границы, на которых скачкообразно меняются упругие свойства среды. При этом она разделяется как минимум на две – отраженную и проходящую. Отраженные волны возвращаются к земной поверхности, а проходящие продолжают двигаться вперед до тех пор, пока не встретят новую границу. Таким образом, к земной поверхности возвращаются все новые и новые волны.
Данная работа заключается в разработке ПО моделирования такого процесса. В работе
представлены результаты решения задачи в двумерной и трехмерной постановках.
2. Постановка задачи
Данная работа посвящена разработке ПО решения системы уравнений, описывающей
поведение упругого тела в двумерной области в цилиндрической системе координат и в
трехмерной области в декартовой системе координат. Поведение упругого тела в декартовой
системе координат для трехмерного случая описывается системой уравнений равновесия:

 2ux
Fx
 div  x , yx , zx    2 
t

2

 uy
Fy
div  xy ,  y , zy    2 
t

2

 uz
Fz
 div  xz , yz ,  z    2 
t

(1)
где напряжения определяются соотношениями









x 
 yx 
 zy 
 xz 
G xy , yz 
G yz , zx 
G zx (2)
 x  1  2   ,  y 
 y  1  2   ,  z 
 z  1  2   , xy 






где    x   y   z . Деформации определяются следующими соотношениями
u
x
u
u
z
u
y
 x x ,  y y ,  z z ,  xy x 
y
u y
x
u y u
u u
,  yz   z ,  zx z  x
z
y
x
z
(3)
где u   ux , u y , uz  – вектор смещения среды (искомая величина), G - модуль сдвига,  - коэфT
фициент Пуассона,  – плотность среды.
129
Постановка для случая цилиндрической системы координат рассмотрена в [1].
Скорости поперечной и продольной волн в однородной среде вычисляются по формулам
(4) и (5) соответственно [2]:
Vs  G 
(4)
(5)
Задача решалась методом конечных элементов с использованием постановки в форме
Галеркина [3]. Для аппроксимации процесса по времени использовалась четырехслойная неявная схема по времени.
Vp 
2 G 1  2 
   2G   ,  
3. Исследование точности решения трехмерной задачи
Для исследования точности полученного решения возьмем некоторую расчетную область небольшого размера, состоящую из двух слоев. Значения смещения будем измерять на
удалении 10м от источника на глубине 15м. Построив некоторую дискретизацию расчетной
области, будем уплотнять сетку по пространству в 2 раза.
На рисунках 1 и 2 приведены графики зависимости смещения вдоль оси Z и погрешности полученного решения от времени для приемника, расположенного на глубине 15м. Рассматривается временной интервал, на котором волна проходит через приемник.
Рис. 1. График зависимости смещения вдоль оси Z от времени на разных сетках
Рис. 2. График зависимости погрешности от времени для разных сеток относительно самого точного
решения
4. Сравнение решения осесимметричной задачи в двумерной и трехмерной постановках
Для данного эксперимента была взята большая расчетная область, чем в предыдущем
эксперименте. Изучалось изменение разницы полученных решений в 2D и 3D постановках
при сгущении сеток по времени и пространству. После получения первых результатов, исходную сетку (mesh 1) сгустили по пространству, получив вторую (mesh 2), после чего, сгустив вторую сетку по времени, получили третью (mesh 3).
130
Далее приведены графики искомого смещения u z (рис. 3), полученного на самых подробных сетках в 2D и 3D. Также приведены графики относительной разницы (относительно
2D) полученных решений на трех сетках (рис. 4).
Рис. 3. График зависимости смещения вдоль оси Z от времени
Рис. 4. График зависимости разности полученных в 2D и 3D решений от времени
5. Заключение
Разработаны программы для моделирования распространения упругой волны в трехмерной и двумерной (осесимметричной) постановках. Проведено сравнение решений двумерной
и трехмерной задач, что подтвердило правильность полученных результатов. При этом, как и
ожидалось, время счета при моделировании распространения осесимметричной упругой
волны в 3D постановке на порядки больше, чем решение этой же задачи в 2D постановке.
Литература
1. Кошкина Ю. И. Моделирование процесса распространения упругих волн в осесимметричной среде // XI международная конференция "Актуальные проблемы электронного
приборостроения" АПЭП – 2012. Т. 6 Моделирование и вычислительная техника, с. 8993.
2. Урупов А. К. Основы трехмерной сейсморазведки, 2004. С. 70-97
3. Соловейчик Ю. Г., Рояк М. Э., Персова М. Г. Метод конечных элементов для решения
скалярных и векторных задач, 2007. С. 364-401
Киселев Дмитрий Сергеевич
магистрант НГТУ факультета прикладной математики и информатики, тел. 8-913-2017762, e-mail: harlequin_00@mail.ru
Научный руководитель – Персова Марина Геннадьевна
д.т.н., профессор кафедры прикладной математики НГТУ, ведущий научный сотрудник
(630073, Новосибирск, пр. Карла Маркса, 20) тел. (383) 346-27-76, e-mail:
persova@ami.nstu.ru
131
Отбор ковариат в модели пропорциональных интенсивностей Кокса
Отбор ковариат в модели пропорциональных
интенсивностей Кокса
А. В. Кочнев
В работе представлены результаты, полученные в ходе исследования методов идентификации LASSO, критерия Макфаддена, скорректированного критерия Макфаддена при
идентификации полупараметрической модели пропорциональных интенсивностей Кокса.
Ключевые слова: метод Lasso, модель пропорциональных интенсивностей Кокса, критерий Макфаддена, скорректированный критерий Макфаддена.
1. Введение
Во многих областях науки и техники часто возникают задачи, связанные с анализом данных, характеризующих время функционирования некоторого объекта. Данные такого рода
принято называть данными типа времени жизни и по природе своей они носят случайный
характер. Статистический анализ этих данных позволяет получить некоторые закономерности, сопоставить результаты экспериментов с некоторой функции надежности, что позволяет
в дальнейшем прогнозировать продолжительность жизни объекта, а также степень влияния
различных факторов.
Процедура построения моделей, описывающих зависимость продолжительности функционирования от внешних условий состоит из двух шагов. На первом шаге, на основе проведѐнных наблюдений строится модель, включающая в себя исходя из предметной области, все
условия, которые могут влиять на наблюдаемый объект. На втором шаге производится выбор
признаков, а также оценивание параметров выбранной модели. Одним из показателей качества построенной модели является исключение из неѐ условий, которые не влияют или незначительно влияют на исследуемый объект. Кроме того, зачастую встаѐт задача упорядочивания факторов по силе воздействия на объект наблюдений. Интерес к решению задач подобного рода основан на выявлении факторов в большей степени приводящей к деградации
объекта. Данные задачи называются задачами регуляризации, суть которых заключается в
добавлении некоторых условий для получения более интерпретируемых и простых моделей.
Для решения данных задач применяются методы, называемые методами регуляризации, суть
которых заключается в уменьшении ошибки предсказаний модели, сокращая вариабельность
оценок коэффициентов.
На данный момент широкое распространение получил метод LASSO, предложенный в
1996 году Робертом Тибширани. Особенностью данного метода является введение параметра
ограничения для параметров модели, в результате которого коэффициенты при малозначащих регрессорах обращаются в нуль.
Кроме того, стоит учитывать тот факт, что при обращении в нуль и/или исключения
большого числа регрессоров, модель также теряет в качестве. Иными словами, необходимо
установить некоторый баланс между исключением и включением в модель регрессоров, для
получения полных и интерпретируемых моделей.
132
2. Используемые методы
Рассмотрим метод LASSO (Least absolute shrinkage and selection operator). LASSO — алгоритм оценивания коэффициентов модели, суть которого заключается в введении ограничения на сумму абсолютных значений коэффициентов модели, что приводит к обращению в
нуль некоторых коэффициентов модели. Ненулевые коэффициенты соответствуют признакам, входящим в модель, нулевые признаки соответствуют коэффициентам, уступающим по
влиянию на модель или не входящим в неѐ. Для получения оценок вводят ограничение:
 i
t,
(1)
i
i – параметры модели, t – параметр ограничения метода.[1]
Критерий Мак-Фадена [2]. Используется для структурной идентификации регрессионной
модели. Наиболее предпочтительной для данного критерия считается модель с наибольшим
значением. Значения высчитываются как:
где
2
RMcFadden
 1
ln Lˆ full
,
ln Lˆ
(2)
intercpt
где ln Lˆ full оценка функции правдоподобия для модели с оцениваемым числом параметров,
ln Lˆintercpt оценка функции правдоподобия для модели с одним параметром – свободным
членом. Значение данного критерия изменяется от 0 до 1.
Критерий Мак-Фадена скорректированный [2]. Отличительной особенностью данного
критерия от предыдущего является штраф, налагаемый на введение дополнительных параметров. Аналогично предыдущему случаю более предпочтительной будет модель с большим
значением данного критерия. Так же стоит заметить, что значение данного критерия изменяется в диапазоне не от 0 до 1. Значение данного критерия рассчитывается как:
2
Radj
.McFadden  1 
ln Lˆ full  K
,
ln Lˆ
(3)
intercpt
где K – разность количества параметров между проверяемой моделью и моделью только со
свободным членом.
Модель Кокса (Cox Proportional Hazards Model), часто называемая в литературе «Пропорциональная модель Кокса» или модель пропорциональных интенсивностей, является наиболее используемым в современных публикациях и рекомендуемым инструментом анализа
данных выживаемости. В ее основе лежит метод множественной регрессии.
Модель пропорциональных интенсивностей, определяется следующим соотношением:
 x
(t;  ) r ( x;  )  0 ( x;  ) ,
(4)
 – вектор параметров регрессии, r ( x;  ) – неотрицательная функция от ковариат,
0 ( x;  ) – базовая кумулятивная функция риска.[3]
где
Если в (3) не вводится предположение относительно закона распределения времени функционирования объекта, модель называется полупараметрической. Если же вводится параметризация как для функции воздействий, так и для базовой кумулятивной функции риска
0 ( x;  ) , модель считается параметрической.
133
Оценки неизвестных параметров модели пропорциональных интенсивностей находятся
методом максимального правдоподобия. В случае полупараметрической модели максимизируют логарифм функции частичного правдоподобия:
ˆ x;  ))

ln(L(

n

r ( x j ;  ))  ,

j:t j ti

n
i ln(r ( xi ;  ))  ln( 
i 1

(5)
В случае параметрической модели логарифмическая функция правдоподобия имеет вид
ln(L(
x;  , ))

n
 i  ln(r ( xi ;  ))  ln 0 (t i ; )   r ( xi ;  )0 (ti ; )  ,
(6)
i 1
Для учѐта штрафа накладываемым методом LASSO воспользуемся методом штрафных
функций. Метод штрафных функций позволяет использовать различные методы поиска для
решения задач с условием.[4]
Пусть необходимо решить задачу:


max f ( x ) h j ( x ) 0, j 1, m ;gi ( x )  0,i m 1,k ,
(7)
в которой целевая функция и функции системы ограничений представляют выпуклые функции. Основная идея заключается в следующем. Строят такую вспомогательную функцию
m
Q( x,r )  f ( x )   r j  H h j ( x )  
j 1
k

j m 1
r j  G  g j ( x )  ,
(8)
чтобы приближенное решение задачи (7) находилось в результате решения последовательности задач безусловной минимизации функции (8)
maxQ( x,r ) ,
(9)
Функции H и G выбираются, таким образом, чтоб они становились отличными от нуля
при нарушении соответствующего ограничения. Приближенное решение задачи (7) получается в результате решения последовательности задач (9) при r j  , j 1, k . Так как в данной работе используются только ограничения неравенства в качестве функции G выберем

1
G
g j (x )  g j (x )
j [g j ( x )] 
2
  ,
2
(10)
3. Выводы
При проведении экспериментов по структурной идентификации логлинейной функции от
воздействий наилучшим образом проявил себя скорректированный критерий Мак-Фадена.
Информационные критерии Акаике и Шварца ввиду величины штрафа достаточно часто
предпочитали модели с меньшим количеством параметров, а критерии Мак-Фадена в качестве истинной принимали модель с избыточным количеством членов. С использованием
критериев принятия решений в [6] показано, что наиболее предпочтительным в большинстве
случаев оказался скорректированный критерий Мак-Фадена.
В результате проведѐнных вычислительных экспериментов выяснено, что метод LASSO
достаточно хорошо упорядочивает ковариаты по степени влияния на модель. Также было
выяснено что при упорядочивании ковариат методом LASSO количество итераций, необхо-
134
димое для получения оценки при условии, что параметр ограничения s превосходит истинную сумму модулей модели равно единице, так как в данном случае метод работает аналогично методу максимального правдоподобия ввиду равенству нулю слагаемого штрафа метода штрафных функций. При уменьшении параметра ограничения количество итераций
возрастает, еще более оно возрастает по приближению к истинной сумме модулей слева. При
изменении величины параметра ограничения, отношения порядка между параметрами сохраняется. В результате чего можно прийти к выводу о том, что метод пригоден для упорядочивания ковариат по степени влияния, но не позволяет оценить степень влияния конкретной ковариаты, а только по отношению к другим. Из чего можно сделать вывод о том, что
данным метод не может использоваться как метод отбора. Кроме того очевидна вычислительная сложность подбора параметра ограничения s , более подробно о которой изложено в
[5]. Также зачастую нулевые параметры не становятся в точности равными нулю, что значительно осложняет их отбор.
На основе рассмотренных методов можно построить вычислительную процедуру по контролируемому отбору ковариат в модели Кокса. Вся процедура будет состоять из двух шагов:
1. С учѐтом априорных данных о модели выбирается параметр ограничения для (1), такой что левая часть неравенства ощутимо превосходит параметр. Если подобных
данных нет, он подбирается.
2. С помощью метода LASSO получаются параметры модели  .
3. С помощью скорректированного метода Макфаддена, определяются ковариаты которые могут быть исключены из модели, не уменьшая значения критерия.
4. Заключение
В работе предложена алгоритм для получения более простых и интерпретируемых моделей пропорциональных рисков Кокса, с использованием метода LASSO и скорректированного критерия Макфаддена. Данный алгоритм значительно проще в вычислительном плане
рассмотренной в [6] процедуры отбора регрессоров, а также позволяет контролировать точность результирующей модели.
Литература
1. Robert Tibshirani. Regression Shrikage and Selection via the Lasso // 1996 Journal of the Royal Statistical Society. Series B (Methodological), Volume 58, Issue 1, 1996, P. 267-290.
2. Allison. P What’s the Best R-Squared for Logistic Regression? [Электронный ресурс] / P
ALLISON;
Statistical
horizons.
–
Режим
доступа:
http://www.statisticalhorizons.com/r2logistic.
3. Е.В. Чимитова, М.А. Ведерникова, Н.С. Галанова Непараметрические критерии согласия
в задачах проверки адекватности моделей надежности по цензурированным данным //
Вестник Томского государственного университета. Управление, вычислительная техника
и информатика. - Томск: 2013. - С. 115-125.Об анализе выживаемости А.Б.Мерков 1 -8
стр 2006
4. Б.Ю. Лемешко. Методы оптимизации: Конспект лекций //– Новосибирск: Изд-во НГТУ,
2009. – 126 с
5. Robert Tibshirani. The lasso method for variable selection in the cox model// Statistics in
medicine, VOL. 16, 385Ð395 (1997)
6. Кочнев А. В. Сравнительной анализ методов идентификации вероятностных моделей//
Материалы всероссийской научной конференции молодых учѐных. «Наука, технологии,
инновации» Новосибирск, 02-06 декабря, 2014. С. 41–44.
135
Кочнев Андрей Владимирович
бакалавр прикладной математики и информатики, магистрант факультета прикладной
математики и информатики НГТУ, тел. 8 (923) 246-44-23, e-mail: anreymost-
case@gmail.com
Covariate selection in Cox proportional hazards model
A. Kochnev
The paper presents results obtained in the study of methods of identification LASSO, McFadden criterion, adjusted McFadden criterion for identification of semiparametric Cox proportional hazards model.
Keywords: Lasso, Cox's proportional hazards model, McFadden criterion, adjusted McFadden
criterion.
136
Апериодический генератор псевдослучайных чисел, основанный на решении уравнений в р-адических
числах и способы увеличения скорости генерации
Апериодический генератор псевдослучайных чисел,
основанный на решении уравнений в p-адических
числах и способы увеличения скорости генерации
А.Ю. Кузьменок, С. Ф. Кренделев, В.М. Волкова
В данной работе представлен новый алгоритм для генерации псевдослучайных чисел,
позволяющий получать последовательности, не имеющие периода. Исследованы статистические свойства таких последовательностей с помощью набора стандартных статистических тестов NIST STS. Дано описание способа оптимизации схемы с целью повышения скорости генерации.
Ключевые слова: апериодические генераторы псевдослучайных чисел, p-адические числа.
1. Введение
Большинство криптографических систем нашего времени требует использования генераторов псевдослучайных чисел. Наиболее важным требованием к генератору является его
надежность, ведь от надежности генератора напрямую зависит качество приложения.
Поскольку серьѐзным недостатком подавляющего числа существующих генераторов является наличие слишком коротких периодов и неприемлемые статистические свойства генерируемых последовательностей, на первом этапе работы решалась задача разработки генератора, основанного на использовании p-адических чисел, лишенного данных недостатков.
2. Принципы разработки генератора, основанного на решении уравнений в
p-адических числах
Идея использования p-адических чисел [1] для генерации псевдослучайных чисел не является новой [2, 3, 4]. Но генерируемые с использованием подобных методов последовательности имели период. Ранее авторами данной работы был рассмотрен [5] вариант pадического представления иррациональных или комплексных чисел, которые являются решениями алгебраического уравнения f x   0 , где f x  – многочлен степени m  2 с целыми коэффициентами. В этом случае можно представить эти числа в виде
x  t0  t1 p  t 2 p 2  ... , последовательность коэффициентов разложения {ti } может быть использована в качестве последовательности псевдослучайных чисел.Было показано, что получаемая с его помощью последовательность псевдослучайных чисел не является периодической.
3. Свойства разработанного генератора
Также были проведены исследования криптографических и статистических свойств, получаемых с помощью генератора последовательностей.
Было проведено тестирование по широко известному набору стандартных статистических тестов NIST STS [6], разработанному национальным институтом стандартов и технологий США. Можно сделать вывод о том, что генератор успешно прошел все 15 тестов NIST и
удовлетворяет свойствам случайных последовательностей.
137
Исследования показали, что для всех выборок значения вероятностей прохождения i -го
теста равномерно распределены, а доля последовательностей, успешно прошедших тест, попадает в заданный доверительный интервал.
Немаловажное значение имеет и простота выбора ключа для генератора: необходимо,
выбирать те полиномы, у которых нет рациональных корней и производная которых не равна
нулю по выбранному модулю.
4. Подходы к решению задачи повышения скорости генерации
Но, надо заметить, что рассматриваемый алгоритм предполагает использование длинных
чисел. Самой трудоемкой операцией алгоритма является возведение в степень длинного числа. Это снижает скорость генерации псевдослучайных чисел.
Очевидно, что задача увеличения скорости генерации при сохранении уровня надежности генератора является крайне важной. Решению данной задачи был посвящен второй, актуальный этап задачи.
Первой предлагаемой оптимизацией алгоритма является введение условия выбора ключа: следует брать в качестве ключа полиномы наименьшей степени. Очевидно, что это полиномы второй степени, при использовании которых возможно модификация алгоритма, позволяющая уйти от большинства самых трудоемких операция, таких как деление длинного
числа на длинное и др.
Был найден способ простой способ задания ключа, минимизирующий проверку допустимых условий и время подбора ключа, что позволило сделать скорость генерации постоянной, путем смены ключа по определенному алгоритму, через некоторое количество итераций.
Литература
1. Koblitz N. P-adic numbers, p-adic analysis, and zeta functions. graduate texts in mathematics V.
58, Springer-Verlag, New York, 1984.
2. Klapper A. and Goresky M. Feedback shift registers, 2-adic span, and combiners with memory
// Journal of cryptology. 1997. V. 10. P. 111-147.
3. Goresky M., Klapper A. 2-adic shift registers // Proceedings, Fast Software Encryption LNCS,
V. 809, Springer Verlag, 199. P. 174-178.
4. Goresky M., Klapper A. Feedback registers based on rami_ed extensions of the 2-adic numbers
(Extended Abstract) // EUROCRYPT, 1994. P. 215-222.
5. Кузьменок А. Ю., Ельчугин М. О. Апериодический генератор псевдослучайных чисел,
основанный на решении уравнений в p-адических числах // Инновации и научнотехническое творчество молодежи : материалы Рос. науч.-технич. конф. Новосибирск,
СибГУТИ, 2014. С. 336–337.
6. Rukhin A. and others A statistical test suite for random and pseudorandom number generators
for cryptographic applications. NIST Special publication 800-22 Revision 1a April 2010.
Кузьменок Александра Юрьевна
студентка 5 курса факультета прикладной математики и информатики НГТУ.
Волкова Виктория Михайловна
к.т.н., доцент кафедры теоретической и прикладной информатикиНГТУ (630073, Новосибирск, пр-т К.Маркса, 20) тел. (383) 3-46-06-00, e-mail: volkova@ami.nstu.ru
138
Кренделев Сергей Федорович
к.ф.-м.н., доцент кафедры программирования ММФ НГУ, руководитель лаборатории современных компьютерных технологий НИЧ НГУ, e-mail: s.f.krendelev@gmail.com
Aperiodic pseudorandom number generator based on the solution of equations in the padic numbers and ways to increase the generation speed
A.Y. Kuzmenok, S.Ph. Krendelev, V.M. Volkova
This article presents a new algorithm for pseudorandom number generating which produce sequences without period. The statistical properties of those sequences were analyzed with the use
of a standard statistical test suite NIST STS. The description of a way for scheme optimization
in order to increase the generation speed rate of generation was given.
Keywords: aperiodic pseudrandom number generators, p-adic number.
139
Решение уравнения Гельмгольца векторным многомасшатабным методом конечных элементов
Решение уравнения Гельмгольца векторным
многомасштабным методом конечных элементов
А. Ю. Кутищева
Разработана и реализована вычислительная схема векторного многомасштабного метода
конечных элементов для решения уравнения Гельмгольца в широком диапазоне частот в
области с микровключениями. Выполнено численное моделирование для нескольких образцов.
Ключевые слова: уравнение Гельмгольца, многомасштабный метод конечных элементов,
векторный метод конечных элементов.
1. Введение
На сегодняшний день уделяется большое внимание различным численным методам, позволяющим выполнить моделирование процессов в гетерогенных средах. Наибольшее развитие получили такие методы, как метод конечных суперэлементов [1], многомасштабный метод конечных элементов [2], гетерогенный многомасштабный метод [3] и другие. Все они
основаны на декомпозиции области моделирования на специальные подобласти – суперэлементы или макроэлементы. Далее в каждой подобласти решаются отдельные задачи в соответствии со спецификой предметной области. Такой поход позволяет изучать материалы с
большим количеством микровключений [4].
Однако вышеуказанные методы рассматриваются для решения только скалярных задач
[5,6], тогда как существует широкий класс приложений, где необходимы векторные постановки (например, моделирование электромагнитного поля в частотной области). В настоящее время подобные задачи решаются векторным методом конечных элементов [7], однако
это накладывает определенные ограничения на рассматриваемые постановки, что связано с
ограниченностью вычислительных ресурсов. В [8] предлагается метод основанный на идеях
многомасштабных методов о введении разбиения на макроэлементы (т.е. вводится специальная иерархия моделей), разрывного метода Галеркина [9] для согласования между макроэлементами и векторного метода конечных элементов [7].
В данной работе рассматривается классический многомасштабный метод конечных элементов [2] для решения векторных задач.
2. Постановка задачи
Рассмотрим уравнение Гельмгольца относительно комплекснозначной величины напряженности электрического поля E в неоднородной области  (рис. 1), состоящей из включений различной геометрии 1 и матрицы 0 (   0  1 ).


1

rot  rotE   i   2 E 0 в ,
(1)


где E – напряженность электрического поля [В/м];   0 r – магнитная проницаемость
[Гн/м],
r
–
относительная
магнитная
проницаемость,
µ

0
4 107 Гн / м ;

k 2 i   2 – волновое число;   2 f – циклическая частота [Гц];  – электропровод140
Z
ность среды [См/м];    0 r – диэлектрическая проницаемость [Ф/м],  r – относительная
диэлектрическая проницаемость,
0
8,85 1012 Ф / м .
Y
1
X
0
1
2
3
Рис. 1. Область моделирования
Граница области является непрерывной и определяется как   1  2  3 . На границах установим краевые условия следующим образом: на 1 определим неоднородные электрическое краевое условие n  E
1

E (где n – единичная внешняя нормаль к поверхно-
сти); определяющее возбуждение электрического поля; на  2 заданы однородные электрические
условия
 1rotE  n
3
nE
2

0 ; на
3
однородные
магнитные
краевые
условия

0.
3. Векторный многомасштабный метод конечных элементов
В основе векторного многомасштабного метода конечных элементов (MsVFEM) лежит
идеология классического многомасштабного метода [3] о построении специальной иерархической структуры. Вся область моделирования разбивается на макроэлементы (суперэлемены в соответствии с терминологией Федоренко [1]), с учетом особенностей среды на макромасштабном уровне. Далее на каждом макроэлементе с помощью серии специально сконструированных решателей строятся векторные неполиномиальные многомасштабные функции формы, позволяющие верно учесть мелкомасштабные особенности области моделирования. Таким образом можно ввести следующие уровни иерархии: решение задачи по ребру
макроэлемента (1Dedge); решение задачи по грани макроэлемента, используя решение на ребрах (2Dface); решение задачи о построении векторной многомасштабной функции формы по
макроэлементу (3Dmicro), где в качестве краевых условий используется решение 2Dface; решение макромасштабной задачи (3Dmacro) с краевыми условиями, определяемыми постановкой.
Наибольшую сложность при данном подходе представляет построение векторных многомасштабных функций формы (3Dmicro), которое осуществляется с помощью векторного метода конечных элементов (VFEM [7]), а также сборка макроскопического решения (3Dmacro)
на базе найденных функций. В [8] предлагается для решения задачи на верхнем уровне
иерархии использовать разрывный метод Галеркина [9]. В данной работе рассматривается
другая идея: согласование между макроэлементами производится через использование схем
численного интегрирования, что позволяет использовать несогласованные конечноэлементные разбиения по границе макроэлементов (рис. 2.б).
141
а)
б)
в)
а) область моделирования
б) декомпозиция в MsVFEM на два макроэлемента (в сечении)
в) декомпозиция в VFEM (в сечении)
Рис. 2. декомпозиция области моделирования на конечные элементы
3.1. Макромасштабная вариационная постановка (3Dmacro)
Введем следующие пространства:

3

) U  L2 () :  U 2 d    U  U d   ,  rotU
(rot , 






 g (rot , 
)
V (rot, ) : V  n 

2


d    rotU  rotU d     ,




 g .

(2)
(3)
Тогда для краевой задачи (1) многомасштабная вариационная постановка примет вид
Найти E  g (rot , ) такую, что V  0 (rot , ) выполняется
1
2
  rotE  rotV d   k E V d  0.


(4)
Рассмотрим разбиение h области  на параллелепипеды. Введем конечномерные под-
пространства пространства  h (rot , )  (rot , ) .
 h,MsVFEM (
rot , ) span{i K ,MsVFEM

: i 1,..., n; K h }  (rot , ),
(5)
,VFEM
 h,VFEM (
rot , ) span{i K
: i 1,..., n; K h }  (rot , ),
(6)
где n – число степеней свободы на элементе разбиения K h , i K ,MsVFEM – векторная многомасштабная функция формы, i K ,VFEM – векторная базисная функция.
Тогда многомасштабная дискретная вариационная постановка в форме Галеркина примет
вид:
Найти E h  hg, MsVFEM (rot , ) такую, что V h 0h,MsVFEM (rot , ) выполняется
1
h
h
2 h
h
 rotE  rotV d   k E V d  0.


(7)
3.2. Микромасштабная вариационная постановка (3Dmicro)
С учетом представления (5) и (6) на каждом макроэлементе K h необходимо найти n
векторных многомасштабных базисных функций i K ,MsVFEM , для чего решается однородное
уравнение Гельмгольца
1

rot  rot iK , MsVFEM   i   2 iK , MsVFEM 
0 в K.
(8)




 

142
В рассматриваемых областях моделирования решение предполагается гладким по границам элементов (т.е. включения не пересекают границ), поэтому для простоты будем использовать следующие краевые условия
iK ,MsVFEM  n  K
iK ,VFEM  n
(9)
Для краевой задачи (8)(9) микромасштабная вариационная постановка примет вид
Найти i K , MsVFEM  g (rot , ) такую, что W  0 (rot , ) выполняется

1



K , MsVFEM
 rotW d   k 2 iK , MsVFEM W d  0.
 rot i


(10)
Рассмотрим разбиение h макроэлемента K h на тетраэды. Введем соответствующее
конечномерное подпространство пространства  h,micro (rot , )  (rot , ) .
Тогда микромасштабная дискретная вариационная постановка в форме Галеркина примет вид:
Найти i K , MsVFEM  hg,micro (rot , ) такую, что W h 0h,micro (rot , ) выполняется
1




K , MsVFEM
 rotW h d   k 2 iK , MsVFEM W h d  0.
  rot i


(11)
4. Результаты моделирования
Рассмотрим уравнение Гельмгольца (1) с краевыми условиями, определѐнными на рис.1,
в области  со сферическими включениями (рис.2.а). Параметры среды будем выбирать в
соответствии со следующими соотношениями.
r  x  0, x  ;
1, если x  0
;
4, если x  1
r  x  
(12)
 0.01(См/ м), если x  0
.
0.001(См/ м), если x  1
  x  
Далее на рисунках приведены распределения действительной z-компоненты векторного
поля E в сечении XZ на разных частотах.
а)
б)
а) однородная область
б) Область с непроводящими включениями
Рис. 3. Действительная компонента Ez в сечении XZ при частоте 10кГц (пунктирными линиями обозначены границы макроэлементов)
143
а)
б)
а) однородная область
б) область с непроводящими включениями
Рис. 4. Действительная компонента Ez в сечении XZ при частоте 1ГГц (пунктирными линиями обозначены границы макроэлементов)
Из рисунков 3,4 видно, что включения легко идентифицируются на рассмотренных частотах (1ГГц и 10кГц).
5. Заключение
Векторный многомасштабный метод конечных элементов позволяет выполнять моделирование распределения напряженности электрического поля в областях сложной геометрии,
а также на высоких и низких частотах. Это становится возможным благодаря введению специальной иерархии моделей, которая позволяет значительно уменьшить размеры дискретной
задачи. Все дополнительные задачи, решаемые на каждом макроэлементе (построение векторных многомасштабных функций формы), могут быть решены независимо на каждом макроэлементе, что позволяет произвести эффективное масштабирование разработанного алгоритма.
Литература
1. Стаховская Л. Г., Федоренко Р. П. Об одном варианте метода конечных элементов, т. 19,
№ 4, 1979. C. 950-960.
2. Hou T., Wu X.-H. A Multiscale Finite Element Method for Elliptic Problems in Composite Materials and Porous Media. Journal of computational physics, № 134, 1997. P. 169-189.
3. E W., Engquist B. The heterogeneous multiscale methods. № 1, 2003. P. 87-132.
4. Эпов М.И., Шурина Э.П., Артемьев М.К. Численная гомогенизация электрических
характеристик сред с контрастными мелкомасштабными включениями. Доклады
академии наук, Т. 442. 2011. С. 1-3.
5. E W., Ming P., Zhang P. Analysis of the heterogeneous multiscale method for elliptic homogenization problems. J. of AMS., 18, 1, 2004. Р. 121-156.
6. Abdulle A. Discontinuous Galerkin finite element heterogeneous multiscale method for elliptic
problems with multiple scales. Math. Comp., 81, 2012. P. 687–713.
7. Bossavit A. Computational Electromagnetism: Variational Formulations, Complementarity,
Edge Elements. Academic Press, 1997.
144
8. Эпов М.И., Шурина Э.П., Михайлова Е.И. Анализ вычислительных схем моделирования
электромагнитного поля в средах с контрастными включениями в широком диапазоне
частот. Вычислительные технологии. Т. 19. № -6. 2014. С. 108-121.
9. Hoppe, R. H., Sharma, N. Convergence analysis of an adaptive interior penalty discontinuous
Galerkin method for the Helmholtz equation. IMA Journal of Numerical Analysis, drs028.
2012.
Кутищева Анастасия Юрьевна
аспирант кафедры вычислительных технологий НГТУ (630073, Новосибирск, пр-т
К.Маркса, 20), м.н.с. лаборатории электромагнитных полей ИНГГ (630090, г. Новосибирск,
проспект
Академика
Коптюга,
3)
тел.
8-952-937-69-14,
e-mail:
Kutischeva.Anastasia@yandex.ru.
The solution of the Helmholtz equation by the multiscale vector finite element method
A.Y. Kutischeva
The computational scheme for vector multiscale finite element method for solving the Helmholtz equation in a wide range of frequencies in objects with micro inclusions was considered.
Numerical modeling for several samples was carried out.
Keywords: the Helmholtz equation, the multiscale finite element method, the vector finite element method.
145
Подход к 2D инверсии данных магнитотеллурических зондирований
с использованием конечноэлементных аппроксимаций
Подход к 2D инверсии данных магнитотеллурических зондирований с использованием конечноэлементных аппроксимаций
А. И. Лиманский
Рассматривается подход к 2D-инверсии данных магнитотеллурических зондирований
(МТЗ) с использованием векторных и узловых конечных элементов. Приводятся математические модели прямой и обратной задачи магнитотеллурического зондирования, анализ
точности получаемых распределений удельной проводимости.
Ключевые слова: метод конечных элементов, магнитотеллурическое зондирование, 2D
инверсия.
1. Введение
Магнитотеллурическое зондирование Земли (МТЗ) - один из основных методов электроразведки, широко применяемый по всему миру для решения разнообразных геологических
задач. В создании метода и его развитии огромную роль сыграли ученые Московского университета академик А.Н. Тихонов(1906–1993), профессор М.Н. Бердичевский (1923–2009) и
их ученики. Главным параметром, изучаемым в этом методе, является удельная электропроводность среды. Задача состоит в том, чтобы определить распределение этого параметра
внутри земли по результатам измерений характеристик электромагнитного поля на поверхности земли.
Большой класс практических задач магнитотеллурики может быть решен с помощью
двумерной постановки ([1], [2], [3], [4]). В данной статье предложен подход к 2D-инверсии
данных магнитотеллурических зондирований с использованием конечноэлементных аппроксимаций. В настоящее время используются алгоритмы двумерной инверсии, реализованные
в программном обеспечении Geotools MT [5], WinGlink [6], ZondMT2D [7]. В них используются борновские приближения, что является некоторым допущением при вычислении производных по параметру. В подходе, который будет рассмотрен в данной статье, производные
по параметру будут вычисляться аналитически, а не с помощью борновских приближений,
что может ускорить процесс сходимости и позволит решать обратную задачу на больших
сетках.
2. Математическая модель
Моделирование магнитотеллурического поля будем выполнять в двумерно-неоднородной
(2D) среде, так как мы предполагаем, что свойства среды меняются только вдоль осей X и Z .
Ось Y в таком случае направлена перпендикулярно плоскости xOz и вдоль нее свойства
среды не меняются (ось Y будем называть осью однородности среды).
При проведении магнитотеллурических зондирований изучаются так называемые магнитотеллурические импедансы, которые определяют связь электрического и магнитных полей в
виде:
Ex
Ey
Zxx H x
Zyx H x
146
Zxy Hy ,
Zyy Hy ,
(1)
где Zxx , Zxy , Zyx , Zyy - магнитотеллурические импедансы([8]).
В свою очередь, в двумерном случае Ex , Ey , Hx , Hy могут быть найдены из решений следующих уравнений:
rot(
1
rotA)
i
A
1
0;
0
rotARe
H Re
n
0
n,
1
rotAIm
0
1
n
0
(2)
1
для тока, направленного перпендикулярно оси однородности;
div
1
0
gradAy
i
Ay
AyRe
0;
1;
n
AyIm
0,
n
1
(3)
1
для тока, направленного вдоль оси однородности.
В уравнениях (2)-(3) A - вектор-потенциал магнитного поля, который связан с индукцией
магнитного поля как B rotA и с напряженностью электрического поля - E
- чаi A;
стота, 0 - магнитная проницаемость вакуума,
- электрическая проводимость среды,
H Re
0,1, 0 . Граница 1 соответствует дневной поверхности, а остальные границы расчетной области являются удаленными и на них задано однородное первое краевое условие.
Для решения задач (2)-(3) будем использовать метод конечных элементов (МКЭ)[9], причем для (2) используем аппроксимацию векторными базисными функциями, а для (3) - скалярными.
3. Математическая модель обратной задачи
При решении обратной задачи исследуемый объем земли(рассматриваемый под точками
области) разбивается на ячейки, в каждой из которых ищется значение удельной проводимости . Для выполнения инверсий используется та же сетка, на которой решается прямая задача. Такой подход применительно к технологиям, где изучаются процессы становления поля, описан, например, в работе [10].
Для решения обратной задачи минимизируем функционал вида:
k
( )
Qu
i 1
2
i)
([Qu ]i
min,
(4)
где Q - оператор, который переводит конечноэлементное решение u в значения в приемниках, а - значения измеренных сигналов в приемниках.
Для поиска минимума функционала (4) выполняется линеаризация:
Qu
Qu 0
,.
J
(5)
где J - матрица Якоби, u 0 - конечноэлементное решение, полученного для начального распределения параметров или на предыдущей итерации,
- вектор приращений удельной
проводимости в ячейках. Элементы матрицы Якоби могут быть вычислены по формуле:
i
Jm
где вектор
ции.
k 1
[Q
u
m
]i
[Q( A 1(
k 1
)
A( )
m
u(
k 1
))]i ,
(6)
- вектор значений удельной проводимости в ячейках на предыдущей итера-
147
В формуле (6) A - матрица, полученная в результате конечноэлементной аппроксимации,
производные которой по параметру фактически вычисляются аналитический. В результате
минимизация функционала по значениям
m сводится к решению СЛАУ вида:
(J T J )
JT [
Qu(
k 1
)] .
(7)
При этом для решения СЛАУ (7) используется итерационный метод - МСГ(метод сопряженных градиентов). На каждой частоте на каждой итерации, фактически, решаем две прямые задачи.
4. Регуляризация для обратной задачи
При решении обратных задач очень важную роль играет регуляризация([11], [12], [13],
[14], [15]). Используемые для этого подходы позволяют резко снизить "пестроту" получаемых распределений удельной проводимости.
В данной статье рассматриваются два вида регуляризаций: ([16], [17]) и ([18]).
4.1.
регуляризация
регуляризацией будем называть регуляризацию, которая позволяет получить "физичные" значения параметров (в нашем случае это означает попадание в диапазон от min до
инициализируется неmax ). Алгоритм организован следующим образом. Вначале вектор
которыми малыми значениями. Затем в случае, если полученная в результате минимизации
функционала СЛАУ является вырожденной, то все значения СЛАУ увеличиваются на некоторый коэффициент до тех пор, пока не будет получено некоторое решение. Затем выполняется анализ полученных параметров проводимости в ячейках. Если какие-то из значений не
попадают в заданный диапазон ( min , max ), то увеличивается значение соответствующей k .
Этот процесс продолжается до тех пор, пока все значения проводимости не попадут в заданный диапазон (получаем адаптивную регуляризацию). В этом случае исходный функционал
принимает вид:
K
( )
( )
k 1
min .
2
k( k )
(8)
Тогда минимизация функционала (8) эквивалентна решении СЛАУ:
(J T J
4.2.
I)
JT [
Qu(
k 1
)] .
(9)
регуляризация
Введем понятие материала как объединения параметров, соответствующих определенным ячейкам области. Тогда под регуляризацией по материалам будем понимать процедуру, которая фактически сглаживает удельную проводимость по материалам. Соответствующий функционал с регуляризующими добавками будет выглядеть следующим образом:
K
( )
( )
k 1
2
k( k )
K
k 1
k
(
m
k
2
m)
min,
(10)
где m - номера параметров, которые находятся вместе с k -ым параметром в одном материале, а k и k - параметры регуляризации.
Минимизация функционала (10) эквивалентна решению СЛАУ:
148
(J T J
I
JT [
C)
Qu(
k 1
)] .
(11)
5. Исследование разработанного подхода с использованием синтетических
аналогов полевых данных
В качестве истинной модели, для которой были получены синтетические данные, было
задано проводящее полупространство с удельной электрической проводимостью 0.01 См/м,
содержащее два высокопроводящих тела с удельной электрической проводимостью 1 См/м
(с размерами 2.4 1.4 км и глубиной 2 км до верхней кромки объекта) и 0.5 См/м (с размерами 2.6 2 км и глубиной 3.2 км до верхней кромки объекта).
Начальное приближение параметров 0 3e 3 . Количество параметров равно числу конечных элементов (около 700 параметров). Количество приемников - 30 . Магнитотеллурические данные моделировались при 11 частотах в диапазоне от 1e 4 до 500 Гц.
На рисунках приведено распределение параметра , полученное с использованием разработанной программы (черными контурами обозначены границы истинных объектов).
В тестах итерационный процесс решения обратной задачи МТЗ продолжался до тех пор,
пока функционал менялся более чем на 0.001% .
Вначале покажем распределение , полученное без использования регуляризации. Оно
изображено на рис. 1. Из рисунка видно, что получили просто "пеструю" картину, в которой
невозможно выделить неоднородности, что говорит о том, что необходимо использовать регуляризацию.
Рис 1. Распределение удельной проводимости
без регуляризаций
Исследования показали, что при использовании только константной регуляризации мы
не сможем получить искомую картину объектов (будут оставаться "нефизичные" даже при
задании больших значениях ), поэтому необходимо использовать адаптивную регуляризацию.
Будем использовать следующие обозначения: begin - начальное значение компонент вектора , 0 - значение функционала при начальном распределении , end - значение функционала по выходу из итерационного процесса.
Исследования также показали, что если использовать только адаптивную
регуляризацию мы не cможем получить адекватную картину объектов (так как обратная задача МТЗ некорректна). Если же задать begin большим числом, то мы сократим итерации нахождения
149
"физичного" распределения, но потеряем в скорости сходимости метода. Получаем, что выгодно задавать begin меньшим числом.
Так же если использовать только регуляризацию, то мы не сможем получить "физичное" распределение удельной проводимости, поэтому будем рассматривать адаптивную
регуляризацию с регуляризацией.
Вначале будем рассматривать всю расчетную область в качестве одного материала, соответствующие результаты приведены на рисунке 2.
Рис 2. Распределение удельной проводимости
begin
1e
14,
1e
18,
0
3.19e
4,
end
при
2.35e
8
По полученному распределению можно выделить две области с повышенными значениями параметра. Объединим ячейки, соответствующие повышенным значениями, в два материала и зададим
1e 14 . Результаты представлены на рисунке 3.
Рис 3. Распределение удельной проводимости
begin
1e
14,
1e
14,
0
3.19e
4,
end
при
6.05e
7
Однако было получено, что значение функционала увеличилось, что дает нам основание
предположить, что объединение ячеек в материалы было сделано неверно. Включаем в материалы еще ячейки. Результаты представлены на рисунке 4.
150
Рис 4. Распределение удельной проводимости при
begin  1e  14,  1e  14,  0  3.19e  4,  end  6.64e  11
В результате получили близкое к истинному распределению параметров, что свидетельствует о работоспособности разработанного программного обеспечения.
6. Заключение
Разработан подход к 2D интерпретации данных МТЗ для получения информации об
электрической проводимости глубинной структуры среды с помощью конечноэлементного
решения прямой задачи и обратной задачи МТЗ с использованием аналитического вычисления производным по параметрам геоэлектрической модели и итерационного решения получаемой в результате минимизации функционала СЛАУ.
Описанная схема была реализована в виде прикладного программного обеспечения (ПО)
с графический представлением моделируемого поля, с возможностью визуального представления данных магнитной индукции, напряженностей электрического и магнитных полей,
импедансов и удельных сопротивлений в каждой точке расчетной области. Результаты исследований на синтетических данных показали работоспособность разработанного ПО.
При этом для каждой частоты на каждой итерации СЛАУ (9) приходится решать две
прямые задачи. Для рассмотренных примеров на каждой итерации минимизации функционала (6) было сделано порядка 15-20 итераций для решения СЛАУ (9), что соответствовало решению 30-40 прямых задач.
Исследования различных регуляризаций показали, что необходимо использовать двухэтапную процедуру. Вначале должна использоваться адаптивная регуляризация (для получения "физичного" распределения ) с регуляризацией по всей области для получения областей с повышенными значениями параметра. На втором этапе повторяем решение обратной задачи с измененными регуляризирующими добавками, объединив найденные ячейки с
повышенными значениями параметра в материалы. Объединение ячеек в материалы, которое
позволило понизить функционал невязки обратной задачи, признается истинным.
Литература
1. С. А. Вагин, А. В. Козлова, И. Л. Варданянц Двумерная инверсия магнитотеллурических
данных с учетом влияния рельефа поверхности. Вестник СПбГУ. Сер. 4. 2013. Вып. 3
2. Варенцов И. М. Прагматическая 2d инверсия синхронных ансамблей МТ/МВ откликов //
Материалы V Всероссийской школы-семинара по ЭМ зондированиям им. М.Н. Бердичевского и Л.Л. Ваньяна. — Т. 2. — СПбГУ Санкт-Петербург, 2011. — С. 17–21.
151
3. Varentsov I., Baglaenko N., Sokolova E. 2d inversion resolution in the emtesz-pomerania project: data simulation approach // Protokoll uber das 22 Kolloquium ―Elektromagnetische
Tiefenforschung―. — Decin/Czech Republic, 2007. — P. 143–150.
4. Varentsov I., Baglaenko N., Sokolova E. 2d inversion resolution in the emtesz-pomerania project: data simulation approach // Protokoll uber das 22 Kolloquium ―Elektromagnetische
Tiefenforschung―. — Decin/Czech Republic, 2007. — P. 143–150.
5. Geotools, Geotools MT Software, [Электронный ресурс] URL:
http://www.reddoggeo.com/www/MT/GeotoolsMT/geotoolsMT.htm. (Дата обращения: 07.10.2014).
6. WinGLink Software, WinGLink Software 2D inversion, [Электронный ресурс]URL:
http://www.slb.com/services/seismic/geophysical_processing_characteriz
ation/seismic_reservoir_characterization/electromagnetics/emsoftware/w
inglink/2dmodel.aspx. (Дата обращения: 07.10.2014).
7. Каминский А.Е.
ZondMT2d,
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
Программа интерпретации магнитотеллурических зондирований
[Электронный
ресурс]
URL:
http://zondgeo.ru/Articles/zondmt.pdf. (Дата обращения: 07.10.2014).
Бердичевский М.Н., Дмитриев В.И. Модели и методы магнитотеллурики. М.: Научный
мир, 2009. 680 с.
Соловейчик, Ю.Г. Метод конечных элементов для решения скалярных и векторных задач
: учебное пособие / Ю.Г. Соловейчик, М.Э. Рояк, М.Г. Персова.–Новосибирск : Издательство Новосибирского государственного технического университета, 2007. – 896 с.
Oldenburg D., Haber E., Shekhman R. Three dimensional inversion of multisource time domain
electromagnetic data. Geophysics - 2013. Vol. 78. 1. P. E47-E57
Бердичевский М.Н., Дмитриев В.И., Новиков Д.Б., Пастуцан В.В. Анализ и интерпретация магнитотеллурических данных. М.: Диалог-МГУ, 1997. 161 с.
Троян В.Н. Принципы решения обратных геофизических задач: СПб, СПбГУ, 2007, - 197
стр.
Вагин С.А., Сальцберг А.В. Одномерная инверсия магнитотеллурических данных с адаптивной регуляризацией. Вопросы геофизики. Выпуск 44. СПб., 2011 - (Ученые записки
СПбГУ; № 444)
Жданов М. С. Теория обратных задач и регуляризация в геофизике. М.: Научный мир,
2007. 710с.
Яновская Т. Б., Порохова Л. Н. Обратные задачи геофизики. СПб.: Изд-во СПбГУ, 2004.
214с
М.Г. Персова, Ю.Г. Соловейчик, Г.М. Тригубович, М.Г. Токарева. Методы и алгоритмы восстановления трехмерной структуры проводимости и поляризуемости среды по
данным электромагнитных зондирований на основе конечноэлементного 3Dмоделирования. Физика Земли, ─ 2013. –№3, –с. 30-45
М.Г. Персова, Ю.Г. Соловейчик, М.Г. Токарева, Е.И. Симон, М.В. Абрамов, У.А. Сафронова. 3D-инверсия данных вызванной поляризации на основе конечноэлементного моделирования. // Научный вестник НГТУ, № 3 (48), 2012. - С. 25-34.
М.Г. Персова, Е.И. Симон, Ю.Г. Соловейчик, Ю.И. Кошкина. Алгоритмы 3Dинверсии данных зондирований становлением поля с использованием борновских приближений // Научный вестник НГТУ. – 2013. – № 2 (51), с. 62-72.
152
Лиманский Александр Игоревич
магистрант прикладной математики и информатики НГТУ. Специализация – моделирование детерминированных и стохастических процессов. E-mail: alimansky@edem-book.ru
Approach to 2D-data inversion of magnetotelluric soundings using finite element approximation
Limanskiy A.I.
An approach to 2D-data inversion of magnetotelluric sounding (MTS) using vector and nodal
finite element. Mathematical models of direct and inverse problems of magnetotelluric sounding, the analysis accuracy of the conductivity distributions.
Keywords: method of finite elements, magnitotelluric soundings, inversion problems.
153
Разработка программной системы для анализа достоверности фактов
в информационном потоке новостных лент
Разработка программной системы
для анализа достоверности фактов
в информационном потоке новостных лент
Р. В. Насонов, А. С. Саутин
В докладе представлено описание архитектуры приложения, которое используется для
сбора, анализа и хранения информации новостных лент, а также предоставления данной
информации конечному пользователю.
Ключевые слова: анализ текстов, верификация фактов, архитектура программных
приложений.
1. Введение
В 1989 году, в стенах Европейского совета по ядерным исследованиям зародилась
концепция интернета. К 30 июня 2012 года число пользователей, регулярно использующих
интернет, составило более чем 2,4 млрд человек. При этом распространение информации
происходит очень быстро. Новость, которая была помещена в интернете, за сутки могут
просмотреть более миллиона человек.
Большое количество средств массовой информации размещает свои публикации в сети.
Эти публикации может процитировать и пересказать на свой лад любой пользователь сети,
даже не указав первоисточник. С развитием Web технологий всем пользователям сети стали
доступны платформы для создания персональных сайтов (блог), которые состоят из личной
информации владельца (блогера). Данный вид информационного источника является не
менее важным, чем СМИ, т.к. доступ к этой информации имеет любой желающий.
И тут возникает несколько вопросов. Какой информации можно доверять? Кто является
первоисточником того или иного факта, статьи? Как оповестить читателей, что они
пользуются недостоверной информацией?
В настоящее время есть ресурсы [1, 2] которые отвечают на эти вопросы. Эти порталы
сосредоточены в верификации фактов в области политики.
Достоверность информации. Информация достоверна, если она отражает истинное
положение дел. Объективная информация всегда достоверна, но достоверная информация
может быть как объективной, так и субъективной. Достоверная информация помогает
принять нам правильное решение. Недостоверной информация может быть по следующим
причинам:
1. преднамеренное искажение (дезинформация) или непреднамеренное искажение
субъективного свойства;
2. искажение в результате воздействия помех («испорченный телефон») и недостаточно
точных средств ее фиксации.
2. Архитектура приложения
Эффективное решение этих проблем представляется возможным за счѐт применения
современных web-технологий. Большое количество пользователей могут как получать, так и
делиться информацией.
Логически, разрабатываемое приложение делится на следующие части:
154
1.
2.
3.
4.
сбор и агрегирование информации;
хранение информации;
анализ полученной информации;
предоставление конечному пользователю степени достоверности того или иного факта.
Данное приложение предусматривает работу с большим количеством пользователей и
данных. Потенциально, количество и того, и другого может стремительно расти. Изначально
необходимо заложить возможность как к масштабированию, так и к уменьшению связности
выделенных частей. Очевидным решением является разбиение приложение на отдельные
сервисы, которые будут взаимодействовать друг с другом посредством некоторого
программного интерфейса - API. Построив таким образом архитектуру, можно более
качественно подойти как к разработке ПО (распределив его разработку на несколько
команд), распределению нагрузки между сервисами, и облегчению масштабируемости всей
системы в целом.
2.1. Сбор и агрегирование информации
В настоящее время в сети накопилось большое количество информации. Необходимо
выбрать именно ту, которая нам нужна, а именно - новостные ленты. И чем больше будет
охват источников, тем качественнее можно будет провести анализ всего объема данных.
Основные проблемы, которые возникают при решении данной задачи связаны с:
1. Множеством ресурсов, публикующих новости. Время на обработку одной статьи должно
быть минимальным.
2. Большинство ресурсов не имеют удобных механизмов доступа к своим данным.
3. Если ресурс имеет механизм доступа к данным, то как правило он предоставляет этот
механизм на платной основе.
4. Данные плохо структурированы: приходится работать с “сырым” HTML.
5. Об этом ресурсе еще необходимо как то узнать.
Одним из эффективных подходов по обработке больших объѐмов информации является
перенос основной части работы сторону пользователя. Это позволяет распределить нагрузку,
и собирать знания о различных источниках.
2.2. Хранение информации
В ходе решения задачи возникает проблема эффективного хранения добытой
информации (как сырую, так и обработанную).
Основные возникающие здесь проблемы это:
3. Большой объем информации.
4. Хранение большого количества неоднородной текстовой информации.
2.3. Анализ полученной информации
Всю полученную информацию необходимо проанализировать. Выделить конкретные факты,
кластеризовать их, определить степень достоверности.
Проблемы:
5. Выделение отдельных фактов из статьи.
6. Определение степени достоверности факта.
2.4. Предоставление конечному пользователю степени достоверности того или иного
факта
Основной платформой, посредством которой пользователь получает информацию из сети
интернет, является браузер. Таким образом, разрабатываемое приложение должно иметь
возможность отображать информацию фактах статьи в момент ее чтения.
155
1.
2.
3.
Проблемы:
Удобное отображение достоверности каждого факта.
Выполнение части работы по сбору информации.
Большое количество платформ (мобильные, десктоп, планшеты, разные браузеры,
разные версии браузеров).
На сегодняшний день одним из самых популярных браузеров является Google Chrome
поэтому перспективным подходом является разработка расширения для этого браузера.
Можно в полной мере использовать широкие возможности его API и решить проблему
наглядного отображения необходимой информации.
3. Заключение
В ходе работы было разработано расширение для браузера Google Chrome, позволяющее
оценивать наглядно представлять информацию о достоверности фактов на просматриваемой
пользователем странице. Также приложение представляет возможность сбора инфомации об
оценках достоверности от конечных пользователей - краудсорсинг.
Литература
PolitiFact [Электронный ресурс]. URL: http://www.politifact.com
FactCheck [Электронный ресурс]. URL: http://www.factcheck.org
Насонов Руслан Викторович
студент 4 курса факультета прикладной математики и информатики НГТУ, e-mail:
rus.nassonov@gmail.com
Саутин Александр Сергеевич
к.т.н, доцент кафедры кафедры теоретической и прикладной информатики НГТУ, e-mail:
sautin@corp.nstu.ru
Development of a software system for the analysis of the reliability of the facts in the
dataflow of news feeds
R. Nasonov, A. Sautin
The report describes the architecture of the application , which is used to aggregation, mining
and store news feeds data, as well as the give of this information to the end user .
Keywords: text mining , verification of the facts , software architecture.
156
Создание кроссплатформенного приложения по передаче секретных сообщений средствами e-mail
Создание кроссплатформенного приложения
по передаче секретных сообщений средствами e-mail
М.М. Сандаков, К.Е.Трифонов, С.Ф. Кренделев, Т.А. Гультяева
Эта статья посвящена созданию кроссплатформенного приложения для передачи секретных сообщений. В рамках данной статьи рассматриваются проблемы реализации различных стеганографических алгоритмов, скрывающих передаваемую информацию и передачи ключей для различных алгоритмов сокрытия информации. Так же в статье рассматривается реализация приложения, обеспечивающего передачу секретных сообщений по
средствам электронной почты.
Ключевые слова: стеганография, сокрытие информации, обмен ключами, создание приложения.
1. Введение
В настоящее время тема сокрытого обмена данными вызывает все больший интерес в
сфере пользовательских услуг. С развитием мобильных технологий, задача передачи информации значительно упрощается. В результате этого зачастую пользователи не заботятся о
конфиденциальности передаваемых данных. Исправить эту ситуацию можно с помощью
предоставления пользователям простого приложения, способного скрыто передавать информацию по некоторым каналам.
Целью данной работы является создание кросплатформеного приложения, позволяющее
безопасно передавать данные с помощью электронной почты. Безопасность передаваемых
данных обеспечивается с помощью шифрования и/или стеганографических алгоритмов.
Выбор электронной почты в качестве канала передачи можно объяснить тем, что данный
канал передачи принципиально является отложенным, т.е. при передачи сообщений через
электронную почту пользователь не ожидает мгновенного ответа. Это позволяет использовать данные каналы для передачи больших объемов информации, в отличии от меседжеров,
используемых для передачи коротких сообщений и видения диалога. Такое использование
электронной почты так же позволяет смериться с временем, затрачиваемым на шифрование и
дешифрование, которое может быть существенным в случае передачи больших файлов (в
качестве приложений к электронным письмам).
Необходимость использования стеганографических алгоритмов обусловлена тем, что во
многих случаях по содержимому передаваемых данных возможно идентифицировать их тип
(передается ли текст, изображение в одном из популярных форматов и т.д.) и, следовательно,
сделать вывод о том, было ли исходное сообщение зашифровано (если содержимое невозможно отнести ни к одному из известных типов данных, то можно предположить, что сообщение было зашифровано). Следовательно, безопасность обмена данными можно повысить,
модифицировав зашифрованные данные таким образом, чтобы они выглядели как осмысленное сообщение. Стеганографические алгоритмы позволяют производить такую модификацию и в итоге представлять передаваемую информацию в виде текста, изображения, видеофайла и т.д. Поэтому для сокрытия информации в разрабатываемом приложении предполагается использование как стеганографических алгоритмов, так и обычных алгоритмов
шифрования, в зависимости от потребностей пользователя. В качестве алгоритмов шифрования предполагается использовать специально разработанные симметричные алгоритмы либо
симметричные алгоритмы шифрования из общедоступных открытых библиотек.
157
2. Описание стеганографических алгоритма
2.1. Выбор стеганографических алгоритма
В связи с необходимостью использования стеганографических алгоритмов одним из
важных аспектов работы является изучение подобных алгоритмов. Была рассмотрена работа
алгоритма, основанного на статистической генерации текста-контейнера из исходных данных, предоставленного вспомогательного текста и начального паттерна. Суть алгоритма заключается в использовании для выбора следующей буквы текста-контейнера деревьев Хаффмана, построенных на основе предоставленного вспомогательного текста и используемого
паттерна. Такой подход позволяет строить тексты статистически похожие на вспомогательный текст.
2.2.Исследования стеганографического алгоритма
При исследовании использовались различные паттерны и вспомогательные тексты на английском языке. Замечено, что при уменьшении длины паттерна, осмысленности получаемого текста уменьшается, а скорость работы алгоритма построения деревьев увеличивается. Из
проведенных исследований можно сделать вывод, что при длине паттерна 5 в большинстве
случаев могут быть получены осмысленные словосочетания при достаточно приемлемой
скорости. Большая длина паттернов приводит как к замедлению работы алгоритма, так и к
значительному увеличению количества создаваемых деревьев, что приводит к увеличению
необходимой для их хранения памяти.
Следует заметить, что выходной текст-контейнер значительно зависит от вспомогательного текста, т.к. строится на основе собранных по нему статистических данных. Для получения хороших текст-контейнеров, в качестве вспомогательного текста должны быть взяты
тексты достаточно больших размеров. Так же при наличии в используемой художественной
литературе большого количества повторяющихся имен персонажей, в выходном тексте так
же могут быть получены аналогичные имена. Таким образом необходимо крайне осторожно
подходить к выбору вспомогательного текста при использовании данного алгоритма.
Размер получаемого в итоге текста-контейнера увеличивается в зависимости от размера
исходных данных. Это связано с тем, что фактически алгоритм представляется как алгоритм
сжатия с помощью кода Хаффмана в обратную сторону, т.е. для получения текстаконтейнера производится аналог операции декодирования по Хаффману (т.е. распаковки).
Для получения исходных данных производится аналог операции кодирования (сжатия). Также расширение происходит из за необходимости добавления букв, не хранящих никакой информации и необходимых для сохранения осмысленности текста (добавление при отсутствии выбора).
В ходе исследования алгоритма было замечено, что, возможно, в качестве подобных стеганографических алгоритмов могут быть использованы так же другие алгоритмы, за основу
которых взяты алгоритмы сжатия по аналогии с алгоритмом сжатия Хаффмана. Предполагается возможность существование алгоритма, выбор которого приведет к меньшему росту
итогового текста-контейнера относительно исходного текста при такой же осмысленности
текста-контейнера. В настоящее время проводится поиск алгоритмов сжатия (по типу энтропийного сжатия и т.п), способных привести к необходимым результатам.
Также, рассматриваемый алгоритм может быть использован в качестве алгоритма симметричного шифрования в котором вспомогательный текст и длина паттерна рассматриваются как ключ. При этом преимущество алгоритма заключается в том, что полезные данные
хранятся не во всех буквах текста-контейнера, что так же осложняет взлом. Так же возможна
реализация алгоритма, дающая различные тексты-контейнеры на основе одинаковых входных данных. В случае такого использования необходимо внимательно подходить к выбору
158
вспомогательного текста, т.к. фактически он является закрытым ключом шифрования. Использование известного текста с большим количеством имен собственных и т.п. может привести к раскрытию ключа и в итоге к компрометации передаваемых данных.
Алгоритм может быть использован для незаметной передачи небольших сообщений, т.к.
в этом случае рост размера получаемого текста-контейнера не велик. Так же алгоритм может
быть использован в паре с некоторым быстрым алгоритмом шифрования для усложнения задачи взлома и для сокрытия факта передачи зашифрованного сообщения.
2.3. Примеры работы стеганографического алгоритма
В качестве примера работы алгоритма приведем полученные текст-контейнеры для одного и того же исходного текста при разных вспомогательных текстах и длинах паттерна.
Входнойтекст:
Hi! How are you?
Would you like to go to the cinema tomorrow? Sessionstartsat 17:00.
В качестве вспомогательного текста использовалась книга Джорджа Оруэлла ―Скотный
двор‖ размером 165кб при длине паттерна 5.
Выходнойтекст:
dining after talking so, it should her old. Napoleon, was guard, kicks to pull thered that
meant a large ration. His hand, which were, the has happened, trembling the money forces,
and, but the pigeons campaigns whom threshed, look a brass movement the donkey.
Benjamin, that might even time instant, snow, stiff in between thrown. All dread, and, purer
shed whenever had gone, and neighed up trying such about that means of england sure tired in
detail of which sheets from sides variously this timidly, but for a pieces off ourse, frisking
water, had flogging one dared eggs. Nobody right there these, another pigs. They hurled it
posite of idle, there sha
Тот же вспомогательный текст, длина паттерна 7.
Выходнойтекст:
ull in a reverent manner before he ate it, lest it shoulder. He looking over your word of all
that milk and eaten there. Finding had to bear, but would be installed. But the shafts of a kind
of surprise the breeze drifted itself across half the current. It ranwhen i have his interment on
this extra spurt and, without boxer twice as they woke at dawn as usual, said napoleon. But in
their longzed round a bonfire which his vanity and at them in a terrible explosion had resorted
to a stop.Ings with his usually been abandoned.Ve me your welfare of his heels.Und, they
halted about. Napoleon acted swiftly and immediately.
He did his work in that nothing, came skipping from his plans grew fainter and bursts of
ireland, beasts alone, with two ounces of jones, who has come to take care he had, he said.
However, napoleon to sell itjanuary it became next day it was fully realised earlier that
divided in the foxhounds.E in trade with blocks, even a trifle unsteady and lambs, were reduce
their distance from three times when that nothing, came more anxious to procured, no one had
been, nor everything they must stop.Mals huddled about. Napoleon, with side whiskers, a
solicitor in a handsome money profit.E cast a very stupidity and obedience in spite of the past,
was touched.
Xplosions and ducks
Вспомогательныйтекст – «Linux Kernel Development 3rd edition» by Robert Love (размер
919кб). Длина паттерна 7.
Выходнойтекст:
159
kely, your consolidateg anecdotes an idle periodic event.The event layer properties, this
looks at them to your softirqs, and to keep all directive of this, whenever possible.This is
often taught at these object code.Thatyriad of queues defer work queued, data into these
example, if an insufficiency of relate to individual kernel naming, use kobjects of tail quiring
a foundation freeze is put into threads are in this mount pointed the date as of a sectors at
one copy entirely.
It is not issues. Most filesystem can select directly, although, are somewhere each user
types of protecting.R bounds.Ject in system can make up one or bottom half. Tasklet.
Tasklet of argument. For findings might simply reading, lack of when exactly how the
few millisecond, organizes device dirty. Dirty and availability through.Red, partially fail.
Maps, and removals from twoque, it too would run.Ng.Table za
Вспомогательный текст – совмещенные книги ―Властелин колец‖ Дж. Р. Р. Толкина и
―Оно‖ Стивена Кинга (размер 4,4 Мб). Длинапаттерна 7.
Выходнойтекст:
p, anyway i must guess, you kept tellin that moment ring. Travel slowly. Not throw him
pause, as my wonderful peristalsis has grown up. He loaded with mithrandir. Then, as if at
anyone who knew we were numenureans, not deep, as if into azanulbizar. Thanks, bill says,
aint happy, none in derry.I was wallys spa everywhere, old nor youngest of las vegas to
recede againthe voice, a more solid as asget off as stomach.
You known manner, silmarien. He wouldnt, could hear. Bullet shot in one quickly and
herb, sweet sad word of horror of here, eddie gripping darkness, as terrified sobs.M and, after a wash first of saying those dreamscape video had brush or pen, an urge the limos speed
a lot more i
2.3. Результаты исследования стеганографического алгоритма
По итогам исследования алгоритма было принято решение, что он может быть использован на современных мобильных устройствах в качестве стеганографического алгоритма.
Данный алгоритм может давать тексты, статистически похожие на осмысленные и таким образом при определенных видах проверок не привлекающих к себе внимания.
3. Алгоритм обмена ключом
Так как используемые алгоритмы шифрования (стеганографический алгоритм) фактически являются симметричными алгоритмами, необходима некоторая реализация обмена ключом для данных алгоритмов. В случае использования приложения какой-либо организацией
существует возможность простого распространения ключа внутри организации. К примеру
предоставление ключа в качестве файла для сотрудников организации, заменяемого на аналогичный файл, в случае необходимости смены ключа.
В случае же общения пользователей вне структурированных организаций необходимо
производить обмен ключа с помощью некоторого алгоритма. Так как использование алгоритма Диффи-Хеллмана в данном случае невозможно, простейшим решением является использование ассиметричных алгоритмов шифрования. Данные алгоритмы позволяют производить обмен ключом в три шага (отправка открытого ключа, шифрование ключа стенографического алгоритма, принятие ключа). Но данный подход так же имеет недостатки в силу
низкой скорости работы подобных алгоритмов, что может быть не так существенно в случае
передачи ключей для обычных алгоритмов шифрования, но играет большую роль в случае
передачи ключей для стеганографический алгоритма шифрования. Решение данной проблемы может быть найдено в совмещении подходов использования симметричного и ассиметричного алгоритмов шифрования на последних шагах обмена ключом, т.е. ключ симметричного шифрования передается с помощью ассиметричного алгоритма, а стеганографический
160
ключ передается с помощью симметричного алгоритма шифрования с переданным на этом
же шаге ключом.
4. Работа приложения
Полученное в итоге разработки приложение должно представлять собой обычный e-mail
клиент с возможностью выбора алгоритма сокрытия передаваемой информации. Важным аспектом работы приложения является реализация алгоритмов шифрования в виде библиотеки,
что позволяет использовать пользовательские алгоритмы шифрования на ряду с предоставленными с программой. Интерфейс библиотеки должен быть представлен определенным
набором функций на языке С.
Поставляемая с приложением библиотека реализует как некоторые популярные алгоритмы шифрования, так и специально разработанный алгоритм шифрования и стеганографический алгоритм. Использование библиотеки позволяет заменять алгоритмы шифрования в
приложении в случае их устаревания. Причем для замены могут быть использованы популярные реализации алгоритмов шифрования, что исключает необходимость самостоятельной
реализации данных алгоритмов.
Перед началом передачи сообщений пользователи должны установить контакт друг с
другом, что фактически является процессом обмена ключей. В случае если пользователь пытается написать письмо неизвестному для его программы контакту (e-mail адресу), ему будет
предложено запросить контакт (на этом шаге фактически пользователь отправляет свой открытый ключ на e-mail адрес запрашиваемого контакта). При получении подобного письма с
запросом на контакт пользователь может отказаться от его установления, либо согласиться (в
случае согласия обратно пересылается ключ шифрования и необходимая информация, зашифрованная с помощью открытого ключа). На завершающем этапе запрашивающий контакт принимает сообщение о том, что контакт был установлен (производится расшифровка
полученного ключа шифрования).
Само сокрытие информации сообщений производится незаметно для пользователя перед
пересылкой. Алгоритмы шифрования встраиваются в систему перед отправкой сообщения на
e-mail сервер, а так же после принятия сообщений сервера. Таким образом открытую информацию, передаваемую в письме, могут наблюдать только пользователь-получатель и пользователь-отправитель.
Выражение благодарности
Выражаем благодарность лаборатории НГУ-Parallels, на базе которой проводилась данная работа.
Литература
1. Alan G. Konoheim, ―Computer security and cryptography‖, 2007.
2. Peter Wayner, ―Disappearing cryptography: Information hiding: Steganography & watermarking‖— 3rd ed, pp. 87-94, October 2008.
3. Salomon.D, ―Data compression: the complete reference‖, 2006.
4. Herbert Schildt, ―Java 7 - The Complete Reference - 8th Edition‖, 2012.
Сандаков Михаил Михайлович
студент 5 курса ФПМИ НГТУ, тел. 8-913-767-84-98, e-mail: mmsandakov@gmail.com
Трифонов Кирилл Евгеньевич
студент 5 курса ФПМИ НГТУ, тел. +7-951-365-93-38, e-mail: goon778@gmail.com
161
Кренделев Сергей Федорович
кандидат физ.-мат. наук, доцент НГУ, e-mail: s.f.krendelev@gmail.com
Гультяева Татьяна Александровна
кандидат технических наук, доцент кафедры ПСиБДНГТУ (630073, Новосибирск, Крала
Маркса 20), тел. (383) 346-06-00, e-mail: t.gultyaeva@corp.nstu.ru
Creating a cross-platform application for the transfer of secret messages via e-mail
M. Sandakov, K. Trifonov, S. Krendelev, T, Gultyaeva
This article focuses on the creation of cross-platform applications to transmit secret messages.
As part of this article deals with the problems of implemention various steganographic algorithms for hiding transmitted information and key exchange problems for various information
hiding algorithms. Also in the article discusses the implementation of an application capable of
transmitting secret messages via e-mail.
Keywords: steganography, information hiding, key exchange, the creation of applications.
162
Алгоритм построения двухмерных несогласованных прямоугольниых сеток
Алгоритм построения двумерных несогласованных
прямоугольных сеток
А. В. Сидоров, И. А. Вагнер
Подробно описывается алгоритм построения двумерных несогласованных прямоугольных сеток. Демонстрируются примеры применения данного алгоритма для задач с разной
конфигурацией расчетной области, а также достигаемое при этом сокращение размерности системы линейных алгебраических уравнений (СЛАУ) при решении краевой задачи
методом конечных элементов.
Ключевые слова: регулярная прямоугольная сетка, несогласованная прямоугольная сетка,
терминальный узел, метод конечных элементов, система линейных алгебраических уравнений.
1. Введение
Для решения практических задач методом конечных элементов (например, моделирование геоэлектромагнитных полей, возбуждаемых горизонтальной электрической линией [1]),
как правило, используются неравномерные сетки, поскольку они позволяют заметно уменьшить вычислительные затраты на получение решения необходимой точности. Если при этом
используется регулярная сетка с прямоугольными ячейками, то можно дополнительно снизить вычислительные затраты, избавившись от так называемых «лишних» узлов, которые
практически не влияют на точность решения задачи [2].
В данной работе описывается алгоритм построения двумерных несогласованных прямоугольных сеток (без «лишних» узлов), демонстрируются примеры его использования для
решения практических задач.
2. Описание алгоритма
Рассмотрим причину возникновения «лишних» узлов на примере. На рис. 1,а изображена
регулярная прямоугольная сетка для решения задачи распределения электрического поля от
точечного источника в горизонтально-слоистой среде. Эта конечноэлементная сетка была
получена следующим образом: на координатных осях были поставлены точки ri  и  z j  ,
через них проведены координатные линии r  ri и z  z j и получены ячейки прямоугольной
регулярной сетки  ri , ri 1    z j , z j 1  . При этом точки ri  и  z j  были расставлены таким об-
разом, что сетка сгущается к источнику (вблизи него образуется почти равномерная прямоугольная сетка), а с удалением от него шаг дискретизации увеличивался с коэффициентами
разрядки kr  1.1 , k z  1.1 . «Лишние» узлы находятся в той части расчетной области, где образуются вытянутые конечные элементы (подобласти W1 , W2 на рис. 1,а). В этих частях расчетной области маленький размер шага по одному из направлений никак не влияет на точность получаемого решения, поэтому несколько узких прямоугольников могут быть объединены в один. В результате данной операции в получившейся несогласованной сетке (рис. 1,б)
будут присутствовать узлы двух типов: обычные узлы, являющиеся только узлами ячеек
(одной или нескольких), и терминальные узлы. Терминальный узел – узел, находящиеся на
границе хотя бы одной стандартной ячейки, узлом которой он не является [3] (см. рис. 2).
163
а)
б)
Рис. 1. Фрагмент регулярной прямоугольной сетки (а) и сетки без «лишних» узлов (б)
Рис. 2. Пример сетки с терминальными узлами
Таким образом, сетка без «лишних» узлов строится на основе регулярной прямоугольной
сетки. Для этого исходная область разбивается по оси r на несколько подобластей, которые
могут определяться изменением направления сгущения сетки по r (рис. 3,a). Затем в этих подобластях происходит поиск прямоугольников исходной сетки, которые необходимо объединить вдоль оси r, т.е. они являются вытянутыми по z, и их размеры удовлетворяют критеhz
рию r  k , где k – некоторый коэффициент, зависящий от решаемой задачи. Затем делаетh
ся аналогичное разбиение на подобласти по оси z (рис. 3,б), поиск и объединение конечных
hr
элементов подробной сетки, для которых выполняется условие z  k .
h
164
а)
б)
Рис. 3. Разбиение исходной области на подобласти и направления их обхода по оси r (а) и по оси z (б)
Обход исходной регулярной сетки в каждой r-подобласти осуществляется по слоям снизу-вверх (под i-ым слоем подразумевается множество конечных элементов, расположенных
между координатными линиями zi и zi 1 ), а порядок обхода ячеек в слое может определяться направлением сгущения сетки в данной подобласти (рис. 3,а).
Рассмотрим подробно алгоритм объединения ячеек во второй подобласти (рис. 3,а).
Формирование новых конечных элементов на первом слое происходит следующим образом. Текущий конечный элемент, определяемый вертикальными границами rj и rj 1 , объединяется со своими соседями вдоль направления обхода до тех пор, пока не происходит
hz
смена материала ячеек, и размеры нового элемента удовлетворяют критерию 1r  k , где h1z
hm
– размер по z конечных элементов в первом слое, hmr – размер по r нового конечного элемента c номером m в слое. После этого запоминаются индексы вертикальных границ сформированного конечного элемента в массиве r prev.bound , т.е. rmprev.bound  j , rmprev.bound
 l , где l – индекс
1
правой вертикальной границы последнего прямоугольника, вошедшего в объединение. Если
новая ячейка была получена в результате объединения нескольких конечных элементов исходной сетки, то она добавляется в несогласованную сетку. В противном случае (сформированный конечный элемент состоит из одного элемента регулярной сетки) – нет, т.к. эта ячейка исходной сетки может быть объединена со своими соседями по оси z при обходе zподобластей. Далее переходим к следующему прямоугольнику регулярной сетки, определяемому границами rl и rl 1 , и повторяем описанные выше действия, пока в слое не закончатся
конечные элементы.
На втором и последующих слоях определяются высота ячеек hiz и ширина ячейки с прошлого слоя h rj ,prev. , которая вычисляется с помощью r prev.bound . Если на текущем слое и шаге
h rj ,prev. не происходит смена материала, то в зависимости от значения
шение об объединении конечных элементов исходной сетки.
165
z
i
r , prev.
j
h
h
принимается ре-



z
i
r ,prev.
j
h
не происходит изменение материала, то но k и на следующем шаге h rj ,prev.
1
h
вый конечный элемент содержит терминальный узел (рис. 4,а).
Иначе образовывается два конечных элемента на текущем слое, т.е. элемент с прошлого
слоя содержит терминальный узел (рис. 4,б), если размеры этих элементов будут удовлеhiz
hiz
 k и r ,cur.
 k соответственно.
творять критериям r ,cur.
hm
hm 1
Иначе новый конечный элемент на текущем слое имеет такой же размер по r, что и с
прошлого (рис. 4,в).
Если
а)
б)
Рис. 4. Варианты формирования конечных элементов
в)
Если же на шаге h rj ,prev. происходит смена материала, то все сводится к случаю, изображенному на рис. 4,б, т.е. граница rmcur.bound
определяет границу материалов.
1
После формирования очередного конечного элемента его вертикальные границы запоминаются в массиве r cur.bound , который при переходе на следующий слой присваивается r prev.bound .
Условие добавления сформированных ячеек в новую сетку не отличается от условия на первом слое.
Поиск и объединение конечных элементов в z-подобластях происходит аналогично, но
имеет два отличия. Во-первых, при обработке очередной ячейки регулярной сетки необходимо учитывать, что она уже могла быть объединена с другой ячейкой в результате работы
прошлого этапа алгоритма. Во-вторых, на каждом слое все сформированные конечные элементы добавляются в несогласованную сетку.
Результат работы алгоритма для исходной регулярной сетки, изображенной на рис. 3,
представлен на рис. 5. Полная сетка содержала 37044 узлов, а построенная несогласованная
при k  2.5 – 12330. Таким образом, количество узлов сократилось в три раза.
Отметим, что при удалении «лишних» узлов описанным способом исключается появление прямоугольников с «перехлѐстом» границ (рис. 6), которые могут привести к плохому
конечноэлементному решению [3].
166
Рис. 5. Фрагмент построенной несогласованной сетки
Рис. 6. Несогласованная сетка с «перехлѐстами»
К тому же достаточно просто решается проблема поиска конечного элемента при выдаче
решения в точке: для этого необходимо завести целочисленный массив, у которого индекс
элемента соответствует номеру ячейки исходной регулярной сетки, а значение – номер ячейки в построенной несогласованной сетке. Этот массив легко сформировать во время процедуры объединения конечных элементов. Таким образом, достаточно определить номер конечного элемента исходной сетки, которому принадлежит заданная точка, и воспользоваться
описанной структурой.
Также описанный алгоритм может быть применен и для случая, когда в задаче имеется
несколько источников (рис. 7).
а)
б)
Рис. 7. Фрагмент исходной регулярной сетки (а) и построенной нерегулярной сетки (б) для задачи с
двумя источниками
167
3. Результаты
Рассмотрим пример применения описанной процедуры построения несогласованной
прямоугольной сетки для решения задачи распределения стационарного электрического поля
точечного источника в проводящей горизонтально-слоистой среде.
Таблица 1 показывает, во сколько раз произошло сокращение количества узлов при решении данной задачи на сетке без «лишних» узлов (для разных значений коэффициента k)
относительно исходной регулярной сетки.
Таблица 1.
Количество
Значение Количество уз- Сокращение коузлов регуляр- k
лов несогласо- личества узлов
ной сетки
ванной сетки
относительно
исходной сетки
22801
3
2.5
2
8801
7672
7095
2.6
2.9
3.2
Из данной таблицы видно, что использование несогласованных сеток позволяет сократить размерность решаемой СЛАУ в несколько раз. При этом решение (значения компоненты Ex вектора напряженности электрического поля E ), полученное на подробной регулярной сетке, в контрольных точках отличается от решения на сетке без «лишних» узлов не
больше чем на 0.3% для рассмотренных значений коэффициента k (рис. 8).
Рис. 8. Графики изменения значений E x , полученных на несогласованных сетках, относительно решения на регулярной сетке вдоль приемной линии
168
4. Заключение
Разработанный алгоритм построения несогласованных прямоугольных сеток позволяет
сократить размерность СЛАУ решаемой задачи в несколько раз и может быть применен для
задач с разной конфигурацией расчетной области. При работе алгоритма удаляются именно
«лишние» узлы, которые практически не влияют на точность получаемого решения.
Литература
1. Персова М. Г., Соловейчик Ю. Г., Абрамов М. В. Конечноэлементное моделирование
геоэлектромагнитных полей, возбуждаемых горизонтальной электрической линией //
Сибирский журнал индустриальной математики. 2009. Т. 12, № 4. С. 106-119.
2. Токарева М. Г., Персова М. Г., Задорожный А. Г. Алгоритм оптимизации прямоугольных сеток для решения задач электроразведки // Сборник научных трудов Новосибирского государственного технического университета. 2002. № 2. С. 41-48.
3. Соловейчик Ю. Г., Персова М. Г., Рояк М. Э. Метод конечных элементов для решения
скалярных и векторных задач: учеб. пособие. Новосибирск: изд. НГТУ, 2007. 896 с.
Сидоров Алексей Викторович
магистрант факультета прикладной математики и информатики НГТУ (630073, Новосибирск, пр. Карла Маркса, 20), e-mail: alexeysidorov92@gmail.com
Вагнер Игорь Александрович
магистрант факультета прикладной математики и информатики НГТУ (630073, Новосибирск, пр. Карла Маркса, 20), e-mail: igorvagner92@gmail.com
Algorithm of two-dimensional irregular rectangular mesh generation
A. Sidorov, I. Vagner
Algorithm of two-dimensional irregular rectangular mesh generation is described in detail in
this paper. Examples of usage of this algorithm for problems with different configuration of a
computational domain are shown, and the reduction of the dimensional of the system of linear
equations for solving boundary value problem using the finite element method is demonstrated.
Keywords: regular rectangular mesh, irregular rectangular mesh, finite element method, system
of linear equations.
169
Исследование взаимоиндукции в системе мелких проводящих вкраплений
Исследование взаимоиндукции в системе мелких
проводящих вкраплений
Н.В. Симанкович
Проведено исследование изменения величины взаимоиндукции от расстояния между
проводящими вкраплениями. Приведены отличия добавочных полей в выбранных точках
расчетной области. Дан анализ полученных результатов.
Ключевые слова: зондирование становлением поля, взаимоиндукция, конечноэлементное
моделирование, метод конечных элементов.
1.
Введение
В некоторых случаях описание гетерогенных сред с помощью эффективных
характеристик может приводить к неадекватным результатам. К таким задачам можно
отнести задачи моделирования геоэлектромагнитных полей в высокоомных средах,
содержащих очень низкоомные вкрапления, при индукционном возбуждении этих полей.
Решение таких задач напрямую путем моделирования трехмерного электромагнитного поля
[1, 2, 3, 4, 5, 6] приводит к высоким вычислительным затратам, что делает их расчет на
современных компьютерах невозможным. Поэтому в работе [7] была предложена
многоэтапная технология выделения поля для точного и быстрого расчета
электромагнитного поля от системы мелких проводящих вкраплений. Под воздействием
источника внешнего поля проводящее вкрапление тоже становится источником добавочного
электромагнитного поля, которое, в свою очередь, оказывает влияние на другие вкрапления,
т.е. возникает процесс взаимоиндукции. Здесь мы оценим влияние взаимоиндукции на
величину добавочного поля от нескольких проводящих вкраплений.
2.
Математические модели
Для оценки величины взаимоиндукции воспользуемся следующим приемом. Сначала
от всех
вкраплений в выбранных точках
выполним расчет добавочного поля
задач с каждым из вкраплений и
расчетной области. Затем поочередно выполним расчет
суммируем, полученные в каждой из задач, значения добавочного поля - . Отличие этих
добавочных полей и будет характеризовать величину взаимоиндукции. Моделирование
трехмерных задач проводилось с применением технологии выделения осесимметричной
части поля от внешнего источника [8].
Для исследований рассмотрим два случая расположения вкраплений. В задаче 1 зададим
вкрапления на расстоянии
по каждой координате (рис. 1а). В задаче 2 зададим
вкрапления на расстоянии
по каждой координате (рис. 1б). Расчетные области
характеризуются следующими параметрами: кубические вкрапления со стороной
,
проводимость среды , проводимость вкрапления . Источником внешнего поля является
круглая замкнутая генераторная петля, расположенная на дневной поверхности с центром в
начале координат, радиус петли
, ток в петле
. Система наблюдений состоит
из 18 точек (рис. 1).
170
а) задача 1
б) задача 2
Рис. 1. Схематический вид расчетной области.
Результаты моделирования в точках наблюдений представлены в табл. 1. Видим, что
вблизи объектов значения отличий добавочных полей в каждой из задач и имеют разброс
(табл. 1 точки 1-9). Это объясняется тем, что при измерениях вблизи источников с разной
геометрией их конфигурация оказывает существенное влияние на сигнал.
Таблица 1 - Отличие добавочных полей в точках наблюдений.
№
1
2
3
4
5
6
7
8
9
Координаты точки
Отличие, %
наблюдения, м
x
y
z
Задача 1 Задача 2
-0.1
-0.1
-9.8
3.66254
13.2314
-0.05
-0.1
-9.8
3.03264
10.0499
-0.025
-0.1
-9.8
3.08282
12.6893
-0.1 -0.05
-9.8
1.78272
8.56778
-0.05 -0.05
-9.8
8.74756
20.4514
-0.025 -0.05
-9.8
3.73889
14.8655
-0.1 -0.025
-9.8
1.6094
7.46993
-0.05 -0.025
-9.8
3.65956
17.0155
-0.025 -0.025
-9.8
2.05364
12.1643
№
10
11
12
13
14
15
16
17
18
Координаты точки
Отличие, %
наблюдения, м
x
y
z
Задача 1 Задача 2
-0.1
-0.1
-9.7
2.16018
13.289
-0.05
-0.1
-9.7
2.0109
13.1735
-0.025
-0.1
-9.7
1.96786
13.0667
-0.1 -0.05
-9.7
2.26117
13.4526
-0.05 -0.05
-9.7
2.17532
13.0616
-0.025 -0.05
-9.7
2.09453
12.8668
-0.1 -0.025
-9.7
2.32085
13.4854
-0.05 -0.025
-9.7
2.21315
13.0195
-0.025 -0.025
-9.7
2.13573
12.8054
полей итоговые значения
Как видно по рис. 2 а), б) при независимом расчете
добавочного поля получаются значительно меньше, чем при решении полной задачи с
объектами. В дальнейшем это может привести к неверному определению структуры и
проводимости среды.
171
а) задача 1
б) задача 2
Рис.2. Графики зависимости
в точках наблюдения.
вкраплениями.
Кривые с треугольными маркерами получены при расчете полной задачи с
Кривые с круглыми маркерами получены как сумма решений задач с одним вкраплением.
Кривые, обозначенные цифрой 6, получены в точке (-0.025, -0.05, -9.8).
Кривые, обозначенные цифрой 10, получены в точке(-0.1, -0.1, -9.7).
3.
Заключение
Исследования показали, что взаимоиндукция дает существенный вклад в значения
добавочного поля. С уменьшением расстояния между вкраплениями отличие полей в
удаленных точках изменилось с 2-3% до 12-13%. Для более детального описания
электромагнитного поля в системе мелких проводящих вкраплений нужно учитывать, что
внутри системы имеет место их взаимное влияние. Таким образом, требуется разработать
необходимый математический аппарат для учета взаимоиндукции.
Литература
1. Persova M. G., Soloveichik Y. G., Trigubovich G. M., Vagin D. V., Domnikov P. A. Transient
electromagnetic modeling of an isolated wire loop over a conductive medium // Geophysical
Prospecting. - 2014. - Vol. 62, iss. 5. - P. 1193-1201.
2. Persova M. G., Soloveichik Y. G., Trigubovich G. M., Tokareva M. G. Methods and algorithms
for reconstructing three-dimensional distributions of electric conductivity and polarization in
the medium by finite-element 3D modeling using the data of electromagnetic sounding //
Izvestiya, Physics of the Solid Earth. - 2013. - Vol. 49, iss. 3. - P. 329–343. [Методы и
алгоритмы восстановления трехмерной структуры проводимости и поляризуемости
среды по данным электромагнитных зондирований на основе конечноэлементного 3Dмоделирования / Персова М. Г., Соловейчик Ю. Г., Тригубович Г. М., Токарева М. Г. //
Физика Земли. - 2013. – № 3. – С. 30–45.]
3. Персова М. Г., Соловейчик Ю. Г., Тригубович Г. М., Вагин Д. В., Домников П. А. Метод
расчета нестационарного электромагнитного поля над изолированной короткозамкнутой
петлей в проводящей среде // Геофизика. - 2013. – № 4. – С. 10–15.
172
4. Персова М. Г., Соловейчик Ю. Г., Токарева М. Г., Абрамов М. В. 3D-моделирование
процессов индукционной вызванной поляризации при возбуждении электромагнитного
поля незаземленной токовой петлей и проблема эквивалентности // Научный вестник
Новосибирского государственного технического университета. - 2013. – № 2(51). – С. 53–
61.
5. Соловейчик Ю.Г., Рояк М.Э., Моисеев В.С., Васильев А.В. Математическое
моделирование на базе метода конечных элементов трехмерных электрических полей в
задачах электроразведки // Изв. РАН, Сер.: Физика Земли. – №9, 1997. – с.67-71.
6. Соловейчик Ю.Г., Рояк М.Э., Тригубович Г.М., Чернышев А.В. Разработка системы
интерпретации электромагнитных полей в задачах индукционной геоэлектроразведки //
Доклады СО АН ВШ, №1(5), 2002г. – стр. 105-114.
7. Симанкович Н.В. Моделирование электромагнитного поля в системе проводящих
объектов, возбуждаемого изменяемым во времени внешним полем / Н.В. Симанкович;
науч. рук. Персова М. Г. // Наука. Технологии. Инновации.: материалы всерос. науч.
конференции молодых ученых, Новосибирск, 29 ноября-2 декабря, 2012. - Часть 1. - С.
8.
Соловейчик Ю.Г., Рояк М.Э., Персова М.Г. Метод конечных элементов для решения
скалярных и векторных задач: учеб. пособие. – Новосибирск: Изд-во НГТУ, 2007. – (Сер.
«Учебники НГТУ»).
Симанкович Надежда Валерьевна
магистрант кафедры прикладной математики НГТУ (630073, Новосибирск, пр. Карла
Маркса, 20), e-mail: nadyasimankovich@gmail.com.
Научный руководиель - зав. кафедрой прикладной математики НГТУ, д.т.н., профессор
Ю.Г. Соловейчик
Research of mutual induction in system of small conductive inclusions
N. Simankovich
Research of changes the value of the mutual induction depending on the distance between small
conductive inclusions. Different values of additional fields at the points of the computational
domain are given. The results are analyzed.
Keywords: transient electromagnetic modeling, mutual induction, finite element modeling, finite
element method.
173
Применение разрывного метода Галёркина для решения задачи Дарси
Применение разрывного метода Галѐркина
для решения задачи Дарси
С.А. Трофимова
Объектом исследования является движение жидкости в пористой среде под действием
давления. В процессе работы проводилось численное моделирование полей давления и
скорости. Релизована вычислительная схема для задачи Дарси с тензорным коэффициентом проницаемости среды.
Ключевые слова: задача Дарси, тензор проницаемости, разрывный метод Галѐркина.
1. Введение
В настоящее время значительная часть мировых запасов нефти и газа находится в месторождениях слоисто-пористой структуры, поэтому математическое моделирование процессов
просачивания жидкости (газа) в пористую среду является актуальным.
Для решения задач фильтрации на современном этапе одним из востребованных методов
является разрывный метод Галеркина (DG-метод), который является модификацией метода
конечных элементов. Популярность этого метода определяется естественной возможностью
работы с неструктурированными сетками, устойчивостью контрастных значений математической модели и повышенной точностью определения разрывных решений. Основная идея
DG-метода заключается в использовании разрывных базисных функций на конечных элементах, что приводит к независимости степеней свободы различных конечных элементов.
Связь между конечными элементами осуществляется с помощью так называемых численных
потоков, которые входят в вариационную постановку и обеспечивают гладкость решения.
Такая стратегия позволяет оптимально применять p-h-технологию для повышения аппроксимирующих свойств решения, а также работать с несогласованными сетками.
В работе рассматривается моделирование движения жидкости в пористой среде для задачи Дарси на базе разрывного метода Галѐркина.
2. Постановка задачи Дарси
Пусть   R n – ограниченная n -мерная область с границей    D . Закон Дарси описывается системой уравнений
u  K p

  u  f
(1)
p D  g
(2)
где u – вектор скорости [ м/с ], p – давление [Па], g – давление [Па] на границе  D , K – положительно-определѐнный ограниченный симметричный тензорпроницаемости среды.
Систему уравнений (1) можно переписать в виде краевой задачи с эллиптическим оператором
174
   K p   f
(3)
p D  g
(4)
3. Вариационная формулировка задачи Дарси
Введем бесконечномерное пространство Лебега L2    со скалярным произведением
 v, wL
 vwd  и нормой
2  

1/2
v L    v, v  L  .
2 
2 
Пусть h 
K – разбиение расчетной области на конечные элементы, под K понимается прямоугольник. Тогда

K  h
K –множество границ элементов K , 0   \  . Конечно-
элементные подпространства определяются следующим образом[1]
Vh
h
v  L2   : v K  P  K  , K h 
  L  :
2
2
K
  K  , K  h

(5)
(6)
где P  K   Pp  K  – пространство полиномов степени p  1 , определенных на элементе K ;
2
 Pp  K   .
K  


 K
Определим скалярный численный поток p  p
 K
u  uK
h
K
h
и векторный численный поток
как линейные функции
p : H 1  h   T   
2
u : H 2   h    H 1   h   T    


Здесь 
T 
(7)
2
(8)
 L2  K  – пространство функций, которые принимают два значения на
K  h
множестве внутренних границ конечных элементов  0 и одно значение на границе  .
Для определения численных потоков на ребрах конечных элементов вводятся операторы
 и скачка  . Пусть e 0 – внутреннее ребро, соединяющее элементы
среднего значения 
K1 и K 2 , для которых на ребре e определены внешние нормали n1 и n2 соответственно.
Тогда операторы среднего значения и скачка скалярной функции q  T    определяются
следующим образом:
1
2
q1n1  q2n2
q  q1  q2  ,  q  

qi q
где
Ki , i 1, 2 .
175
(9)
2
Для векторной функции   T     значения 1 и  2 определяются аналогичным обра и  примут вид:
зом, тогда операторы 
1
2
  1  2  ,    1  n1  2  n2
(10)
Для граничного ребра e , принадлежащего элементу K с внешней нормалью n ,
2
операторы среднего значения и скачка функции q  T    и   T     определяются следующим образом:

,  q  qn
q q
(11)
  ,     n
(12)
Воспользуемся введенными операторами и выпишем вариационную постановку разрывного метода Галѐркина в общем виде для системы уравнений (1):
 K

h
ph  h vd     p  ph   K  h v  K p  [v ] dS 

   p  ph   K  h v   [ K p ]v 
dS
 fvd 
0
(13)

В зависимости от вида численных потоков можно получить вычислительную схему с
определенными свойствами. Различные варианты выбора численных потоков и вид соответствующих вариационных постановок для однородного эллиптического уравнения подробно
рассмотрены в [1]. Определим численные потоки в вариационной постановке (13) в форме
Baumann-Oden:
0

{ p }   ph   nK , на  ,
p h

nK   ph  g D  , на Г D ,
(14)
K ph  на 0 ,
u
 K ph на Г D ,
(15)
Подставив выражения для потоков в (13), получим окончательный вид вариационной постановки DG-метода в форме Baumann-Oden:
 K
h
ph  h vd  

  p n  K  v  K p
h
h
h
 vn  dS 
D
   ph    K  h v   K ph   [v] dS
0
+   g D n    K  h v  dS
D
176
 fvd +

(16)
n
Определим искомое решение в виде разложения по базисным функциям ph   qii , где
i 1
i – базисные функции пространства Vh . Аналог вариационной постановки (16) в матрично-
векторном виде:
 G  Pb  Pin  q b  Pg
(17)
где слагаемые вычисляются по сотношениям:
G
 K  j i d ,
ij
(18)
  j n  K i  K  j  i n  dS
(19)

(20)


Pbij
Pin

ij
D

  j   K i   K  j   i  dS
0
 n


bi    f j j  i d 
 j 1




Pgi
 n

   g j j  n  K i dS
 D  j 1

(21)
(22)
4. Результаты численного моделирования
4.1. Задачи с тензорным коэффициентом проницаемости
Рассмотрим систему (1) – (2) с тензорным коэффициентом проницаемости среды K для
 0,1  0,1 . Базисные функции – бизадач, имеющих аналитическое решение в области 
квадратичные на прямоугольниках.
Задача 1. Разрывный скалярный коэффициент проницаемости
Пусть заданы следующие параметры задачи (1) – (2):

x 2 y 3  cos( xy ), 0  x  0.5

 I , 0  x  0.5
, p  2x  9 2
K 


 3
 2x  9 
10 I , 0.5  x  1
y  , 0.5  x  1

 y  cos 
 20

 20 
Мелкость разбиения сетки – 0.025
Относительная погрешность решения в норме L2 – 4.86436e-007
177
(23)
Рис. 1. Численные поля давления и скорости для задачи 1
В таблице 1 приведены относительные погрешности в норме L2 для сеток с мелкостью
разбиения

h 0.05,

h / 2 0.025,

h / 4 0.0125.
Таблица 1. Относительные погрешности решения задачи 1
h/2
h/4
h
3.22146e-006
4.86436e-007
9.24956e-008
Задача 2. Тензорный коэффициент проницаемости с разрывом
Параметры задачи:
2 1
xy, 0  x  0.5

 , 0  x  0.5 , p 

K 

1 2 
 xy   x  0.5 y  0.5 , 0.5  x  1
 I , 0.5  x  1

(24)
Мелкость разбиения сетки – 0.025
Относительная погрешность решения в норме L2 – 1.63967e-011
Рис. 2. Численные поля давления и скорости для задачи 2
В таблице 2 приведены относительные погрешности в норме L2 для сеток с мелкостью
разбиения

h 0.05,

h / 2 0.025,

h / 4 0.0125.
178
Таблица 2. Относительные погрешности решения задачи 2
h/2
h/4
h
3.87307e-012
1.63967e-011
1.20242e-010
4.2. Задача со слоистой расчетной областью
Рис. 3. Вид расчетной области
p p
Пусть на верхней границе области заданы первые краевые условия: 
0 0, на нижp p
ней границе также заданы первые краевые условия: 
1 1, на левой и правой границах –
p
вторые краевые условия: K
 0.
n
1. Проведем исследование влияния толщины среднего слоя на численные поля давления и
скорости.
K1, K2 , K3 – тензоры проницаемости первого, второго и третьего слоев соответственно.
1 0 
10 0 
K
1 K
3 
2 
 , K

0
1


 0 10
Исследование проводилось на вложенных сетках с шагом

h 0.05,

h / 2 0.025,

h / 4 0.0125.
Таблица3. Относительные погрешности решения при различной толщине второго слоя
ph /4  ph L
2
ph /4 L
ph /4  ph /2 L
2
ph /4 L
  0.3
2.38035e-009
2.00741e-009
  0.07
1.72904e-008
1.7257e-008
  0.01
2.441e-009
2.65873e-009
2
179
2
Рис. 4. Численные поля давления и скорости при   0.3
Рис. 5. Численные поля давления и скорости при   0.07
Рис. 6. Численные поля давления и скорости при   0.01
180
2. Проведем исследование влияния контрастности коэффициента проницаемости среды
K1, K2 , K3 – тензоры проницаемости первого, второго и третьего слоев соответственно.
1 0 
K
 0.15
1 K
3 
 ,
0 1 
Исследование проводилось на вложенных сетках с шагом

h 0.05,

h / 2 0.025,

h / 4 0.0125.
Таблица 4. Относительные погрешности решения при различных значениях коэффициента
проницаемости второго слоя
ph /4  ph L
2
ph /4 L
ph /4  ph /2 L
2
ph /4 L
2.93006e-010
1.98597e-010
2.65553e-010
1.86504e-010
8.0909e-010
1.56826e-009
2
0 
0.001
K2  
0.001
 0
0.1 0 
K2  

 0 0.1
100 0 
K2  

 0 100 
2
0 
0.001
Рис. 7. Численные поля давления и скорости при K 2  
0.001
 0
181
0.1 0 
Рис. 8. Численные поля давления и скорости при K 2  

 0 0.1
100 0 
Рис. 9. Численные поля давления и скорости при K 2  

 0 100 
5. Заключение
Результаты проведенных исследований показали, что вариационная постановка в форме
Baumann-Odenна классе задач с тензорным коэффициентом проницаемости среды имеет второй порядок аппроксимации. Повышение порядка аппроксимации дискретного аналога, полученного DG-методом для задачи Дарси, достигается за счет выбора специальной вариационной постановки с дополнительными стабилизаторами и использования специальных базисных функций из пространства H div [4, 5].
При рассмотрении задачи со слоистой структурой расчѐтной области было выявлено, что
влияние толщины среднего слоя на численные поля давления и скорости минимально, однако различная контрастность тензорного коэффициента проницаемости среды значительно
меняет картину поля давления.
Литература
1. D.N.Arnold, F.Brezzi, B.Cocburn, D.Marini. Unified analysis of discontinuous Galerkin methods for elliptic problems //SIAM J. Numer. Anal. 2002. V.39.
182
2. C.E.Baumann and J.T.Oden. A discontinuous hp finite element method for convection-diffusion
problems //Comput. Methods Appl. Mech. Eng., 175, 2000, pp. 311-341.
3. Sudirham J.J., Van der Vegt J.J.W.V., Damme R.M.J.V. A study on discontinuous Galerkin finite element methods for elliptic problems. Memorandum No. 1690 .// University of Netherlands. 2003.
4. V. Girault, B, Riviere, M. F. Wheeler. A discontinuous Galerkin method with nonoverlapping
domain decomposition for the Stokes and Navier-Stokes problems.// Math. Comp. 2005. № 74.
pp. 53-84.
5. Brezzi F., Cockburn B., Marini L.D., Suli E. Stabilization mechanisms in Discontinuous Galerkin finite element methods //www.imati.cnr.it/brezzi/papers/bcms.pdf
Трофимова Светлана Алексеевна
магистрант кафедры Вычислительных технологий НГТУ(630073, г. Новосибирск, пр-т
К.Маркса, 20) тел. (383) 346-27-76, e-mail: www.svetik-missy@mail.ru
Discontinuous Galerkin method for Darcy flow
S.Trofimova
The object of research is the filtration of fluid in a porous medium under pressure. This paper
deals with the numerical modeling of pressure and velocity fields. A computational scheme for
the Darcy flow equation with the tensor permeability coefficient of the medium is implemented.
Keywords: the Darcy problem, permeability tensor, Discontinuous Galerkin method.
183
Исследование скорости сходимости непраметрической оценки функции надежности Каплана–Мейера к
аналитическому распределению
Исследование скорости сходимости
непараметрической оценки функции надежности
Каплана-Мейера к аналитическому распределению
П.А. Филоненко, С.Н. Постовалов1
Оценка Каплана-Мейера – это широко-распространенная методика для непараметрического оценивания функции надежности. Однако необходимо понимать насколько сильно
оценка Каплана-Мейера отличается от распределения, из которого были получены данные. Была рассмотрена непараметрическая оценка функции надежности Каплана-Мейера.
Исследована скорость сходимости к аналитическому распределению, используя имитационный метод Монте-Карло. Результаты представлены в виде степенных регрессий.
Ключевые слова: теория надежности, оценка функции надежности, оценка КапланаМейера, скорость сходимости, цензурированные справа данные, метод Монте-Карло.
1. Введение
В теории надежности важной характеристикой случайной величины является функция
надежности. Под функцией надежности S (t ) будем понимать вероятность объекта не выйти
из строя на интервале [0, t ] :
S (t ) P i  t 1  P i  t 1  F  t  ,
где F  t  – функция распределения вероятностей отказов.
Существуют различные оценки функций надежности, следовательно, перед исследователем встает выбора какими оценками стоит пользоваться в конкретной ситуации. Исследователю следует также знать, кроме теоретической скорости сходимости оценки к аналитическому закону, фактическую скорость сходимости к аналитическому закону. Фактическую
скорость сходимости получим, используя имитационный метод Монте-Карло. Оценка функции надежности является более предпочитаемой, чем другая оценка, если в конкретной ситуации требуется меньший объем для достижения некоторой точности аналитического закона,
из которого получены данные.
Для исследования скорости сходимости рассмотрим различные конфигурации законов
распределения моментов отказа, законов распределения моментов цензурирования и степеней цензурирования.
2. Исследование скорости сходимости
2.1. Моделирование
Для исследования скорости сходимости был использован имитационный метод МонтеКарло. Количество повторений вычисления наибольшего расстояния между оценкой Каплана-Мейера и аналитическим распределением составляет 10 000. Объемы выборок n1  n2 от
50 до 500 с шагом 50. Степени цензурирования 0%-50%.
1
Работа выполнена в рамках гранта НГТУ №042 – НСГ – 14, а также при поддержке Министерства образования и науки Российской Федерации (проект №2.541.2014К)
184
Наибольшее расстояние Dn будем вычислять, используя следующее соотношение:

D sup Sˆ (t )  S (t ) ,
n
t 
где Sˆ (t ) – оценка функции надежности Каплана-Мейера, а S (t ) – аналитическое распределение.
Исследовать сходимость будем, используя степенную регрессию без свободного члена
вида:
aebt .
Использованные распределения представлены в таблице 1.
Таблица 1 – Использованные распределения для исследования скорости сходимости
2
fWe (1 , 2 ; t )

Использованные
законы распределения
моментов отказа
 2t
 2 1
e
1
 t 
 
 1 
2
, t  0,
где 

2
1
2
f Exp

(t;1 ) 1e1t , t  0 ,
где 1  1
2
fWe (1 , 2 ; t )

Использованные
законы распределения
моментов цензурирования
 2t
 2 1
e
1
 t 
 
 1 
2
, t  0,
с различными параметрами 1 и  2
 2 1
t

 t 
1
  e

1 


, t  0,
f  (t ;1 ,  2 )
1( 2 )
с различными параметрами 1 и  2
2.2. Результаты моделирования
В этой части мы рассмотрим сходимость непараметрической оценки функции надежности к аналитическому закону. Т.к. функция надежности - это функция от данных типа времени жизни, то исследовать сходимость было бы разумно для разных законов распределения
моментов отказов, разных законов моментов цензурирования и разной степени цензурирования. Результаты моделирования представим в таблице 2.
F (t ) / F C (t )
We / We
We / 
Exp / We
Exp / 
Таблица 2 – Исследования скорости сходимости,
представленные в виде степенных регрессий
Степень цензурирования
0%
10%
20%
30%
40%
1,2595x-0,488
R² = 0,9998
1,275x-0,491
R² = 0,9995
1,3377x-0,499
R² = 0,9993
1,323x-0,496
R² = 0,9993
1,3121x-0,489
R² = 0,999
1,3265x-0,492
R² = 0,9983
1,2767x-0,488
R² = 0,9994
1,2938x-0,49
R² = 0,9993
1,4072x-0,495
R² = 0,999
1,3464x-0,486
R² = 0,999
1,3622x-0,494
R² = 0,9991
1,4061x-0,498
R² = 0,9994
1,5575x-0,503
R² = 0,9994
1,509x-0,495
R² = 0,9992
1,1458x-0,43
R² = 0,9987
1,4546x-0,483
R² = 0,9993
1,7382x-0,5
R² = 0,9996
1,6805x-0,499
R² = 0,9992
0,8961x-0,326
R² = 0,9963
1,3441x-0,431
R² = 0,9989
50%
1,6504x-0,455
R² = 0,9984
1,9495x-0,502
R² = 0,9977
0,7689x-0,242
R² = 0,9922
1,1572x-0,345
R² = 0,998
Из результатов, представленных в таблице 2, очевидно, что выбор закона распределения
моментов отказа и выбор закона распределения моментов цензурирования оказывают влияние на скорость сходимости. Это видно из коэффициентов соответствующих степенных ре185
грессий, которые отличаются, а, главное, коэффициент скорости сходимости может отличаться в случае разных конфигураций законов распределения моментов отказа, моментов
цензурирования и степени цензурирования.
Литература
1. E.L. Kaplan, P. Meier, Nonparametric estimator from incomplete observation, J. Amer. Statist.
Assoc. 53 (1958), pp. 457–481.
2. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. — М.: Наука, 1983. —
416 с.
3. M.S. Pepe, T.R. Fleming, Weighted Kaplan–Meier statistics: A class of distance tests for censored survival data, Biometrics 45 (1989), pp. 497–507.
4. Smirnov N. V. ―Tables for estimating the goodness of fit of empirical distributions‖,
Annals of Mathematical Statistics, vol. 19, num. 1, 1948, 279.
Филоненко Петр Александрович
аспирант кафедры теоретической и прикладной информатики НГТУ, (630073, Новосибирск, пр. Карла Маркса, 20) тел. (383) 346-27-76, e-mail: petr-filonenko@mail.ru.
Постовалов Сергей Николаевич
к.т.н., доцент кафедры теоретической и прикладной информатики НГТУ, (630073, Новосибирск, пр. Карла Маркса, 20) тел. (383) 346-27-76, e-mail: postovalov@ngs.ru.
186
Исследование скорости сходимости непараметрической оценки Каплана–Мейера
к функции надежности
Исследование скорости сходимости
непараметрической оценки Каплана-Мейера
к функции надежности
П.А. Филоненко, С.Н. Постовалов1
Оценка Каплана-Мейера широко распространена для непараметрического оценивания
функции надежности по цензурированным справа наблюдениям. В работе исследуется
скорость сходимости оценки Каплана-Мейера к функции надежности при разных законах
распределения моментов отказов, моментов цензурирования и доли цензурированных
наблюдений. Исследования проведены численно с помощью метода Монте-Карло. Результаты представлены в виде степенных регрессий.
Ключевые слова: теория надежности, оценка функции надежности, оценка КапланаМейера, скорость сходимости, цензурированные справа данные, метод Монте-Карло.
1. Введение
В теории надежности важной характеристикой случайной величины является функция
надежности. Под функцией надежности S (t ) будем понимать вероятность объекта не выйти
из строя на интервале [0, t ] :
S (t ) P   t 1  P   t 1  F  t  ,
где F  t  – функция распределения вероятностей отказов,  – случайная величина – время
работы объекта до отказа.
Цензурированная
справа
выборка
может
быть
представлена
в
виде
( X1, 1), ( X 2 ,  2 ), ..., ( X n ,  n ) , где X i  min (Ti , Ci ) – значение наблюдения, Ti – момент
–
момент
цензурирования,
наступления
системного
события,
Ci
Ti
1, если Ti  Ci , X i 
– индикатор цензурирования, который равен единице, если i -е
Ci
0, если Ti  Ci , X i 
i  
наблюдение полное, нулю – если цензурированное.
Выборка называется случайно цензурированной, если Ti и Ci представляют собой независимые случайные величины, причем Ti принадлежит закону распределения вероятностей с
функцией F ( x) , а Ci – закону FC ( x) .
Существуют различные оценки функций надежности по случайно цензурированной
справа выборке, однако наиболее известна оценка Каплана-Мейера [1]. Обозначим через
a1  a2  ...  ak 
 , k  n моменты времени, в которые были зафиксированы отказы
 X i , i  1 . Тогда оценку Каплана-Мейера можно вычислить по формуле:
1
Работа выполнена в рамках гранта НГТУ №042 – НСГ – 14, а также при поддержке Министерства образования и науки Российской Федерации (проект №2.541.2014К)
187
ˆ ( x)
S
n

 1 
ai  x 
di
ri

,

где di    j , ri – количество наблюдений, для которых X j  ai , j  1,..., n .
X j  ai
Известно, что оценка Каплана-Мейера сходится к функции надежности со скоростью
O n [2], однако вопрос о том, как влияет степень цензурирования и закон распределения
 
моментов цензурирования остается открытым.
Для исследования скорости сходимости в данной работе мы рассмотрим различные конфигурации законов распределения моментов отказа, законов распределения моментов цензурирования и степеней цензурирования.
2. Исследование скорости сходимости
Определим расстояние между оценкой Каплана-Мейера и функцией надежности следующим образом:

Dn sup Sˆn (t )  S (t ) , .
t 
Скоростью сходимости Sˆn (t ) (например, распределения статистики при объеме выборки n ) к функции надежности S (t ) называется число b, при котором Dn  O(nb ) . Чем
больше величина b, тем больше скорость сходимости.
Задача определения скорости сходимости является одной из классических задач математической статистики и может быть решена только аналитическими методами. Однако с помощью метода Монте-Карло можно дать численные оценки скорости сходимости, с одной
стороны, и оценить необходимый объем выборки, при котором погрешность оценки Каплана-Мейера будет несущественной, с другой стороны.
Для оценки скорости сходимости будет использоваться предположение о том, что расстояние между оценкой Каплана-Мейера и функцией надежности аппроксимируется
как  (n)  anb с неизвестными параметрами a и b .
3. Численное моделирование
Для исследования скорости сходимости был использован имитационный метод МонтеКарло [3]. Количество повторений вычисления расстояния Dn составляет 10 000. Объемы
выборок n изменялись от 50 до 500 с шагом 50. Степени цензурирования варьировались в
диапазоне от 0% до 50%.
Было рассмотрено два закона распределения случайных величин для функции надежности: распределение Вейбулла-Гнеденко с функцией плотности
2

fWE (t ;1,  2 )
2
 t 
 
 2 1  1 
t
e
12
,t 0
где 
1 
2 2 и экспоненциальное распределение с функцией плотности
f Exp

(t;1) 1e1t , t  0 ,
188
где 1  1 .
Было рассмотрено два закона распределения моментов цензурирования: распределение
Вейбулла-Гнеденко и гамма-распределение
 2 1  t
1
 t 
 


f (t ;1, 2 )  1 
e
1( 2 )
,t 0
с параметрами 1,2 зависящими от степени цензурирования.
Результаты моделирования и аппроксимации Dn степенной функцией регрессии показа-
ны в таблице 1. Коэффициент детерминации R 2 близок к 1 во всех случаях, что показывает
довольно хорошую аппроксимацию Dn .
Таблица 1 – Аппроксимации Dn при разных законах распределения отказов, законов распределения моментов цензурирования и степенях цензурирования
Степень цензурирования
C
F (t ) / F (t )
0%
10%
20%
30%
40%
50%
1,2595x-0,488
1,3121x-0,489
1,4072x-0,495
1,5575x-0,503
1,7382x-0,5
1,6504x-0,455
We / We
We / 
Exp / We
Exp / 
R² = 0,9998
1,275x-0,491
R² = 0,9995
1,3377x-0,499
R² = 0,9993
1,323x-0,496
R² = 0,9993
R² = 0,999
1,3265x-0,492
R² = 0,9983
1,2767x-0,488
R² = 0,9994
1,2938x-0,49
R² = 0,9993
R² = 0,999
1,3464x-0,486
R² = 0,999
1,3622x-0,494
R² = 0,9991
1,4061x-0,498
R² = 0,9994
R² = 0,9994
1,509x-0,495
R² = 0,9992
1,1458x-0,43
R² = 0,9987
1,4546x-0,483
R² = 0,9993
R² = 0,9996
1,6805x-0,499
R² = 0,9992
0,8961x-0,326
R² = 0,9963
1,3441x-0,431
R² = 0,9989
R² = 0,9984
1,9495x-0,502
R² = 0,9977
0,7689x-0,242
R² = 0,9922
1,1572x-0,345
R² = 0,998
4. Заключение
Результаты, представленные в таблице 1 подтверждают, что скорость сходимости оценки
Каплана-Мейера близка к O n . Также очевидно, что выбор закона распределения момен-
 
тов отказа и выбор закона распределения моментов цензурирования оказывают некоторое
влияние на скорость сходимости оценки Каплана-Мейера к функции надежности.
Литература
1. E.L. Kaplan, P. Meier, Nonparametric estimator from incomplete observation, J. Amer. Statist.
Assoc. 53 (1958), pp. 457–481.
2. Лемешко Б.Ю., Постовалов С.Н.Компьютерные технологии анализа данных и исследования статистических закономерностей: Учебное пособие. – Новосибирск: Изд-во НГТУ,
2004. – 119 с
3. M.S. Pepe, T.R. Fleming, Weighted Kaplan–Meier statistics: A class of distance tests for censored survival data, Biometrics 45 (1989), pp. 497–507.
Филоненко Петр Александрович
аспирант кафедры теоретической и прикладной информатики НГТУ, (630073, Новосибирск, пр. Карла Маркса, 20) тел. (383) 346-27-76, e-mail: petr-filonenko@mail.ru.
Постовалов Сергей Николаевич
д.т.н., доцент кафедры теоретической и прикладной информатики НГТУ, (630073, Новосибирск, пр. Карла Маркса, 20) тел. (383) 346-27-76, e-mail: postovalov@ngs.ru.
189
Нахождение установившегося режима в задаче идентификации
гауссовских линейных дискретных систем
Нахождение установившегося режима в задаче
идентификации гауссовских линейных
дискретных систем
О.С. Черникова, К.Н. Анисимова
Для гауссовских линейных дискретных систем получены аналитические соотношения
для определения установившихся значений ковариационной матрицы одношагового
предсказания и еѐ производных. Также приведѐн пример определения установившегося
режима для модельной задачи при различных интенсивностях шумов системы и измерений.
Ключевые слова: фильтр Калмана, установившийся режим, ковариационная матрица одношагового предсказания.
1. Введение
Во временной области эффективность процедуры активной параметрической идентификации при построении моделей стохастических динамических систем была показана, например, в работе [1]. Следуя [2], переход из временной области в частотную упрощает параметрическую идентификацию, в связи с чем, становится весьма интересным решение этой задачи для моделей динамических систем именно в частотной области. Применение разработанных в [1] алгоритмов параметрической идентификации в частотной области требует умение
вычислять установившиеся значения ковариационной матрицы одношагового предсказания
и еѐ производных.
В работе приводится вывод аналитических соотношений установившихся значения ковариационной матрицы одношагового предсказания и еѐ производных первого и второго порядков.
2. Структурно-вероятностное описание математической модели
Рассмотрим следующую гауссовскую линейную дискретную модель в пространстве состояний:
(
)
(
)
(
)
( )
(
( )
)
( ),
(1)
.
(2)
Здесь:
( ) – n-вектор состояния;
( ) – r-вектор управления;
( ) – p-вектор возмущения;
(
) – m-вектор измерения;
(
) – m-вектор ошибки измерения.
Предположим, что:

– соответственно постоянные матрицы состояния, управления, возмущения и наблюдения требуемых размеров;
матрицы
удовлетворяют условию

– устойчива (собственные значения
);
190



пары
)
–
);
пара (
) наблюдаема (
случайные векторы
( ) и (
последовательности, для которых
(
и(
)
,
)
(
,
( )
);
) образуют стационарные белые гауссовские
,
( )
(
управляемы
(
( )
( )
)
( )
;
( )
(
(3)
;
)
,
(4)
(5)
для любых
(
– символ Кронекера);
 начальное состояние ( ) имеет нормальное распределение с параметрами
̅ ( ), ( ) и не коррелирует с ( ) и (
) при любых значениях переменной ;
 структура модели (1)-(2) задана с точностью до неизвестных параметров
(
), которые могут входить в различных комбинациях в матрицы , ,
, ,а также в ковариационные матрицы , , ( ).
Необходимо для модели (1)-(2) с указанными априорными предположениями (3)-(5) получить аналитические соотношения для вычисления установившихся значений ковариационной матрицы и еѐ производных.
3. Вычисление установившихся значений ковариационной матрицы ошибок одношагового предсказания и еѐ производных
Запишем уравнения дискретного фильтра Калмана [3]:
(
)
|
)
̂ (
̂ (
(
(
(
(
|
(
| )
̂ (
)
| )
)
)
(
)
̂ (
̂ ( | )
| )
( | )
(
| )
(
| )
)
| ),
( ),
(
)
;
;
(
);
(
(
),
(6)
(7)
(8)
(9)
| );
для
,
,
, с начальными условиями: ̂ ( | )
̅ ( ),
( | )
( ).
Здесь:
| ) – оценка одношагового предсказания состояния ̂ (
);
 ̂ (
|
) – оценка фильтрации состояния ̂ (
);
 ̂ (
(
| ) – ковариационная матрица ошибок одношагового предсказания;

(
|
) – ковариационная матрица ошибок одношаговой фильтрации.

В установившемся режиме ковариационная матрица ошибок одношагового прогнозирования практически не меняется,т.е., начиная с некоторого момента времени , выполняется
условие:
где
‖ (
| )
( |
,
)‖
(10)
– малое положительное число.
Подставив в уравнение (6) выражение для ( | ), определѐнное равенством (9), получим:
(
| )
( )
( |
)
ǡ
С учѐтом того, что вустановившемся режиме справедливы соотношения:
191
Ǥ
( |
)
(
| ),
,
,
полученное выражение можно записать в следующем виде:
.
(11)
Уравнение (11) представляет собой обобщѐнное дискретное алгебраическое уравнение
Риккати.
Продифференцировав уравнение (11), получим дискретное уравнение Ляпунова вида:
,
(12)
в котором:
,
,
,
,
.
Продифференцировав (12), вновь получаем дискретное уравнение Ляпунова:
,
(13)
где:
*
(
192
)+
Таким образом, для нахождения установившихся значений ковариационной матрицы
ошибок одношагового предсказания и еѐ производных первого и второго порядков необходимо решить уравнения Риккати (11) и Ляпунова (12) и (13). Воспользуемся программной
системой MATLAB, применяя соответственно функции dare() и dlyap() пакета ControlSystemToolbox [4].
4. Модельный пример
Приведѐм пример нахождения установившихся значений ковариационной матрицы ошибок одношагового предсказания и еѐ производных первого и второго порядков для следующей гауссовской линейной дискретной модели:
{
(
(
)
)
*
(
+ ( )
Выберем в качестве входного сигнала
начального состояния ( )
)
*
(
( )
+ ( )
)
( )
*
(
( ) Истинные значения параметров
+ ( )
(14)
, а в качестве
)
,
.Для
определения установившегося режима положим
в условии (10).
Рассмотрим случаи с различными интенсивностями шумов системы и измерений.
Случай 1.
Выберем
*
+
*
(15)
+
и представим в табл.1 результаты вычисления значений ковариационной матрицы ошибок
одношагового предсказания, еѐ производных первого и второго порядков.
Таблица 1. Результаты вычислений для модели (14) с предположениями (15)
Время,
1
Ковариационная матрица ошибок одношагового предсказания, ( |
2
3
193
)
4
5
6
7
‖ ( | )
( | )‖
(
)
1
(
1
) (
)
2
1
2
2
Рис. 1. График зависимости вектора состояния от времени ( - начало установившегося режима)
Случай 2.
Выберем
*
+
*
+,
(16)
и представим в табл.2 результаты вычисления значений ковариационной матрицы ошибок
одношагового предсказания, еѐ производных первого и второго порядков.
194
Таблица 2. Результаты вычислений для модели (14) с предположениями (16)
Время,
1
Ковариационна матрица ошибок одношагового предсказания, ( |
2
)
3
4
5
6
‖ ( | )
( | )‖
(
)
1
1
2
1
2
2
(
) (
)
Рис. 2. График зависимости вектора состояния от времени ( - начало установившегося режима)
195
Случай 3.
Выберем
*
+
*
(17)
+,
и представим в табл.3 результаты вычисления значений ковариационной матрицы ошибок
одношагового предсказания, еѐ производных первого и второго порядков.
Таблица 3. Результаты вычислений для модели (14) с предположениями (17)
Время,
1
Ковариационна матрица ошибок одношагового предсказания, ( |
2
)
3
4
…
17
18
19
‖ (
|
)
(
|
(
)‖
)
1
1
2
1
2
196
2
(
) (
)
Рис. 3. График зависимости вектора состояния от времени( - начало установившегося режима)
5. Заключение
В работе получены выражения для вычисления установившихся значений ковариационной матрицы одношагового предсказания и еѐ производных. На модельном примере проиллюстрировано определениеустановившегося режима, что в дальнейшем будет использовано
при решении задачи параметрической идентификации гауссовских линейных дискретных
систем в частотной области.
Работа выполнена при финансовой поддержке Министерства образования и науки РФ
(№2014/138, проект №1689)
Литература
1. Активная параметрическая идентификация стохастических линейных систем: монография / В.И. Денисов, В.М. Чубич, О.С. Черникова, Д.И. Бобылева. Новосибирск: Издательство НГТУ, 2009. 192 с.
2. TomasMcKelvey,
LennartLjung.FrequencyDomainMaximumLikelihoodIdentification.Proc.
ofthe 11thIFACSymposiumonSystemIdentification, Fukuoka, Japan, 1997. P. 1741-1746.
3. Огарков М.А. Методы статистического оценивания параметров случайных процессов. М.:
Энергоатомиздат, 1990. 208 с.
4. MATLABControlSystemToolbox [Электронныйресурс] // TheMathWorks, Inc.[сайт].URL:
http://www.mathworks.com/help/control/index.html
(дата обращения 21.12.2014)
197
Черникова Оксана Сергеевна
к.т.н., доцент кафедры теоретической и прикладной информатики
(630073, Новосибирск, пр-т К.Маркса, 20), e-mail: chernikova@corp.nstu.ru
НГТУ
Анисимова Ксения Николаевна
магистрант 1 курса НГТУ, факультет прикладной математики и информатики, e-mail:
ksushaa22@gmail.com
A calculationof a steady-statefor identification problem of Gaussian linear discrete systems
O. Chernikova, K. Anisimova
In this paper analytical equations for calculation of one-step covariance prediction and its derivatives are obtained for Gaussian linear discrete systems. In addition, there is an example of
computation of steady-state for the one stochastic discrete model with different noises of process and measurements.
Keywords: Kalman filter, steady-state,one-step covariance prediction
198
Активная параметрическая идентификация модели системы стабилизации летательного аппарата на
основе планирования входных сигналов и начальных условий
Активная параметрическая идентификация модели
системы стабилизации летательного аппарата
на основе планирования входных сигналов
и начальных условий
О.С. Черникова1, Е.А. Берикет1
В работе приводится процедура активной параметрической идентификации с использованием планировании входных сигналов и начальных условий на примере модели системы стабилизации летательного аппарата. Также дано описание разработанной программной системы активной параметрической идентификации стохастических динамических
систем, описываемых линейными дискретными моделями в пространстве состояний.
Ключевые слова: дискретная система, активная идентификация, метод максимального
правдоподобия, планирование эксперимента, информационная матрица.
1. Введение
Идентификация является наиболее сложным этапом решения прикладных задач, возникающих в различных отраслях промышленности и на транспорте при проектировании и расчете систем автоматического управления. Определение структуры и параметров математических моделей объектов исследования приобретает особенно важное значение для фундаментальной науки и практики.
Возможны два подхода к решению задачи идентификации. При пассивной идентификации обрабатываются данные наблюдений, полученные по результатам проведения идентификационных экспериментов, в режиме нормальной эксплуатации системы. Активная идентификация предполагает использование специальным образом синтезированного плана эксперимента. Компенсацией за нарушение технологического режима является получение экспериментатором более информативных измерительных данных, что способствует повышению эффективности проводимых исследований при небольшом количестве опытов.
Для реализации процедуры активной идентификации системы с предварительно выбранной модельной структурой необходимо выполнить следующие этапы:
1. Вычислить оценки неизвестных параметров, используя измерительные данные, полученные по некоторому пробному плану эксперимента (оценивание параметров).
2. Используя полученные на первом этапе оценки, выполнить синтез оптимального плана в соответствии с выбранным критерием оптимальности (планирование эксперимента).
3. Выполнить пересчет оценок неизвестных параметров по измерительным данным, соответствующим полученному оптимальному плану.
В работе приводится процедура активной параметрической идентификации на основе
совместного планирования входных сигналов и начальных условий, с применением разработанной авторами программной системы APIS на примере модели системы стабилизации летательного аппарата, исследуется эффективность указанной процедуры.
1
Работа выполнена при финансовой поддержке Министерства образования и науки РФ по государственному заданию №2014/318, проект №1689.
199
2. Постановка задачи
Рассмотрим стохастическую линейную дискретную систему, описываемую уравнениями
(1)
x  k  1    k  x  k     k  u  k     k  w  k  ,
y  k  1
 H  k  1 x(k  1)  v  k  1 , k 0,1,..., N  1 .
(2)
Выполнены следующие априорные предположения:
 случайные векторы w  k  и v  k  1 образуют стационарные белые гауссовские последовательности, для которых
  w  k  
0,   w  k  wT  i  
Q ki ,


 v  k  1 0,  v  k  1 vT  i  1 R ki ,


T


   k  1 w  i   0, k , i  0,1, , N  1


(здесь и далее   – оператор математического ожидания,  ki – символ Кронекера);
(3)
(4)
(5)
 начальное состояние x  0  имеет нормальное распределение с параметрами

  x  0  
x  0  ,  x  0   x  0   x  0   x  0 
T
  0

(6)
и не коррелирует с w  k  и v  k  1 при любых значениях переменной k ;
 неизвестные параметры сведены в вектор  ( 1 , 2 ,
, s ) и могут содержаться в
элементах матриц   k  ,   k  ,   k  ,   k  1 , Q, R, P  0  в различных комбинациях;
Необходимо для модели (1), (2) с учетом высказанных априорных предположений найти
оптимальные оценки параметров на основе совместного планирования входных сигналов и
начальных условий.
3.Оценивание неизвестных параметров
Оценивание неизвестных параметров математической модели будем осуществлять по
данным наблюдений  , полученным в процессе проведения идентификационных экспериментов, в соответствии с критерием максимального правдоподобия. Будем понимать под
дискретным нормированным планом эксперимента  план вида:
1 ,  2 , ,  q 


   k k
kq  , i   , i  1, 2,..., q ,
1 2
 , , , 
 
 
 задает ограничения на условия проведения эксперимента.
Обозначим через Yi , j j -ю реализацию выходного сигнала ( j  1, 2,
ющую i -ой точке плана  i ( i  1, 2,
ставлена в виде:
u 0
i
, ki ), соответству-
, q ). Каждая точка  i спектра плана может быть пред-
1. при планировании входного сигнала

iT
(7)
T
T
, ui 1 ,..., ui  N  1
2. при планировании начальных условий
200
T
;

T
i
iT   x  0  
;
3. при совместном планировании входного сигнала и начальных условий
u 0
T


i
T

T
T
i
, ui 1 ,..., ui  N  1 ,  x  0  .
По результатам проведения идентификационных экспериментов по плану  сформируем множество

iT
, Yi, j  , j
Ui

q
1,
2,..., ki , i 1, 2,..., q ,  ki   .
i 1
Априорные предположения, высказанные в разделе 1, позволяют воспользоваться для
оценивания параметров методом максимального правдоподобия (ММП). В соответствии с
этим методом необходимо найти такие значения параметров  , для которых выполняется

 arg min  ln L  ;    .

(8)

Согласно [1] можно записать:
T
Nm
1 q ki N 1
L  ;  
ln 2      i, j  k  1  1  k  1  i , j  k  1  
 ln



2
2i 1 j 1 k 0 
1 N 1
   ln det   k  1,
2 k 0
(9)
где  i, j  k  1 , B  k  1 определяются по рекуррентным соотношениям дискретного фильтра Калмана [2].
Поиск условного минимума в задаче нелинейного программирования (8) целесообразно
осуществлять, используя пакет Global Optimization программной системы MATLAB.
4. Основополагающие понятия теории планирования оптимального эксперимента
Под непрерывным нормированным планом  условимся понимать совокупность величин
q

 1 ,  2 , ,  q 

 
(10)
 , p i  0 ,  p i  1 ,  i    , i  1, 2,..., q .
,
,
,
p
p
p
q
i 1
 1 2


В отличие от дискретного нормированного плана в непрерывном нормированном плане
снимается требование рациональности весов pi .
Для плана (10) нормированная информационная матрица может быть записана в виде
q
    p i  i ;   ,
i 1
в котором информационные матрицы Фишера (ИМФ) одноточечных планов
  2 ln L ; Y N 
1 
 ( ; )    
T


Y



зависят от неизвестных параметров  , что позволяет говорить только о локальнооптимальном планировании.
Аналитические формулы и алгоритмы вычисления ИМФ для стохастической линейной
дискретной системы (1), (2) можно найти в [3].

201

Качество оценивания параметров моделей можно повысить за счет построения плана
эксперимента, оптимизирующего некоторый выпуклый функционал X от информационной
матрицы, путем решения экстремальной задачи
(11)
 *  arg min X [ M ( )].
 
Воспользуемся критериями D- и А- оптимальности, для которых, соответственно,
X [M ( )]   ln det M   и X [M ( )]  SpM 1 ( ) . Применяя эти критерии, мы будем осуществлять воздействие на нижнюю границу неравенства Рао – Крамера, минимизируя в случае критерия D – оптимальности объем эллипсоида рассеяния оценок неизвестных параметров, а в случае критерия А – оптимальности – сумму квадратов длин его осей.
Будем считать, что входные сигналы являются кусочно-постоянными функциями, сохраняющими свои значения на интервале между соседними измерениями. В этом случае оптимизационную задачу (11) можно решать с помощью двух подходов. Первый из них (прямой)
предполагает непосредственный поиск минимума функционала X  M    в предположении,
s( s  1)
 1 точек. Другой (двойственный) подход осно2
ван на обобщенной теореме эквивалентности [1] и вытекающей из него процедуре. При
двойственном подходе размерность пространства варьируемых параметров меньше, чем при
прямом подходе, результат точнее, но решение задачи находится медленнее.
Отметим также, что применение градиентов в процедурах планирования позволяет заметно повысить скорость решения задач и невозможно без вычисления производных инфорM  ; 
и по
мационной матрицы точки спектра плана по компонентам входного сигнала
u j  k 
что спектр плана (10) состоит
из q
компонентам вектора начальных условий
водной
M  ; 
u j  k 
M  ; 
x j  0 
. Аналитическое выражение для произ-
получено в [4], там же разработан алгоритм ее вычисления. Расчетное
соотношение для производной
M  ; 
x j  0 
по своему виду и структуре напоминает результат
из [5], что позволяет после незначительной модификации использовать разработанный в указанной статье соответствующий вычислительный алгоритм.
5. Описание программной системы APIS
Программная система APIS, разработанная коллективом авторов на кафедре теоретической и прикладной информатики НГТУ позволяет решать задачи активной параметрической
идентификации стохастических нелинейных дискретных и непрерывно-дискретных систем
на основе планирования A- и D- оптимальных входных сигналов с применением статистической и временной линеаризации. Кроме того, программная система позволяет осуществлять
оптимальное оценивание параметров моделей гауссовских линейных нестационарных дискретных систем на основе планирования входных сигналов и (или) начальных условий [6].
Проиллюстрируем работу программной системы на примере модели системы стабилизации летательного аппарата из [7,8]:
202
x1  t  
c4 x1  t   x 2  t   c4 w  t  ,


x2 t 
c2 x1  t   1 x2  t   c3u  t   c2 w  t  ,
(12)
x3  t   x2  t  ,
 x1  t  1 
0 1 0




y t 1 
(13)
  x2  t  1   v  t  1 .
0
0
1

  x  t  1 
 3

где c2  4.2 , c3  7.4 , c4  0.77 .
Будем считать, что w  t  и v  t  1 для t  0,1,... образуют белые гауссовские последовательности, причем
0

T
  1  2
E  w 
t  wT   1.44 t , , E v  t  1 v
  t , ,
 0 2 
0 
 0.01 0
T


E  x  0  x  0     0 0.01 0  .
 0
0 0.01

Выполнив дискретизацию модели состояния и считая шаг дискретизации T 
0.5 , получим
 11 12 0 
 11 
  11 






x  k  1  21 22 0  x  k    21  u  k     21  w  k  ,

(14)


 
 
 31 32 1 
 31 
 31 
где
11 
 a  1  c4  e0.251  c4  a    a  1  c4  e0.25 a 1  c4 
12 
31 
32 
11
 21 
e
0.25  a 1  c4 
c2 e
e
a
e
a
0.25 1  c4  a 
0.25 1  c4  a 
0.25 1  c4  a 
c e
; 21  2
;
0.25 1  c4  a 
e
0.25  a 1  c4 
a
;
 a  c2c4  1c2  1  c4  a  c2ea 2  2c2 ae0.25  c  a   ;
1
4
2a  c2  1c4 
b  bea 2  2c4 ae0.25  c  a   , b 
1
4
2a  c2  1c4 
2c2  1c4  c42  ac4 ;
2c3
0.25 1  c4   0.25 1  c4 
0.25 1  c4  a 
e
e
 ea 2   1  e
;
a 1  c4  a 
c2 e

0.25 1  c4  a 
 a  c2c4  1c2  1  c4  a  c2ea 2  2c2 ae0.25  c  a   ;
1
2a  c2  1c4 
203
4
 c  d  f  21c2 c4  a1c42



0.25 1  c4  a  
a2
2
2

c3e
 c  d  f  21c2 c4  a1c4  1 c2 c4 e


  2  c  d   4c 2 c   c 4  c c3  2 2 c 2  



c

a
0.25
2
4
1
4
2
4
1
4


1 4

;
e

  2 c3   3c 2  4 c c  6 c c 2


1 4
1 4
1 2 4
1 2 4
 


 31 

2a  c2  1c4 
2
c
4c22  c44 ; f 
c43 a  12 c42  a1c2  3ac2 c4 ;
12 c2  21c43  5c2 c42 ; d 
11 
 21 
e
0.25 1  c4  a 
2c2 e
0.25 1  c4 
1
 4 ;
4
2a
sinh a
a
c2 e
 31 
 a  1  c4   a  1  c4  ea 2  2ae0.25 a   c   ;



 1a  ac4  a 2  1a  ac4 e a 2  



2 0.25 1  c4  a 
 2a e

0.25 1  c4  a   a
2
213c4  212 c2  412 c42  121c2 c4  2c431  8c22  2c42 c2
.
Реализации выходных сигналов получим компьютерным моделированием при истинных
*
значениях параметров 1* c
1 1.76 и 2  0.7725 . Применяя метод максимального правдоподобия, вычислим оценки неизвестных параметров ˆ . Определим область планирования:
  U   x (0) , где

 0.5 
1  


 
3 



1  u k  5, k  0,1,...,39 ,  x (0)   x (0) 
U 
 1   x (0)   5   .
 0 
1  

 
 

В соответствии с критерием D-оптимальности построим непрерывный план эксперимента и
«округлим» его до дискретного из расчета возможности проведения пяти запусков, смоделируем данные наблюдений, пересчитаем оценки неизвестных параметров и получим ˆ* .
После запуска на выполнение программного модуля main.m на экране монитора появляется головное графическое окно, изображенное на рис.1.
U 
40
204
Рис. 1. Головное окно на начальном этапе
Строка меню содержит следующие четыре команды: Определение структурновероятностных элементов модели, Данные наблюдений, Оценивание параметров и Планирование эксперимента. При работе с программным комплексом следует иметь в виду, что активизация каждой последующей команды строки меню становится возможной только после
выполнения всех предыдущих команд. На начальном этапе активна команда Определение
структурно-вероятностных элементов модели. Остановимся на каждой из команд отдельно.
Выполнение команды Определение структурно-вероятностных элементов модели
начинается с определения характеристик линейной модели (1), (2), которые задаются в файле
dmodel.m. Эта же программная компонента отвечает за вычисление значений соответствующих производных по компонентам вектора неизвестных параметров.
После закрытия файла происходит возвращение в головное окно, где становится активной команда меню Измерительные данные.
По команде меню Измерительные данные задаются непрерывный план эксперимента
(10) и соответствующие ему реализации выходных сигналов, в результате чего формируется
множество  .
По команде меню Измерительные данные  План эксперимента можно выбрать следующие способы задания плана эксперимента:
1.Генерировать псевдослучайные входные сигналы (рис. 2)
2.Генерировать псевдослучайные начальные условия (рис. 3)
3.Генерировать псевдослучайные входные сигналы и начальные условия (рис. 4)
205
Рис. 2. Графическое окно для задания дискретного плана с генерацией входных сигналов
Рис. 3. Графическое окно для задания дискретного плана с генерацией начальных условий
206
Рис. 4. Графическое окно для задания дискретного плана с генерацией входных сигналов и начальных условий
При нажатии кнопки «Генерировать план» с учетом введенных ограничений моделируются псевдослучайные входные сигналы и/или начальные условия в соответствии с выбранным пунктом меню, которые записываются в файлы u.txt и x0.txt.
В случае выбора пункта меню Генерировать псевдослучайные начальные условия, необходимо указать способ задания входных сигналов:
a) Генерировать псевдослучайные входные сигналы (рис.5)
Рис. 5. Графическое окно для задания границ входного сигнала
b) Использовать готовые входные сигналы
Входной сигнал хранится в файле u.txt.
Соответствующие им количества повторных запусков хранятся в файле p.txt. Происходит переход к заданию выходных данных.
По командам меню Данные наблюденийПлан эксперимента Использовать готовый
план Оптимальный или Данные наблюдений План эксперимента Использовать готовый план Неоптимальный появляется графическое окно, изображенное на рис. 6.
207
Рис. 6. Графическое окно при использовании оптимального плана
Программный комплекс предоставляет пользователю возможность осуществлять корректировку плана. Для этого нужно установить флажок в отведенном поле и внести соответствующие изменения в файлы u_opt.txt, x0_opt.txt и p_opt.txt при использовании
оптимального плана эксперимента либо в файлы u.txt, x0.txt и p.txt при работе с неоптимальным планом.
Переход к заданию выходных данных происходит при нажатии кнопки «Далее».
По команде меню Измерительные данные Выходные данные указывается способ задания выходных данных, после чего задаются либо моделируются данные в соответствии с
выбранным планом эксперимента.
Для моделирования выходных данных необходимо ввести через пробел в отведенном
поле (см. рис. 7) истинные значения параметров математической модели. При нажатии кнопки «Далее» данные моделируются, заносятся в файл y.txt и происходит возвращение в головное графическое окно программного комплекса. Становится активной команда меню
Оценивание параметров.
Рис. 7. Графическое окно в случае моделирования выходных данных
208
В случае использования данных, полученных в результате проведения натурного эксперимента, их ввод можно осуществить после нажатия соответствующей кнопки «Ввести данные» в файл y.txt с результатами измерений.
По команде меню Оценивание параметров вычисляются оценки параметров используемой математической модели в соответствии с имеющимися данными наблюдений. При выборе этой команды появляется графическое окно, в отведенных полях которого через пробел
вводятся границы области допустимых значений параметров и начальное приближение для
поиска неизвестных параметров (см. рис. 8).
Рис. 8. Графическое окно при оценивании параметров
После нажатия кнопки «Оценить параметры» происходит обработка экспериментальных
данных. Результаты вычислений записываются в файл teta.txt. Открывается графическое
окно, показанное на рис. 9, в котором содержится информация о полученных оценках неизвестных параметров и относительной ошибке оценивания в пространстве откликов. Если
выходные данные были смоделированы, также определяется относительная ошибка оценивания в пространстве параметров.
209
Рис. 9. Графическое окно с информацией о результатах оценивания
После нажатия кнопки «Далее» происходит возвращение в головное графическое окно
программного комплекса. Становится активной команда Планирование эксперимента.
По команде меню Планирование эксперимента (см. рис. 10) синтезируется А- или D- оптимальный план. Задается критерий оптимальности, выбираются процедура планирования
эксперимента, а также содержание плана эксперимента.
Рис. 10. Графическое окно при планировании эксперимента
При нажатии кнопки «Планировать эксперимент» производится построение оптимального непрерывного плана и его округление до дискретного. Точки спектра результирующего
плана хранятся в файле u_opt.txt, x0_opt.txt, а соответствующие им количества повтор210
ных запусков – в файле p_opt.txt. Также проводится процедура активной идентификации с
использованием соответствующего плана, результаты которой отображаются в графическом
окне, представленном на рис. 9, и записываются в файл teta_opt.txt. Автоматически происходит возвращение в головное графическое окно.
Представим результаты выполнения процедуры активной параметрической идентификации с использованием совместного планирования входных сигналов и начальных
условий в табл. 1.
Таблица 1. Результаты процедуры активной идентификации модели (13), (14)
План эксперимента

 
 *  ˆ
*
Y 
Y  Yˆ
Y
Исходный входной сигнал
6
4
2
1.75606 
0.67686 


0.04980
0.027480
1.74192 
0.73571 


0.02132
0.00969
0
Исходное начальное условие
T
x (0)  0.5;1;0
Синтезированный входной сигнал
6
5
4
3
2
1
0
Синтезированное начальное условие
T
x (0)  0.5;5;1
Проведенные численные исследования показывают, что качество оценивания параметров удалось повысить как в пространстве параметров (на 1,6%), так и в пространстве откликов (на 2,6%), что говорит об эффективности применения совместного планирования входных сигналов и начальных условий при активной параметрической идентификации стохастических дискретных систем.
211
6. Заключение
Разработанное программно-математическое обеспечение позволяет решать задачи
активной параметрической идентификации с использованием метода максимального
правдоподобия, а также прямой и двойственной градиентных процедур построения A– и D–
оптимальных планов. На примере математической модели системы стабилизации
летательного аппарата показана эффективность процедуры активной параметрической
идентификации на основе совместного планирования входных сигналов и начальных
условий.
Литература
1. Активная параметрическая идентификация стохастических линейных систем: монография / Денисов В.И. Чубич В.М., Черникова О. С., Бобылева Д.И. Новосибирск: Изд-во
НГТУ, 2009. 192 с.
2. Огарков М.А. Методы статистического оценивания параметров случайных процессов. М.:
Энергоатомиздат, 1980. 206 с.
3. Чубич В.М. Вычисление информационной матрицы Фишера в задаче активной параметрической идентификации стохастических нелинейных дискретных систем // Научный
вестник НГТУ. 2009. № 1(34). С. 23-40.
4. Чубич В. М. Алгоритм вычисления производных информационной матрицы Фишера по
компонентам входного сигнала в задаче активной параметрической идентификации гауссовских нелинейных дискретных систем // Научный вестник НГТУ, 2010. № 3(40). С. 2740
5. Чубич В. М., Черникова О.С. Оптимальное оценивание параметров моделей гауссовских
линейных дискретных систем на основе планирования начальных условий// Научный
вестник НГТУ. 2013. №4(53). C. 31-40.
6. Чубич В.М., Черникова О.С., Филиппова Е.В. Интерактивная программная система активной параметрической идентификации стохастических динамических систем (APIS 2.0)//
Свидетельство о государственной регистрации программы для ЭВМ №2013613299. М.:
Федеральная служба по интеллектуальной собственности (Роспатент). 2013.
7. Красовский А.А. Аналитическое конструирование контуров управления летательными
аппаратами. М.: Машиностроение, 1969. 240 с.
8. Волков В.Л. Измерительные информационные системы. Арзамас: Ассоциация ученых,
2008. 158 с.
212
Черникова Оксана Сергеевна
к.т.н., доцент кафедры теоретической и прикладной информатики НГТУ (630073, Новосибирск, пр. Карла Маркса, 20), e-mail: chernikova@corp.nstu.ru
Берикет Екатерина Александровна
магистрант факультета прикладной математики и информатики НГТУ, (630073, Новосибирск, пр. Карла Маркса, 20), e-mail: beriket.e.a@gmail.com
Active parametric identification of the model system of stabilization of the aircraft based
on the design inputs and initial conditions
O.Chernikova, E.Beriket
We consider and solve actual problem of active identification based on the design of input signals and initial state for the model of system stabilization of the aircraft. Description of program system of active identification stochastic dynamic system described by linear discrete
state space models is considered.
Keywords: discrete system, active identification, maximum likelihood method, experimental
design, information matrix.
213
Исследование свойств ОМП параметров распределения Вейбулла по усеченным слева данным
Исследование свойств ОМП
параметров распределения Вейбулла
по усеченным слева данным
Е.В. Чимитова, Е.О. Ермилова
Данная статья посвящена исследованию статистических свойств оценок максимального
правдоподобия (ОМП) параметров распределения Вейбулла по усеченным слева данным.
Оцениваются потери информации Фишера от усечения и относительная эффективность
ОМП, а также их зависимости от объема выборки, глубины усечения, процента наблюдений из усеченного распределения.
Ключевые слова: усеченные слева данные, распределение Вейбулла, оценка максимального правдоподобия, информационное количество Фишера.
1. Введение
В задачах статистического анализа данных типа времени жизни выборки наблюдений,
как правило, оказываются усеченными слева и/или цензурированными справа. Исследованию методов оценивания параметров распределений по цензурированным данным посвящено огромное количество публикаций, в частности [1–3]. Однако исследований статистических свойств ОМП по усеченным слева данным, судя по публикациями в отечественных изданиях, практически не проводится.
Для объяснения понятия усеченной слева выборки рассмотрим следующий пример.
Пусть имеется генеральная совокупность людей, страдающих определенной болезнью. Обозначим через F (t ) функцию распределения случайной величины T – времени с начала болезни до смерти. Предположим, что в момент времени t0 началось обследование n пациентов
с данной болезнью. При этом люди из этой же генеральной совокупности, которые умерли
до момента времени t0 , не включены в выборку. Обозначим через T1,T2,...,Tn независимые
времена жизни с начала болезни до смерти пациентов, включенных в выборку. Необходимо
отметить, что если рассматривать данную выборку как обычную выборку из распределения
F (t ) , то полученный результат будет слишком оптимистичным, поскольку чем больше продолжительность жизни пациента, тем больше у него шансов попасть в выборку, в то время
как пациенты c ранними смертями в выборку не попадают. Обозначим через Di время с
начала болезни i -го пациента до начала обследования. Тогда условное распределение случайной величины Ti имеет вид:
F (t ) F (Di )
, t Di .
1 F (Di )
Аналогично, плотность распределения определяется соотношением:
f (t )
fLT (t )
, t Di .
1 F (Di )
FLT (t )
214
(1)
(2)
В выборку могут быть включены также пациенты, заболевшие уже после момента времени t0 . В этом случае соответствующий элемент выборки представляет собой полное наблюдение, для которого Di
0.
Усеченную слева выборку можно представить в следующем виде:
(3)
Xn
T1, D1 , T2, D2 ,..., Tn , Dn ,
где n – объѐм выборки, Ti – время отказа i -го объекта, Di – время усечения, i
1, n . В та-
кой выборке содержатся наблюдения, с функциями распределения F (t ) и FLT (t ) .
На практике усеченные слева выборки отказов вида (3) встречаются довольно редко. Чаще всего выборки являются усеченными слева и цензурированными справа:
Xn
T1, D1, 1 , X2, D2, 2 ,..., Xn , Dn , n ,
(4)
где n – объѐм выборки, Xi – время отказа или момента цензурирования i -го объекта, Di –
время усечения, i – индикатор цензурирования.
В связи широким использование закона распределения Вейбулла в анализе данных типа
времени жизни, будем проводить исследование, ориентируясь на этот закон. Функция распределения Вейбулла выглядит следующим образом:
F (t; )
1
exp
t
2
(5)
1
где 1  0 – параметр масштаба,  2  0 – параметр формы.
За последние годы за рубежом появилось множество публикаций, относящихся к проблеме построения вероятностных моделей по усеченным слева и цензурированным справа
данным. Обширные исследования данной тематики приведены в [3-12]. В частности, Балакришнан Н. и Митра Д. разработали EM-алгоритм и исследовали свойства ОМП для усеченной слева и цензурированной справа выборки на основе информации о работе объектов, времена жизни которых принадлежат закону Вейбулла [4] или логнормальному распределению
[5]. В [6] разработан новый подход к спецификации модели пропорциональных интенсивностей Кокса для усеченной выборки, который предполагает существование зависимости между временем усечения и временем отказа объекта. Построению вероятностных моделей на
основе данных типа времени жизни в зависимости от объясняющих переменных посвящена
работа [7]. При выборе подхода к исследованию надежности объектов необходимо исходить
из представленной информации.
Если априорные данные отсутствуют и нельзя сделать предположение о виде вероятностной модели, то для оценивания надежности используют непараметрические способы,
например, оценка Каплана-Мейера. В [8] описано построение оценки Каплана-Мейера функции надежности цензурированных данных, а в [9] рассматривается непараметрическая оценка для случая, когда выборка содержит усеченные данные. В [10] была рассмотрена непараметрическая оценка Нельсона-Аалена, которая была применена для анализа выживаемости
по усеченным слева и цензурированным справа данным, собранных в результате экспериментов «Ченнинг Хаус» и «Здравоохранения в Массачусетс».
В вышеперечисленных трудах рассматриваются усеченные слева и цензурированные
справа данные. Главная особенность данной работы заключается в том, что свойства оценок
максимального правдоподобия параметров распределения Вейбулла рассматриваются в зависимости от параметров усечения без учета цензурирования данных намного более подробно. Интересно рассмотреть, как усечение данных влияет на потери информации Фишера, на
относительную эффективность и диаграмму рассеивания ОМП параметров распределения
Вейбулла.
215
2. Потери информации Фишера от усечения
Пусть имеется полная выборка времен жизни T1,T2,...,Tn из распределения F (t; ) , где
– это вектор параметров размерности s . Если условия проведения эксперимента таковы, что наблюдению доступны только те отказы, для которых время жизни больше некоторой наперед заданной величины D , называемой временем усечения, то в результате получаем усеченную выборку
T (1), D , T (2), D ,..., T (M), D , объем которой представляет со-
бой случайную величину M из биномиального распределения Bi n,1
F (D) .
Введем следующее обозначение:
d
F (D) ,
и будем называть данную величину глубиной усечения.
Функция плотности распределения усеченной случайной величины T (1), D определяется
соотношением:
f (t; )
, t D,
(6)
1 F (D; )
где D – время усечения, F (t; ) – функция распределения времен отказов.
Тогда информационное количество Фишера в усеченной выборке, полученной из полной
выборки T1,T2,...,Tn , имеет вид:
fLT (t; )
n
J LT ( )
(1
где
n
P M
m 0
d )J LT
J LT
ной выборке
|M
m J LT
|M
|M
m
m 0
m ,
C nm (1
d )m d n mJ LT
|M
m
m – это информационное количество Фишера о параметре
T (1), D
,
T (2), D
J LT
|M
,...,
T (m), D
m
(7)
в усечен-
:
ln fLT (t; )
m
2
(8)
fLT (t; )dt.
D
Поскольку для оценивания s неизвестных параметров требуется как минимум s наблюдений, то выражение (7) примет вид:
(1 d )J LT
|M
m
J LT ( )
.
(9)
s 1
1
m 0
C nm (1
d )m d n m
Понятно, что при больших объемах выборок величиной
s 1
m 0
C nm (1
d )m d n
m
в выра-
жении (9) можно пренебречь.
О потерях информации Фишера от усечения слева будем судить по величине
J LT ( ) / J ( ) , где J ( ) – количество информации Фишера в полной выборке T1,T2,...,Tn . В
табл. 1 для закона распределения Вейбулла найдены значения J LT ( ) / J ( ) и значения отношения определителей соответствующих информационных матриц det JLT ( ) / det J( )
для случая векторного параметра в зависимости от глубины усечения при n 100 .
216
Таблица 1. Отношение количества информации Фишера в усеченной слева выборке к количеству информации в исходной полной выборке
d
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
О параметре 1 распределений
экспоненциального, Релея и
Вейбулла
О параметре 2 распределения
Вейбулла
О двух параметрах
распределения Вейбулла
0.6595
0.6186
0.6141
0.6122
0.5990
0.5657
0.5051
0.4080
0.2590
0.4008
0.2211
0.1261
0.0709
0.0380
0.0187
0.0079
0.0025
0.0004
0.9000
0.8000
0.7000
0.6000
0.5000
0.4000
0.3000
0.2000
0.1000
Анализируя результаты, представленные в табл. 1, можно отметить, что наиболее существенные потери в информации Фишера от усечения слева наблюдаются в случае оценивания двух параметров рассматриваемых распределений. Например, в случае распределения
Вейбулла при глубине усечения d
0.5 усеченная выборка содержит 50% от информации
Фишера по полной выборке о параметре масштаба, примерно 60% информации о параметре
формы, и при этом не более 4% информации о двух параметрах данного распределения.
Проведем исследование методом Монте-Карло точности ОМП параметров распределения отказов по усеченной слева выборке в зависимости от объема выборки n и глубины усечения. Для этого рассмотрим изменение величины D
раметра или det D
/ det D
LT
/D
LT
– в случае скалярного па-
– в случае векторного параметра, где
– ОМП неиз-
вестного параметра распределения по полной выборке, LT – ОМП по усеченной слева выборке. Результаты моделирования представлены в табл. 2. Количество N моделируемых выборок, по которым исследовались законы распределения оценок по выборкам объема n , было взято равным 100000. При построении распределений оценок выборки моделировались по
закону Вейбулла с параметром масштаба 1 2 и формы 2
2.
Таблица 2. Относительная эффективность оценивания параметров распределения Вейбулла в
зависимости от объема выборки
d
0.1
0.3
0.5
0.7
d
0.1
0.3
0.5
0.7
n
100
0.9009
0.6982
0.4986
0.2950
n
100
0.6363
0.5519
0.5385
0.4491
О параметре
1
n
200
n
О параметре
2
n
n
0.9004
0.6978
0.4961
0.2964
200
0.6531
0.5888
0.5747
0.4810
распределения Вейбулла
300
0.9010
0.7019
0.4969
0.2971
n
500
0.8984
0.6994
0.4975
0.2987
n
700
n
1000
n
700
n
1000
0.8985
0.6967
0.4957
0.2971
0.8995
0.7044
0.5032
0.3014
распределения Вейбулла
300
0.6496
0.5952
0.5799
0.4882
217
n
500
0.6573
0.6053
0.5912
0.4951
0.6584
0.6063
0.5919
0.4975
0.6546
0.6054
0.5899
0.4981
d
0.1
0.3
0.5
0.7
n
100
0.3745
0.0884
0.0152
0.0002
О двух параметрах распределения Вейбулла
n
n 200
n
300
n 500
0.3964
0.1107
0.0232
0.0021
0.4035
0.1137
0.0250
0.0025
0.4010
0.1201
0.0292
0.0031
700
n
0.4009
0.1248
0.0329
0.0039
1000
0.3993
0.1225
0.0311
0.0042
По данным, представленным в табл. 2, видно, что с ростом объема выборки величина относительной
эффективности
оценивания
параметров
распределения
Вейбулла
D   / D  LT  повышается и стремится к величине J LT ( ) / J ( ) . Данную зависимость
 


можно заметить при рассмотрении всех случаев оценивания – параметра 1 , параметра  2 и
обоих одновременно, для любой глубины усечения. Однако в некоторых случаях наблюдается отклонение от общей закономерности, вызванное погрешностью моделирования.
3. Исследование точности ОМП по усеченным слева выборкам
Пусть имеется усеченная слева выборка вида:
Xn
{(T1, D1),(T2, D2 ),...,(Tn , Dn )},
где n – объем выборки, Ti – время отказа i -го объекта, Di – время усечения, i
1, n . Если
0 , то i -е наблюдение является полным.
В выборке могут содержаться как полные наблюдения, так и наблюдения усеченных случайных величин, причем времена усечения могут быть различными. Такого рода выборки
обычно являются результатом наблюдения за объектами, начиная с некоторого момента времени t0 . При этом отсчет времени для некоторых объектов (дата рождения, момент начала
Di
эксплуатации и др.) начался раньше момента времени t0 , когда началось наблюдение. В этом
случае наблюдаемые случайные величины являются усеченными слева и время усечения Di
равно разности между t0 и началом отсчета времени i -го объекта. Если же отсчет времени
начался позже начала наблюдения t0 , то соответствующее наблюдение является полным.
В силу того, как формируется выборка в задаче анализа выживаемости, она может представлять собой смесь элементов, принадлежащих усеченным законам вида FLT (t; ) с различной глубиной усечения, и элементов, принадлежащих F (t; ) . В частном случае может
FLT (t; ) , где 0
наблюдаться смесь двух законов вида F (t; )
1 задает долю присутствия наблюдений усеченной случайной величины. Однако поскольку в решаемых задачах анализа выживаемости и надежности известно, какое наблюдение принадлежит соответствующему усеченному, а какое неусеченному закону, поэтому нет принципиальных проблем
с записью функции правдоподобия, а, следовательно, и с поиском оценок. Информационное
количество Фишера о параметре в этом случае представляет собой линейную комбинацию
J ( ) J LT ( | M
n ) n(1
)J ( ) ,
где J ( ) – информационное количество Фишера о параметре , содержащееся в одном полном наблюдении.
1)
В табл. 3 представлены значения информационного количества Фишера J LT ( | M
и определителей соответствующих информационных матриц det JLT ( | M
векторного параметра распределения Вейбулла с параметрами 1
218
2 и
2
1) для случая
2 для различ-
ных значений глубины усечения. Значения в первой строке таблицы при d
0.0 соответствуют информационному количеству J ( ) в полном наблюдении.
На основе значений, представленных в табл. 3, можно рассчитать значения информации
Фишера J ( ) в выборке из смеси двух законов вида F (t; )
FLT (t; ) при различных
процентах наблюдений из усеченного распределения
100% .
Таблица 3. Информационное количество Фишера в одном наблюдении из усеченного распределения Вейбулла с параметрами 1 2 и 2
2
d
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
О параметре 1 распределений экспоненциального, Релея
и Вейбулла
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
О параметре 2 распределения
Вейбулла
О двух параметрах распределения Вейбулла
0.4559
0.3341
0.3526
0.4000
0.4652
0.5462
0.6448
0.7676
0.9301
1.1809
0.4112
0.2035
0.1421
0.1059
0.0810
0.0626
0.0481
0.0363
0.0261
0.0168
При d  0.0 представленные в табл. 3 величины соответствует информационному количеству Фишера в одном полном наблюдении. Важно отметить, что при увеличении глубины
усечения информация Фишера о параметре 1 остается неизменным, о параметре  2 увеличивается, а о векторном параметре – уменьшается.
Информационное количество Фишера определяет нижнюю границу дисперсии несмещенных оценок. ОМП являются асимптотически эффективными, т.е. при n
достигается нижняя граница неравенства Рао-Крамера:
J 1( ) .
D
Реальную же картину точности ОМП при ограниченных объемах выборок можно увидеть, оценив величину J 1( ) D 1 , которая при n
должна стремиться к 1.
Необходимо отметить, что в случае оценивания параметра масштаба (при известном параметре
формы)
распределения
Вейбулла
оценки
относительной
дисперсии
J
1(
1)
D
1
1
по усеченным выборкам оказываются близкими к 1 независимо от глуби-
ны усечения и процента наблюдений из усеченного распределения, поскольку информационное количество Фишера о параметре масштаба в наблюдении усеченной случайной вели1) совпадает с информацией в полном наблюдении.
чины J LT ( | M
В табл. 4 представлены оценки относительной эффективности ОМП параметра формы
(при известном параметре масштаба) распределения Вейбулла J
1(
2)
D
1
2
по усечен-
ным выборкам из смеси усеченного и неусеченного распределения Вейбулла при различных
процентах наблюдений из усеченного распределения
100% и при различной глубине усечения d .
219
Таблица 4. Оценки относительной дисперсии ОМП параметра формы распределения Вейбулла по усеченным слева выборкам в зависимости от объема выборки n
Степень
усеч.
n
Степень
усеч.
n
25%
50%
75%
100%
25%
50%
75%
100%
Степень
усеч.
25%
50%
75%
100%
Степень
усеч.
25%
50%
75%
100%
100
0.949
0.944
0.942
0.931
100
0.945
0.925
0.918
0.900
n
100
0.952
0.941
0.942
0.935
n
100
0.952
0.948
0.959
0.961
n
200
n
0.974
0.971
0.977
0.963
n
200
200
n
200
0.981
0.976
0.983
0.980
n
n
d
0.3
300
n
n
500
d
0.5
300
n
500
n
0.7
300
n
0.984
0.985
0.985
0.995
500
1.001
0.997
0.991
0.987
n
700
n
700
n
700
1000
0.990
0.985
0.990
0.992
n
0.991
0.996
0.997
0.988
n
1000
0.990
0.991
0.995
0.995
0.989
0.987
0.989
0.987
0.991
0.982
0.983
0.983
d
700
0.984
0.998
0.994
0.996
0.984
0.980
0.985
0.978
0.980
0.984
0.985
0.974
n
500
0.987
0.981
0.985
0.983
0.979
0.985
0.972
0.968
0.969
0.970
0.972
0.960
n
0.1
0.984
0.984
0.971
0.975
0.968
0.966
0.957
0.949
n
d
300
1000
0.999
0.992
0.995
0.995
n
0.988
1.001
0.992
1.000
1000
0.992
0.997
0.993
1.000
Как видно из табл. 4, с ростом объема выборки дисперсия ОМП стремится к соответствующей асимптотической дисперсии J 1
d
0.1 и d
2
. Отметим, что в случае глубины усечения
0.3 , когда информация Фишера J LT
2
|M
1 в наблюдении из усеченно-
го распределения меньше, чем в полном наблюдении (см. табл. 3), точность ОМП параметра
формы падает с ростом процента усеченных наблюдений в выборке, чего не наблюдается
0.7 , когда информационное количество Фишера в наблюдении усеченно0.5 и d
при d
го распределения больше, чем в полном наблюдении.
В табл. 5 представлены оценки относительной дисперсии ОМП векторного параметра
распределения Вейбулла det J 1( ) det D 1
. В данном случае информационное количе-
ство Фишера в одном наблюдении усеченного распределения значительно меньше, чем в
полном наблюдении, и уменьшается с ростом глубины усечения. Поэтому для всех рассмотренных значений глубины усечения точность ОМП параметров по усеченной выборке падает
с увеличением процента наблюдений из усеченного распределения. Отметим также, что при
ˆ ˆ к
увеличении величины
100% от 25% до 75% уменьшение скорости сходимости det D
det J
1
не столь существенно как при увеличении
220
100% от 75% до 100%.
Таблица 5. Оценки относительной дисперсии ОМП параметров масштаба и формы
распределения Вейбулла по усеченным слева выборкам в зависимости от объема выборки n
Степень
усеч.
25%
50%
75%
100%
n
Степень
усеч.
n
Степень
усеч.
n
25%
50%
75%
100%
25%
50%
75%
100%
Степень
усеч.
25%
50%
75%
100%
100
0.932
0.942
0.917
0.909
100
0.920
0.908
0.885
0.749
100
0.925
0.912
0.873
0.529
n
100
0.946
0.923
0.868
0.305
n
200
n
0.972
0.966
0.963
0.955
n
200
200
n
200
0.972
0.968
0.943
0.426
300
n
n
d
0.3
300
n
d
0.5
300
n
500
500
0.7
300
n
500
1.001
0.975
0.965
0.627
700
n
0.992
0.997
0.981
0.974
n
700
n
700
n
700
1.006
0.976
0.976
0.692
1000
0.990
0.986
1.004
0.971
n
0.987
0.986
0.974
0.870
n
1000
0.996
0.998
0.987
0.986
0.987
0.984
0.989
0.957
0.983
0.988
0.983
0.831
d
0.978
0.974
0.961
0.519
n
0.988
0.971
0.965
0.937
0.971
0.972
0.944
0.745
n
500
0.989
0.973
0.980
0.970
0.978
0.979
0.960
0.891
0.968
0.946
0.937
0.675
n
0.1
0.985
0.975
0.980
0.962
0.970
0.947
0.938
0.868
n
d
1000
1.030
1.007
0.972
0.893
n
1000
0.981
1.001
1.004
0.774
Рассмотрим, каким образом глубина и степень усечения слева влияют на распределение
ОМП параметров распределения Вейбулла. На рис. 1 – 2 изображены диаграммы рассеивания ОМП в случае векторного параметра  , которые были получены для выборок объемом
n 100 при различных значениях глубины и степени усечения.
Рис. 1 – 2 демонстрируют, что при увеличении значения глубины и степени усечения эллипсоиды рассеивания ОМП деформируются и становятся все больше ассиметричными относительно осей. Данный факт свидетельствует о том, что полученные ОМП параметров
масштаба и формы распределения Вейбулла существенно отклоняются от многомерного
нормального закона, и чем больше глубина или степень усечения, тем сильнее данное отклонение. Особое внимание следует обратить на ситуацию, наблюдаемую на рис. 2: при изменении степени усечения с 75% до 100% можно отметить очень резкое изменение формы диаграммы рассеивания ОМП, чего не наблюдалось при изменении степени усечения с 25% до
75%, что объясняет результаты, полученные в табл. 5.
221
2
2
1
2
(а) d
1
0.1
2
(б) d
0.3
1
(в) d
1
(г) d
0.5
0.7
Рис. 1. Диаграммы рассеяния ОМП параметров масштаба и формы распределения Вейбулла по
усеченным выборкам объема n
100 ,
100% наблюдений из усеченного распределения Вейбулла
222
2
2
1
2
1
(а) 25%
2
(б) 50%
1
1
(в) 75%
(г) 100%
Рис. 2. Диаграммы рассеяния ОМП параметров масштаба и формы распределения Вейбулла по
усеченным выборкам объема n
100 при глубине усечения d
0.5
Литература
1. Баталова З.Г. Анализ точности метода максимального правдоподобия для случайно
цензурированных выборок. В кн.: Статистические методы обработки результатов
наблюдений при контроле качества и надежности машин и приборов. Л., ЛДНТП, 1979. –
С. 14-17.
2. Баскаков В.Н. Обобщенный метод минимального расстояния для цензурированных данных // Надежность и контроль качества, 1995. № 7. - С. 3-7.
3. Лемешко Б.Ю., Гильдебрант С.Я., Постовалов С.Н. К оцениванию параметров надежности по цензурированным выборкам // Заводская лаборатория. Диагностика материалов.
2001. Т. 67. – № 1. – С. 52-64.
223
4. Balakrishnan N., Mitra D. Left truncated and right censored Weibull data and likelihood infence with an illusrtation // Computational Statistics and Data Analysis. 2012. V. 56, № 12. P.
4011-4012.
5. Balakrishnan N., Mitra D. Likelihood inference for lognormal data with left truncation and
right censoring with an illustration // Journal of Statistical Planning and Inference. 2011. V.141,
№ 11. P. 3536-3553.
6. Li J. Cox Model Analysis with the Dependently Left // Mathematics Theses. – Georgia State
University, Atlanta, GA, 2010. Paper 88.
7. Su Y.-R., Wang J.-L. Modeling left-truncated and right-censored survival data with longitudinal
covariates // The Annals of Statistics. 2012. Vol. 40, No. 3. P. 1465-1488.
8. Кокс Д.Р., Оукс Д. Анализ данных типа времени жизни /пер. с англ. О.В. Селезнева. М:
Финансы и статистика, 1988. 191 с.
9. Bagdonavicius V., Kruopis J., Nikulin M.S. Nonparametric Tests for Censored Data. London,
Wiley (ISTE – 2010). P. 233.
10. Pan W. A, Chappell R. Nonparametric Estimator of Survival Functions // Lifetime Data Analysis. Boston, 1998. №4. P. 187-202.
11. Cohen, A. C. Truncated and censored samples: theory and applications. New York: Marcel
Dekker, 1991. 328 p.
12. Balakrishnan N., Cohen A.C. Order Statistics and Inference: Estimation. Boston: Academic
Press, 1991.
Чимитова Екатерина Владимировна
к.т.н., доцент кафедры теоретической и прикладной информатики НГТУ, тел. (383) 34606-00, e-mail: chimitova@corp.nstu.ru
Ермилова Елена Олеговна
студент 1-го курса магистратуры факультета прикладной математики и информатики
НГТУ, e-mail: ermilovaeo@gmail.com
The research on properties of MLE of Weibull distribution parameters for left truncated
data
E. Chimitova, E. Ermilova
This paper is devoted to the research on statistical properties of maximum likelihood estimators
(MLE) of Weibull distribution parameters for left truncated data. The Fisher information losses
from truncation and relative efficiency of MLE have been estimated. The dependence of the
precision of MLE on the sample size, truncation depth and the number of truncated observations in sample has been analyzed.
Keywords: left truncated data, Weibull distribution, maximum likelihood estimators, Fisher information
224
Построение деградационной гаммы-модели с учетом внезапных отказов
Построение деградационной гамма-модели
с учетом внезапных отказов
Е.В. Чимитова, В.И. Самусенко
В данной работе рассматривается процесс построения деградационной гамма-модели, в которой учитываются внезапные отказы. В работе проводится исследование основных свойств оценок максимального правдоподобия для данной деградационный гамма-модели в зависимости от
некоторых заданных условий. Описываются два случая: рассматриваемая деградационная гамма-модель полностью параметрическая, и когда рассматриваемая модель является полупараметрической деградационной гамма-моделью
Ключевые слова: деградационные процессы, гамма-модель, функция надежности, внезапные отказы.
1. Введение
В современном мире одной из ключевых проблем является оценка качества и исследование надежности технических устройств. Для того чтобы выявить дефекты и проверить
надежность устройства многие производители стараются провести исследования, имитирующие эксплуатационные процессы. Системы высокой надежности, как правило, строятся из
небольших самостоятельных частей, которые должны обладать высокой степенью надежности и быть устойчивыми к длительной эксплуатации. Так как любое производство ограничено некоторыми рамками при разработке данных систем, то и исследование надежности, и
оценка качества технических устройств крайне ограничены.
Основной причиной отказов устройств является процесс деградации, который приводит
к износу объекта. Отказы технических устройств можно разделить на два вида: деградационные и внезапные. Деградационные отказы происходят в тех случаях, когда суммарное значение измерений показателя деградации к текущему моменту времени превышает некоторое
заданное пороговое значение. Внезапные отказы происходят вследствие неожиданных обстоятельств, которые выводят из строя рассматриваемый объект. Для составления более полной картины качества и надежности технического устройства используют и данные об изменении деградационного показателя, и информацию об отказах.
Длительное время различные ученые занимаются исследованиями деградационных процессов. Данная тема была освещена в работах [1-5]. При рассмотрении деградационных моделей часто делают предположение, что деградационный процесс является случайным процессом с независимыми приращениями [1-6]. В [6] проводится исследование различных типов деградационных процессов, ограниченных некоторым заданным критическим уровнем
деградационного показателя и их свойств. В [7] рассматриваются два случая – когда отказавшие устройства заменяются (т.е. производится внеплановое техническое обслуживание),
или, когда уровень деградации превышает заданный критический уровень (т.е. производится
профилактическое обслуживание). Далее он описывает издержки на ремонт в обоих случаях,
а также получает формулу, описывающую среднюю стоимость обслуживания одного
устройства при длительной эксплуатации. Также в [8] рассматривают оптимальную процедуру инспекции объектов, описывающих деградационные процессы, представляющие собой
возрастающий Марковский процесс, где деградационный уровень отслеживается периодически. Для этого используются две переменные, описывающие интервал между инспекциями и
уровень профилактического обслуживания. Также важно отметить, что в данном случае от-
225
каз объекта может быть зафиксирован только в момент проведения очередной инспекции. В
работе [9] авторы описывают метод для вычисления зависимости надежности компонента
системы от времени, комбинирующий в себе два случайных процесса: процесс ухудшения
сопротивления и процесс колебания нагрузки. В статье [10] описан метод, цель которого построение прогноза развития деградационного процесса при исследовании однородных групп
одинаковых систем в различных условиях.
В данной работе в качестве распределения приращений деградационного показателя используется гамма-распределение, поскольку оно обладает свойством воспроизводимости по
параметру, то есть всегда можно определить распределение случайной величины (деградационного показателя) в данный момент времени. Именно это делает этот подход столь популярным, и он часто используется в выше перечисленных работах. Если рассматривать задачу
построения деградационных гамма-моделей надежности с учетом внезапных отказов более
углубленно, то можно столкнуться с некоторыми трудностями. Например, отсутствием программного обеспечения, позволяющего решать такую задачу или с необходимостью проведения исследований свойств оценок и другими.
2. Описание модели и представление данных
Деградационные
T (0)
модели
можно
описать
выражением
z 0 , где Z (t ) – деградационный процесс, z 0 –
критическое значение. Деградационный отказ наступает, когда Z (t ) достигает значения z 0 .
Мы предполагаем, что деградационный процесс является положительно определенным и
неубывающим. Случайный процесс называется деградационным гамма-процессом с параметром формы (t ) и параметром масштаба , если
1) Z (0) 0 ;
2) Z (t ) является случайным процессом с независимыми приращениями;
3) приращения Z (t ) Z (s) подчиняются гамма-распределению с функцией плотности:
sup t : Z (t )
fGam (t )
z0
1
(t )
inf t : Z (t )
t
(s )
t (t )
(s ) 1
( (t )
(s ))e
,t
0.
Предположим, что объекты наблюдаются при некоторой нагрузке x (при изменении температуры, давления, и др.). Тогда случайный процесс будет зависеть от этой величины, обозначим его Zx (t ) .
Обозначим условное математическое ожидание случайного процесса
Zx (t ) через
t
; , где mx t – это функция тренда показателя деM Zx (t )
mx t; ,
m
r (x, )
градации, – вектор параметров функции тренда, r (x, ) – некоторая положительная монотонная функция от ковариат, – регрессионный параметр функции от ковариат [11].
Пусть события возникновения внезапного и деградационного отказов – независимые. Тогда функция надежности будет иметь следующий вид:
m t; ,
,
Sx (t )
1 FTr t;
FGam z 0; , x
где FTr t
– функция распределения внезапных отказов,
распределения внезапных отказов, FGam z 0
– вектор параметров функции
– критическое значение деградационного по-
226
казателя,
– параметр масштаба функции гамма-распределения,
mx t; ,
– параметр
формы функции гамма-распределения.
В деградационных моделях данные представляются следующим образом:
X1, 1,V1, Z1(t ), x1 ,..., Xn , n ,Vn , Zn (t ), xn ,
n
где Xi – время отказа i-того объекта, i – индикатор цензурирования (1 – наблюдается деградационный или внезапный отказ i-того объекта, 0 – наблюдение цензурированное), Vi –
индикатор типа отказа (0 – деградационный, 1 – внезапный), Zi (t ) – деградационный проT
xi1,..., xis
цесс i-того объекта, xi
– вектор объясняющих переменных, при которых
наблюдался i-тый объект.
В работе для оценивания неизвестных параметров будем использовать метод максимального правдоподобия. Рассмотрим понятие оценки максимального правдоподобия. Предположим, что интенсивность внезапных отказов не зависит от деградации. Тогда логарифм
X1, 1,V1, Z1(t ), x1 ,..., Xn , n ,Vn , Zn (t ), xn
функции правдоподобия для выборки n
имеет вид:
ki
n
mx tij ; ,
mx tij 1; ,
i
ln L n ,
ln fGam
Zij ; , i
i 1 j 1
n
iVi ln fTr Xi ;
i 1
где ki
1
i
0
i 1
Vi ln S Tr Xi ;
1
i ln S Tr Xi ;
,
– наблюдаемое число измерений деградационного показателя i -ого
объекта, Vi – индикатор типа отказа, Xi – момент отказа или цензурирования i -го наблюдения, fGam () – функция плотности гамма-распределения, fTr () – функция плотности распределения внезапных отказов, S Tr () – функция надежности, соответствующая распределению
внезапных отказов, а вектор
T, T, , T
T
.
3. Исследование статистических свойств оценок параметров модели
Рассмотрим исходные данные, используемые в исследованиях. В качестве распределения
приращений возьмем гамма-распределение FGam (0, 0.5,1) . В качестве функции тренда де-
0, 1 0.3 . В ка0
1t , где 0
x
e , где значение регрессионного параметра
градационного показателя возьмем mx t; , 0, 1
честве функции от ковариат возьмем r x,
0.1 . В качестве распределения внезапных отказов возьмем распределение Вейбулла
FWei (0,10,5) . Средний процент деградационных отказов и средний процент цензурирования
будет изменяться в зависимости от момента цензурирования (времени окончания эксперимента) – в данном исследовании рассматриваются варианты с моментами цензурирования
равными 8, 9, 10. Число замеров по времени равно 5 и происходит в точках 2, 4, 6, 8, 10. Если
момент цензурирования наступает раньше последнего замера, то число замеров сокращается
до номера последнего замера в точке.
Проведем исследования статистических свойств оценок в зависимости от значения момента времени окончания эксперимента (момента цензурирования) и в зависимости от объема выборки и числа замеров деградационного показателя.
227
Рис. 1. Плотности ОМП регрессионного параметра функции от ковариат
цензурирования. Объем выборки n
100
при разных моментах
Рис. 1 показывает, что при увеличении значения времени цензурирования смещение относительно истинного значения регрессионного параметра увеличивается. При этом разброс
оценок относительно среднего практически не меняется.
Рис. 2. Плотности ОМП параметра масштаба функции распределения приращений
ментах цензурирования. Объем выборки n
100
при разных мо-
На Рис. 2 показано, что при увеличении значения времени цензурирования значение выборочной дисперсии и величина смещения не слишком различаются. Однако, при небольшом увеличении количества приращений смещение относительно истинного значения параметра масштаба функции распределения приращений возрастает, а также уменьшается значение выборочной дисперсии.
228
Рис. 3. Плотности ОМП регрессионного параметра функции от ковариат
борки
при разных объемах вы-
Рис. 3 показывает, что при рассмотренных объемах выборки и количества замеров деградационного показателя регрессионного параметра оценки параметров оказываются смещенными, а с ростом объема выборки приращений значение выборочной дисперсии уменьшается.
Рис. 4. Плотности ОМП параметра масштаба функции распределения приращений
емах выборки
при разных объ-
На Рис. 4 показано, что оценка является симметричной, и при увеличении объема выборки смещение относительно истинного значения параметра масштаба функции распределения
растет, а значение выборочной дисперсии уменьшается.
Из результатов проведенных выше исследований можно заметить, что оценки оказались
очень сильно смещенными из-за того, что приходится оценивать вектор параметров доста229
точно большой размерности по выборкам малого объема. Поэтому в данной работе предлагается снизить размерность вектора неизвестных параметров и рассмотреть полупараметрическую деградационную гамма-модель и вместо оценивания параметров некоторой функции
распределения внезапных отказов, вычислять непараметрическую оценку распределения
внезапных отказов. Поскольку выборки внезапных отказов являются цензурироваными справа, используем оценку Каплана-Мейера, имеющую следующий вид:
di
Fn x
1
1
,
ri
t x
i
где di
Xj
tj
j
, ti – моменты времени, в которые произошел отказ, ri – количество
наблюдений, для которых X j
ti , j
1,..., n .
Проведем исследования статистических свойств оценок максимального правдоподобия в
зависимости от параметризации функции распределения внезапных отказов и в зависимости
от объема выборки.
Выборки были сгенерированы на основе истинной модели, описанной выше. Однако по
генерированным будем строить три разные модели: полностью параметрическую модель с
истинным законом распределения внезапных отказов FWei (0,10,5) , полностью параметриче-
скую модель с неверным законом распределения внезапных отказов Exp(0,12) , полупараметрическую модель с использованием непараметрической оценки Каплана-Мейера.
Рис. 5. Плотности ОМП регрессионного параметра функции от ковариат
при использовании оценки Каплана-Мейера [1],
полной параметризации с истинным законом распределения [2],
полной параметризации с неверным законом распределения [3]
n
200
true
0.1
Рис. 5 показывает, что при использовании оценки Каплана-Мейера, оценки регрессионного параметра функции от ковариат оказываются практически несмещенными. Также
можно отметить, что при полностью параметризованной функции распределения внезапных
отказов получаются очень большие смещения.
230
Рис. 6. Плотности ОМП параметра масштаба функции распределения приращений
0.5
нии оценки Каплана-Мейера true
при использова-
Рис. 7. Плотности ОМП параметра масштаба функции распределения приращений
0.5
раметризации true
при полной па-
Из Рис. 6 и Рис. 7 видно, что при использовании оценки Каплана-Мейера, оценки параметра масштаба функции распределения приращений оказываются намного менее смещенными при большем объеме выборки, чем при полной параметризации. Также можно отметить, что с увеличением объема полученные оценки становятся более точными.
231
4. Заключение
При проведении исследования статистических свойств оценок максимального правдоподобия для полностью параметрической модели было показано, что при увеличении количества приращений смещение оценок регрессионного параметра и параметра масштаба функции распределения приращений относительно истинного значения увеличивается и с увеличением объема выборки смещение оценок не уменьшается. Однако дисперсия оценок максимального правдоподобия при увеличении объема выборки заметно уменьшается. При проведении исследования статистических свойств оценок максимального правдоподобия для полупараметрической модели было показано, что при использовании оценки Каплана-Мейера
смещение оценок параметров относительно истинных значений значительно уменьшается, а
увеличение объема выборки также положительно сказывается на точности полученных оценок.
Литература
1. Bordes, L., Paroissin C., Salami A. Parametric inference in a perturbed gamma degradation process. Pau: Preprint/Statistics & Probability Letters, 2010. – p. 13.
2. Tsai, C.C., Tseng S.T., Balakrishnan N. Optimal design for degradation tests based on gamma
processes with random effects // IEEE TRANSACTIONS ON REABILITY. – 2012. – Vol.61,
NO.2. – p. 604-613.
3. S.T. Tseng, Balakrishnan N. Optimal step-stress accelerated degradation test plan for gamma
degradation processes // IEEE TRANSACTIONS ON REABILITY. – 2009. – Vol.58, NO.4. – p.
611-618.
4. Tsai, C.C., S.T. Tseng, N. Balakrishnan Optimal burn-in policy for highly reliable products using
gamma degradation process // IEEE TRANSACTIONS ON REABILITY. – 2011. – Vol.60, NO.1.
– p. 234-245.
5. Nikulin, M., Bagdonavicius V. Accelerated Life Models: Modeling and Statistical Analisys. Boca
Raton: Chapman & Hall/CRC, 2002. – 334 с.
6. Abdel-Hameed, M. S., Nikulin, M. Degradation Processes: An Overview // Advances in
Degradation Modeling, Statistics for Industry and Technology. Birkhauser Boston, a part of
Springer Science + Business Media, 2010. – p. 17-25.
7. Abdel-Hameed, M. S. Optimal replacement policies for devices subject to a gamma wear process,
In The Theory and Applications of Reliability; with Emphasis on Bayesian and Nonparametric
Methods (Ed., C.P. Tsokos, I.N. Shimi), Academic Press, New York, 1977 – p. 397–412.
8. Abdel-Hameed, M. S. Inspection and maintenance policies for devices subject to deterioration,
Advances in Applied Probability, 1987 – p. 917–931.
9. van Noortwijk, J.M., van der Weide J.A.M., Kallen M.J., Pandey M.D. Gamma processes and
peaks-over-threshold distributions for time-dependent reliability, 2006 – p. 8.
10. Grall-Maes, E., Beauseroy P., Grall A.: Degradation prognosis based on a model of Gamma
process mixture. EUROPEAN CONFERENCE OF THE PROGNOSTICS AND HEALTH
MANAGEMENT SOCIETY, 2014 – p. 8.
11. Чимитова, Е.В., Четвертакова Е.С., Вожов С.С. Построение гамма деградационной модели надежности с учетом влияния объясняющих переменных, 2014. – 6 с.
232
Чимитова Екатерина Владимировна
к.т.н., доцент кафедры теоретической и прикладной информатики НГТУ, тел. (383)
346-06-00, e-mail: chimitova@corp.nstu.ru
Самусенко Вячеслав Игоревич
студент 1-го курса магистратуры факультета прикладной математики и информатики НГТУ, e-mail: starkflynn@gmail.com
Building degradation gamma-model with traumatic failures
E. Chimitova, V.Samusenko
This paper describes the process of building degradation gamma-models with traumatic failures.
This paper includes research of the connection between the maximum-likelihood estimation of
this degradation gamma-model and some special conditions. There are two cases: when described model is fully parametric and when described model is semi-parametric.
Keywords: degradation processes, gamma-model, reliability function, traumatic failures.
233
Вопросы проверки адекватности деградационной гаммы-модели надежности
Вопросы проверки адекватности деградационной
гамма-модели надежности
Е. В. Чимитова, Е.С. Четвертакова1
В данной работе рассматривается деградационная модель надежности учетом влияния
объясняющих переменных, в основе которой лежит предположение о принадлежности
независимых приращений случайного процесса изменения показателя деградации гаммараспределению. Предлагается подход к проверке статистической гипотезы о согласии с
моделью с использованием непараметрических критериев типа Колмогорова, КрамераМизеса-Смирнова и Андерсона-Дарлинга. С использованием методов имитационного моделирования проводится исследование распределений статистик и мощности рассматриваемых критериев относительно различных видов конкурирующих гипотез.
Ключевые слова: деградационная гамма-модель, модели надежности с объясняющими
перемеными, критерии согласия, оценка надежности.
1. Введение
В современном мире большое внимание уделяется вопросам контроля качества и исследования надежности технических устройств, особенно если от их работоспособности зависит
жизнь и здоровье человека. Если речь идет о высоконадежных изделиях, то данных об отказах таких изделий может быть недостаточно для оценки функции надежности, поскольку в
период проведения эксперимента наступление отказов наблюдается крайне редко. Существует два возможных способа получить дополнительную информацию о надежности изделий: первый заключается в проведении ускоренных испытаний, когда изделия подвергаются
повышенным нагрузкам, в результате чего отказы наступают раньше; второй способ состоит
в измерении значений некоторого показателя, характеризующего процесс деградации (старения) изделия. При этом момент времени, когда значение деградационного показателя достигает критического уровня, считается временем наступления отказа. Оба подхода можно совместить, наблюдая процессы деградации и наступление отказов изделий, эксплуатирующихся при повышенных нагрузках. В качестве нагрузок могут выступать температура, давление,
напряжение, механические нагрузки и другие.
Проанализировав полученные данные о деградации изделия, для получения оценки
надежности (прогноза) и проведения дальнейших исследований необходимо построить деградационную модель. При построении моделей деградации учитывается распределение и
функция тренда приращений показателя старения, а также функция влияния объясняющих
переменных – функция от ковариат. В большинстве работ по исследованиям деградационных процессов в качестве распределения приращений показателя старения рассматриваются
либо гамма-распределение (гамма-процесс) [1], либо нормальное распределение (винеровский процесс) [2,3]. Это обусловлено тем, что данные распределения являются устойчивыми
относительно суммирования (воспроизводимыми), и за счет этого можно легко определить
распределение исследуемой случайной величины – показателя деградации в некоторый момент времени, а затем оценить вероятность безотказной работы.
1
Исследование выполнено при поддержке Министерства образования и науки Российской Федерации в
рамках государственного задания №2014/138 (проект №1689).
234
В настоящей работе рассматриваются вопросы построения деградационной гаммамодели как наиболее часто используемой при описании реальных данных. Так, например, в
[4] сравниваются деградационные гамма и винеровская модели на примере исследования
надежности арсенид-галлиевых лазеров; авторы [5] используют деградационную гаммамодель для описания износа автомобильных тормозных колодок; в [6] рассматривается пример моделирования зависимости износа автомобильной шины от нагрузок с использованием
гамма-модели. Различные виды деградационных моделей на основе гамма-распределения
представлены в работе [7].
Основной проблемой использования деградационной гамма-модели является отсутствие
математического аппарата для проверки статистической гипотезы о виде модели, в то время
как проверка гипотезы о согласии является обязательным этапом построения вероятностных
моделей. В данной работе предлагается подход к проверке статистической гипотезы о виде
деградационной гамма-модели надежности с учетом влияния объясняющих переменных,
предусматривающий исследование методами компьютерного моделирования распределений
статистик критериев согласия в интерактивном режиме проверки гипотезы. В качестве критериев согласия предлагается использовать непараметрические критерии типа Колмогорова,
Крамера-Мизеса-Смирнова и Андерсона-Дарлинга. Приводится пример построения деградационной гамма-модели надежности по данным об углеродистых резисторах.
2. Деградационная гамма-модель надежности
Случайный процесс Z (t ) , характеризующий процесс деградации исследуемых изделий
называется деградационным гамма-процессом с параметром формы ν (t ) и параметром масштаба σ , если
1. Z (0)  0 ;
2. Z (t ) является случайным процессом с независимыми приращениями;
3. приращения ΔZ (t )  Z (t  Δt )  Z (t ) подчиняются гамма-распределению с функцией
плотности
Δν (t ) 1
e t / σ
t 
fGamma  t ; σ , Δν (t )    
,
σ  Г  Δν (t ) 
σ 
где Δν (t ) ν (t  Δt ) ν (t ) – параметр формы и σ  0 – параметр масштаба.
Пусть деградационный процесс наблюдается при некоторой постоянной во времени
нагрузке (ковариате) x , диапазон значений которой определяется условиями эксперимента и
представляет собой отрезок числовой прямой. Влияние ковариаты x на изменение показателя деградации будем учитывать так же, как это делается в модели ускоренных испытаний
[8]:
 t 
Z x (t )  Z 
,
 r ( x; β ) 
где r ( x; β ) – положительная функция от ковариат. Существует множество моделей функций
от ковариат. Наиболее популярные из них [9]:
- логлинейная модель вида r ( x; β )  eβ 0  β1x применяется, например, для анализа данных
усталости при тестировании различных электронных компонент;
- модель правила мощности в форме r ( x; β )  eβ 0  β1 ln x используется в случаях, когда
воздействием являются напряжение, механическая нагрузка;
- модель Аррениуса вида r ( x; β )  eβ 0  β1 / x применяется, когда в качестве нагрузки выступает, температура.
Обозначим условное математическое ожидание случайного процесса Z x (t ) через
235
M  Z x  t    mx  t  ,
 t 
где mx  t   σν 
 – положительно определѐнная, возрастающая функция. Будем
 r ( x; β ) 
называть ее функцией тренда показателя деградации. В качестве функции тренда могут использоваться такие параметрические модели, как:
t
;
- mx  t; β  
r ( x; β )
γ
 t  0
- mx  t ; β , γ   
 , γ0  0 ;
 r ( x; β ) 
γ

 t 1


 
, γ  γ 0  1  e  r ( x; β )   , γ 0  0 , γ 1  0 .
- mx  t ; β






Несложно показать, что при выполнении сформулированных предположений случайный
процесс Z x (t ) в некоторый фиксированный момент времени t  tk представляет собой случайную величину, имеющую гамма-распределение с параметром масштаба σ и параметром
m (t )
формы, равным x k . Время безотказной работы, которое зависит от ковариаты x , пред-
σ
ставляет собой величину

Tx sup{t : Z x (t )  z} ,
где z – критическое значение показателя деградации, при достижении которого фиксируется
отказ объекта. Тогда функция надѐжности для рассматриваемой деградационной гаммамодели принимает вид:
m (t; β ,γ ) 

S x (t
) P{Tx  t
} P{Z x (t )  z
} FGamma  z; σ , x
(1)
.
σ


Пусть для каждого из n случайно отобранных из генеральной совокупности объектов известно изменение показателя деградации во времени в виде случайного процесса Z i (t ) , а
также соответствующая величина нагрузки (ковариаты) xi , при которой эксплуатировался i ый объект, i  1, n . Обозначим измерения показателя деградации для i -го объекта через


Z i  (0, Z0i ), (t1i , Z1i ),..., (tki , Z ki ) ,
i
i
где ki – это число измерений деградационного показателя во времени. Без потери общности,
будем считать, что начальное значение показателя старения Z0i  0 , i  1, n .
Обозначим выборку приращений через

  
 
Xn X 1j 
Z1j Z1j 1, j 
1, k1 , x1 ,..., X nj 
Z nj Z nj 1, j 
1, kn , x n .
Предполагая, что наблюдаемые случайные процессы Z i i (t ) ,
x
i  1, n подчиняются деграда-
ционной гамма-модели с математическим ожиданием mx  t; β ,γ  , по выборке X n можно
оценить неизвестные параметры модели (параметр масштаба σ , параметры функции тренда
γ (если таковые присутствуют в модели) и регрессионные параметры β ) и построить прогноз времени безотказной работы с заданной вероятностью при заданных значениях ковариаты. Оценка максимального правдоподобия (ОМП) вектора параметров вычисляется в результате максимизации функции правдоподобия:
236
n ki

ln L( Xn )   ln fGamma ( X ij ; σ , pij )  max ,
σ ,γ , β
i 1 j 1
где pij 
m i (t ij ;γ , β )  m i (t ij 1;γ , β )
x
σ
x
(2)
– параметр формы гамма-распределения.
3. Проверка статистической гипотезы о согласии
Обязательным этапом построения деградационной гамма-модели надежности (впрочем, как и любой другой вероятностной модели) является проверка статистической гипотезы о согласии:

где pˆ ij 

i
n, j 1, k ,
H 0 : X ij  FGamma t;σˆ , pˆ
j , i 1,
(3)
m i (t ij ;γˆ , βˆ )  m i (t ij 1;γˆ , βˆ )
x
x
.
σˆ
Для проверки гипотез о согласии по выборкам независимых одинаково распределенных случайных величин существует целый ряд критериев, такие как критерии типа хи-квадрат, непараметрические критерии согласия Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга и многие
другие. Однако к выборке приращений X n классические критерии согласия неприменимы, поскольку элементы данной выборки в общем случае не являются одинаково распределенными.
Введѐм следующее преобразование приращений деградационного показателя:
i

Rij FGamma ( X ij ;σˆ , pˆ
n, j 1, ki .
j ), i 1,
При справедливости гипотезы H 0 :
R ij  Uniform(0,1)
, i 1,

n, j 1, ki .
Таким образом, задача проверки гипотезы H 0 сводится к проверке гипотезы о равномерном распреi
делении случайных величин R
n, j 1, ki . Для проверки данной гипотезы применим критеj , i 1,
рии согласия типа Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга.
*
*
 R(2)
 ...  R(*N ) , N 
Обозначим через R(1)
по выборке

RN
n
 ki
i 1
Rij , i

элементы вариационного ряда, построенного

1,
n, j 1, ki .
В критерии типа Колмогорова в качестве расстояния между эмпирическим и теоретическим законами распределения используется статистика с поправкой Большева [10] вида:
Sk 



, D
где DN  max( DN
N ) , DN
6 NDN  1
6 N
,
i  1
i

* 


max  R(*i ) 
max   R
.
(i )  DN
N 
1i  N 

1i  N  N
В критерии Крамера-Мизеса-Смирнова используется статистика вида
2
N 
1
2i  1
2
Sω 
Nω N
    R(*i ) 
 ,
12 N i 1 
2N 
а в критерии типа Андерсона-Дарлинга – статистика в форме
Необходимо учитывать то, что проверяемая гипотеза является сложной, поскольку неизвестные
параметры модели оцениваются по тем же данным, по которым проверяется согласие. При проверке
сложных гипотез условные распределения данных статистик зависят от ряда факторов: от метода
оценивания параметров, от типа оцениваемого параметра и числа оцениваемых параметров, а в случае гамма-распределения от конкретного значения параметра формы [10]. Поэтому для вычисления
237
достигнутого уровня значимости и принятия решения о гипотезе H 0 условное распределение статистики критерия согласия G( S | H 0 ) может быть оценено только в интерактивном режиме проверки
гипотезы в соответствии со следующим алгоритмом:
1. На основе деградационной гамма-модели, с которой проверяется гипотеза о согласии, сгенерировать выборку приращений X n в соответствии с заданным планом эксперимента (при заданных
значениях ковариаты, тех же количествах объектов в группах с разными значениями ковариаты, а
также с теми же моментами времени замера показателя деградации).
2. По полученной выборке X n оценить параметры модели методом максимального правдоподобия (2).
3. Сформировать выборку R N .
4. По выборке R N вычислить значение статистики критерия согласия (статистики S K , Sω или
SΩ ).
5. Повторяя пункты 1-4 M раз, получим выборку статистик объѐма M , на основе которой построить эмпирическую функцию распределения GM ( S | H 0 ) .
По полученному эмпирическому распределению GM ( S | H 0 ) вычисляется оценка достигнутого
уровня значимости α N  1  GM (S N | H 0 ) , где S N – значение соответствующей статистики, полученное по исходной выборке, по которой проверяется гипотеза о согласии H 0 . Если α N не превы-
шает заданного уровня значимости α , то гипотеза H 0 отвергается.
4. Исследование мощности критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга для деградационной гаммамодели
Мощностью критерия называется вероятность отвергнуть неверную гипотезу при уровне значимости α : 1  G( Sα | H1) . Понятно, что чем больше мощность критерия, тем выше его способность различать близкие конкурирующие гипотезы.
С использованием методов имитационного моделирования проведем исследование мощности критериев типа Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга при проверке сложной
гипотезы H 0 , соответствующей деградационной гамма-модели с линейной функцией тренда и
логлинейной функцией от ковариат.
Рассмотрим три различные конкурирующие гипотезы:
1. H11 : Общая деградационная модель [11] с линейной функцией тренда и логлинейной функцией
от ковариат, с распределением приращений по закону Вейбулла;
2. H12 : Деградационная гамма-модель со степенной функцией тренда с параметром γ 0  1.3 и
логлинейной функцией от ковариат;
3. H13 : Деградационная гамма-модель с линейной функцией тренда и функцией Аррениуса в качестве функции от ковариат.
Моделирование будем проводить для M  10000 , число объектов n  20 и n  40 , число замеров деградационного показателя для каждого объекта равно ki  10 и ki  20, соответственно,
i  1,..., n ; скалярная ковариата x  1, 2 .
В Таблицах 1, 2 и 3 представлены оценки мощности рассматриваемых критериев согласия при
проверке сложной гипотезы H 0 против конкурирующих гипотез H11 , H12 и H13 , соответственно.
Таблица 1. Мощность критериев в случае конкурирующей гипотезы H11

n 20,

k 10
n 20,

k 20
n 40,

k 10
Критерии согласия
Колмогорова
0.483
238
0.711
0.725
Крамера-Мизеса-Смирнова
Андерсона-Дарлинга
0.578
0.614
0.836
0.792
0.843
0.821
H12
n 20,

k 20

n 20,

k 10
n 40,

k 10
Таблица 2. Мощность критериев в случае конкурирующей гипотезы
Критерии согласия
Колмогорова
Крамера-Мизеса-Смирнова
Андерсона-Дарлинга
0.766
0.827
0.836
0.883
0.921
0.976
0.892
0.929
0.981
H13
n 20,

k 20

n 20,

k 10
n 40,

k 10
Таблица 3. Мощность критериев в случае конкурирующей гипотезы
Критерии согласия
Колмогорова
Крамера-Мизеса-Смирнова
Андерсона-Дарлинга
0.624
0.683
0.716
0.782
0.855
0.827
0.794
0.860
0.846
Как видно из Таблиц 1-3, с ростом объема выборки мощность критериев увеличивается, при этом
более предпочтительными по мощности для всех рассмотренных пар конкурирующих гипотез оказались критерии типа Крамера-Мизеса-Смирнова и Андерсона-Дарлинга.
5. Пример построение деградационной гамма-модели по данным об углеродистых резисторах
Углеродистые резисторы (Carbon Film resistors) применяются в радиотехнической и электронной
аппаратуре. Данные резисторы отличаются тем, что в качестве проводящего слоя они используют
пленку пиролитического углерода. Отказ наступает в тот момент, когда процент повышения сопротивления относительно начального значения достигает критического уровня z (2% или 5% в зависимости от типа резисторов.
В [12] представлены результаты ускоренных испытаний на надежность 29 резисторов в течение
8084 часов. План эксперимента представляет собой три группы по 9, 10 и 10 резисторов, соответственно. Исследования проводились при повышенной температуре: для первой группы резисторов
температура составила 83oC, для второй – 133oC, для третьей – 173oC. На основе полученных данных
построим деградационную гамма-модель с линейной функцией тренда и функцией Аррениуса в качестве функции от ковариат. В результате решения задачи (2), найдены ОМП параметров деградационной гамма-модели: σˆ =2.7131 , βˆ0 =13.1012 , βˆ1  7.9512 .
Проверим гипотезу о согласии с гамма-моделью для критериев типа Колмогорова, КрамераМизеса-Смирнова, Андерсона-Дарлинга. Для критерия типа Колмогорова получены значение статистики Sk  0.882 и достигнутый уровень значимости α N  0.418 ; для критерия типа Крамера-
Sω  0.073 , α N  0.733 ; для критерия Андерсона-Дарлинга SΩ  0.66 ,
α N  0.593 . Так как полученный достигнутый уровень значимости α N  α 
0.05 для всех рас-
Мизеса-Смирнова
смотренных критериев, гипотеза о согласии с выбранной моделью не отвергается.
Рассчитаем прогноз времени безотказной работы для данных резисторов при различной фиксированной температуре и различных критических уровнях превышения сопротивления допустимом проценте превышения. Результаты расчета времени прогноза для различных условий проведения эксперимента представлены в Табл. 4.
Табл. 4. Оценка вероятности безотказной работы при различных условиях проведения эксперимента
Температура
Критический
уровень z
125oC
125oC
60oC
2%
5%
2%
Время
безотказной
работы tk
1000 ч
3000 ч
8760 ч (1 год)
239
Оценка
надежности
S x (tk )
0.990
0.989
0.998
Как видно из Табл. 4, с вероятностью около 0.99 при температуре 125oC время безотказной работы
в случае критического повышения сопротивления z  2% составит 1000 часов, а для z  5% – 3000
часов. При температуре 60oC и z  2% время безотказной работы составит 8760 часов (примерно 1
год) с вероятностью 0.998.
6. Заключение
В данной работе рассмотрены вопросы построения деградационной гамма-модели надежности по
результатам измерений деградационного показателя при различных постоянных во времени нагрузках. Предложен метод проверки сложной гипотезы о согласии для данной модели с использованием
непараметрических критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова и АндерсонаДарлинга. В результате исследований мощности рассматриваемых критериев можно утверждать, что
предложенный метод проверки гипотезы о согласии позволяет проверять предположения как о виде
распределения приращений, так и о виде функции тренда и функции от ковариат.
Рассмотрен пример построения деградационной гамма-модели надежности по данным об углеродистых резисторах. Проведена проверка гипотезы о согласии и на основе полученной модели рассчитаны вероятности безотказной работы для некоторых значений времени наработки при различных
температурах.
Литература
Bordes L., Paroissin C., Salami A. Parametric inference in a perturbed gamma degradation process // Preprint/Statistics & Probability Letters. – Pau, 2010 – P. 13.
2. Liao C.M., Tseng S.-T. Optimal design for step-stress accelerated degradation test // IEEE
Trans. Reliab. – 2006. – 55. – P. 59-66.
3. Tang L.C., Yang L.C., Xie M. Planning of step-stress accelerated degradation test // Los Angeles : Reliability and Maintainability Annual Symposium, 2004. – P. 1.
4. Tsai C.-C., Tseng S.-T., Balakrishnan N. Mis-specification analyses of gamma and Wiener degradation processes // Journal of Statistical Planning and Inference. – 2011. – 12. – P. 25-35.
5. Crowder, M., Lawless, J. On a scheme for predictive maintenance // European J. Oper. Res. 16,
2007. – P. 1713–1722.
6. Статистические модели в теории надежности / Антонов А.В., Никулин М.С. М.: Абрис, 2012. – 390 с.
7. Park, C., Padgett, W.J., 2005. Accelerated degradation models for failure based on geometric
Brownian motion and gamma process. Lifetime Data Analysis 11, P. 511–527.
8. Nikulin M., Bagdonavicius N. Accelerated Life Models: Modeling and Statistical Analisys //
Boca Raton : Chapman & Hall/CRC, 2001. – P. 334.
9. Галанова Н.С., Лемешко Б.Ю., Чимитова Е.В. Применение непараметрических критериев согласия к проверке адекватности моделей ускоренных испытаний // Автометрия. –
2012. – № 6. – С.53-68.
10. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход: монография / Лемешко Б.Ю. и др. Новосибирск:
Изд-во НГТУ, 2011. – 888с.
11. Chimitova E., Chetvertakova E. Alternatives for Wiener and gamma degradation models:
method of selection // Applied methods of statistical analysis. Applications in survival analysis,
reliability and quality control – AMSA’2013, Novosibirsk, 25–27 Sept. 2013 : proc. of the intern. workshop. – Novosibirsk : NSTU publ., 2013. – P. 77-82.
12. Meeker W.Q., Escobar L.A. Statistical Methods for Reliability Data // New York : John Wiley
and Sons, 1998. – P. 680.
1.
240
Чимитова Екатерина Владимировна
к.т.н., доцент, докторант кафедры теоретической и прикладной информатики Новосибирского государственного технического университета (630073, г. Новосибирск, проспект Карла
Маркса, 20), e-mail: ekaterina.chimitova@gmail.com.
Четвертакова Евгения Сергеевна
аспирантка кафедры теоретической и прикладной информатики Новосибирского государственного технического университета (630073, г. Новосибирск, проспект Карла Маркса,
20), тел. 8-913-941-50-02, e-mail: evgenia.chetvertakova@gmail.com.
The problem of constructing the gamma degradation model
E. Chimitova, E. Chetvertakova
In this paper, we consider the problem of constructing the gamma degradation model as the
most frequently used one for description of a degradation process and prediction of non-failure
operation time.
Keywords: gamma degradation model, goodness-of-fit tests, computer simulation methods.
241
Сравнительный анализ алгоритмов построения непараметрической оценки функции
распределения по интервальным данным
Сравнительный анализ алгоритмов построения
непараметрической оценки функции распределения
по интервальным данным
С.С. Вожов, Е.В. Чимитова
В данной работе с использованием методики компьютерного моделирования проводится
сравнительный анализ алгоритмов вычисления непараметрической оценки функции распределения по выборкам интервальных наблюдений. Рассматриваются алгоритм Тѐрнбулла и ICM-алгоритм. Показано, что ICM-алгоритм позволяет существенно быстрее вычислять оценку функции распределения.
Ключевые слова: интервальные данные, алгоритм Тѐрнбулла, ICM-алгоритм.
1. Введение
Развитие статистических методов анализа интервальных данных является перспективным направлением исследований в области прикладной математической статистики. Природа возникновения интервальных данных многообразна. Например, вследствие погрешности
измерительных приборов полученные наблюдения представляют собой интервалы фиксированной длины. В маркетинговых исследованиях наблюдения, полученные в результате анкетирования целевой группы потребителей, как правило, являются интервальными. В задачах
анализа надежности и выживаемости данные типа времени жизни зачастую являются интервально-цензурированными. При этом длины интервалов могут быть бесконечными.
Для построения непараметрической оценки функции распределения по интервальным
данным разработаны различные алгоритмы: алгоритм Тѐрнбулла [1-3], ICM-алгоритм [4-6],
гибридный ICM-EM-алгоритм [7]. В [8] алгоритм Тѐрнбулла использовался для построения
оценки функции распределения в маркетинговом исследовании спроса на биоэнергетические
напитки. Исследование статистических свойств непараметрической оценки функции выживаемости по двустронне-цензурированным данным с использованием ICM-алгоритма проводилось в [9-11].
Целью данной работы является выявление наиболее предпочтительного алгоритма вычисления непараметрической оценки функции распределения по интервальным данным.
2. Непараметрическая оценка функции распределения
Пусть X1, X2,..., Xn – выборка независимых одинаково распределѐнных случайных величин из F (x ) . Однако часто возникают ситуации, когда неизвестно точное значение Xi , но
известно, что они попадают в некоторый интервал (Li , Ri ) , i 1, n . Тогда исходную выборку можно представить в виде:
(L1, R1 ),(L2, R2 ),...,(Ln , Rn )
n
Основная идея построения непараметрической оценки функции распределения по интервальным данным заключается в том, что находится максимум логарифма функции правдоподобия
242
n
ln L
n
i 1
ln F (Ri )
F (Li )
по значениям функции распределения в граничных точках интервалов наблюдений при
соблюдении условия монотонности функции распределения. Однако решение данной оптимизационной задачи методом штрафных функций требует больших вычислительных ресурсов. Вместо этого целесообразно использование специальных алгоритмов, таких как алгоритмы Тѐрнбулла и ICM.
F (x )
рассмотрим
разбиение
Для
оценивания
функции
распределения
,
состоящее
из
всех
неповторяющихся
упорядоченных
границ
интер0
...
0
1
m
валов Li и Ri , i 1, n . Заметим, что m 2n 1 . При этом m
правые границы интервалов не совпадают друг с другом.
2n
1 , если все левые и
2.1. Алгоритм Тѐрнбулла
Для всех j
1, m и i
1, n определяются веса:
1, если (
0, если (
ij
(Li , Ri ],
(Li , Ri ].
j 1, j )
1,
j
j)
Алгоритм Тѐрнбулла заключается в выполнении следующего итерационного процесса:
0 . Определить начальное приближение, например, следующим обра1. Положить k
зом: Fˆ(0)( j )
m
1
l 1
l
j
.
2. Вычислить вероятности попадания в интервал ( j 1, j ) :
1, m .
p(jk ) Fˆ(k )( j ) Fˆ(k )( j 1 ) , j
3. Вычислить оценку числа отказов в момент j :
aij p(k )
n
dj
j
m
a p(k )
l 1 ij l
i 1
, j
1, m
4. Вычислить соответствующую оценку количества объектов, находящихся под наблюдением в момент j :
m
Yj
l
j
dl ,
5. Используя вычисленные на шаге 2 и 3 величины d j и Y j , пересчитать оценку по
формуле Каплана-Майера:
Fˆ(k
6. Если для всех j
1)(
j
j)
1
1
i 1
di
, j
Yi
1, m .
1, m выполняется условие останова:
Fˆ(k )( j ) Fˆ(k 1)( j )
,
то оценка Тѐрнбулла найдена, иначе k
k
Полученная оценка функции распределения
243
1 и перейти на шаг 1.
0, t
Fˆ( 1 ),
...
Fˆ( ),
Fˆ(t )
1,
t
1
m
2,
t
m
является состоятельной, т.е.
P sup Fˆ(t )
F (t )
1.
0, n
t 0
2.2. ICM-алгоритм
Идея алгоритма заключается в том, чтобы свести задачу максимизации функции правдоподобия к задаче последовательного вычисления изотонической регрессии [6]. При этом
функция распределения максимальна в точках левой производной выпуклой миноранты, ко-
G (jk ),Vj(k ) , при P0
торая определяется по точкам Pj
(0, 0) . Миноранта – функция,
значение которой не больше соответствующих значений данной функции. На рис. 1 изображѐн пример такой функции:
Рис. 1 – Выпуклая миноранта
1, m и i
Для ICM-алгоритма для всех j
1, n определяются веса:
1, если j
1, если j
0, если j
ji
Li ,
Ri ,
(Li , Ri ].
Итерационный процесс ICM-алгоритма для произвольного шага алгоритма k
1. Для всех j
1, m найти точки
G (jk ),Vj(k )
в соответствии со следующими выраже-
ниями:
G (jk )
Wj(k )
G (jk )1
Wj(k )1
n
1
i 1
Fˆ(k )( j )
ji
n
i 1
ji
244
1:
1
Fˆ(k )(Li )
Fˆ(k )( j 1 )
Fˆ(k )(Ri )
2
,
,
D(jk )
D(jk )1
Fˆ(k )( j )
n
i 1
Vj(k )
ji
Fˆ(k )( j )
Wj(k )
Fˆ(k )( j 1 )
2
,
D(jk ) .
0.
2. Установить l
3. Оценка функции распределения равна левой производной выпуклой миноранты:
Fˆ(k )( j )
min
l 1 s m
Vs(k )
Vl(k )
Gs(k )
Gl(k )
,
где j l 1, s , s – индекс угловой точки выпуклой миноранты.
4. Изменить l s . Если l m переходим на пункт 3.
Алгоритм повторяем до тех пор, пока для всех j
1, m не выполнится условие:
(
k
)
(
k
1)
ˆ
ˆ
( j)
10 7
F ( j) F
Полученная оценка функции распределения по ICM-алгоритму так же как и оценка
функции распределения, найденная по алгоритму Тѐрнбулла, является непараметрической и
равномерно строго состоятельной.
3. Сравнительный анализ алгоритмов
Алгоритм Тѐрнбулла и ICM-алгоритм вычисляют одинаковую оценку функции распределения в пределах заданной точности, однако скорость вычисления этой оценки у алгоритма ICM значительно выше, что видно на рис. 2:
Рис. 2 – Скорость вычисления оценки интервальными алгоритмами
С увеличением длины интервала скорость вычисления оценки функции распределения
алгоритмом Тѐрнбулла увеличивается. Для ICM-алгоритма наоборот – чем больше интервал,
тем меньше скорость вычисления оценки.
245
4. Заключение
1. Реализованы алгоритм Тѐрнбулла и ICM-алгоритм для вычисления непараметрической
оценки функции распределения по интервальным данным в рамках приложения LiTiS
(Life Time Statistics).
2. В результате сравнительного анализа алгоритмов Тѐрнбулла и ICM показано, что точность вычисления оценки функции распределения у алгоритмов одинаковая, однако время вычисления оценки по ICM-алгоритму существенно меньше, чем у алгоритма Тѐрнбулла.
Литература
1. Turnbull, B.W. Nonparametric estimation of a survivorship function with doubly-censored data.
J. Am. Statist. Assoc. 69, 169-73, 1974.
2. Turnbull, B,W. The empirical distribution function with arbitrarily grouped, censored and truncated data. J. Roy. Statist. Soc. B 38, 290 – 295, 1976.
3. Efron, B. The two sample problem with censored data. Proc. 5th Berkeley Symp. 4, 831-853,
1967.
4. Groeneboom, P. Asymptotics for interval censored observations. Technical Report 87-18. Depart-ment of Mathematics, University of Amsterdam, 1987.
5. Groeneboom, P. Nonparametric maximum likelihood estimation for interval censored data.
Technical Report, Statistics Department, Stanford University, 1991.
6. Groeneboom, P. and Wellner, J.A. Information Bounds and Nonparametric Maximum Likelihood Estimation, Basel: Birkhauser Verlag, 1992.
7. Jon A Wellner, Yihui Zhan. A hybrid algorithm for computation of the nonparametric maximum
likelihood estimator from censored data. Journal of the American Statistical Association, P.
945-959, 1997.
8. Ж.Н. Зенкова, И.В. Краковецкая. Непараметрическая оценка Тѐрнбулла для интервальноцензурированных данных в маркетинговом исследовании спроса на биоэнергетические
напитки. Вестник Томского государственного университета №3(24), 2013.
9. Chang, M.N. Weak convergence of a self-consistent estimator of the survival function with
doubly censored data. Ann. Statist. 18, 391-404, 1990.
10. Chang, M.N. and Yang, G.L. Strong Consistency of a nonparametric estimator of the survival
function with doubly censored data. Ann. Statist 15, 1536-1547, 1987.
11. Samuelsen, S.O. Asymptotic theory of nonparametric estimator from doubly-censored data.
Scand. J. Statist. 16, 1-21, 1989.
Вожов Станислав Сергеевич
аспирант кафедры теоретической и прикладной информатики НГТУ, тел. (383) 346-0600, e-mail: vss920414@gmail.com
Чимитова Екатерина Владимировна
к.т.н., доцент кафедры теоретической и прикладной информатики НГТУ, тел. (383) 34606-00, e-mail: chimitova@corp.nstu.ru
246
Разработка подсистемы построения контрольных карт Шухарта на платформе 1С: Предприятие 8.3
Разработка подсистемы построения контрольных
карт Шухарта на платформе 1С: Предприятие 8.3
А.Н. Шевченко1, С.Н.Постовалов
В данной работе описаны контрольные карты Шухарта, а также приведено описание разработанной подсистемы построения карт Шухарта для конфигурации «Статистически
контроль качества» на платформе 1С: Предприятие 8.3.
Ключевые слова: контрольные карты Шухарта, статистический анализ качества, ГОСТ Р
50779.42-99.
1. Введение
Важнейшим роста эффективности производства является постоянное повышение технического уровня и качества выпускаемой продукции. Системный подход к улучшению качества выпускаемой продукции позволяет заложить научные основы промышленных предприятий, объединений, планирующих органов. Развитие статистических методов контроля качества на предприятии в настоящее время является одной из наиболее актуальных задач в промышленности в области менеджмента качества.
Статистический контроль качества - раздел математической статистики, методы которого используются в промышленности для определения фактически достигнутого уровня качества, тенденций его изменений и выработки обоснованных воздействий на технологический
процесс. Требуемый уровень качества определяется государственными стандартами (ГОСТ),
в которых даны правила оценки фактического уровня показателей качества.
Внедрение статистических методов управления качества предполагает проведение статистической оценки точности и стабильности процессов. Она традиционно проводится на стадии предварительного анализа технологических процессов и позволяет изучать возможности
технологического оборудования и исследовать изменчивость процесса.
2. Контрольные карты
2.1. Определение контрольных карт
Контрольные карты (контрольные карты Шухарта) – инструмент, позволяющий отслеживать изменение показателя качества во времени [1].
Контрольная карта используется для обеспечения статистического контроля стабильности процесса. Своевременное выявление нестабильности может помочь предотвратить возникновения брака. Учитывая независимость среднего и среднеквадратического отклонения у
нормального распределения, контрольные карты обычно используют парами, например для
среднего и среднеквадратичного отклонения. Контрольные карты впервые введены в 1924
году Уолтером Шухартом с целью исключения отклонений, вызванных не случайными причинами, а при нарушении процесса обработки деталей (технологии обработки).
Выходящий параметр процесса всегда имеет изменчивость вследствие воздействия различных шумов (малых кратковременных отклонений входов и внутренних параметров).
1
Данная работа поддержана грантом Фонда содействия развитию малых форм предприятий в научнотехнической сфере по программе «УМНИК».
247
Факторов слабых (малых) шумов обычно много, и поэтому они частично компенсируют друг
друга. Вследствие этого в устойчивом состоянии выходы процесса лежат в определѐнном
коридоре. Вероятность выхода параметра за пределы коридора под воздействием только шумов мала.
Если доказать влияние отдельного фактора шумов на отклонение выхода с требуемой вероятностью невозможно, то этот фактор называют незначимым.
Некоторые слабые факторы шумов становятся значимыми при большой выборке, но при
этом их влияние все равно будет очень малым, так как факторов, вызывающих шумы, много.
Практический интерес представляют крупные отклонения выходного параметра, превышающие обычную его изменчивость. Обычно крупные отклонения являются значимыми
2.2. Обозначения и сокращения
Пусть наблюдается X – измеряемая характеристика качества, а ее индивидуальные значения X1 , X 2 , X 3 … X N , которые группируются в k подгрупп по n наблюдений в каждой
подгруппе. Введем следующие обозначения:
1
X – среднее значение для подгруппы, X t   X i ;
N
X – среднее средних значений подгрупп;
 – истинное среднее процесса;
Me – медиана подгруппы;
Me – среднее значение медиан подгрупп;
R – размах подгруппы (разность наибольшего и наименьшего значений в подгруппе);
R – среднее значение R для всех подгрупп;
s – выборочное стандартное (среднеквадратическое) отклонение;
s - среднее выборочных стандартных (среднеквадратических ) отклонений подгрупп;
 – истинное внутригрупповое стандартное отклонение;
 – оцененное внутригрупповое стандартное отклонение процесса;
np – число несоответствующих единиц в подгруппе;
p – доля несоответствующих единиц в подгруппе
p – среднее значение доли несоответствующих единиц;
c – число несоответствий в подгруппе;
c – среднее значений c для всех подгрупп;
u – число несоответствий на единицу в подгруппе;
u – среднее значений u .
3. Типы контрольных карт
Контрольные карты Шухарта бывают двух основных типов: для количественных и альтернативных данных. Для каждой контрольной карты встречаются две ситуации:
a) стандартные значения не заданы;
b) стандартные значения заданы.
Стандартные значения - значения, установленные в соответствии с некоторыми конкретными требованиями или целями.
Контрольные карты, для которых не заданы стандартные значения:
Цель таких карт — обнаружение отклонений значений характеристик (например, X , R
или какой-либо другой статистики), которые вызваны иными причинами, чем те, которые
могут быть объяснены только случайностью. Эти контрольные карты основаны целиком на
данных самих выборок и используют для обнаружения вариаций, которые обусловлены неслучайными причинами.
248
Контрольные карты при наличии стандартных значений:
Целью таких карт является определение того, отличаются ли наблюдаемые значения X ,
R и т. п. для нескольких подгрупп (каждая объемом n наблюдений) от соответствующих
стандартных значений X 0 (или  ) и т. п. больше, чем можно ожидать при действии только
случайных причин. Особенностью карт с заданными стандартными значениями является дополнительное требование, относящееся к положению центра и вариации процесса. Установленные значения могут быть основаны на опыте, полученном при использовании контрольных карт без априорной информации, или на заданных стандартных значениях, а также на
экономических показателях, установленных после рассмотрения потребности в услуге и стоимости производства, или указаны в технических требованиях на продукцию.
Предпочтительно, чтобы установленные значения определялись на основе исследования
предварительных данных, которые, как предполагается, станут типичными для всех будущих
данных. Для эффективного использования контрольных карт стандартные значения должны
быть сопоставимы с присущей процессу изменчивостью. Карты, основанные на таких стандартных значениях, особенно полезны для управления процессами и поддержания однородности продукции на желаемом уровне.
3.1. Контрольные карты для количественных данных
Количественные данные представляют собой наблюдения, полученные с помощью измерения и записи значений некоторой характеристики для каждой единицы, рассматриваемой в
подгруппе, например, длина в метрах, сопротивление в омах, шум в децибелах и т. д. Карты
для количественных данных, и особенно простейшие из них ( X и R -карты), — это классические контрольные карты, применяемые для управления процессами.
Контрольные карты для количественных данных имеют следующие преимущества:
a) большинство процессов и их продукция на выходе имеют характеристики, которые могут быть измерены, так что применимость таких карт потенциально широка;
b) измеренное значение содержит больше информации, чем простое утверждение «да —
нет»;
c) характеристики процесса могут быть проанализированы безотносительно установленных
требований. Карты запускаются вместе с процессом и дают независимую картину того,
на что процесс способен. После этого характеристики процесса можно сравнивать или
нет с установленными требованиями;
d) хотя получение количественных данных дороже, чем альтернативных, объемы под групп
для количественных данных почти всегда гораздо меньше и при этом намного эффективнее. Это позволяет в некоторых случаях снизить общую стоимость контроля и
уменьшить временной разрыв между производством продукции и корректирующим воздействием.
3.2. Метод управления и интерпретация контрольных карт для количественных данных
Система карт Шухарта опирается на следующее условие: если изменчивость процесса от единицы к единице и среднее процесса остаются постоянными на данных уровнях
(оцененные, соответственно, по X и R ), то размахи R и средние X отдельных подгрупп будут меняться только случайным образом и редко выходить за контрольные границы. Не допускаются очевидные тренды или структуры данных, кроме возникающих
случайно с некоторой долей вероятности.
X -карта показывает, где находится среднее процесса и какова его стабильность. Та
же карта выявляет нежелательные вариации между подгруппами и вариации относительно их среднего. R -карта выявляет любую нежелательную вариацию внутри под249
групп и служит индикатором изменчивости исследуемого процесса. Это мера состоятельности и однородности процесса. Если R -карта показывает, что вариации внутри
подгрупп не изменяются, то это значит, что процесс остается в статистически управляемом состоянии. Такое происходит только в том случае, если все выборки обрабатывались одинаково. Если R -карта показывает, что процесс вышел из управляемого состояния или уровень на R -карте возрастает, то это может означать, что либо отдельные подгруппы подверглись разной обработке, либо в процессе действует несколько различных
систем причинно-следственных связей.
На X -карты также могут повлиять условия, при которых процесс вышел из состояния статистической управляемости по R-карте. Возможность интерпретировать размахи
или средние подгрупп зависит от оценки изменчивости от единицы к единице, поэтому
R-карту необходимо анализировать первой. Процедура управления приведена в 1) —7).
1) Собирают и анализируют данные, вычисляют средние и размахи.
2) Строят R-карту. Сопоставляют нанесенные точки размахов с контрольными границами, выделяют точки вне границ, необычные структуры или тренды. Для каждого сигнала о наличии неслучайной причины в значениях размаха проводят анализ операций
процесса, чтобы определить причину. Проводят корректирующие действия и действия
по предотвращению повторения данной причины.
3) Исключают все подгруппы, на которые повлияла неслучайная причина, затем пересчитывают и наносят на карту новые средний размах R и контрольные границы.
Необходимо получить подтверждение того, что все точки размахов при сравнении с
новыми границами указывают на статистическую управляемость. Если требуется, повторяют последовательность действий «идентификация — корректировка — пересчет».
4) Если некоторые подгруппы исключены из R-карты из-за выявленных особых причин,
их надо исключить и из X -карты. Пересмотренные значения R и X надо использовать для пересчета пробных контрольных границ для средних X  A2 R .
5) Когда размахи находятся в статистически управляемом состоянии, разброс процесса
(отклонения внутри подгрупп) считается стабильным. В этом случае можно проанализировать средние, чтобы увидеть, меняется ли со временем среднее положение процесса.
6) Теперь строят X -карту и сравнивают точки с контрольными границами. Выделяют
точки вне границ, необычные структуры точек или тренды. Так же как и для R-карты
необходимо анализировать любое из состояний статистической неуправляемости и
проводить корректирующие и превентивные меры. Надо исключить точки, которые
характеризуют это состояние и для которых были найдены неслучайные причины.
Повторно вычисляют и наносят на график новое среднее процесса ( X ) и контрольные
границы. Проверяют, чтобы, по сравнению с новыми границами, все точки демонстрировали статистически управляемое состояние, при необходимости возобновляя
последовательные действия: «идентификация — корректировка — пересчет».
7) Если исходные данные для установления эталонных значений контрольных границ
располагаются устойчиво внутри пробных пределов, расширяют границы, чтобы
охватить будущие данные.
8) Исполнители (оператор или (и) мастер) должны пользоваться этими границами для
последующего управления процессом, реагировать на сигналы о выходе процесса из
управляемого состояния на любой из X и R карт и выполнять надлежащие действия.
4. Проверка структур на особые причины
Для интерпретации хода процесса по картам Шухарта существует набор из восьми дополнительных критериев, который ниже схематически изображены на рисунках 1-3.
250
Рис. 1. Критерии для особых причин (1, 2)
Рис. 2. Критерии для особых причин (3,4)
251
Рис. 3. Критерии для особых причин (7,8)
Этот набор критериев можно принять за основу, но пользователи должны обращать внимание на любую необычную структуру точек, которая может указывать на проявление особых (неслучайных) причин. Поэтому эти критерии следует рассматривать только как примеры ситуаций, когда может быть установлено проявление неслучайных причин. Появление
любого из случаев, описанных в этих критериях, — указание на присутствие особых причин,
которые должны быть проанализированы и скорректированы.
5. Последовательность построения контрольных карт
Последовательность построения X - и R -карты для случая, когда стандартные значения
не заданы, приведена в 1) – 4). Если предварительные данные невозможно разбить на подгруппы в соответствии с намеченным планом, то необходимо разбить весь набор значений,
полученных в результате наблюдений, на последовательные подгруппы. Подгруппы должны
иметь одинаковую структуру и объем. Единицы каждой подгруппы должны объединяться на
основе предположительно одного важно¬го общего фактора, например, все они произведены
в коротком интервале времени или все единицы из одного или нескольких одних и тех же
источников или мест. Разные подгруппы должны представ¬лять возможные или подозреваемые различия в процессе, из которого они сформированы, например разные интервалы времени или источники.
1. Для каждой подгруппы вычисляют среднее ( X )и размах (R).
2. Подсчитывают общее среднее (среднее средних) всех полученных значений X и
средний размах ( R ).
3. На соответствующей форме или бумаге в клеточку строят X и R -карты, где вертикальная шкала слева – для X и R, а горизонтальная шкала – для номера подгруппы.
Наносят вычисленные значения X на карту средних и вычисленные значения R-карту
размахов.
4. На соответствующие карты наносят сплошные горизонтальные прямые, представляющие X и R .
252
6. Программная реализация ГОСТ Р 5077.42-99
Реализация данной подсистемы производилась строго в соответствии с ГОСТом Р
5077.42-99(ИСО 8258-91) [1]. Из этого источника были взяты основные правила построения
контрольных карт, их классификация, табличные коэффициенты для вычисления границ значений, а также практические примеры построения графиков изучаемых статистик.
Разработка осуществлялась на платформе 1С: Предприятие 8.3. Форма обработки «Контрольные карты» показана на рис. 4.
Рис. 4. Контрольные карты
Для рисования графика контрольной карты пользователю необходимо проделать ряд
предварительных действий по отбору исследуемых выборок. А именно: выбрать наблюдаемую переменную, единицу ее измерения, определить тип контрольной карты и вид статистики. Также указать период отбираемых данных и нажать кнопку «Заполнить». Появится список выборок с данными, по которым и будет строиться карта (рис. 5). Далее пользователь
может перейти на вкладку «Настройки» (рис. 6) и задать различные параметры графика, такие как цвета верхней, нижней, или центральной линий карты, границы осей графика, и т.д.
253
Рис. 5. Заполнение списка выборок
Рис. 6. Настройка параметров графика карты
254
Также на этой вкладке можно задать стандартные значения статистик, если таковы необходимы (рис. 7). По умолчанию ввод этих значений скрыт. Но при установке соответствующего флага появляется возможность ввода значений статистик вручную.
Рис. 7. Ввод стандартных значений
Далее предлагается перейти на вкладку «График», и нажать кнопку «Нарисовать». Таким
образом, появится интересующий нас график карты (рис. 8).
Рис. 8. График контрольной карты
7. Заключение
Контрольные карты применяются на любом предприятии, занимающемся выпуском готовых продуктов. Поэтому область применения таких карт очень велика, а использование
имеет широкое распространение
Литература
1. ГОСТ Р 50779.42-99 (ИСО 8258-91). Статистические методы. Контрольные карты Шухарта – М. : ИПК Издательство стандартов, 1999. – 32 с.
255
Шевченко Андрей Николаевич
магистрант факультета прикладной математики и информатики Новосибирского государственного технического университета (630073, Новосибирск, пр. Карла Маркса, 20) тел.
(383) 346-27-76, e-mail: alexshew91@yandex.ru.
Постовалов Сергей Николаевич
д.т.н., доцент кафедры теоретической и прикладной информатики НГТУ, (630073, Новосибирск, пр. Карла Маркса, 20) тел. (383) 346-27-76, e-mail: postovalov@ngs.ru.
256
Решение уравнения диффузии методом виртуального элемента
Решение уравнения диффузии методом
виртуального элемента
Э. П. Шурина, М. И. Ряховский
В данной работе описывается решение трѐхмерного стационарного уравнения диффузии
методом виртуального элемента. Приводится способ построения базиса первого порядка
для решения уравнения на многогранниках. Также сравниваются решения, полученные
классическим методом конечных элементов и методом виртуального элемента.
Ключевые слова: уравнение диффузии, трѐхмерные задачи, метод виртуального элемента, построение базиса.
1. Введение
Создаваемые людьми метаматериалы могут иметь произвольную как физическую, так и
геометрическую структуру. В последнее время разрабатываются фотонные кристаллы, имеющие сложную геометрическую ячейку периодичности, благодаря которым можно создавать оптические диоды или изоляторы [1].
Моделирование объектов со сложными геометрическими и физическими областями
классическим методом конечных элементом (МКЭ) может быть очень затратным по времени, из-за того, что приходиться решать задачи на подробных сетках. Частично данную проблему можно решить, используя классический многомасштабный метод конечных элементов
(ММКЭ) [2], который позволяет выделять макроэлементы и решать задачу с их использованием, сводя решение общей задачи к решению нескольких задач меньшей размерности.
Главным ограничением ММКЭ является форма макроэлемента. В трѐхмерном пространстве
макроэлементом могут быть только параллелепипеды или тетраэдры. При усложнении границ области ограничиваться такой формой элементов уже нельзя.
Для решения задач, где макроэлементом является произвольный многогранник, был разработан метод виртуального элемента (МВЭ). МВЭ является развитием мимикрического метода конечных разностей и реализацией его идей на конечноэлементную постановку [3].
Особенностью метода является возможность работать с макроэлементами произвольной
геометрии, такие макроэлементы называют виртуальными элементами.
В данной работе рассматривается решение уравнения диффузии методом виртуального
элемента, описываются алгоритм и особенности построения базиса первого порядка на произвольном многограннике, также производится сравнение полученного решения с решением
классическим методом конечных элементов.
2. Уравнение диффузии и вариационная постановка на макроэлементах
2.1. Постановка задачи
R3 , в которой требуется решить
Пусть задана некоторая геометрическая область
уравнение. Область будем называть расчѐтной областью, границу расчѐтной области обоS1 S2 , при этом S1 S2
значим
и представим в виде
. На поверхности S1 известно значение неизвестной величины, на поверхности S2 поток неизвестной величины ра-
257
вен нулю. Тогда уравнение диффузии с соответствующими краевыми условиями будет записываться, как
(1)
u
0 в
(2)
u
ug
S
1
u
n
Здесь,
(3)
0
S2
– коэффициент диффузии, ug – значение неизвестной на границе S1 (значение
первых краевых условий).
2.2. Непрерывная вариационная формулировка
Введѐм в рассмотрение билинейную форму a (u, v)
a (u, v)
u
(4)
vd
Так же введѐм следующие пространства
H 1( )
H (grad, )
H 01( )
L2 ( ) |
u
u
H 1( ) | u
S1
L2 ( )
u
3
(5)
(6)
0
С использованием введѐнных обозначений непрерывная вариационная постановка Галѐркина примет вид:
Найти u {u0 ug | u0 H 01( )} такое, что
a(u, v)
0 v
(7)
H 01( )
3. Переход к дискретному аналогу
Для решения задачи (7) с помощью МВЭ расчѐтную область необходимо представить
в виде объединения некоторых подобластей, пересекающихся только по границе
(8)
Vi , Vi Vj
R2
nV
В данной работе рассматривается только случай конформной сетки. Множество {Vi } i
1
–
это множество виртуальных элементов. Также выделим следующие множества, описываюnf
щие геометрию области: {fi } i
рѐбер виртуальной сетки и
ne
1
– множество граней виртуальной сетки, {ei } i
np
{pi }
i 1
1
– множество
– множество узлов виртуальной сетки.
Для нахождения приближенного решения u h задачи (7) представим его в виде разложения по некоторому базису
i
n
i 1
uh
n
i 1
qi i
(9)
Поскольку метод рассматривается конформный, то глобальные базисные функции i на
каждом виртуальном элементе имеют своѐ представление в виде локальных базисных функций. И поэтому, чтобы построить глобальные функции необходимо построить локальные.
258
4. Построение локальных базисных функций
Чтобы построить базис на виртуальных элементах необходимо учитывать всю иерархию
геометрии: узлы, рѐбра, грани и объѐмные элементы [3]. Это связано с тем, что идея построение базиса в МВЭ совпадает с идей построения базиса в ММКЭ. Базис в ММКЭ строится
следующим образом: решается уравнение с тем же оператором и специальными краевыми
условиями [2]. Если в ММКЭ краевые условия могут быть двух типов: первого порядка (когда в качестве условия задаѐтся значение «стандартной» базисной функции на границе) и осциллирующие (когда в качестве условие задаѐтся решение задачи меньшей размерности), то
в МВЭ для построения базиса на объѐмных элементах возможны только осциллирующие
условия. Это связано с тем, что гранью является произвольный многоугольник (что следует
из того, что сам элемент – произвольной многогранник) и для нахождения значений также
надо прибегнуть к решению задачи МВЭ, только для двухмерного случая. Для построения
базиса на гранях решать задачу с осциллирующими краевыми условиями не обязательно, если принять ограничение, что ребро целиком содержится в одной физической подобласти. В
данной работе мы будем придерживаться этого ограничения.
В данной работе будет рассматриваться только построение базиса первого порядка, в котором все степени свободы связаны только с узлами виртуальной сетки.
4.1. Описание конечного элемента
Конечным элементом называется тройка множеств K , P,
, где K – геометрический но-
ситель элемента, P – множество базисных функций,
– множество степеней свободы. В
МВЭ данное разделение важно, поскольку помогает правильно учесть все особенности метода, как на этапе теоретического его описания, так и на этапе реализации метода в виде программы.
4.2. Построение базиса на ребре
Как говорилось выше, предполагается, что ребро сетки целиком содержится в одной физической подобласти и решать задачу на ребре не надо. Однако следует описать базис на
ребре в явном виде, поскольку он будет использоваться в качестве краевого условия для построения базиса на грани.
Пусть ребро e характеризуется двумя его конечными вершинами p1e и p2e , им соответствуют радиус-векторы r1e и r2e . Также они связаны со степенями свободы
можно описать, следующим образом: e
x(
e ), y( e ), z ( e ) |
0
e
1
, здесь
e
1
e
и
e
2
. Ребро
– локальная
координата ребра. Связь между локальными и глобальными координатами можно выразить
следующей формулой:
(10)
r (r2e r12 ) e
r1e
В локальных координатах базисные функции, связанные со степенями свободы
записываются следующим образом
e e
1( )
4.3. Построение базиса на грани
e
1
e e
2( )
e
e
1
и
e
2
,
(11)
(12)
Для построения базиса на грани элемента необходимо решить задачу с тем же оператором, что и исходное уравнение (1) и специальными краевыми условиями. Поскольку базис
259
имеет первый порядок, то правая часть нулевая. Обозначим рассматриваемую грань за f ,
данную грань можно охарактеризовать множеством еѐ вершин, рѐбер и степеней свободы:
f
(j
n p, f
pif
1, n
i 1
,f
, eif
ne , f
i 1
,
f
i
n
,f
i 1
. Выпишем способ построения
j -й
базисной функции
). Для этого надо решить следующую задачу
f
0 на f
j
f
j
(13)
(14)
f
j ,g
f
Краевое условие (14) определяется функциями (11) и (12) по следующему правилу
eif
k
ef
i
, if jf
k
0, otherwise
f
j ,g
(15)
То есть, если вершина p jf , связанная со степенью свободы
f
j
принадлежит ребру eif , то
берѐтся значение функции соответствующей этой глобальной степени свободы. Если вершина не предлежит ребру, то берѐтся 0 . Метод решения задачи (13) – (14) будет описан позже.
4.4. Построение базиса на объѐмном элементе
Построение базиса на объѐмном элементе аналогично построению базиса на грани. Рассмотрим некоторый элемент V , который мы можем описать его вершинами, гранями и степенями свободы V
pV
i
n p,V
i 1
, fiV
n f ,V
i 1
,
V
i
n
,V
i 1
. Для построения j -й функции необходимо
решить следующую задачу
V
j
V
j
V
(16)
0
(17)
V
j ,g
Краевое условие (17) определяется решениям задач (13) – (14), по правилу аналогичному
(15)
fiV
k ,
fV
i
if Vj
k
0, otherwise
V
j ,g
То есть, если глобальная степень свободы
(18)
присутствует на грани fiV , то выбираем
V
j
функцию, связанную с этой степенью свободы. Иначе значение краевого на этой грани рано
нулю.
4.5. Решение вспомогательных задач, для построения базиса
Для решения задач (13) – (14) и (16) – (17) будет использоваться классический метод конечных элементов в постановке Галѐркина, двухмерный и трѐхмерный соответственно. Вариационные постановки для решения этих задач будут записываться аналогично (7), отличия
будут в определении пространств. Так, для двухмерного случая, пространство H 1(f ) определяется, как
H 1( f )
u
L2 (f ) |
u
L2 ( )
2
(19)
А при определении пространств с нулевым следом на части границе H 01(V ) и H 01(f ) , нулевой след требуется на всей границе множества. Вид билинейной формы (4) остаѐтся без изменений.
260
Непрерывная вариационная постановка для двухмерной задачи диффузии (13) – (14):
f
f
f
найти jf
H 01(f ) такое, что
j ,g
j ,0 | j ,0
a f ( jf , v)
0 v
H 01(f )
(20)
Непрерывная вариационная постановка для трѐхмерной задачи диффузии (16) – (17) :
V
V | V
найти Vj
H 01(V ) такое, что
j ,g
j,0
j,0
aV ( Vj , v)
0 v
H 01(V )
(21)
Задачи (20) и (21) будем решать МКЭ на симплексах: в двухмерной задаче геометрическим носителем элементов будет треугольник, в трѐхмерной – тетраэдр. Эту сетку будем
называть «микросеткой».
5. Примеры базисных функций
Продемонстрируем примеры базисных функций для выпуклых и невыпуклых многогранников. Для демонстрации рассмотрим два девятигранника
Рис. 1. Примеры элементов
Оба многогранника получаются путѐм деформации верхней грани куба.
5.1. Пример базисных функций на выпуклом десятиграннике
Поскольку элемент обладает симметрией, продемонстрируем только три базисные
функции – связанную с вершиной фигуры, связанную с верхней гранью куба-основания и
связанную с нижней гранью куба-основания.
В трѐхмерном изображении функции выглядят следующим образом
261
Рис. 2. Трѐхмерное изображение функций на выпуклом девятиграннике
В сечении x
0.5 базисные функции выглядят следующим образом
Рис. 3. Сечение функций на выпуклом девятиграннике
На рисунках 2 и 3 первый рисунок показывает функцию, связанную с нижней гранью
куба, второй – с верхней гранью куба, третий – с вершиной пирамиды.
5.1. Пример базисных функций на невыпуклом десятиграннике
Для невыпуклого девятигранника ниже представлены аналогичные три функции. В
трѐхмерном виде
262
Рис. 4. Трѐхмерное изображение функций на невыпуклом девятиграннике
В сечении x
0.5
функции выглядят следующим образом
Рис. 5. Сечение функций на невыпуклом девятиграннике
6. Решение модельной задачи МВЭ и сравнение с решением МКЭ
Рассмотрим следующую модельную задачу: расчѐтная область состоит из кубов, внутри
каждого куба, в центре, есть шарик. Коэффициенты диффузии основной среды (куба) и
включения (шарика) различаются. Известно значение решения на верхней и нижней границе
области. То есть коэффициенты задачи (1) – (3) задаются следующим образом
263
10 2 , in orb
1, otherwise
ug
1, z
0, z
(22)
0
2
(23)
Изображение расчѐтной области приведено ниже, на рисунке 6
Рис. 6. Расчѐтная область
Каждый куб, содержащий шарик будет выступать в качестве макроэлемента. Пример базисной функции, в сечении z 0.5 (в центре куба) представлен на рисунке 7.
Рис. 7. Сечение базисной функции, которая используется для решения
Из рисунка видно, что около шарика базисная функция начинает искажаться и перестаѐт
быть трилинейной (какой она является в однородном кубе).
В результате решения задачи в сечении z 0.5 получаем распределение поля, изображенное на рисунке 8
Рис. 8. Распределение поля модельной задачи в сечении z
0.5
На рисунке явно выделены тѐмной линией границы макроэлементов. В силу того, что в
различных макроэлементах сетка различается, и построение картины велось по значениям
264
функции в центре микроэлементов-тетраэдров, то картинка распределения поля в макроэлементах немного различается.
Полученное решение МВЭ сравнивалось с решением полученным МКЭ. При анализе полученной погрешности следует учитывать, что сетки для решений хоть и обладали одинаковыми характеристиками (такими, как минимальный и максимальный размер ребра элемента),
всѐ же были разными сетками. Микросетки различных виртуальных элементов в МВЭ в общем случае не согласованны, тогда как в МКЭ сетка должна быть полностью согласованной.
Из-за этого сравнивать решения на одной и той же сетке нет возможности. Для сравнения
решений была выбрана норма L2 ( )
u
Полученная погрешность
uVEM
u FEM
u FEM
(24)
u 2d
L2
L2
2 10
3
, что соответствует среднему объѐму
L2
элемента. То есть можно сказать, что полученные решения эквивалентны.
7. Заключение
Метод виртуального элемента имеет сложный алгоритм построения базисных функций,
на который может быть затрачено значительное количество времени при решении задачи.
Поэтому для решения простых задач его использование может быть не оправданно, так же,
если есть возможность выделения макроэлементов простой геометрии (тетраэдр или параллелепипед) и при этом нет необходимости использовать осциллирующие условия, то использование ММКЭ будет более оправданным. МВЭ подходит для решения задач со сложными
подобластями как физическими, так и геометрическими.
В будущем планируется рассмотреть построение базисов второго и более порядка на
виртуальных элементах, а так же рассмотреть сочетание МВЭ и разрывного метода Галѐркина.
Литература
1. M. Thiel, H. Fischer, G. von Freymann and M. Wegener Three-dimensional chiral photonic superlattices // Optics Letters, Vol. 35, Issue 2, pp. 166-168 (2010)
2. Шокин, Ю.И. Современные многосеточные методы.Многоуровневые методы. Применение многомасштабных методов / Ю.И. Шокин, Э.П. Шурина, Н.Б. Иткина. – Новосибирск : НГТУ, 2012. – 98 с.
3. L. B. Veiga, F. Brezzi, A. Cangiani, G. Manzini, L. D. Marini and A. Russo Basic principles of
virtual element methods // Math. Models Methods Appl. Sci. 1 (2013), pp. 199-214
Шурина Элла Петровна
д.т.н., профессор кафедры Вычислительных технологий НГТУ (630073, г. Новосибирск,
пр-т К.Маркса, 20) тел. (383) 346-27-76, e-mail: shurina@online.sinor.ru
Ряховский Максим Игоревич
магистрант кафедры Вычислительных технологий НГТУ (630073, г. Новосибирск, пр-т
К.Маркса, 20) тел. (383) 346-27-76, e-mail: elnadrius@gmail.com
265
Целевая функция и граничные условия при выполнении оптимизации информационных систем
с использованием тензорных методов анализа
Подсекция 1.2. СибГУТИ
Целевая функция и граничные условия при
выполнении оптимизации информационных
систем с использованием тензорных методов
анализа
Е.А. Веловатый, Н.Г. Треногин
Тензорный метод анализа систем является перспективным направлением изучения
характеристик и оптимизации систем, модели которых могут быть представлены в виде
сетей массового обслуживания. Элементы информационных систем являются одним из
видов объектов данных исследований. Важное значение для предложений по
оптимизации информационных систем является выбор целевой функции. В статье
предложен один из вариантов целевой функции, который использован для изучения
ряда реальных объектов.
Ключевые слова: тензорный, система, функция.
1. Введение
В работах по оптимизации информационных систем с применением тензорных методов
анализа [1-3] важное значение имеет выбор целевой функции. Функция должна показывать
изменение важных характеристик системы при изменении параметров отдельных
элементов. В то же время велико значение граничных условий. Одним из них является
система уравнений, полученных при помощи тензорного метода анализа. Другим условием
должно быть ограничение на рост изменяемых параметров. Таким ограничением может
являться стоимость вносимых изменений (в суммовом выражении).
2. Предложение по выбору целевой функции
Критерием оптимальности предложено выбрать минимум функции среднего времени
нахождения заявок в системе:
k
Tg  
i 1
Ni
λi
где k-количество элементов модели системы
Ni- количество заявок на обслуживание в устройстве i
λi– интенсивность поступления заявок на устройствеi
k
Граничные условия:
  f  X N  xi Ci  Z
i 1
где Х-матрица вносимых изменений производительности элементов,
Сi-стоимость
изменения xi.
То есть, граничным условием является система уравнений, полученная с
использованием тензорного метода анализа, а также бюджет на возможные изменения Z.
266
3. Решение задачи для реальных систем
На рисунке 1 представлена модель (в виде сети массового обслуживания) схемы работы
систем и оборудования, являющихся составными частями системы поддержки
операционной и бизнес деятельности Новосибирского филиала компании ОАО
«Ростелеком»[2].
Рис. 1. Модель системыподдержки операционной и бизнес-деятельности, представленная в
виде сети массового обслуживания.
С применением тензорного метода анализа систем, было определено что работа
системы описывается системой уравнений
1 +  4 +  8 = (f 1,1 + f 4,4 + f 8,8)  Na + f 4,4  Nb + ( f 4,4 + f 8,8)  Nc + f 8,8  Ne

 2 +  4 +  6 = f 4,4  Na + (f 2,2 + f 4,4 + f 6,6)  Nb + (f + f 8,8)  Nc + f 6,6  Nd
4,4

 3 +  4 +  8 = (f 4,4 + f 8,8)  Na + f 4,4  Nb + (f 3,3 + f 4,4 + f 8,8)  Nc + f 8,8 * Ne

 5 +  6 = f 6,6  Nb + (f 5,5 + f 6,6)  Nd

 7 +  8 = f 8,8  Na + f 8,8  Nc + ( f 7,7  f 8,8)  Ne
Критерием оптимальности выбран минимум функции среднего времени нахождения
8
заявок в системе
N
Tg  
i 1
λi
i
  f  X  N 8 x C  Z
Граничные условия:
i
i
i 1
где Х-матрица вносимых изменений производительности элементов, Сi-стоимость
изменения xi.
Граничным условием является система уравнений, полученная с использованием
тензорного метода анализа, а также ограничение по максимальной стоимости оборудования
Z.
В ходе работ по оптимизации, выполнялся поиск матрицы Х, при которой целевая
функция Tg принимала минимальное значение, при условии выполнения граничных
условий.
Первоначальное значение целевой функции составляло 0,0003988 сек.
Исследования показали, что наибольший эффект, в плане оптимизации
производительности с учетом цены оборудования, получен при увеличении
производительности устройств 6 и 8, представляющие из себя элементы корпоративной
267
сети передачи данных. На рисунке 2 представлено поведение целевой функции при
выполнении оптимизации по данным двум параметрам.
Tg,c
∆f6
∆f8
x10%
x10%
Рис. 4.2. Изменение целевой функции Tg в зависимости от увеличения параметров f6,
f8
С учетом расчета значений целевой функции и граничного условия стоимости было
принято решение об умощнении оборудования КСПД на 50% от первоначального значения.
Минимальное значение целевой функции, с учетом граничных условий, соответствует
значению
1
0

0

0
X
0

0
0

0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0 0
0 0
0 0
0 0
1 0
0 1,5
0 0
0 0
0 0
0 0 
0 0

0 0
0 0

0 0
1 0

0 1,5
После выполнения процедур оптимизации, значение целевой функции составило
0,0002571 сек. (то есть сократилось на 35,5%).
Литература
1. Треногин Н.Г., Веловатый Е.А., Петров М.Н. Описание и оптимизация технической
архитектуры системы управления предприятием связи с использованием тензорной
методологии анализа систем // Вестник Сибирского государственного аэрокосмического
университета им. академика М.Ф. Решетнѐва. - 2011. - Вып. 5/38. - С. 95-100
2. Треногин Н.Г., Веловатый Е.А., Петров М.Н. Система поддержки операционной и
бизнес-деятельности предприятия связи с использованием тензорной методологии анализа
систем. // Электросвязь. - 2013. - №1. - С. 17-20
3. Веловатый Е.А., Треногин Н.Г. Оптимизация корпоративной информационной системы
с использованием методов тензорного анализа // Материалы Российской научно268
технической конференции «Информатика и проблемы телекоммуникаций». - Новосибирск.
- 2014. – С. 128-131
Веловатый Евгений Александрович
Начальник отдела корпоративных систем управления департамента корпоративных
систем управления макрорегионального филиала Сибирь ОАО «Ростелеком» (630099,
Новосибсрск, ул. Горького, 53) тел. +7-913-752-6639, e-mail:
Evgeny.A.Velovaty@sibir.rt.ru
Треногин Николай Геннадьевич
к.т.н., доцент кафедры передачи дискретных сообщений
СибГУТИ(630102, Новосибирск, ул. Кирова, 86) тел. (383) 2-191-122
269
и
метрологии
Информатизация составления плана повышения квалификации сотрудников
высшего учебного заведения
Информатизация составления плана повышения
квалификации сотрудников высшего
учебного заведения
Н.Ю. Захаров, А.Н. Полетайкин
Рассмотрена задача создания информационной системы планирования повышения
квалификации научно-педагогического персонала высшего учебного заведения.
Определены цель создания системы и принципы формирования плана повышения
квалификации. Показаны преимущества внедрения указанной информационной системы.
Ключевые слова: информатизация, планирование повышения квалификации, повышение
эффективности, информационная система,
1. Введение
Для современных вузов чрезвычайно важна необходимость эффективного и
своевременного повышения квалификации их научно-педагогических сотрудников (НПС).
Большая численность штата НПС при сопутствующем воздействии различных факторов,
среди которых такие, как неполнота информации об актуальных на данный момент курсах,
неравномерная занятость сотрудников, их персональные предпочтения по срокам и тематике,
и др., в совокупности приводит к недостаточно эффективному планированию повышения
квалификации НПС. Отсутствие единого информационного источника для оперативного
получения вышеуказанных сведений приводит к тому, что заинтересованные лица не могут
воспользоваться доступной информацией в виду ее неполноты или неактуальности. Поэтому
разработка информационной системы планирования повышения квалификации НПС вуза
(далее ИС ППК), является актуальной и востребованной задачей.
2. Цель и задачи создания ИС ППК
Целью создания ИС ППК является повышение эффективности планирования повышения
квалификации НПС в вузе за счет оперативного инфообмена и взаимодействия участников
процесса, связанного с процедурами планирования повышения квалификации, их
информационной открытости и прозрачности для подразделений вуза, а также повышения
актуальности и целостности данных о динамике профессиональных компетенций
сотрудников.
Основными задачами разработки Системы являются:
1. формирование эффективного инструмента по сбору, обработке и раскрытию
сведений о процедурах повышения квалификации персонала;
2. оперативное раскрытие информации о плане повышения квалификации;
3. обеспечение актуальности и полноты информации о развитии компетенций
сотрудников;
4. повышение информационной открытости и прозрачности процедур для ректората,
деканатов и иных заинтересованных лиц;
5. повышение эффективности информационного обмена и взаимодействия участников
процесса, связанного с процедурами повышения квалификации.
270
3. Технология организации повышения квалификации НПС
Повышение квалификации и иные формы развития компетенций сотрудников
университета происходят в рамках выполнения программы развития. Повышение
квалификации осуществляется в соответствии с планом повышения квалификации и
развития компетенций сотрудников, утверждаемым ректором на календарный год. Для
организации работы и контроля над ее результатами в системе есть доступ ответственным
лицам за по повышение квалификации и развитие компетенций сотрудников.
Программа развития включает в себя:
- модернизацию содержания и организации научно-исследовательского процесса;
- модернизацию содержания и организации инновационной деятельности;
- модернизацию инфраструктуры университета;
- повышение квалификации и развития компетенций сотрудников в зарубежных вузах
и организациях.
Вопрос о целесообразности включения в план по конкретному виду, форме и тематике
программ повышения квалификации, профессиональной переподготовки и иных форм
развития компетенций сотрудников решается ответственными лицами. Основные критерии
при решении вопроса о включении в план:
- соответствие тематики и программы повышения квалификации и иных форм
развития компетенций сотрудников приоритетным направлениям
научнообразовательной и инновационной деятельности университета;
- необходимость повышения квалификации в связи с приобретением инновационного и
иного оборудования в рамках реализации программы развития и его дальнейшей
эксплуатации;
- необходимость приобретения дополнительных знаний, навыков и компетенций по
приоритетным направлениям научно-образовательной и инновационной деятельности
университета;
- необходимость
эффективного
обеспечения
образовательного,
научноисследовательского, инновационного и управленческого процессов.
Порядок организации повышения квалификации НПС, определенный в СибГУТИ [1],
предполагает формирование плана по представлению кафедр. При этом актуальным является
вопрос о целесообразности включения в план курсов, соответствующих определенной
тематике, где основными критериями включения могут быть, например, такие [2]:
соответствие тематики приоритетным направлениям научно-образовательной и
инновационной деятельности вуза, необходимость, продиктованная приобретением
инновационного и иного оборудования в рамках реализации программы развития вуза,
необходимость приобретения дополнительных знаний, навыков и компетенций по
приоритетным направлениям деятельности вуза, и др.
4. Заключение
Разработка и внедрение ИС ППК позволит обеспечить полноту, достоверность и
защищенность информации о процессе повышения квалификации и развития компетенций
сотрудников университета на протяжении всего цикла управления процессом, а также
оптимизировать информационное взаимодействие участников данного процесса.
Литература
1. Положение о повышении квалификации [действующий экземпляр, дата введения:
07.12.2010]
/
Материал
с
официального
сайта
СибГУТИ.
–
URL:
http://my.sibsutis.ru/students/info/ (дата обращения: 09.12.2014).
271
2. Положение о повышении квалификации и развитии компетенций сотрудников /
Материал
с
официального
сайта
БФУ
им.
И.
Канта.
–
URL:
http://www.kantiana.ru/federal/project_2/ (дата обращения: 16.02.2015).
Захаров Никита Юрьевич
Студент группы ПИ-08, факультет информатики и вычислительной техники, СибГУТИ
(630102, г. Новосибирск, ул. Кирова, д. 86) тел. 8-952-911-70-83, e-mail:
zakhar_1907@mail.ru.
Полетайкин Алексей Николаевич
Кандидат технических наук, доцент кафедры математического моделирования бизнеспроцессов СибГУТИ (630102, г. Новосибирск, ул. Кирова, д. 86) тел. (383) 2-698-391, e-mail:
polietaikin@sibsutis.ru.
Informatization of the professional development plan of higher education institutions
scientific-pedagogical staff
N. Zakharov, A. Poletaykin
Examined the problem of creating the professional development information system of higher
education institutions scientific-pedagogical staff. Determined the purpose of creating the
system and the principles of forming the professional development plan. Demonstrated the
advantages of introducing the specified information system.
Keywords: informatization, development plan of higher education, increasing of efficiency,
information system
272
Преимущества медленных температурно-скоростных режимов деформирования
Преимущества медленных температурноскоростных режимов деформирования
Т. Э. Захарова
Приводятся экспериментальные результаты, иллюстрирующие преимущества
медленных режимов деформирования по сравнению с быстрым деформированием.
Ключевые слова: нагружение, релаксация, режимы деформирования.
Ранее [1] рассматривались некоторые особенности медленных режимов деформирования
применительно к использованию их при обработке материалов давлением (ОМД) с точки
зрения сохранения остаточного прочностного ресурса деталей на стадии изготовления. Было
замечено, что если в процессе ОМД материал необходимо продеформировать до некоторой
величины необратимой деформации  н , то с точки зрения сохранения комплекса физикомеханических свойств материала в детали целесообразнее создать эту деформацию не быстрым пластическим деформированием, а медленным - за счет деформаций ползучести.
В пользу медленного режима нагружения говорят и следующие экспериментальные данные. Две партии образцов, вырезанных из монолитных панелей сплава АК4-1 после формоо
образования при температуре 195 С в быстром и медленном режимах нагружения, были
подвергнуты испытаниям по отраслевому стандарту во Всероссийском научноисследовательском институте авиационных материалов (ВИАМ) по таким параметрам, как
ударная вязкость, усталость, длительная прочность, ползучесть и т.д. По всем параметрам
партия образцов, вырезанных из панели, отформованной в медленном режиме нагружения за
2 часа, дала более хорошие показатели в сравнении с партией образцов, вырезанных из панели, отформованной в быстром режиме. Например, предел ползучести увеличился на 15-20%,
время до разрушения при испытании на длительную прочность увеличилось на порядок [2].
Частично результаты испытаний приведены в таблице 1.
Таким образом, чем меньше удельная работа, затраченная непосредственно на деформирование материала, тем большая часть работы используется на обеспечение несущей способности конструкции. На рис.1а приведены экспериментальные данные сплава ВТ-20 при
Т=750оС по изменению напряжений при растяжении с постоянными скоростями деформирования до величины  0  2% с дальнейшей релаксацией. На рис. 1б показано изменение
внешнего момента при чистом изгибе балок прямоугольного сечения шириной 10 мм и высотой 20 мм из того же сплава при 750оС с постоянной скоростью изменения кривизны
(светлые точки) и постоянным моментом (темные точки) до æ  1,5  10 3 мм 1 с последующей релаксацией. Из экспериментальных кривых видно, что хотя начальные условия и виды
нагружения были различны, значение напряжения на диаграммах релаксации выходят практически на один уровень. При увеличении продолжительности ОМД уровень прорелаксированных напряжений стремится к нулю, что облегчает расчет технологических процессов и
существенно повышает точность изготовления деталей.
273
Таблица 1. Сравнительные прочностные данные для деталей из сплава АК4-1Т при двух способах формообразования
Сравнительные прочностные характеристики для деталей из сплава АК4-1Т при двух
способах формообразования
Способы формообразования
Быстрое нагружение с последующей
термообработкой
Временное сопротивление разрыву, Мпа
Предел текучести, МПа
Относительное удлинение, %
Ударная вязкость, МДж/м2
Предел ползучести, МПа
(Т=150оС, t=100 ч)
Время до разрушения, ч
(Т=150оС,  =330 МПа)
(Т=150оС,  =290 МПа)
Совмещение медленного деформирования с
термообработкой
451
420
4,5
5,8
452
425
7,5
8,23
200
235
0,8
24,5
90
209
Рис. 1. а) Экспериментальные значения изменения напряжений при растяжении сплава ВТ-20 при
о
Т=700 С с различными постоянными скоростями деформаций до величины  0  2% и последующей
о
релаксацией, б) изменение внешнего момента при изгибе балок при Т=750 С с постоянной скоростью
изменения кривизны (светлые точки) и постоянным моментом (темные точки) до æ  1.5  103 мм 1 с
последующей релаксацией.
Приведенные данные наглядно иллюстрируют преимущества обработки материалов в
медленном режиме деформирования в условиях ползучести как с точки зрения повышения
прочностных ресурсов готовых изделий в сравнении с быстрым режимом обработки, так и с
точки зрения уменьшения требуемых для обработки материалов мощностей технологического оборудования.
274
Преимущества медленных температурно-скоростных режимов деформирования проявляются еще в большей степени в условиях, близких к сверхпластичности (режим БСП). При
высоких температурах Т>0,5Тпл и малых скоростях деформирования   10 3 c 1 составляющая пластичности полностью исчезает и необратимое деформирование осуществляется
только за счет деформации ползучести  í   ñ . Деформация ползучести  с обычно протекает в три стадии. При высоких температурах первая стадия как правило отсутствует, а поврежденность материала накапливается в основном за третью стадию. Отсюда, чем больше
продолжительность второй стадии, тем меньше скорость накопления поврежденности в материале и тем большую величину деформации может выдержать материал до разрушения. В
режимах БСП скорость накопления повреждений на стадии изготовления деталей минимальная, в процессе медленного температурно-силового воздействия на материал внутренние
напряжения в нем успевают прорелаксировать до малых величин, которыми можно пренебречь, и после снятия нагрузки остаточных напряжений не возникает.
В процессе исследования были проведены эксперименты, фиксирующие изменения изо
о
гибающего момента сплава 1561 при температуре 320 С и 480 С, полученные на балках
прямоугольного сечения шириной 10мм и высотой 20мм. Деформирование осуществлялось в
зоне упругих напряжений до кривизны æ  2,4  10 3 мм 1 со скоростью деформации, не пре-
вышающей   10 3 c 1 в крайнем волокне балки. Затем при этой кривизне балка фиксироо
валась, происходил процесс релаксации. Температура 480 С, соответствующая температуре
сверхпластичности, является оптимальной с точки зрения получения точной геометрической
формы и заданных размеров деталей в номинал, так как при более низких температурах в
о
том числе и при температуре отжига 320 С, имеет место упругое восстановление детали [3].
Приведенные выше результаты наглядно иллюстрируют преимущества медленных режимов деформирования. Медленные режимы деформирования существенно снижают усилия
формообразования, улучшают качество изделия в сравнении с быстрыми, легче поддаются
автоматизации, непрерывному контролю за техпроцессом, позволяют за один технологический цикл изготавливать детали сложной геометрии двойной кривизны и т.д.
Литература
1. Захарова Т. Э. Особенности и преимущества медленных режимов деформирования //
Российская научно-техническая конференция «Современные проблемы телекоммуникаций». Новосибирск, 2014. Материалы конференции, С. 177-179.
2. Заключение по исследованию влияния процесса термофиксации монолитных панелей из
сплава АК4-1 на свойства сплава. Технический отчет ВИАМ. 1978. 15 с.
3. Горев Б. В., Клопотов И. Д., Шавров И. А., Кузнецовский А. П. Технология формообразования крупногабаритных деталей из сплава 1561 в режиме сверхпластичности // Судостроительная промышленность. Судоверфь. 1989. Вып. 14. С. 11-23.
Захарова Татьяна Эрнестовна
доцент кафедры высшей математики СибГУТИ (630102, Новосибирск, ул. Кирова, 86)
тел. (383) 2-868-038, e-mail: zaharova.tatyana@mail.ru.
275
Восстановление двухмерной функции по интегралам вдоль прямых
Восстановление двумерной функции по интегралам
вдоль прямых
Ю.В. Кривцов
Аннотация. В докладе предлагается алгебраический алгоритм восстановления функции двух
переменных по интегралам от неѐ вдоль прямых линий
Ключевые слова: интегральная геометрия, преобразование Радона.
1. Интегральная геометрия.
Интегральная геометрия – это раздел математики, в котором в качестве основной ставится
задача определения функции по интегралам от неѐ по гиперплоскостям. Для двумерного случая
это значит, что надо определить функцию от двух переменных f (x, y) по интегралам от неѐ
g ( L)
g ( L)   f ( x, y)dl
(1)
L
вдоль всех прямых L на плоскости. Интегральная геометрия исторически возникла из работ
Германа Минковского. В частности, Минковский решал такую задачу.
Пусть на сфере S 2  E 3 , поверхности шара, задана непрерывная функция f и известны
интегралы от неѐ по большим окружностям C , то есть сечениям поверхности шара
плоскостями, проходящими через центр шара. Определяется ли функция f своими интегралами
g (C)
g (C )   fds
C
(2)
Минковский доказал теорему, в которой указал ограничения на функцию, при которых
можно восстановить функцию f по этой информации. Это одна из первых теорем интегральной
геометрии. Минковский восстановил по g (C ) коэффициенты в разложении функции f в ряд по
сферическим функциям. Явной формулы он не получил.
В 1917 году немецкий математик Радон получил явную формулу, но для другой задачи.
Вместо сферы он рассмотрел плоскость, вместо окружностей – прямые. Итак, рассмотрим
плоскость E 2 , пусть f - непрерывная функция на E 2 , L - прямая и
g ( L)   fds
L
(3)
Как восстановить f по g ( L) ? Ответ в следующей теореме.
Теорема (Радон).
Если f ( x, y) - финитная, бесконечно дифференцируемая функция и интеграл от неѐ вдоль
прямой, отстоящей от точки ( x, y) на расстоянии p равен g ( x, y, p) , то имеет место следующая
формула обращения
1
276
f ( x, y )  
где
G( x, 
y, p )
1



G `p ( x, y, p)
p
0
1
2

2
0
dp
g ( , p  x cos   y sin  )d
(4)
(5)
то есть G( x, y, p) - среднее функции g ( x, y, p) по прямым, равноотстоящим от точки ( x, y) на
расстояние p .
В формуле обращения требование бесконечной дифференцируемости функции f можно
существенно ослабить. Достаточно, чтобы функция f имела непрерывные первые частные
производные.
2. Томография.
В классической трактовке томография – это метод рентгенологического исследования, с
помощью которого можно производить снимок слоя, лежащего на определѐнной глубине
исследуемого объекта. Он был предложен французским врачом Бокажем в 20-х годах прошлого
века. В 1972 году был создан первый компьютерный рентгеновский томограф, в котором для
определения функции f - коэффициента линейного поглощения просвечиваемого тела, по
интегралам от неѐ вдоль различных прямых, использовался метод интегральной геометрии.
С точки зрения взаиморасположения источника зондирующего излучения,
объекта и
детектора (приѐмника излучения) томографические методы могут быть разделены на
следующие группы:
1) трансмиссионные – регистрируется зондирующее внешнее излучение, прошедшее через
пассивный (неизлучающий) объект, частично ослабляясь при этом;
2) эмиссионные – регистрируется излучение, выходящее из активного (излучающего)
объекта с некоторым пространственным распределением источников излученияю.
3) комбинированные трансмиссионно-эмиссионные – регистрируется вторичное излучение
от источников, распределѐнных по объѐму объекта и возбуждѐнных внешним излучением.
Сфера применения томографии [1].
1) Медицинская томография.
2) Промышленная томография (дефектоскопия).
3) Астрономия.
4) Электронная микроскопия.
5) Ядерно-магнитный резонанс.
6) Оптика.
7) Геофизика и другие области.
Зондирующее излучение может быть различным.
1) Томография с использованием звуковых волн.
2) Томография с использованием электромагнитного излучения
3). Томография с использованием электромагнитных полей.
4) Томография с использованием элементарных частиц.
2
277
3. Алгебраические алгоритмы восстановления [2].
Различные способы дискретизации приводят к различным алгоритмам восстановления
функции по интегралам от неѐ вдоль прямых. Дискретизация- это переход от непрерывных
функций к дискретным. Для решения интегрального уравнения (3) преобразуем его в систему
линейных уравнений методом коллокации с кусочно-постоянными координатными функциями.
Пусть нужно решить систему уравнений
(5)

g j 
fds, j 1,..., N
Lj
Где L j - прямые, пересекающие конечный носитель H на плоскости функции f . Покроем
область H малыми квадратами S m , m  1,..., M , и будем считать функцию f постоянной на
каждом
квадрате, то есть заменим f вектором F M , у которого m -я компонента равна
значению f на S m . Введѐм
a jm  ( L j
всех квадратов, большинство значений
Sm ) . Поскольку L j пересекает лишь небольшую часть
a jm равно нулю. С использованием обозначения
a j  (a j1 ,...,a jm )T систему (5) после дискретизации можно представить в виде
T
a
g
1,..., N .
jF
j, j
Или
(6)
AN ,M FM  GN
(7)
где AN , M разреженная матрица, а система (7), как правило, несовместная. Эта несовместность –
недостаток способа дискретизации. Чтобы решить задачу, сформулируем еѐ по-другому. Будем
искать такой вектор FM , чтобы AN , M FM лишь приближѐнно было равно GM , а именно, в том
смысле, чтобы длина невязки была минимальной. Под невязкой будем понимать M - мерный
вектор
(8)

rM AN ,M FM  GN
M
Итак, задача состоит в том, чтобы выбрать вектор F , который минимизирует || r ||2   ri 2 .
i 1
Для решения этой задачи найдѐм сингулярное разложение матрицы A . Известно, что
T
A
всякую действительную прямоугольную матрицу N , M можно представить в виде A  UDV ,
где U - ортогональная NxN матрица, V - ортогональная MxM матрица, а D - диагональная
 ij  0
 i  0 . Для матриц U и V
NxM матрица, у которой элементы
ii
при i  j и 
T
T
U U E
,V V E, где E - единичная матрица. Величины  i
выполняется соотношение 
называются сингулярными числами матрицы, а столбцы матриц U и V - левым и правым
сингулярными векторами. Поскольку ортогональные матрицы сохраняют норму, то
|| r ||
|| U T AVV T F  U T G ||
|| Dz  b || .
(9)
Следовательно SVD - разложение сводит задачу минимизации невязки к задаче с
диагональной матрицей. Вектор z , дающий минимум для || r || , выражается соотношением
d
z j  j , если  j  0 и z j произвольно, если  j  0. Обратное преобразование F  Vz решает
j
исходную задачу, то есть при таком векторе F невязка минимальна.
3
278
Рассмотрим другое решение системы (6).
Составим систему уравнений, для определения средних значений функции f в областях
CEFD, ACDB и DFGK. Введѐм следующие обозначения.
f1, f2, f3 - значения неизвестной функции в соответствующих областях, площади которых
равны s1, s2 и s3. v1 - интеграл от функции f по верхней полосе CEGK, v2 - интеграл от
функции f по левой полосе AEFB, v3 - интеграл от функции f по областям с площадью s2 и s3
ACDB и DFGK Значение v1 вычислим, зная интегралы вдоль горизонтальных прямых,
проходящих внутри полосы CEGK. Значение v2 определим, зная интегралы вдоль вертикальных
прямых, проходящих внутри полосы AEFB. Значение v3 найдем по интегралы вдоль прямых,
проходящих через точку D внутри областей ACDB и DFGK.
s1 f 1  s2 f 2 
v2
s1 f 1  s3 f 3 
v1
s2 f 2  s3 f 3 
v3
У этой системы трѐх уравнений с тремя неизвестными определитель равен
det 
2 s1 s2 s3  0;
E
s1
f1,
C
s2
F
G
f3, s3
K
D
f2,
A
H
B
Рис.1
Литература
1. Deans S.R. The Radon Transform and Some of Its Applications. 1983.
2. Наттерер Ф. Математические аспекты компьютерной томографии. Москва, 1990.
Кривцов Юрий Васильевич
к.ф-м.н., доцент кафедры высшей математики СибГУТИ
(630102,
Новосибирск,
ул.
Кирова,
86)
тел.
yuri.krivtsov@rambler.ru
(383)
2-868-037,
e-mail:
Summary. In the report the algebraic algorithm4 of restoration of function of two variables on
integrals from it along straight lines is offered. The offered method is compared to method of the
smallest squares.
Keywords: integrated geometry, Radon transformation.
279
Применение универсального кодирования для прогнозирования макроэкономических показателей
Применение универсального кодирования
для прогнозирования макроэкономических
показателей
А. В. Милешко
Представлено описание метода прогнозирования временных рядов основанный на универсальной мере. Приведены результаты исследований на примерах прогнозирования
макроэкономических показателей США, таких как номинальный валовой внутренний
продукт, уровень безработицы, AAA корпоративные облигации, BAA корпоративные облигации. Для сравнения приведены результаты опубликованные в докладе Американской
статистической организации и Национального бюро экономических исследований.
Ключевые слова: прогнозирование, универсальная мера, временные ряды.
1. Введение
Прогнозирование – исследование направленное на выяснение тенденций развития событий, основанное на исторических данных. Это существенно важно во многих областях таких
как финансы, метеорология, промышленность и так далее. В настоящее время известно
большое количество моделей используемых для решения задач прогнозирования временных
рядов.
Например, в 1950-х в работах Брауна были представлены методы экспоненциального
сглаживания, получившие в дальнейшем большую популярность. Модель авторегрессии и
скользящего среднего (ARMA) является важным методом анализа временных рядов. Концепция авторегрессии (AR) и скользящего среднего (MA) были сформулированы в работах
Юла, Слуцкого, Уолкера и Ягла. На основе модели авторегрессии-скользящего среднего была создана интегрированная модель авторегрессии-скользящего среднего (ARIMA) [1]. Разница между этими моделями в том, что модель ARIMA преобразует нестационарные временные ряды в стационарные, прежде чем применить модель ARMA. Модели ARMA и
ARIMA широко используются для прогнозирования линейных временных рядов. Для прогнозирования нелинейных временных рядов, были предложены другие модели. Например,
искусственные нейронные сети, являющиеся мощным инструментом для исследования нелинейных процессов, были применены в области прогнозирования [2,3]. Кроме моделей экспоненциального сглаживания, ARMA, ARIMA, искусственных нейронных сетей, существуют другие методы для исследования временных рядов, например, модель авторегрессионной
условной гетероскедастичности (ARCH), модель обобщѐнной условной гетероскедастичности (GARCH) и так далее. Каждый метод имеет свои особенности.
В данной работе представлены результаты практического применения метода, предложенного в [4], в основе которого лежит универсальный код, описанный в [5]. На сегодняшний день подобные работы [6, 7, 8, 9] немногочисленны и эффективность метода малоизучена.
Для исследования были взяты некоторые макроэкономические индикаторы США, такие
как: номинальный валовой внутренний продукт, уровень безработицы, AAA корпоративные
облигации, BAA корпоративные облигации. Для сравнения также приведены прогнозы
опубликованные в докладе (SPF) Американской статистической организацией и Национального бюро экономических исследований. SPF – старейший ежеквартальный обзор макроэкономических показателей США. В составлении которого участвуют эксперты из Американ280
ской статистической организации, Национального бюро экономических исследований, и некоторых федеральных резервных банков США.
2. Описание метода прогнозирования основанного на универсальной мере
2.1. Задача прогнозирования, определения универсальной меры и универсального кода
Прежде чем перейти к описанию метода прогнозирования, следует сформулировать задачу прогнозирования и дать определения универсальной меры и универсального кода.
Пусть дан источник, который порождает последовательности элементов x1x2  из множества A , которое может быть, как конечным так и бесконечным. Пусть в момент времени t
дана порождѐнная источником последовательность x1 x2  xt xi  A . Задача прогнозирования - предсказать элемент xt 1 в момент времени t  1 .
Некоторая мера µ называется универсальной, если для любого стационарного и эргодического источника P верны равенства:
1
lim  log 2 Px1,..., x t   log 2  x1,..., x t   0
t  t
с вероятностью 1, и
lim  Pu log 2 P(u ) /  (u)  0
t   u At
Код U называется универсальным, если для любого стационарного и эргодического источника P верны равенства:
U ( x1... x t )
lim
 H ( P)
t
t 
с вероятностью 1, и
U ( x1... x t )
 H ( P)
lim E p
t
t 
где E p ( f ) – среднее значение f по отношению к P , а H (P) – энтропия P по Шенно-


ну
Следующая теорема говорит о связи между универсальными кодами и универсальными
мерами.
Теорема 1. Пусть U – универсальный код и
 U ( )
 u ( )  2  U  
2
тогда µ - универсальная мера.
u A 
2.2. Описание метода
Кричевский в своей работе [10] приводит меру, которая является универсальной для
множества марковских процессов:
1

,t  m

t
A

K m ( x1... x t )   1
 a A v x  a   1 / 2 / (1 / 2) 

,t  m
m

v x ( )  A / 2 / ( A / 2)
 A t  A

281
где v x ( ) число последовательностей  , встречающихся в x , v x ( )   a A v x (a ) ,
x  x1x2 ...xt , () – гамма функция.
Пусть   12 ... – распределение вероятностей, где
 i  1 / log( i  1)  1 / log( i  2)
для множества целых чисел {1, 2…}.
Определим меру R основанную на универсальном коде из [5]:

R( x1... x t )   i 1 K i ( x1... x t )
i 0
Так как мера R является оценкой вероятностей для класса всех стационарных и эргодических процессов на некотором конечном алфавите , можно вычислить условную вероятность для любого символа a  A :
R( x1... x t a)
R(a | x1... x t ) 
R( x1... x t )
Рассмотрим случай в котором источник принимает значения из непрерывного интервала.
Пусть стохастический процесс порождает последовательность X , элементы которого принимают значения из стандартного борелева пространства Ω. Пусть { n }, n  1 – возрастающая последовательность конечных разбиений Ω, а x[k ] – элемент  k , содержащий точку
x.
Определим совместное разбиение Pn для ( X1 X 2 ...X n ) , как функцию плотности вероятности p( x1x2 ...xn ) по отношению к сигма-конечной мере M n . Для целых s и n определим оценку плотности вероятности p( x1x2 ...xn ) :
s
p ( x1... x n)  P n ( x1[ s] ,..., x[ns]) / M n ( x1[ s] ,..., x[ns])
Определим оценку плотности вероятности:

r ( x1... x t )    i R( x1[ s ] ,..., x[t s ]) / M n ( x1[ s ] ,..., x[t s ])
s 1
В [7] показано, что r ( x1x2 ...xt ) является оценкой неизвестной плотности p( x1x2 ...xt ) ,
а условная плотность
r ( x1... x t a)
r (a | x1... x t ) 
r ( x1... x t )
является оценкой условной вероятности p( x1...xn ) .
3. Результаты
Для исследования были взяты следующие временные ряды: номинальный ВВП (GDP),
уровень безработицы (Unemployment rate), облигации (AAA corporate bond yield, BAA corporate bond yield).
Все прогнозы производились на 4 шага в перѐд. Прогноз вѐлся следующим образом: прогнозировалось очередное значение ряда, после чего ряд пополнялся прогнозным значением,
после чего прогнозирование осуществлялось с использованием обновлѐнного ряда, после чего вычисляется ошибка прогнозирования.
Для сравнения эффективности методов была использована среднеквадратическое отклонение:
282
n
2
 actual (t )  forecast (t )
RMSE  t 1
n
где actual (t ) – истинное значение ряда во время t , forecast (t ) – спрогнозированное
значение ряда во время t , n – количество шагов прогнозирования.
Для анализа точности прогноза, прогнозирование каждого ряда проводилось на трѐх разных интервалах. В каждой из таблиц отражена следующая информация: первый столбец –
название ряда, второй столбец – среднеквадратическое отклонение метода прогнозирования
на универсальной мере, третий столбец – среднеквадратическое отклонение прогноза доклада SPF.
В табл. 1 приведены данные прогнозов макроэкономических параметров в период с первого квартала 2010 года.
Таблица 1. Прогнозирование макроэкономических параметров на 2010 год
Временной ряд
GDP
Unemployment rate
AAA corporate bond yield
BAA corporate bond yield
RMSE R
RMSE SPF
129.3
0.247688
0.550984
0.556873
120.1
0.239792
0.560758
0.55263
В табл. 2 приведены данные прогнозов макроэкономических параметров в период с первого квартала 2012 года.
Таблица 2. Прогнозирование макроэкономических параметров на 2012 год
Временной ряд
GDP
Unemployment rate
AAA corporate bond yield
BAA corporate bond yield
RMSE R
RMSE SPF
513,357468
0,253871
0.506043
0.503087
475.04121
0.193649
0.481067
0.44657
В табл. 3 приведены данные прогнозов макроэкономических параметров в период с первого квартала 2014 года.
Таблица 1. Прогнозирование макроэкономических параметров на 2014 год
Временной ряд
GDP
Unemployment rate
AAA corporate bond yield
BAA corporate bond yield
RMSE R
RMSE SPF
134.38535
0.43543
0.741319
0.813847
134.26352
0.3937
0.663099
0.750899
Как видно из вышеприведѐнных результатов разница ошибок в разных столбцах небольшая, что подтверждает выводы сделанные в [8,9] и говорит о том, что прогнозирование при
помощи меры R может применяться на практике.
Следует также заметить, что метод прогнозирования на основе универсальной меры легко можно обобщить на случай прогнозирования многомерных рядов.
Литература
1. Box G. E., Jenkins G. M., Reinsel G. C. Time Series Analysis: Forecasting and Control //
Wiley, 2013. 784 p.
283
2. Hippert H. S., Pedreira C. E., Souza R. C. Neural networks for short-term load forecasting: a
review and evaluation // Power Systems, IEEE Transaction 16, 2001.
3. Zhang G., Eddy Patuwo B., Hu M. Forecasting with artificial neural networks: state of the art //
International journal of forecasting. 14, 1998.
4. B. Ryabko. Compression-based methods for non-parametric on-line prediction, regression, classification and density estimation of time series // Festschrift in Honor of Jorma Rissanen on the
Occasion of his 75th Birthday. Tampere, 2008. P. 271 – 288.
5. B. Ya. Ryabko, Twice-universal coding // Problems of information transmition. 1984. V.20, №3.
P. 173 – 177.
6. A. Gruzin, B. Ryabko. Practical application of universal codes to time series forecasting // 2009
XII international symposium on problems redundancy in information and control systems, proceedings. P. 10-15.
7. B. Ryabko, V. Monarev. Experimental investigation of forecasting method based on data compression algorithms. Problems of information transmission. 2005. V.41, №1. P. 65-69.
8. П. А. Приставка. Экспериментальное исследование метода прогнозирования основанного на универсальных кодах // Вестник СибГУТИ. 2010. №4. С. 26 – 35.
9. А. С. Лысяк, Б. Я. Рябко. Прогнозирование временных рядов на основе универсальной
меры и деревьев решений // Вестник СибГУТИ. 2014. №2. С 57 – 71.
10. R. Krichevsky. Retrieval and data compression complexity // Proc. Int. Congr. Math. Berkley.
1986. P. 1461-1468.
Милешко Антон Владимирович
аспирант кафедры прикладной математики и кибернетики СибГУТИ,
e-mail: anton.mileschko@yandex.ru.
The use universal coding for forecasting macroeconomic indicators
A. Mileshko
The description of the method of time series prediction based on a universal measure. The results of case studies on predicting US macroeconomic indicators, such as the nominal gross domestic product, unemployment rate, AAA corporate bond yield, BAA corporate bond yield. For
comparison, the results published in the report of the American Statistical Association and the
National Bureau of Economic Research.
Keywords: forecasting, universal measure, time series.
284
Построение иерархического меню при помощи кодов сжатия данных
Построение иерархического меню при помощи
кодов сжатия данных
И. В. Нечта
В данной статье рассматриваются основные принципы, используемыепри построении оптимального иерархического меню. Автором предложен подход, позволяющий минимизировать среднее количество переходов,при поиске нужного элемента в иерархии меню.
Показано, что задача минимизации может рассматриваться как задача построения оптимального кода, применяемого для сжатия данных.
Ключевые слова: Оптимизация интерфейса, закон Хика, иерархическое меню.
1. Введение
Для эффективного взаимодействия пользователя и программного приложения используется графический интерфейс. Считается, что чем быстрее пользователь отдает команды приложению, тем более эффективно спроектирован интерфейс. Проблема поиска оптимального
интерфейса рассматривается не только в программных приложениях, но и для представления
информации на web-страницах или в других средах человеко-машинного взаимодействия.Одной из основных задач, решаемых в рамках данной проблемы, следует считать подбор цветовой гаммы для представления элементов интерфейса. Здесь учитывается биологические особенности зрительного восприятия человека. Так, неправильно подобранный цвет
фона может утомлять глаза, что быстро приводит к снижению концентрации внимания, и соответственно, скорости работы пользователя. Другой задачей,связанной с оптимизацией, является выбор расположения элементов пользовательского интерфейса относительно друг
друга. Известно, что пользователь взаимодействует с компьютером посредством клавиатуры
и манипулятора типа «мышь». Соответственно, при проектировании интерфейса, необходимо учитывать частоту переноса рук с одного устройства на другое, скорость наведения курсора мыши и другие факторы.
Проблема оптимизации интерфейса привлекает внимание многих исследователей. В работе [1]показаны основные принципы зрительного восприятия и даны рекомендации по выбору формы и цвета графических элементов интерфейса. В других работах [2,3] рассматривались размер и взаимное расположение элементов на экране и относительно друг друга.Был
сформулирован закон Фиттса, согласно которому среднее время, затрачиваемое пользователем для перемещения курсора мыши и нажатия по кнопке, тем меньше, чем больше размеры
этой кнопки. Возвращаясь к работе [1], наиболее выгодным расположением кнопки на
экране (по крайней мере, для пользователей-правшей) следует считать правый верхний угол.
Например, это учитывалось при размещении кнопок управления окном (закрыть, свернуть)
в операционных системах семейства Windows.
Одним из ключевых элементов пользовательского интерфейса следует считать иерархическое меню, которое содержит в себе основные и наиболее необходимые операции для взаимодействия с приложением.Задача оптимальной расстановки пунктов меню рассматривалась во многих работах, например в[4−6], были предложены различные подходы, однако до
сегодняшнего момента нет единого мнения по данной проблеме. Задача оптимизацииинтерфейса является междисциплинарной и должна рассматриваться не только с точки зрения
теории информации, но и с точки зрения психофизиологических особенностей работы человеческого мозга в момент принятия выбора.
285
В настоящей работе предлагается новый подход к расстановке элементов пользовательского меню. Основным отличием такого подхода является применения универсальных кодов
сжатия данных для получения минимального среднего времени поиска нужного пункта меню.
2.Обзор базовых принципов оптимизации интерфейса
Обычно для оценки эффективности проектируемого меню используется среднее время
выбора нужного элемента. Экспериментальные оценки для одной и той же иерархии меню
могут существенно различаться для разных групп людей отличающихся между собой возрастом, полом, опытом работы с компьютером и др.В общем случае, мы можем рассматривать время взаимодействия пользователя с интерфейсом (время реакцииRT), при выборе
нужного пункта одноуровневого меню, как суммуследующих компонент1:
,
(1)
где
− время восприятия (прочтения) пункта меню,
− время принятия решения и выбора пункта меню. Восприятие элементов меню зачастую зависит от скорости чтения человека и скорости движения глаз по монитору. Подробнее это рассматривается в работах [7, 8].
Вторая компонента включает в себя время принятия решения пользователем и время для завершения ответа2.
Время принятия решения описывается законом Хика[4], устанавливающим логарифмическую зависимость времени от количества вариантов выбора. Надо отметить, что в ряде
экспериментов,представленных в публикациях [9−11],закон Хика не находил своего подтверждения. В других работах [12, 13]закон был достоверно подтвержден. Можно утверждать, что работа мозга полностью не изучена, следовательно,при различных постановках
эксперимента могут возникать труднообъяснимые аномалии. Тем не менее, при одинаковой
постановке экспериментов наблюдаетсявоспроизводимость результатов. В связи с этим мы
будем рассматривать только взаимодействие пользователя с меню компьютерной программы, где выбор осуществляется при помощи мыши.
Завершение выбора, определяющего время перемещение курсора мыши по экрану, может быть с высокой точностью описано законом Фитса. Согласно этому закону, чем больше
размер кнопки, тем легче наводить нее курсор, и в тоже время, для увеличения скорости ответа интерфейс должен позволять минимизировать движения курсора мыши. В общем случае эффективность интерфейса может быть оценена согласно модели GOMS [14], и сравнивая различные версии интерфейса,достигается выбор наиболее приемлемого варианта. Однако такая модель не дает никаких рекомендаций относительно дальнейшей оптимизациииерархии меню.
Самым простым способом размещения элементов в меню, скажем контактов в телефонном справочнике, является их сортировка в алфавитном порядке. В таком случае, считается,
что все элементы могут быть выбраны с равной вероятностью. При большом числе контактовданный подход становится неудобным, т.к. пользователь не видит сразу же все варианты
выбора. В таком случае применяется группировка. Причем группы могут иметь разный размер и разную кумулятивную вероятность выбора еѐ элементов. Например, часто используемые пункты меню, целесообразно выносить вверх иерархии. Следует также учитывать, что
некоторыепункты принципиально не могут быть размещены в одной группе, т.к. имеют
сильно различающуюся семантику.
Согласно результатам, полученным в работе [15], существуют две стратегии взаимодействия пользователя с меню:
1
2
Будем считать, что пункты меню уже отображены на экране.
Под завершением подразумевается перенос курсора мыши и нажатия на кнопку.
286
исчерпывающий поиск – пользователь полностью просматривает все элементы
меню,и затем принимает решение о выборе наиболее подходящего для него;
 последовательный поиск – пользователь последовательно просматривает варианты, до тех пор, пока не встретит нужный.
В статье [5], утверждалась, что оптимальной структурой меню для исчерпывающего поиска следует считать однородное дерево, в котором каждый уровень иерархии имеет одинаковый размер и одинаковую кумулятивную вероятность. Для последовательного поиска более подходящим является неоднородная структура. С одной стороны, следует отобразить в
верхнем уровне меню как можно больше элементов, чтобы пользователь не переходил
вглубь иерархии. С другой стороны,слишком большой уровень затрудняет визуальное восприятие информации. Таким образом, следует искать баланс между глубиной и шириной
иерархии.
В работах [16, 17]экспериментально показано, для стратегии последовательного поиска в
64-х элементном меню наиболее эффективной оказалась двухуровневая структура по 8х8 и
4х16 элементов на верхнем и нижнем уровне соответственно. В статье [18] подчеркивалось,
что поиск оптимального меню является NP-сложной задачей, если перебирать все варианты
и учитывать группировку сильно различающихся по смыслу элементов с помощью некоторой функции штрафа. В данной работе предлагается подход, который позволяет построить
оптимизированную по числу переходов иерархию меню при помощи кодов сжатия данных.
В качестве функции штрафа здесь может выступать обычная избыточность кода.

3.Описание предлагаемого подхода
Рассматривая стратегию последовательного поиска можно увидеть, что для оптимизации
нам необходимо получить минимальное среднее время доступа к каждому элементу меню в
иерархии. Данная задача, может быть сведена к построению оптимального кодового дерева,
при известном распределении вероятностей выбора пунктов меню.Здесь для упрощения мы
будем строить меню с двумя элементами на уровне.
Рассмотрим более подробно предлагаемый подход на следующем примере.Пусть имеют} и известно распределение вероятностей обра{
ся пункты меню
{
} Построим оптимальный код Хаффмана3 для
щения к ним
заданного алфавита.
Таблица 1. Код Хаффмана
Символ алфавита
Вероятность
0.5
0.2
0.1
0.1
0.05
0.05
Кодовое слово
0
10
110
1110
11110
11111
Теперь построим меню на основе полученного кода. Здесь строится обычное кодовое
дерево и затем, если узел дерева содержит левую и правую ветви, то в меню он представля{
}. В итоге получитсядерево, представленное на
ется как группирующий пункт
рис. 1.
Как уже ранее было отмечено, один уровень меню может содержать от четырѐх до
восьми пунктов. В таком случае мы переходим от двоичных кодов к кодам с другим основанием системы счисления.В дальнейшем нужно будет учесть множество других факторов, ко3
Код имеет минимальную избыточность.
287
торые могут повлиять нарасположение элементов в кодовом дереве. Например, некоторые
пункты меню не могут быть сгруппированы вместе из-за сильно различающегося смысла.
Значит, у нас будет появляться некоторая избыточность.Очевидно, что чем меньше избыточность полученногокода, тем более эффективно будет построена иерархия меню.
Рис. 1. Оптимизированное меню
Рис. 2. Среднее число переходов по иерархии меню
Теперь определим, как будет расти средняя длина кодового слова при увеличении общего числа элементов меню. В работе [6] было показано, что у наблюдаемой группы пользователей телефоном распределение вероятностей вызовов на различные номера подчиняется закону Ципфа. Мы также будем использовать данное распределение вероятностей при моделировании.На рис. 2 представлен график зависимости среднего количества переходов по
иерархии меню от общего количества пунктов меню. Меню построены по вышеописанным
схемам. На графике представлены кривые для различных размеров (от двух до восьми) уровняменю.
Мы видим, что для некоторого числа пунктов менювыбор максимальной ширины одного
уровня иерархии не всегда дает минимум. На представленном графике мы видим лишь ниж-
288
ние границы размера одного уровня меню. Верхние границы следует оценивать с учетом
психофизиологических свойств человека. В дальнейшем также планируется построить код
для неравномерной иерархии.
Литература
1. Gibson J. J. The ecological approach to visual perception. – Psychology Press, 2013.
2. Kabbash P., Buxton W. (1995). The "Prince" Technique: Fitts’ Law and Selection Using Area
Cursors. Proceedings of CHI'95, P. 273–279.
3. Fitts P. M. "The information capacity of the human motor system in controlling the amplitude
of movement". Journal of Experimental Psychology 47 (6). (June 1954). P. 381–391.
doi:10.1037/h0055392. PMID 13174710.
4. Hick W.E. On the rate of gain of information. Quarterly Journal of Experimental Psychology, 4,
1952. P. 11–26.
5. Губко М.В., Даниленко А.И. Математическая модель оптимизации структуры иерархического меню // Проблемы управления. 2010. №4. С. 49-58.
6. Witten I. H., Cleary J. G., Greenberg S. On frequency-based menu-splitting algorithms
//International Journal of Man-Machine Studies. – 1984. – Т. 21. – №. 2. – P. 135-148.
7. Aaltonen A., et al. 101 spots, or how do users read menus? //Proceedings of the SIGCHI conference on Human factors in compu-ting systems. – ACM Press/Addison-Wesley Publishing Co.,
1998.P. 132–139.
8. Goldberg J. H., Wichansky A. M. Eye tracking in usability evaluation: A practitioner’s guide
//To appear in: Hyönä. – 2002.
9. Dassonville P, et al.Choice and stimulus–response compatibility affect duration of response selection. Cognitive Brain Research. 1999;7. P. 235–240.
10. Wright C. E., et al. Visually guided, aimed movements can be unaffected by stimulus–response
uncertainty. Experimental Brain Re-search. 2007;179. P.475–496.
11. Leonard J. A. Tactual choice reactions: I. Quarterly Journal of Experimental Psychology.
1959;11.P. 76–83.
12. Berryhill M., et al. Effects of directional uncertainty on visually-guided joystick pointing. Perceptual and Motor Skills. 2005;100. P. 267–274.
13. Schneider D. W., Anderson J. R. A memory-based model of Hick’s law //Cognitive Psychology.
– 2011. – Т. 62. – №. 3. – P. 193-222.
14. Card S. K. et al. The psychology of human-computer interaction. – 1983.
15. Lee E., Macgregor R. Minimizing user search time in menu retrieval systems. Human factors,
27(2), 1985, P.157–162.
16. Kiger J. I. The depth/breadth trade-off in the design of menu-driven user interfaces
//International Journal of Man-Machine Studies. – 1984. – Т. 20. – №. 2. – P. 201–213.
17. Zaphiris P. G. Depth vs Breath in the Arrangement of Web Links //Proceedings of the Human
Factors and Ergonomics Society Annual Meeting. – SAGE Publications, 2000. – Т. 44. – №. 4.
– P. 453–456.
18. Bailly G., et al.Menuoptimizer: Interactive optimization of menu systems //Proceedings of the
26th annual ACM symposium on User interface software and technology. – ACM, 2013. – P.
331–342.
289
Нечта Иван Васильевич
к.т.н., доцент кафедры прикладной математики и кибернетики СибГУТИ, начальник отдела подготовки кадров высшей квалификации «СибГУТИ» (630102, Новосибирск, ул. Кирова, 86) тел. (383) 2-698-358, e-mail: www@inbox.ru.
Construction hierarchical menus by data compression codes
I. Nechta
This article discusses the basic principles used for the construction of optimal hierarchical
menu. The author suggests an approach which minimizes the average number of transitions in
finding the right item in the menu hierarchy. It is shown that the problem can be considered as
the minimization problem of finding an optimal code used for data compression.
Keywords: interface optimizing, Hick Law, hierarchical menu.
290
Оценека и повышение эффективности сетей доставки данных
Оценка и повышение эффективности
сетей доставки данных
П.А. Приставка, О.А. Ключникова, И.В. Климова
Сети доставки данных (CDN) помогли преодолеть ограничение Интернета по скорости и
надежности доставки информации до конечного пользователя путем размещения копий
данных с оригинального сервера на географически распределенных кэш серверах. Благодаря этому CDN сети получили широкое внимание со стороны научного сообщества.
Предметом различных исследований стали инфраструктура CDN-сетей, технология распределения данных, механизмы балансировки нагрузки и маршрутизации, управление
кэш-памятью. В работе описывается предложенный Б.Я. Рябко
теоретикоинформационный подход для оценки пропускной способности CDN-сетей, а также производится экспериментальная оценка сетей с различной конфигурацией с целью продемонстрировать возможности метода при применении его на практике.
Ключевые слова: CDN-сети, оценка пропускной способности, кэширующие сервера.
1. Описание подхода
Интернет эволюционирует из сети коммуникации в глобальную платформу для бизнеса,
развлечения, средств массовой информации и общения, при этом сам Интернет не был предназначен для широкого распространения самой различной цифровой информации и для
обеспечения надежного и быстрого доступа к ней пользователей. Эта проблема в настоящий
момент решается с помощью CDN сетей, чья производительность зависит и в том числе от
эффективности распределения данных на кэширующих серверах.
В работе Б.Я. Рябко «Using information theory to study the efficiency and capacity of caching
in the computer networks» предлагается основанный на теории информации подход для оценки пропускной способности сети, который кратко может быть описан следующим образом.
и некоторым набором файлов
Рассмотрим сеть Ω с количеством узлов n (w1 ,..., wn)
F  F 1,..., F k , . Время передачи файла f  F i различно для каждого узла, при этом файл загружается с узла с минимальным временем передачи. Обозначим время чтения файла f узлом wi из узла w j через T ij ( f ) и находим время загрузки файла узлом wi по формуле:
T wi  min j T ij ( f )
Задачей f ' будем считать последовательность файлов f 1... f s , s  1 , считываемую узлом
wi . И время загрузки такой последовательности будет вычисляться как сумма времен загрузки каждого файла из этой последовательности:
T w j ( f ') 
s
T w j ( f k )
k 1
Положим, что  i - количество задач, которые могут быть выполнены узлом wi время T :
wi (T )  { f ': T wi ( f ' )  T }
Так как  i растѐт экспоненциально, то определим пропускную способность узла wi как:
291
C ( wi )  lim sup
T 
log i (T )
T
Пропускной способностью сети будет являться сумма пропускных способностей всех еѐ
узлов:
C ()   C ( w)
w
2. Экспериментальные результаты
В рамках работы была разработана программная модель сети доставки данных, которая
на основе таких входных данных, как ѐмкость и количество кэш серверов, количество конечных пользователей, скорость передачи данных от каждого сервера и структура сети, вычисляет пропускную способности сети. Структура моделируемой сети представлена на рис.
1.
Оригинальный сервер
Кэшсервер 1
Клиент 1
Кэшсервер 2
Кэшсервер 3
Клиент 2
Клиент 3
Рис. 1. Структура моделируемой CDN-сети
Для того чтобы показать зависимость пропускной способности сети от еѐ состояния, мы
изменяли скорость передачи данных от оригинального сервера и количество информации,
которое может содержать в себе кэширующий сервер. Уменьшая второй параметр, мы увеличивали вероятность того, что для удовлетворения запроса пользователя может произойти
вынужденное обращение к оригинальному серверу. И, соответственно, чем выше его скорость передачи, тем быстрее пользователь получит необходимые данные.
Результаты экспериментальных исследований, представленные в Таблице 1, показывают,
в первую очередь, зависимость от количества информации, которое может содержать кэш
сервер. Например, при количестве возможных записей равных 10, пропускная способность
не меняется с изменением скорости передачи от оригинального сервера, так как отпадает
необходимость в получении от него данных.
292
Таблица 1. Результаты экспериментальных исследований
3
5
10
10
0.682920
0.706303
0.738026
30
Скорость
канала
оригинального сервера, мбит/сек
Количество возможных записей в кэше
0.682924
0.706304
0.738026
Результаты исследований показывают, что применение предложенного метода на практике позволяет не только оценить пропускную способность сети аналитически, но и заранее, т.е. на этапе проектирования сформировать конфигурацию, обеспечивающую наилучшую пропускную способность.
Приставка Павел Анатольевич
к.т.н., доцент кафедры прикладной математики и кибернетики СибГУТИ, (630102, Новосибирск, ул. Кирова, 86) тел. (383) 2-698-272, e-mail: ppa@ngs.ru
Ключникова Ольга Александровна
ассистент кафедры прикладной математики и кибернетики СибГУТИ, (630102, Новосибирск, ул. Кирова, 86) тел. (383) 2-698-272, e-mail: craftytail@gmail.com
Климова Ирина Вячеславовна
ассистент кафедры прикладной математики и кибернетики СибГУТИ, (630102, Новосибирск, ул. Кирова, 86) тел. (383) 2-698-272, e-mail: irin.klimova@gmail.com
Estimation and increasing of CDN efficiency
P. Pristavka, O.Klyuchnikova, I. Klimova
Content delivery networks (CDN) are the tool to eliminate Internet limitations on speed and reliability of traffic delivery to ultimate user by allocation of original server data copies to geographically distributed cash servers. Due to this fact CDN are in the focus of scientist and research society. Among the main subjects for study are CDN infrastructure, data distribution
technologies, load balancing mechanisms, cash memory control. In this paper information theoretic approach suggested by B. Ya. Ryabko is described and also experimental estimation of capacity of CDNs with different configuration is accomplished to demonstrate the approach possibilities in practical application.
Keywords: CDN, capacity estimation, cashing servers.
293
Теоретическая оценка вычислительной способности современных мобильных устройств с процессором
Теоретическая оценка вычислительной способности
современных мобильных устройств с процессором
A. А. Ракитский, А. А. Величко
В докладе рассматриваются современные мобильные устройства с вычислительным процессором (ноутбуки, планшеты, смартфоны и т.д.). Рассматривается возможность применения метода оценки вычислительной способности компьютеров, предложенного Б.Я.
Рябко в работе [1]. Вычислительная способность - это характеристика, базирующаяся на
основных определениях теории информации и позволяющая оценить производительность
компьютера. В работах [2,3,4] рассмотрены современные процессоры Intel и AMD, в том
числе процессоры, на базе которых собираются ноутбуки, и предложен метод оценки их
вычислительной способности. В данном докладе отдельно рассматриваются процессоры,
используемые в мобильных устройствах, в том числе процессоры с архитектурой ARM.
Ключевые слова: вычислительная способность, компьютер, теория информации, оценка
производительности, архитектура компьютера, ARM, процессоры.
1. Введение
В 2014 году только в России было продано 26 миллионов единиц смартфонов. И эти показатели не включают продажи планшетов, ноутбуков, электронных книг, «умных» часов и
прочих подобных мобильных устройств. Ежегодно спрос на мобильные устройства с вычислительным процессором растѐт, и перед их производителями встают всѐ более сложные задачи для поддержания конкурентоспособности: повышение производительности, времени
работы, разработка более удобных моделей. Каждое следующее устройство должно быть
лучше предыдущего, иначе производитель рискует потерять свои позиции на рынке. Одной
из важнейших задач, с которой сталкиваются производители мобильных устройств – это повышение производительности устройства (как правило, эта задача рассматривается в комплексе с увеличением времени работы устройства от аккумулятора, что еѐ только усложняет).
При разработке нового процессора для устройства, необходимо иметь средства объективной оценки производительности, чтобы сравнивать его с предыдущими моделями и подбирать оптимальный вариант конфигурации архитектуры. В настоящее время для оценки
производительности устройств используются только бенчмарки – наборы тестовых задач,
которые выполняются на устройстве и оценивают такие характеристики как время выполнения задач, объемы использованной в процессе выполнения памяти и т.д. Основная проблема
в использовании этого инструмента заключается в необходимости иметь полноценную рабочую модель оцениваемого устройства. Кроме того, необходимо учитывать, что бенчмарк
оценивает работу устройства на конкретном конечном наборе задач, а не рассматривает все
возможные задачи, что делает этот способ необъективным.
В работе [1] Б.Я. Рябко предлагает использовать для оценки производительности характеристику вычислительная способность компьютера. Эта характеристика базируется на основных определениях теории информации Шеннона и позволяет оценить количество различных задач, которые могут выполниться на исследуемом компьютере за некоторое время.
Для определения вычислительной способности компьютера достаточно иметь описание его
архитектуры: список инструкций и время их выполнения, количество и устройство конвейеров и информация обо всех видах доступной памяти. В работах [2,3,4] предложен метод
оценки вычислительной способности современных реальных компьютеров на базе процессо294
ров Intel и AMD. Кроме того метод применѐн для оценки вычислительной способности суперкомпьютеров и во всех случаях применения показывает хорошие результаты, опубликованные в работе [5]. Всѐ вышеописанное позволяет говорить о применимости этого метода и
к современным мобильным устройствам с вычислительным процессором, т.к. по сути, они
являются компьютерами. Более того, производительность современных смартфонов порой
даже превосходит производительность многих настольных компьютеров.
2. Оценка вычислительной способности мобильных устройств
2.1. Основные определения
Основные определения подробно описаны в [1] со всеми доказательствами. Однако
необходимо всѐ же дать некоторые пояснения, без которых понимание метода не будет полным. Компьютер – это некоторый набор инструкций и памяти . Для каждой инструкции
известно время еѐ выполнения
. Считаем, что все
являются целыми числами, а
их наибольший общий делитель равен 1. Вычислительной задачей компьютера является в
. При этом, если в задатаком случае последовательность инструкций
че встречается некоторый цикл, то его содержимое повторяется в задаче
столько раз,
сколько должен выполниться цикл. Время выполнения вычислительной задачи
определяется как
. Обозначим количество различных
задач, время выполнения которых , как
Определение 1. Пусть есть компьютер с набором инструкций , и пусть
– время
. Тогда вычислительная способность
будет представлена
выполнения инструкции
как
Утверждение 1. Данный предел существует, когда
– конечное множество, времена
выполнения
– целые числа и их наибольший общий делитель равен 1.
Доказательство данного утверждения, как и более подробное описание метода, приводится в
работе [1].
Рассмотрим случай, когда все последовательности инструкций в вычислительной задаче
допустимы. Тогда можно считать, что - это алфавит, а вычислительная задача – это слово
над этим алфавитом. В таком случае может быть применѐн метод определения пропускной
способности канала без потерь, предложенный Шенноном в [6]. Можно считать такую значение верхней границей оценки, т.к. если какие-либо последовательности инструкций недопустимы, то множество всех допустимых последовательностей будет являться подмножеством всех последовательностей инструкций.
Пусть имеется компьютер с набором инструкций , время выполнения которых
, и все последовательности инструкций разрешены. В этой ситуации возможно
применение описанного выше метода оценки вычислительной способности, предложенного
равна логарифму от наибольшего
Шенноном. Суть этого метода заключается в том, что
действительного решения
уравнения:
где
Иначе говоря,
295
2.2. Вычислительная способность процессоров с архитектурой PM.
Процессоры семейства Pentium M были представлены компанией Intel в 2003м году и являлись частью платформы для ноутбуков Carmel. Особенностью этих процессоров является
низкое энергопотребление при достаточно высокой производительности. Архитектура PM в
основе своей мало отличается от архитектуры предшествующего семейства процессоров P6.
Основные стадии конвейера в процессоре остались теми же: предсказание переходов, выборка команд, декодирование инструкций, переименование регистров, переупорядочивание команд, очередь ожидания исполнения, исполнительные модули, обратное переупорядочивание и восстановление регистров. Естественно многие из этих модулей были улучшены и переработаны, кроме того, из существенных изменений, затрагивающих оценку вычислительной способности, можно отметить появление fused операций. За счѐт этих операций появилась возможность существенно повысить пропускную способность некоторых блоков, предшествующих исполнительному блоку. Подробное описание их влияния на определение вычислительной способности можно найти в [3], а описание самих операций в [7]. Так же в работе [3] можно найти и подробное описание самой архитектуры. При помощи разработанного программного комплекса [8,9,10] было составлено характеристическое уравнение для
данной микроархитектуры процессора. Получившееся уравнение в виде, предлагаемом после
всех преобразований программного комплекса, содержит 1388 слагаемых. Тем не менее, после приведения всех подобных слагаемых, уравнение приобретает следующий вид:
Решение данного уравнения
, откуда следует, что вычислительная способность
бит/такт. Необходимо учесть, что в данном процессоре одновременно могут выполняться 3 потока инструкций в конвейере, а это значит, что можно их
бит/такт. Расрассматривать, как 3 параллельных конвейера. Откуда получаем
смотрим один из самых распространѐнных процессоров данного семейства с частотой 1.6
ГГц, для которого вычислительная способность составит 81
Гбит/сек.
3. Архитектура процессоров ARM
Архитектура ARM – это микропроцессорная архитектура с набором команд RISC, разрабатываемая компанией ARM Limited. Преимущество архитектуры заключается в небольшом
наборе простых команд, которые обрабатываются с минимальными затратами энергии, что
позволяет ARM-процессорам находить большое применение: недорогие и энергоэффективные чипы используются в мобильных устройствах, встраиваемых системах, сетевом оборудовании и измерительных приборах.
ARM Limited не является производителем микросхем, компания занимается лишь разработкой микропроцессоров и их лицензированием для фирм, которые уже занимаются производством чипов. Среди этих компаний: AMD, Apple, Analog Devices, Atmel, Xilinx, Altera,
Cirrus Logic, Intel, Marvell, NXP, STMicroelectronics, Samsung, LG, MediaTek, MStar, Qualcomm, Sony, Texas Instruments, nVidia, Freescale,Миландр, HiSilicon.
С технической точки зрения называть чипы архитектуры ARM процессорами не совсем
верно, ведь помимо одного или нескольких вычислительных ядер они включают целый ряд
сопутствующих компонентов. Более уместными в данном случае являются термины однокристальная система и система-на-чипе (от англ. system on a chip (SoC)). Так, новейшие однокристальные системы для смартфонов и планшетных компьютеров включают в себя контроллер оперативной памяти, графический ускоритель, видеодекодер, аудиокодек и опционально модули беспроводной связи. Узкоспециализированные чипы могут включать дополнительные контроллеры для взаимодействия с периферийными устройствами, например датчиками.
296
Рассмотрим непосредственно архитектуру ARM. Конвейер этих процессоров имеет довольно простую структуру. В отличие от рассмотренного выше процессора Intel, конвейер
ядра процессора ARM имеет в большинстве случаев всего 3 блока (в более поздних моделях
количество блоков расширено до 5). Это блок выборки инструкций, блок дешифрации и блок
выполнения. Инструкции реализованы довольно просто, и во многих случаях инструкция
выполняется за 1 такт процессора. Кроме того, все процессоры ARM поддерживают несколько режимов работы, каждый из которых характеризуется своим набором инструкций.
Таким образом, для оценки вычислительной способности процессоров с архитектурой
ARM, необходимо оценить вычислительную способность работы процессора в каждом из
режимов, для этого необходимо иметь список инструкций, соответствующий этому режиму
(данная информация является открытой и легкодоступной), а так же знать время выполнения
каждой инструкции (здесь многое зависит от конкретной реализации процессора). При наличии этих данных, можно легко построить характеристическое уравнение для каждого из режимов и оценить вычислительную способность процессора при работе в нѐм. Далее может
быть множество способов использования полученных данных. Например, при сравнении
процессоров ARM между собой: можно выделить слабые и сильные стороны процессора,
продумать возможность внесения изменений для устранения недостатков, сравнить разные
режимы работы.
4. Заключение
Таким образом, в докладе показано, что метод оценки вычислительной способности компьютеров может быть применѐн и к мобильным устройствам с процессором. Более того, т.к.
процессоры с архитектурой ARM используются практически во всех современных портативных устройствах, в которых требуется наличие вычислительного блока, то появляется возможность оценивать весь этот широкий спектр устройств. Это может пригодиться как пользователям, для сравнения моделей устройств между собой, что позволяет подобрать более
выгодный вариант для покупки, так и производителям устройств, которые могут на этапе
разработки процессора, оценить его и сравнить с уже существующими процессорами, чтобы
наиболее оптимально подобрать конфигурацию и избежать расходов на создание рабочей
модели.
Литература
1. Ryabko B. An information-theoretic approach to estimate the capacity of processing units //
Performance Evaluation. 2012. V. 69, P. 267-273.
2. Rakitskiy A., Ryabko B., Fionov A. Evaluation of computer capacity for P5 intel processors //
Problems of Redundancy in Information and Control Systems (RED), 2012 XIII International
Symposium. St. Petersburg, 5-10 Sept. 2012. P. 70-73.
3. Ракитский А.А. Теоретическая оценка вычислительной способности процессоров Intel //
Вестник СибГУТИ. 2013.3 с. 29-45.
4. Ракитский А.А. Использование вычислительной способности как характеристики для
оценки и сравнения суперкомпьютеров // Вестник СибГУТИ. 2013.4 с. 67-84.
5. Ракитский А.А., Рябко Б.Я., Фионов А.Н. Аналитический метод сравнения и оценки производительности компьютеров и вычислительных систем. // Вычислительные технологии, 2014, Том 19, № 4, с. 84-98.
6. Shannon C. E. A mathematical theory of communication // Bell Sys. Tech. J. 1948. V. 27, P.
379-423, P. 623-656.
7. Fog A. The microarchitecture of Intel, AMD and VIA CPUs An optimization guide for assembly programmers and compiler makers. Copenhagen University College of Engineering. 201202-29. URL: http://www.agner.org/optimize/ (Дата обращения: 04.12.2014).
297
8. Ракитский А.А., Рябко Б.Я., Фионов А.Н. Программа нахождения вычислительной способности по характеристическому уравнению. № гос. регистрации 2013619017.
9. Ракитский А.А. Программа для преобразования списка инструкций компьютера в характеристическое уравнение. № гос. регистрации 2013619015.
10. Ракитский А.А. Программа для построения списка инструкций компьютера в требуемом
формате представления. № гос. регистрации 2013619014.
Ракитский Антон Андреевич
Старший преподаватель кафедры прикладной математики и кибернетики ФГОБУ ВПО
«СибГУТИ», тел.+7-923-101-1936, e-mail: rakitsky.anton@gmail.com
Величко Анна Андреевна
Студентка группы ИП-10 факультета ИВТ ФГОБУ ВПО «СибГУТИ», тел. +7-913-70876-83, e-mail: velichko.sibsuti@gmail.com
Theoretical estimation of the computer capacity of modern mobile devices with processor
A. Rakitskiy, A. Velichko
The main goal of this paper is the computer capacity of modern mobile devices with processor
(notebooks, tablets, smartphones, etc.). We try to investigate the possibility of applying the
method, which described in [1] by B. Ryabko. The computer capacity is based on the main concepts of information theory. It helps to evaluate the performance of computers. Intel and AMD
modern processors, including the processors which used in notebooks, considered in [2,3,4] as
well as method of the evaluation of their computer capacity. Here we investigate the processors
used in mobile devices which includes processors with ARM architecture.
Keywords: computer capacity, computer, information theory, performance evaluation, computer architecture, ARM, processors.
298
Анализ временных рядов количества слушатлей ИДПО
Анализ временных рядов количества слушателей
ИДПО
Е.А. Темникова, В.С. Асламова
Статья посвящена анализу и моделированию временных рядов количества слушателей
курсов повышения квалификации на примере Института дополнительного
профессионального образования (ИДПО) Иркутского государственного университета
путей сообщения. В результате анализа временных рядов было выявлено отсутствие
тренда внутри года. Значения уровней временных рядов количества слушателей
двухнедельных и недельных курсов представляют собой сумму сезонной и случайной
компонент. Были найдены значения сезонной компоненты по месяцам. Доказано
подчинение временных рядов и рядов остатков нормальному закону распределения.
Проведен гармонический анализ усредненных значений временных рядов количества
слушателей за период с 2002 г. по 2014 г., получены ряды Фурье, приведены критерии их
статистической значимости.
Ключевые слова: статистический анализ, временные ряды, тренд, сезонная компонента,
гармоническое распределение Фурье.
1. Введение
Эконометрическую модель можно построить, используя ретроспективные временные
ряды. Каждый уровень временного ряда формируется под воздействием большого числа
факторов, которые условно можно подразделить на три группы:
 факторы, формирующие тенденцию ряда;
 факторы, формирующие циклические колебания ряда;
 случайные факторы.
При различных сочетаниях этих факторов зависимость уровней ряда от времени может
принимать разные формы [1].
Известно, что спрос на любую продукцию, в том числе и на оказания образовательных
услуг, имеет фазы начального роста, наивысшего уровня и спада [2]. С точки зрения
выработки правильного управленческого решения включение периодических (сезонных)
колебаний в модель будет способствовать повышению эффективности прогноза и позволит
предсказывать ожидаемые высокие и низкие значения прогнозирования количества
слушателей.
2. Анализ временных рядов
Был проведен анализ числа слушателей двухнедельных (k2), недельных (k1) курсов
повышения квалификации и семинаров (kc) за период с 2002 г. по 2013 г. (t = 1, 2,…,12) с
целью выявления общей тенденции развития временных рядов. На рис. 1, 2 представлены
гистограммы, описывающие распределение количества слушателей k2, k1 по месяцам за
рассматриваемый период времени [3]. Судя по рис. 1 и 2, временные ряды k2, k1 имеют
сезонную составляющую.
На рис. 3, 4 представлены гистограммы частот (плотности) распределения слушателей
ИДПО за период с 2002 г. по 2013 г., полученные при обработке данных в пакете
STATGRAPHICS Centurion XV.I, где по оси ординат – описана частота, с которой
299
встречается значение числа слушателей за взятый период времени, а по оси абсцисс –
распределение количества слушателей для двухнедельных, недельных курсов и семинаров.
Оптимальное количество столбцов и их ширина определятся автоматически в
STATGRAPHICS Centurion XV.I.
Рис. 1. Временной ряд количества слушателей
двухнедельных курсов
по месяцам с 2002 г. по 2014 г.
Рис. 2. Временной ряд количества слушателей
недельных курсов
по месяцам с 2002 г. по 2014 г.
Рис. 3. Гистограмма частоты распределения
числа слушателей
двухнедельных курсов с 2002 г. по 2013 г.
Рис. 4. Гистограмма частоты распределения
числа слушателей
недельных курсов с 2002 г. по 2013 г.
Интегральная функция нормального распределения количества слушателей ki i-го вида
курсов (i = 1, 2) вычислялась по формуле:
 x  M 2 
ki
1

ki 
Fk i  
dx ,
(1)
 exp  

2
2   ki  
2

ki


1 156
где M ki 
 kij – средневыборочное значение,  ki – выборочное среднеквадратическое
156 j 1
отклонение.
Моменты третьего и четвертого порядков A и E позволяют определить подчинение
временного ряда закону нормального распределения. Если выполняются условия:  2  A  2
и  2  E  2 , тогда временной ряд подчиняется закону нормального распределения, если
значения характеристик A и E выходят за пределы указанного диапазона, то не
подчиняется [4]. Выборочная характеристика асимметрии A определялась по формуле:
300
A
1 156
 Et 3
156 j 1
,
(2)
3
 1 156

2

E t 
 156 j

1


где E(t) – случайная компонента (абсолютная ошибка).
Выборочная характеристика эксцесса (характеристика временного ряда) E определялась
по формуле:
1 156
 Et 4
156 j 1
3.
E
(3)
4
 1 156


E t 2 
 156 j

1


с
Значения статистических характеристик: математическое ожидание
M ki
доверительным интервалом p = 95%; выборочное среднеквадратическое отклонение  ki ;
коэффициент вариации Vв; выборочная характеристика асимметрии A ; выборочная
характеристика эксцесса E ; минимальные и максимальные значения временных рядов
приведены в табл. 1.
Таблица 1. Основные статистические значения для k1 и k2
k1
k2
kс
M ki при p=95%
137.991  13.454
119.338  10.412
52.08  12.164
 ki
70.8654
51.35%
9.0
343
1.24227
-0.61217
60.704
36.85%
5.0
266.0
1.66958
-0.99556
42.8013
82.18%
1.0
172.0
3.12861
1.13739
Значения
Vв
min значение
max значение
A
E
На рис. 5, 6 представлены сопоставления данных временных рядов со значениями,
рассчитанными по формуле (1).
Выявлено, что интегральные функции распределения уровней временных рядов k2, k1
удовлетворяют нормальному закону распределения (см. рис. 5, 6), т.к. выполняются условия:
 2  A  1,66958  2 и  2  0,995566  E  2 , а для k1:  2  A  1,24227  2 и
 2  0,612171  E  2 (см. табл. 1).
Рис. 5. Сопоставление временного ряда k2 с
нормальным распределением
Рис. 6. Сопоставление временного ряда k1 с нормальным
распределением
301
Временной ряд kc не подчиняется нормальному закону распределения, моменты 3-го и 4го порядков выходят за пределы указанного диапазона (см. табл. 1). О ярко выраженной
тенденции или наличии сезонной компоненты тоже нельзя утверждать. Это можно
объяснить тем, что большинство курсов повышения квалификации слушателей ИДПО
основано на сорока часовой (k1) и семидесяти двух часовой (k2) образовательных
программах.
3. Представление временного ряда в виде математической модели
Обобщенная модель временного ряда может быть представлена в аддитивной форме [4]:
(4)
Y t   U t   V t   Et   Z t   i ,
где U(t) – компонента, характеризующая общую тенденцию временного ряда (тренд); V(t) –
сезонная компонента; E(t) – случайная компонента; Z(t) – компонента, обеспечивающая
сопоставимость элементов временного ряда; ηj – управляющая компонента (путем
воздействия на члены временного ряда позволяет формировать желаемую траекторию его
развития) [1].
Поскольку при первичном анализе временных рядов k2, k1 и kc ярко выраженного тренда
не наблюдается, в отличие от периодического спада количества слушателей в летний период
времени, характеризующего наличие сезонности (цикличности), это видно из рис. 1, 2, было
решено построить аддитивную модель сезонности, которая позволит описать временной ряд
как:
(5)
Y t   V t   E t  .
Компоненты Z(t) и ηj не вносят существенной погрешности в прогноз количества
слушателей, так как применяется одинаковая методика расчета количества слушателей (Z(t)
= 0) и управляющая компонента не используется.
Процесс построения модели включает в себя следующие этапы [1]:
 выравнивание исходного ряда (механические методы: по двум точкам, скользящей
средней, взвешенной скользящей средней; аналитические методы);
 расчет значений сезонной компоненты V(t);
 устранение сезонной компоненты из исходных уровней ряда и получение абсолютной
случайной ошибки E t   Y t   V t  .
3.1. Расчет значений сезонной компоненты
Выравнивание исходного ряда
Обратимся к данным о количестве слушателей двухнедельных, недельных курсов и
семинаров за период с 2002 г. по 2013 г. и осуществим выравнивание исходных уровней ряда
методом скользящей средней, который позволяет повысить точность расчета сезонной
волны, за счет снижения чувствительности к случайным колебаниям.
Значения сглаженного ряда определяются по трехчленной скользящей средней:
Y t  1  Y t   Y t  1
, при t = 2, 3,…,12n,
Y1 t  
(6)
3
где t – номер месяца, n – номер года.
Центрированная скользящая средняя определяется по формуле:
Y t  1  Y1 t 
, t = 3, 4,…,12n.
Y2 t   1
(7)
2
Расчет значений сезонной компоненты
Зачастую при разделении сезонной и случайной компонент первой вычленяют сезонную
компоненту, а оставшуюся часть временного ряда относят к случайной составляющей.
Оценка сезонной компоненты находится как разность между фактическим уровнем ряда
302
и центрированной скользящей средней:
Vc t   Y t   Y2 t  , t= 3, 4,…,12n.
Сезонная компонента определяется по формуле:
V t   Vcp t   k ,
(8)
(9)
где Vcp t  – средняя оценка сезонной компоненты; k – корректирующий коэффициент.
1 12
(10)
 Vcp t  .
12 t  3
Полученные значения сезонных компонент V(t) и средние оценки сезонных компонент
Vcp(t) по месяцам (t = 1, 2,…,12) за период с 2002 г. по 2013 г. для двухнедельных k2 и
недельных k1 курсов приведены в табл.2, 3.
k
Таблица 2. Значения сезонной компоненты для k2
при корректирующем коэффициенте k =0,3696
Значения
 Vc t 
Vcp t 
V t 
Значения
Vc t 
Vcp t 
V t 
Номер месяца
4
1
2
3
-401.331
446.163
132.666
101.333
5
6
-343.331
-257.6643
-36.4846
40.560
11.055
8.444
-28.610
-21.472
-36.8543
40.1905
10.6858
8.0747
-28.9806
-21.8417
7
8
9
-320.831
-289.763
393.663
449.164
-26.7359
-24.1469
32.8052
37.4303
41.666
-30.0755
-27.1056
-24.5166
32.4355
37.0606
41.2967
-30.4452
Номер месяца
10
11
12
458.331
-330.831
Проверим условие равенства нулю суммы значений V(t):
12
 V t   36,8543  40,1905  10,6858  8,0747  28,9806  21,8417  27,1056 
t 1
 24,5166  32,4355  37,0606  41,2967  30,4452  0.
Таблица 3. Значения сезонной компоненты для k1
при корректирующем коэффициенте k = 0,320
Значения
Vc t 
Vcp t 
V t 
Значения
Vc t 
Vcp t 
V t 
Номер месяца
4
1
2
3
5
6
-345.497
11.500
133.000
134.165
-112.333
375.830
-31.4088
1.0455
11.0833
11.1804
-9.3611
31.3192
-31.7292
0.7251
10.763
10.860
-9.6815
30.9988
Номер месяца
9
10
7
8
11
12
-636.998
-474.330
450.999
458.163
43.999
31.167
-53.0832
-39.5275
37.5833
38.1803
3.999
2.8334
-53.4035
-39.8479
37.2629
37.8599
3.6795
2.513
Проверим условие равенства нулю суммы значений V(t):
303
12
 V t   31,7292  0,7251  10,763  10,86  9,6815  30,9988  53,4035 
t 1
 39,8479  37,2629  37,8599  3,6795  2,513  0.
Проверим распределение уровней ряда остатков E(t) на соответствие нормальному
закону распределения
Случайная компонента отражает стохастический характер экономического процесса,
влияние на него многочисленных факторов [5].
В случае, если распределение E(t) не является нормальным, то в математической модели
присутствуют неучтенные компоненты, одной из которых может быть U(t) – тренд.
Данное утверждение можно отвергнуть, т.к. из рис.7 и 8 видно, что распределение
уровней ряда остатков E(t) для k2 и k1 подчиняется нормальному закону распределения.
Рис. 7. Сопоставление ряда E(t)дляk2
с нормальным распределением
Рис. 8. Сопоставление ряда E(t)дляk1
с нормальным распределением
Значения выборочных характеристик асимметрии A и эксцесса E также попадают в
пределы указанных диапазонов:  2  A  2 и  2  E  2 (см. табл. 4.).
Таблица 4. Значения характеристик 3-го и 4-го порядков для E(t)
Значения
E(t)для k1
E(t)для k2
1.37894
1.54863
A
-1.62523
-1.44018
E
3.2. Гармонический анализ
Вычисление сезонной составляющей возможно с помощью гармонического анализа,
необходимым условием осуществления которого является исключение из ряда Y(t)
регулярной компоненты U(t).
Несмотря на то, что ранее было опровергнуто утверждение о наличие тренда, для
большей уверенности, было решено усреднить уровни временных рядов k2 и k1 по месяцам за
весь период с 2002 г. по 2013 г., что позволило свести регулярную компоненту к нулю U(t) =
0. Значения усредненных уровней временных рядов k2 и k1 приведены в табл. 5.
Осуществим гармонический анализ полученных в результате усреднения динамических
рядов k2C и k1C. Для этого разложим функцию R(t) (где R(t) = k2C(t) или R(t) = k1C(t)) в ряд
Фурье, который в общем виде записывается следующим образом [6]:

a
Rt   0   ak  cos kt  bk sin kt ,
(11)
2 k 1
2
; T – eѐ период (в нашем случае,
где ω – частота функции, которая определяется как:  
T
Т = 12 месяцев, годовой цикл); k – индекс текущей гармоники; a k , bk – коэффициенты ряда
304
Фурье.
Достоинства модели (11) состоит в том, что она обеспечивает стабильность прогноза
даже в точках цикла с наименьшими значениями прогнозируемой переменной, так как
коэффициенты вычисляются путем усреднения всего набора имеющихся данных, а не только
результатов наблюдений в пределах одного цикла [2].
С помощью программного приложения TableCurve 2D были получены гармонические
ряды Фурье k2C(t) и k1C(t) (см. формулы 12, 13) для временных рядов k2C и k1C, а также
значения коэффициентов a k , bk .
Чтобы определить основные закономерности временного ряда k2С, достаточно
ограничить гармонический ряд k2C(t) четырьмя членами ( 4  2 ), тогда его математическое
выражение будет иметь вид:
1





k 2C t   a0  a1  cos t  b1  sin t  a 2  cos t  b2  sin t  a3  cos t 
2
6
6
3
3
2
2
2

 b3  sin t  a 4  cos
t  b4  sin
t.
2
3
3
Подставим в выражение коэффициенты ak , bk :
k 2C t   



382,864
 31,49  cos t  801,1779  sin t  491,6596  cos t 
2
6
6
3
 63,44147  sin

3
t  22,15  cos

2
t  107,759  sin

2
t
(12)
2
2
t  29,4995  sin
t.
3
3
Для выявления основной закономерности временного ряда k1С, достаточно ограничить
гармонический ряд тремя членами ( 3  2 ), тогда его можно описать как:
1





k1C t   a0  a1  cos t  b1  sin t  a 2  cos t  b2  sin t  a3  cos t 
2
6
6
3
3
2
 15,3977  cos
 b3  sin

t.
2
Подставим в выражение коэффициенты a k , bk :
56,746935


k1C t  
 54,351623  cos t  49,252731  sin t 
2
6
6
 35,8571  cos
Период
с2002 г. по
2013 г.

3
t  73,7077  sin

3
t  79,809  cos

2
t  15,5437  sin

2
Таблица 5. Значения усредненных уровней временных рядов
Месяц
Январь
Февраль
Март
Апрель
Май
Июнь
Июль
Август
Сентябрь
Октябрь
Ноябрь
декабрь
Порядковый №
месяца
1
2
3
4
5
6
7
8
9
10
11
12
305
(13)
t.
Временной ряд
k2C
k1C
83.75
61.66667
162.5
84.66667
157.0833
103.0833
153.25
114.8333
85.66667
101.4167
50.75
129.0833
7.25
10.75
2.25
1.916667
88.58333
94.25
145.75
136.9167
179
128.1667
102.4167
126.6667
На рис. 9, 10 представлено сопоставление уровней рядов k2C и k1C с гармоническим
распределением Фурье.
Судя по рис. 9, 10, гармоническое распределение временных рядов количества
слушателей k2C и k1Cсвидетельствует об отсутствии тренда в зависимости от месяца года.
В табл. 6 приведены критерии статистической значимости полученных гармонических
рядов: коэффициент детерминации R2; скорректированный коэффициент детерминации R2c;
среднеквадратическая ошибка σki, математическое ожидание Мki при p = 95 %;
характеристики асимметрии A и эксцесса E .
Рис. 9. Сопоставление значений ряда k2C с распределением Фурье
Рис. 10. Сопоставление значений ряда k1C с распределением Фурье
Таблица 6. Критерии статистической значимости гармонических рядов
Гармонические
ряды
k2C(t)
k1C (t)
R2,%
 ki
Мki
A
E
98.09
71.69
42.88
101.521
25.7
91.118
-1.11154
0.636177
-0.870323
-0.185169
Полученные ряды Фурье (12), (13) можно использовать для прогноза количества
слушателей по месяцам, что позволит руководству ИДПО принимать оптимальные решения
по распределению бюджета, часов и ставок (нагрузки преподавателей), а также
формированию учебного графика.
306
Выполненный анализ временных рядов показал, что тренд существует только при
рассмотрении временного ряда по годам отдельно для каждого месяца. В работе [7]
представлены регрессионные модели для прогнозирования числа слушателей ИДПО в
летний период времени.
Литература
1. Елисеева И.И. Эконометрика: учебник / И.И. Елисеева, С.В. Курышева, Т.В. Костеева и
др.; под ред. И.И. Елисеевой. – 2-е изд., перераб. и доп. – М.: Финансы и статистика, 2007. – 576
с.
2. Исследование операций: в 2-х томах / Под ред. Дж. Моудера, С. Элмаграби. – Т. 2. – М.:
Мир, 1981. – 677 с.
3. Асламова В. С. Оценка числа слушателей ИДПО на основе адаптивной модели Брауна /
В. С. Асламова, Е. А. Темникова // Материалы 5-й междун. науч.-практ. конф. «Транспортная
инфраструктура Сибирского региона» в 2-х т., 2014. – Т. 1. – С. 274-278.
4. Кобелев Н.Б. Практика применения экономико-математических методов и моделей :
учеб.-практ. пособие / Н.Б. Кобелев. – М.: ЗАО «Финстатинформ». – 2000. – 246 с.
5. Гладилин А.В. Эконометрика: учебное пособие / А.В. Гладилин, А.Н. Герасимов, Е.И.
Громов. – М.: КНОРУС, 2006. – 232 с.
6. Борискин В. Гармонический волновой анализ: учебное пособие / В. Борискин – ДЦ
"Альпари", 2010. – 152 с.
7. Темникова Е.А. Алгоритмы принятия решений на основе регрессионных моделей оценки
числа слушателей ИДПО / Е.А. Темникова, В.С. Асламова // Современные технологии.
Системный анализ. Моделирование. – 2014. – № 1(41). – С. 197-201.
Темникова Елена Александровна,
аспирант кафедры «Техносферная безопасность» Иркутского государственного
университета путей сообщения (ИрГУПС), тел.: 8(950)080-78-58, е-mail: lenchik8907@mail.ru, temnikova_ea@bk.ru
Асламова Вера Сергеевна,
д.т.н., проф., профессор кафедры «Техносферная безопасность» ИрГУПС, тел.:
8(908)643-14-12, е-mail: aslamovav@yandex.ru
Time series analysis of the listeners number fromIAPE
Temnikova E.A., Aslamova V.S.
This article analyzes and modeling of time series of the number of students refresher courses on
the example of the Institute of additional professional education (IAPE), Irkutsk State
University of Railways. As a result, time-series analysis was found no trend in the year. The
values of time series represents the sum of seasonal and random components. Values were
found seasonal component for months, proved submission time series and a number of residues
normal distribution. An analysis of the harmonic average of the available time series of the
number of listeners for the period from 2002 to 2014, received the Fourier series are given the
criteria for statistical significance.
Keywords:statistical analysis, time series, trend, seasonal component, the Fourier harmonic
distribution.
307
Системный подход к оптимизации сетевой инфраструктуры мегаполиса
Системный подход к оптимизации сетевой
инфраструктуры мегаполиса
Г.Ы.Токтошов
Рассматриваются вопросы оптимизации сетевой инфраструктуры мегаполиса. Предложен
новый подход к решению задачи оптимизации инженерных коммуникаций, основанный
на структуризации процесса проектирования на отдельных подсистем.
Ключевые слова: инженерная коммуникация, трасса, граф, гиперсеть.
1.
Введение
В настоящее время во всем мире, прослеживается динамика интенсивного развития
городов-мегаполисов, для которых первоочередной задачей является создание сети
инженерных коммуникаций обеспечивающих снабжение жилых и общественных зданий
теплом, водой, электроэнергией и связью. В связи с этим возникает необходимость
проектирование новых или развитее существующих инженерных коммуникаций для данного
микрорайона. При этом эффективность затрат различных ресурсов (материальных,
финансовых, временных и т.д.) при разработке проектов по оптимизации инженерных
коммуникаций различного назначения
во многом связана с решением проблемы
оптимального пространственного размещения их элементов.
Пространственное положение инженерных коммуникаций традиционно определяется на
стадии инженерных изысканий. Инженерные изыскания – это комплекс работ по выбору
трассы для прокладки инженерных коммуникаций, отвечающей всем требованиям
технических условий и требующих наименьших затрат на их возведение и эксплуатацию [1].
Согласно этому определению, вынос на местность трасс инженерных коммуникаций
осуществляется до разработки проекта самого сооружения, в частности, до определения мест
установки опор линий электропередач или площадок нефтеперекачивающих станций на
нефтепроводах.
Однако
такое
теоретическое
положение
не
соответствует
действительностью, поскольку оно содержит противоречие, которое заключается в
следующем. Во-первых, вариантов, отвечающих по большому счету всем требованиям
технических условий, в действительности не существует. Во-вторых, в границах района, где
намечено строительство линейного сооружения, можно выявить множество вариантов трасс,
отвечающих большинству технических требований на прокладке линейных сооружений. Это
обстоятельство порождает проблему оценки вариантов трасс этого множества по
экономическому критерию, поскольку на стадии инженерных изысканий не определяются
капитальные, тем более приведенные затраты на реализацию проекта. Кроме того, в
практике инженерных изысканий трасс прибегают к сравнению значений параметров,
непосредственно влияющих на технико-экономические показатели проектируемой
инженерной коммуникации. Так, например, для линий электропередачи основным критерием
оценки трассы является величина удлинения трассы по сравнению с «воздушной прямой», а
для автодорог – объемы земляных работ. Однако, в том или другом случаях должны быть
учтены еще ряд других факторов, позволяющее объективно оценить проектные решения.
Таким образом, традиционный технологический процесс разработки проекта не
позволяет рассматривать все многообразие возможных проектных вариантов размещения
инженерной коммуникации на местности, что приводит неоптимальным решениям, и в
конечном счете, к неоправданному расходу различных ресурсов при строительстве и
308
эксплуатации. Выход из данной ситуации основывается на иерархическом разделении
функций между отдельными подсистемами процесса построения инженерных коммуникаций
различного назначения. При этом целью проведения изыскательских работ уже становится
не трасса, как это принято в традиционном процессе, а информационное обеспечение в виде
прикладных информационных или цифровых моделей местности (ЦММ).
2.
Иерархическое представление построение сетей
Согласно предлагаемого в настоящей работе подхода процесс построения инженерной
коммуникации разбивается на ряд этапов или уровней детализации, на каждом из которых
решают свои задачи анализа. На каждом этапе проектирования генерируется некоторое
множество возможных вариантов, подавляющее большинство которых отбрасывается при
последующем анализе ввиду невыполнения условий, налагаемых системой ограничении, или
в соответствии со стоимостной оценкой. Каждый из вариантов, отобранных на предыдущем
уровне детализации, генерирует некоторое множество на последующем, среди этого
множества снова происходит сравнение и выбор, что позволяет существенно уменьшить как
число просматриваемых вариантов, так и количество их сравнений между собой.
В настоящей работе задачи оптимизации сетевой инфраструктуры мегаполиса
рассматривается как четырехуровневая иерархическая система, состоящая из следующих
уровней (подсистемы):
– информационное обеспечение процесса проектирования инфраструктуры мегаполиса
(построение ЦММ);
– построение сети ситуационных или возможных трасс для прокладки инженерных
коммуникаций;
– поиска оптимальных трасс для прокладки инженерных коммуникаций;
– реализация (размещения) инженерной коммуникации в найденную трассу.
Далее рассмотрим задачи анализа сетей при проектировании инженерных
коммуникаций, соответствующие каждому иерархическому уровню.
2.1.
Построение ЦММ
Для построения ЦММ на прямоугольной картографируемой области (топографической
карты местности)   ( x, y) | a  x  b, c  y  d  введем регулярную сетку  x   y :
 x : a  x0  x1  ...  xn  b,
 y : c  y0  y1  ...  ym  d ,
образованную двумя семействами прямых x  x j ( j  0,1,..., n ), параллельных оси Oy , и
y  yi ( i  0,1,..., m ), параллельных оси Ox .
В этом случае массивы {x j }, j  0,1,..., n и
{ yi }, i  0,1,..., m определяют абсциссы и ординаты линий – границы ячеек, обозначаемых как
 ji , где  ji  ( x, y) | x  ( x j , x j 1 ), y  ( yi , yi1 ) . Очевидно, что вся область    ji .
Предполагается, что сетка  x   y наложена на область  таким образом, чтобы точки,
которые необходимо связать коммуникацией, оказались в некоторых ее узлах. Если это
условие невыполнимо, то эти точки смещаются в ближайший узел сетки  x   y . В силу
регулярности применяемой сетки  x   y   .
Будем использовать следующие обозначения: узлы сетки  x   y обозначим через
x ji  ( x j , yi ), x j  k ,i  r  ( x j  k , yi r ) ( j  k , i  r : k , r  {1;0;1} ). Каждая пара узлов x ji  X и
x j  k ,i  r  Г ( x ji ) представляет собой ветви v  ( x ji , x j  k ,i  r ) , через которые может быть
проложена инженерная коммуникация (часть возможных трасс). Всякая ветвь
v  ( x ji , x j  k ,i  r ) , соединяющая пары узлов x ji и x j  k ,i  r сетки  x   y , как прямолинейный
309
отрезок в области  , имеет длину l ( x ji , x j k ,ir ) , и как часть возможных трасс она имеет
также стоимость  ( x ji , x j  k ,i  r ) . Стоимость ветви определяется исходя из того, что ветви
v  ( x ji , x j  k ,i  r ) , соединяя на сетке  x   y узлы x ji и x j  k ,i  r , соответствуют некоторым
участкам в области  , которые включают в себя следующие прямые затраты: выкуп
земельного участка, аренда ресурсов участка прохождения коммуникаций, земляные работы
(освобождение места под траншею и разрушение улиц, разрытие траншеи, выемка грунта,
подготовка русла траншеи) и т.д.
Пусть теперь, узлы сетки  x   y образуют вершины, а ветви представляют собой ребра с
приписываемым им весами некоторого графа PG  ( X , G; F ) . В нашем случае веса ребра
( x ji , x j k ,ir ) интерпретируется как стоимости земельного участка плюс стоимость земляных
работ на этом участке
 ( x ji , x j k ,i  r )  a( x ji , x j k ,i r )  b( x ji , x j k ,i  r )  l ( x ji , x j k ,i  r )
(1)
где x ji  ( x j , yi ), j  1,2,..., n; i  1,2,..., m – координаты точек пересечения сетки  x   y ;
l ( x ji , x j k ,ir ) – длина ветви ( x ji , x j k ,ir ) ; a( x ji , x jk ,ir ) – удельная стоимость земли (выкуп,
аренда, налог и т.д.) на участке, соответствующем ветви ( x ji , x j k ,ir ) ; b( x ji , x j k ,ir ) – удельная
стоимость земляных работ (освобождение места под траншею, разрытие траншеи, выемка
грунта и т.п.) на участке, соответствующем ветви ( x ji , x j k ,ir ) , зависящая от типа участка
(горная, равнинная, холмистая). Таким образом, граф PG  ( X 0 , G; F0 ) определяет графа
ЦММ.
2.2.
Построение сети ситуационных (возможных) трасс
Для построения сети ситуационных трасс и дальнейшего определения конкурирующих
вариантов трассы из рассмотрения сразу же исключают объекты и участки местности,
проход трассы инженерной коммуникации через которые либо заведомо нецелесообразен,
либо вовсе невозможен, а также устанавливают фиксированные точки и направления, проход
трассы через которые обязателен.
Чтобы построит ситуационных трасс для дальнейшего поиска оптимальных решений, так
же как и в
[3] на  введем области запрета s , s  1,2,..., S такие, что
 s  ;  s  q   , s, q  1,2,..., S заданные своими границами. В качестве областей запрета
s q
могут выступать природные участки, непроходимые для прокладки коммуникаций: горы,
овраги, водоемы, заболоченные или лесистые участки, участки социального и
сельскохозяйственного
назначения,
существующие
коммуникации,
территории
промышленных предприятий, населенные пункты, территории оборонных объектов,
заповедные зоны, и т.д.
Кроме того, возможность прокладки маршрута ограничивается характером рельефа
местности – его крутизной. Для этого введем следующие обозначения:  – угол между
отрезком в пространстве, соединяющим некоторые пары узлов, и горизонтальной
поверхностью  . Для каждого типа инженерной коммуникации можно ввести следующие
дополнительные обозначения:  up – предельно допустимый угол прокладывания
коммуникаций вверх по склону;  dowm (  dowm  0 ) – предельно допустимый угол
прокладывания коммуникаций вниз по склону;  side – предельно допустимый угол
прокладывания коммуникаций горизонтально по поверхности склону.
310
Пусть   x ji v ji x j 1,i1...x j n,imv j n,im x j n,im некоторая трасса, где j  1,2,..., n; i  1,2,..., m
множество номеров вершин (или ребер) в графе PG  ( X 0 , G; F0 ) . Тогда для проектируемого
вида коммуникаций и для ее трассы возможны следующие ограничения:
1.    , j  k , i  r : k , r  {1;0;1} - нахождение трассы внутри исследуемой области;
2.   s , j  k , i  r : k , r  {1;0;1} и s - непрохождение трассы через области запрета;
3. Если    up , то прокладка инженерной коммуникации вверх по склону разрешена, в
противном случае – нет;
4. Если    dowm , то прокладка инженерной коммуникации вниз по склону разрешена, в
противном случае – нет;
5. Если    side , то прокладка инженерной коммуникации горизонтально по поверхности
склону разрешена, в противном случае – нет. Ясно, что в природных условиях {  up ,  dowm ,
 side }<900.
Ясно, что в общем случае  up   dowm и, как правило,  side  min( up ; down) , что
приводит к неравенству значений веса от узла к узла соседнему и наоборот. Таким образом,
построенный нами граф PG  ( X 0 , G; F0 ) является ориентированным.
Последние три ограничения связаны с безопасностью строительства и эксплуатации
инженерных коммуникаций, поскольку значения этих углов определяются видом и
назначением инженерной коммуникации и свойствами грунта вдоль трассы для их
прокладки.
Ограничение 2 означает, что вершины X '  X 0 графа PG  ( X 0 , G; F0 ) , попавшие в
какую-либо из областей s , s  1,2,..., S изолируются, т.е. весу ребер, соединяющих данный
узел со всеми соседними и наоборот присваивается значение бесконечности. Аналогично,
невыполнение хотя бы одного ограничения из 3-5 для некоторого ребра v  ( x ji , x j k ,ir )
равнозначно присвоению выражению (1) значения бесконечности, т.е.  ( x ji , x j  k ,i  r )   .
Ребра G \ G ' с бесконечным весом ребер из графа PG  ( X 0 , G; F0 ) удаляются, в результате
чего получается некоторая «дискретная плоскость с «запретами», которые ограничивают
прокладки инженерной коммуникации как по плану, так и по профилю. Моделируем
«дискретную плоскость с «запретами» графом PO  ( X 1 , U ; F1 ) , в котором X 1  X 0 \ X ' ,
U  G \ G ' и X 1  X 0 , U 1  G . Полученный граф назовѐм графом ситуационных
(возможных) трасс для поиска оптимальных маршрутов прокладки инженерных
коммуникаций.
2.3.
Поиск оптимальных трасс
Здесь обязательно учитывается вид и назначения проектируемой коммуникации,
поскольку параметры элементов коммуникации и область размещения взаимозависимы.
Поэтому на этом этапе в системном виде решается задачи поиска оптимальных трасс для
данного вида коммуникаций или наоборот задачи поиска оптимальных параметров
элементов проектируемой коммуникации для данного типа местности (горная, равнинная,
холмистая). Пусть предполагаемая структура трассы удовлетворяющие условиям 1-5 в
п.п.2.2. для данного вида коммуникаций задана графом PS  ( X 2  X 1 , V ; F2 ) , а структура
проектируемой коммуникации графом WS  ( X 3  X 2 , R; F3 ) . Кроме того известны
параметры элементов этих подсистем, т.е. l (v) − длина ветви v V графа PS ;  (r ) − длина
311
ребра r  R графа WS , равная  (r ) 
 l (v ) ;
a(v) − удельная стоимость земли отведенной
vF ( r )
под строительство на ветвях v  V ; br (v) − удельная стоимость земляных работ для ветви
v V ; c(r ) − стоимость приобретения и монтажа коммуникаций r  R между парой
заданных точек; d v (r ) − стоимость эксплуатационных работ.
Тогда задача заключается в реализации ребра графа WS (прокладке коммуникаций) по
соответствующим маршрутам в графе PS таким образом, чтобы функционал




Q( S )     1  a(v)   br (v)   l (v)     2  c(r )   d v (r )    (r )
vV
rR
 rR


 vV
(2)
принимал минимальное значение при ограничениях 1-5 в п.п.2.2., где:  1 и  2 –
коэффициенты дисконтирования для стоимостей строительных работ и оборудования
соответственно. Коэффициент дисконтирования – это коэффициент для приведения
экономических показателей разных лет к сопоставимым по времени величинам. Первое
слагаемое в выражении (2) соответствует выражению (1) и представляет собой стоимость
земли отведенной под строительство и земляных работ для ветвей v  V графа PS , по
которым проходят ребра r  R графа WS , а второе – стоимость приобретения и монтажа
коммуникаций и его эксплуатации.
Таким образом, на последнем этапе проектирования инженерной коммуникации
системном виде решается задачи поиска трассы для данного вида коммуникации и
реализация ее ребер по найденным трассам. Задачи в такой постанове не удастся решить
классическими методами теории графов, поскольку она сугубо гиперсетевая задача [4], в
которой нельзя рассматривать без увязки одной подсистемы к другой. Поэтому для решения
подобных задач предлагается использовать двухэтапного эвристического алгоритма
прокладки инженерных коммуникаций [5], суть которого заключается в поиске первичного
приближения и его последующем улучшении.
3.
Заключение
Таким образом, системный подход к оптимизации сетевой инфраструктуры мегаполиса,
основанный на иерархического представления сетей, состоит из построения множества
вариантов системы на каждом уровне и усечения этого множества до некоторой
целесообразной подсистемы. Такое усечение может осуществляться на каждом этапе
проектирования либо непосредственно по некоторому критерию, поставленному в
соответствие каждому элементу этого множества, либо по комплексной оценке параметров
элементов отдельных подсистем, как это показано на этапе поиска оптимальных трасс.
Предложенный подход, в отличие от традиционной технологии строительства инженерных
коммуникаций позволяет учесть взаимодействие отдельных подсистем, что важно для
комплексной оценки характеристики элементов проектируемой коммуникации и
окружающей среды.
Литература
1. Струченков В.И. О методологии компьютерного проектирования трасс линейных
сооружений// САПР и графика. 2013. №7. – С.26-30
2. Попков В. К. Математические модели связности / Отв.ред. А. С. Алексеев. – 2-е изд.–
Новосибирск: ИВМиМГ СО РАН, 2006. – 490 с.
312
3. Абрамов Ю.А. Оптимизация маршрута движения в условиях пересеченной местности /
Ю. А. Абрамов, А.А.Тарасенко// Науковий вісник будівництва. Вип. 52.– Харків, 2009. –
С. 401-407.
4. Токтошов Г.Ы. Гиперсетевой подход к проектированию инженерных сетей//Материалы
Российской
научно-технической
конференции
«Информатика
и
проблемы
телекоммуникаций», г.Новосибирск, 21-22 апреля 2011 г.// Том 1.– С.167-170
5. Попков В.К., Токтошов Г.Ы., Юргенсон А.Н. Об одном подходе к оптимизации
инфраструктуры инженерных сетей//Вестник СибГУТИ. 2012. № 3 – С.11-28.
Токтошов Гулжигит Ысакович
к.т.н., младший научный сотрудник лаборатории Системного моделирования ИВМиМГ
СО РАН, 630090, Новосибирск, ул. Академика Лаврентьева проспект, 6, тел.: +7-952-9139625, e-mail: tgi_tok@rambler.ru.
A systems approach to the metropolis network infrastructures optimization
G.Toktoshov
The problems of the metropolis network infrastructures are considered. A new approach to
solving the optimizing utilities problems, based on structuring the design process at the
individual subsystems is offered.
Keywords: engineering communication, trace, graph, hyper network
313
ОБ одной задаче размещения элементов инженерных коммуникаций
Об одной задаче размещения элементов
инженерных коммуникаций
А.Ж. Жусупбаев, Г.Ы. Токтошов
Рассматривается задачи размещения элементов инженерных коммуникаций.
Предлагается метод последовательных расчетов, который позволяет вычислить
оптимальный вариант размещения источников целевой продукции и потребителей с
учетом плана (объема) транспортируемой продукции.
Ключевые слова: инженерная коммуникация, размещение, оптимальный план, выпуклая
функция, гиперсеть.
1.
Введение
Первым этапом проектирования инженерных коммуникаций (газо-, водо-, и
теплоснабжения, сети связи и линии электропередач, автомобильные или железные дороги и
т.д.) является выбор схемы размещения их элементов и план транспортируемой продукции
от источника (информация, энергия, продукт) до потребителей (абоненты, населенные
пункты, промышленные зоны и т.п.). Этот этап оказывает определяющее влияние на
строительство и функционирование коммуникаций в целом. Оптимизация процесса выбора
структуры инженерных коммуникаций и плана транспортируемой продукции на этапе их
проектирования играет важнейшую роль в снижении финансовых и материальных затрат на
сооружение и последующую их эксплуатацию.
Задача проектирования инженерных коммуникаций сводятся к определению
местоположению подсистем сети (источники целевой продукции, потребители и линии),
значений их параметров и переменных, а также схемы соединения этих подсистем,
обеспечивающих минимальности значений некоторого критерия (веса, стоимости и т.д.).
Другими словами, проектирование инженерной коммуникации, как и любой другой сложной
системы, сводиться к выбору из множества возможных вариантов проектируемой
коммуникации варианта, оптимального по некоторому критерию. В общем случае суть
задачи проектирования инженерных коммуникаций заключается в определении
оптимального варианта размещения элементов инженерных коммуникаций и плана
транспортируемой продукции.
2.
Постановка задачи
При проектировании инженерных сетей нового микрорайона в качестве исходных
данных известны: возможные пункты размещения источников целевой продукции (газ,
нефть, вода и т.д.) A  {ai }, i  1,2,..., m , с неизвестными объемами x i , 0  xi  ai , и
возможные пункты их потребления (промышленные зоны, жилые районы, торговые узлы и
т.д.) B  {b j }, j  1,2,..., n , с неизвестными объемами y j , 0  y j  b j ; стоимостные
характеристики строительства линейных сооружений (рытье траншеи, строительство
коллекторов, тоннелей и опор и т.п.) C  {cij }, i  1,2,..., m; j  1,2,..., n , между
соответствующими элементами A и B ; стоимостные характеристики строительство самих
линий (монтаж и эксплуатация газо-, -нефте- или водопроводов, линии электросвязи и
314
D  {d ij }, i  1,2,..., m; j  1,2,..., n
электропередачи
и т.д.)
элементами A и B .
, между соответствующими
Известны, потребность Q
каждого абонента из множества B в определенный вид
 ( x ),  ( x j )
–
продукции из множества A и для каждого элемента A и B , функции i i
стоимость размещения источника целевых продукций и потребителей на соответствующих
местах.
Требуется определить оптимальный вариант размещение источников целевой продукции
и потребителей, план (объем) транспортируемой продукции из A в B , при которых
суммарные затраты на размещения источника целевых продукций и потребителей, а также
на строительства и эксплуатации коммуникаций были бы минимальными.
3.
Математическая модель
Математическая модель изложенной задачи описывается в терминах теории гиперсетей
[1] и целочисленного выпуклого программирования [2]. Она представляет собой
определенное обобщение известных задач размещения с учетом специфики рассматриваемой
задачи [2, 3].
Пусть сеть возможных трасс представляется в виде графа PS  ( X ,V ) , где X множества вершин, соответствующие возможным пунктам размещения источников целевой
продукции и потребителей, V - множество ветвей, соответствующие возможным трассам
между источниками целевой продукции и потребителей. При этом возможности соединения
источника целевой продукции и потребителя отражаются несколькими ветвями между этими
пунктами. Тем самым, граф возможных трасс PS является мультиграфом.
Пусть структура проектируемой сети представляет собой граф вида WS  (Y , R) , где Y пункты размещения источника целевой продукции и потребителей, соответствующие
некоторому проектному решению, Y - множества линий между источниками целевой
продукции и потребителей, прокладываемые по соответствующим трассам в графе PS .
Тогда задача на языке теории гиперсетей и целочисленного программирования может
быть представлена следующим образом: найти оптимальную реализацию элементов (вершин
и ребер) графа WS в графе PS таким образом, чтобы функционал
m
n
m
n
i 1
j 1
L( x)    ij ( xij )    i ( xi )   ( x j )
i 1 j 1
где,
(
, принимал минимальное значение при условиях:
)
n
x
j 1
i 1
m
 xi  ai , i  1,2,..., m,
(2)
 y j  b j , j  1,2,..., n, ,
(3)
ij
m
x
ij
n
 x
i 1 j 1
ij
(4)
 Q,
xij  0, i  1,2,..., m, j  1,2,..., n
где x  xij
m,n
(1)
.
Предполагается, что
315
(5)
m
n
i 1
j 1
Q   ai , Q   b j .
(6)
Запись
( )
означает, что оптимальная структура проектируемой сети
зависеть от места расположения источников целевой продукции и потребителя. Ясно, что
оптимальная реализация (размещение) графа вторичной сети в первичную зависть от места
размещения источников целевой продукции и потребителей, а также от объема (плана)
транспортируемой продукции.
4.
Метод последовательных расчетов
Таким образом, мы свели инженерную задачу к задаче целочисленного выпуклого
программирования. Основная трудность решения задачи (1)-(5) ее многоэкстремальность.
Поэтому любой метод, разрабатываемый для задачи целочисленного выпуклого
программирования, приведет лишь в один из многих локальных минимумов. Метод
приводящий к точному решению любой многоэкстремальной задачи – это перебор всех
вершин многогранника. Однако для реальных задач число вершин столь велико, что их
полный перебор практически невозможен.
В настоящее время существуют как точные, так и приближенные методы, позволяющие,
хотя и посредством большего объема вычислительных работ, находить глобальный
экстремум многоэкстремальной задачи с любой степенью точности [4]. Поэтому для
решения поставленной задачи предлагается воспользоваться модификацией метода
последовательных расчетов [5].
Рассмотрим способ решение задач (1)-(5) в случае, когда функция ij ( xij ) - выпуклая
а
xij  0, b j  ,

i 1,
2,...m, j 1, 2,...n ,
i ( xi ) 
i ( xi )  Ti ( xi ) , i 
1, 2,...m, 
), j 1, 2,...n , где i ( xi ),  j ( y j ) j ( y j )  j ( y j )   j ( y j
возрастающая
по
1, 2,...m, и по y j  (0, b j ] , j 
выпуклые возрастающие функции по xi  (0, ai ], i 
1, 2,...n ,
соответственно.
Тогда задача (1)-(5) примет следующий вид. Найти минимум

L( x )
m
n

i 1 j 1
ij
m
n
( xij )   (i ( xi )  Ti ( xi ))   ( j ( y j )   j ( y j ))
i 1
(7)
j 1
при условиях (2) - (5).
Обозначим через I множество, состоящее из m возможных пунктов размещения
источника целевой продукции Ai , i 1 , 2 , .m. .т.е., I  1, 2,..., m , а через J - множество
состоящее из n возможных пунктов потребления B j , j  1, 2,...n , т.е. J  1, 2,..., n . Кроме
того, обозначим через  и  произвольные подмножества множества I и J
соответственно, где I I  m  1 , J  J  n  1 . В дальнейшем будем считать , что
m  1 является
элементом любого подмножества   I , а
n  1
элементом любого

  \ m  1 , а
  \ n  1 .
подмножества   J . Подмножество
Тогда для любых произвольных подмножеств   I и   J можно рассматривать
следующую задачу:
Найти минимум
(8)

L( x, ,  ) ij ( xij )  (i ( xi )  Ti )  ( j ( y j )   j )
i j
при условиях:
i
 x
j
ij
j

xi ai , i  ,
316
(9)
 x
i

y j  b j , j  ,
ij
x

 
i
ij
j
(10)
Q ,
(11)
xij  0, i  , j   .
(12)
Обозначим через p(,  ) минимальное значение функционала (8) при условиях (9) - (12).
Тогда исходная задача может быть сформулирована следующим образом:
Требуется определить такую пару подмножеств *  I и  *  J , для которой p( ,  )
достигает своего наименьшего значения p(* ,  * ) , т.е. требуется найти
p( * ,  * )  min  p( ,  )
I
 J
(13)
Для решения этой задачи поступаем следующим образом. Любому допустимому
подмножеству   J поставим в соответствие экстремальную задачу:
Найти минимум
(14)

L( x,  ) ij ( xij )   (i ( xi )  Ti ( xi ))   ( j ( y j )   j )
i j
i
i j
i
i j
i
j
при условиях (9) - (12) и   I .
Аналогично любому допустимому подмножеству   I поставим в соответствие
следующую задачу:
(15)

L( x,  ) ij ( xij )   (i ( xi )  Ti )   ( j ( y j )   j ( y j ))
j
при условиях (9)-(12) и   J .
Далее покажем применимость метода последовательных расчетов к задачам (14), (9) (12). Для этой цели преобразуем задачу к виду:
Найти минимум
(16)

L( x,  ) ij ( xij )   (i ( xi )  Ti ( xi ))   ( j (b j  xm1 j )   j )
при условиях:
j
x


i
ij
 x
j
ij
 x
j
b j , j  ,
(17)

xi ai , i   ,
m 1 j
(18)
(19)
 am1 ,
xij  0 , i   , j   ,
(20)

0 j 
am1  b j  Q

где m1 j ( xm

1 j )
M
,
j n  1,
j

Докажем, что для любых подмножеств 1 , 2  I выполняется условие
s(1 , 2 )  p(1 )  p(2 )  p( )  p( )  0 ,
(21)

1 2 ,  
1  2 , а
p(1 ), p(2 ), p( ) , p(  ) - минимальные значения
где
функционала

L( x,  ) ij ( xij )   (i ( xi )  Ti )   ( j (b j  xm1 j )   j )
i j
i
j
при условиях (17)-(20) и замене множеств  соответственно множествам 1 , 2 ,  ,  .
Тогда для задачи (16)-(20) условие (21) запишется в виде
317



s (1 , 2 ) min   ij ( xij )   i ( xi )   Ti   j (b j  xm 1 j )    j  
xij
i1
i1
j
j
i1 j



 min    ij ( xij )   i ( xi )   Ti   j (b j  xm 1 j )    j  
xij
i2
i2
j
j
i2 j

(22)


 min  ij ( xij )   i ( xi )   Ti   j (b j  xm 1 j )    j  
xij
i
i
j
j
 i j



 min  ij ( xij )   i ( xi )   Ti   j (b j  xm 1 j )    j   0
xij
i 
i
j 
j
 i j

Из величин  и  легко заметить, что
( Ti    j )  (  Ti    j
) ( Ti    j )  ( Ti    j ).
i1
j
i2
j
i
j
i
Далее предположим, что для задачи (16)-(20) на множестве
1
2
допустимые планы xij , xij
j
1 и
2 имеются
, которые удовлетворяют следующим условиям:
1
xij 
xij , i  \ 2 , j   ,
(23)
xij2 
xij , i  \ 1 , j   ,
(24)

xij 1  xij2 xij  xij , i   , j   ,
min xi , xi


 x
1
i
, xi  max xi , xi
2


(25)
  a , i
(26)
i
где xij - оптимальный план задачи (16)-(20) при замене множества  на  , а


xij - на множество  . Тогда для доказательства условия (22) достаточно показать, что
s (
1 , 2 )
 
i1 j
ij
( xij1 )   i ( xi1 )   j (b j  xm11 j ) 
i1
j
   ij ( xij2 )   i ( xi2 )   j (b j  xm21 j ) 
i2 j
i2
j
 ij ( xij )   i ( xi )   j (b j  xm 1 j ) 
i j
i
(27)
j
  ij ( xij )   i ( xi )   j (b j  xm 1 j )  0 .
i j
Действительно,
i
так
как
j
xij1 , xij2
не
являются
оптимальными
решениями
соответствующих задач, то
p(1 )   ij ( xij1 )   i ( xi1 )   Ti  j (b j  xm11 j )   j ,
i1 j
i1
i1
j
j
p(2 )   ij ( xij2 )   i ( xi2 )   Ti  j (b j  xm211 j )   j .
i2 j
i2
i2
j
j
Следовательно, s(1 , 2 )  s (1 , 2 ) . Поэтому из s (1 , 2 )  0 следует s(1 , 2 )  0 .
Далее используя условия (23)-(25), из (27) получаем
318
s (1 , 2 )   ij ( xij1 )   ij ( xij2 ) 
i j
i j
 ij ( xij )   ij ( xij )   i ( xi1 )   i ( xi2 )   i ( xi ) 
i j
i j
i
i
(28)
i
 i ( xi )   j (b j  xm11 j )   j (b j  xm21 j )   j (b j  xm 1 j )   j (b j  xm 1 j )
i
j
j
Из (28) и свойства выпуклости функций
 ( (
j
i
ij
j
j
ij ( xij ), i ( xi )
и
 j (yj )
имеем
( xij1 )  ij ( xij2 )  ij ( xij )  ij ( xij )))  0 ,
 ( ( x )   ( x )   ( x )   ( x  ))  0,
i
i
 (
j
i
j
1
i
i
2
i
i
i
i
(b j  xm11 j )  ( j (b j  xm21 j )  ( j (b j  xm 1 j )  j (b j  xm 1 j ))  0,
т.е. s (1 , 2 )  0.
Таким образом, применимость метода последовательных расчетов к задаче (16)-(20)
доказана в предложении о существовании планов xij1 , xij2 , удовлетворяющих условиям
(23)-(26).
Доказательство существования допустимых планов
xij1 , xij2 , удовлетворяющих
соотношениям (23)-(26) для задачи (16)-(20), проводится аналогично приведенному
доказательству в [3].
Следовательно, для любого допустимого   I может быть использован алгоритм метода
последовательных расчетов при решении задач (14), (9)-(12) и для каждого допустимого
  I определено такое множество  ( )  I , на котором
p( ) достигает своего
наименьшего значения p( ( ))  min  p( ) , где через p( ) обозначено минимальное
I
значение функционала


 

L( x,  )
i
j
ij
( xij )  i ( xi )   Ti   j ( y j )    j
i
i
j
j
при условиях (9)-(12) и фиксированном множестве   J .
Далее рассмотрим задачу (15), (9)-(12). Она аналогично задаче (14), (9)-(12).
Следовательно, для всех допустимых   I может быть использован алгоритм метода
последовательных расчетов к задаче (15),(9)-(12) и найдено такое подмножество  ( )  J ,
на котором p( ) достигает своего наименьшего значения p( ( ))  min  p( ). Здесь через
 J
p( ) обозначено минимальным значением функционала

L( x,  )


 
i
j
ij
( xij )  i ( xi )   Ti   j ( y j )    j
i
i
j
j
при условиях (9)-(12) и фиксированном   I .
Тогда, чтобы определить такую пару подмножеств *  I и  *  J , для которой
функция p(,  ) достаточно была бы наименьшего значения p(* ,  * ) , по-видимому
необходимо начать решение с полного перебора всех возможных подмножеств   I или
 J.
Предположим, что известны все подмножества   J , удовлетворяющие условию
b
 j  Q . Тогда для любого допустимого   J решаем задачу (11),(9)-(12). При этом
j
319
определим такое подмножество  ( )  I , на котором
значения p( ( )) ,т.е p( (  ))  min  p( ).
p( ) достигает своего наименьшего
I
Далее сравниваем значение p( (  )) для всех допустимых   J , определяем такую пару
подмножеств *  I ,  *  J , для которых p(,  ) достигает своего наименьшего значения
p(* ,  * )  min  p( ( ) .
 J
Аналогично результат может быть получен в случае, когда осуществляется полный
перебор всех допустимых подмножеств   I . При этом из (2n  1)(2m  1) возможных
вариантов перебирается не больше (2m  1)n2 или (2m  1)m2 - в зависимости от
производится ли полный перебор вариантов   I или   J .
5.
того,
Заключение
Предложенный в настоящей работе метод последовательных расчетов, позволяет уже на
этапе проектирования вычислить оптимальный вариант размещения элементов инженерных
коммуникаций и план (объем) транспортируемой продукции от источника к потребителю.
Предложенный метод может быть использован для решения задач средней размерности. Для
задач большой размерности целесообразно использовать технологии распараллеливания.
Литература
1.
2.
3.
4.
5.
Попков В. К. Математические модели связности / Отв.ред. А. С. Алексеев. – 2-е изд.–
Новосибирск: ИВМиМГ СО РАН, 2006. – 490 с.
Ланге Э.Г., Жусупбаев А. Комбинированный метод решения задачи размещения –
Фрунзе:Илим ,1990-153 с.
Кристофидес Н. Теория графов. Алгоритмический подход. М.:Мир, 1978.
Ланге Э.Г., Жусупбаев А. О методах решения задачи размещения //изд.АН СССР.
Техническая Кибернетика-1982. №6.
Черенин В.П., Хачатуров В.Р. Решение методом последовательных расчетов одного
класса задач о размещения производства.- Экономико-математические методы.-М.:
Наука , 1965. –вып.2.
Жусупбаев Амангелди Жусупбаевич
д.ф.-м.н., профессор, зав.лабораторией Экономико-математических методов ИТиПМ
НАН КР, 720071, г. Бишкек, Чуйский проспект, 265а, e-mail: aman_jus@mail.ru.
Токтошов Гулжигит Ысакович
к.т.н., младший научный сотрудник лаборатории Системного моделирования ИВМиМГ
СО РАН, 630090, г. Новосибирск, ул. Академика Лаврентьева проспект, 6, тел.: +7-952-9139625, e-mail: tgi_tok@rambler.ru.
One a problem of the engineering communications elements locating
A.Zhusupbaev, G.Toktoshov
The engineering communications elements locating problems are considered. The successive
calculation methods, which allows us to calculate the optimal location engineering
communications elements taking into account the plan of transported goods is proposed.
Keywords: engineering communication, location, optimal plan, convex function, hyper network
320
Анализ потокобезопасного неблокируемого стека на основе метода исключения парных операций
Секция 2
ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ
Анализ потокобезопасного
неблокируемого стека на основе метода
исключения парных операций
М. А. Алейников, А. А. Пазников1
Выполнен анализ эффективности неблокируемого потокобезопасного стека на основе
метода исключения парных операций. Алгоритм устранения избыточных операций со
стеком позволяет сократить число обращений к вершине стека, таким образом обеспечивая лучшую пропускную способность. В работе выполнен анализ эффективности алгоритмов реализации стека и приведены рекомендации по использованию метода исключения парных операций.
Ключевые слова: многопоточное программирование, масштабируемые алгоритмы, неблокируемые структуры данных.
1. Введение
Структуры данных и алгоритмы, свободные от блокировок (lock-free), сегодня широко
применяются для повышения масштабируемости многопоточных программ [1-3]. Они основаны на использовании атомарных операций (таких как Compare-and-swap, CAS), что позволяет избежать недостатков, присущих блокировкам: голодания (starvation), взаимных блокировок (deadlocks), инверсий приоритетов (priority inversions). Неблокируемые структуры данных обеспечивают гарантированное время выполнения алгоритмов, в том числе при большом количестве потоков и высокой частоте выполнения операций.
При реализации связных списков (стеков, очередей и др.), свободных от блокировок, отдельные вершины становятся «узким местом» (bottleneck), приводя к увеличению загрузки
шины данных и кэш-памяти. Кроме того, параллельные обращения к вершинам списка реализуются последовательно (serialization). Вследствие этого данные структуры не обеспечивают достаточный уровень масштабирования.
2. Исключение парных операций
Выполнено исследование неблокируемого стека на основе исключения парных операций [4, 5]. Суть данного метода состоит в следующем. Поступающие в течение короткого
промежутка времени операции добавления (push) и удаления (pop) элемента из стека обрабатываются в отдельном массиве (elimination array), при этом элемент, добавляемый в стек одним потоком, становится для другого потока результатом операции извлечения элемента (рис.). Стек остается в том виде, в котором он был до выполнения этих операций. Алгоритм позволяет сократить частоту обращение потоков к вершине стека и обеспечивает параллельное выполнение отдельных операций со структурой, что приводит к увеличению
пропускной способности структуры и сокращению времени выполнения операции.
1
Работа выполнена при поддержке РФФИ (гранты № 15-07-02693, 15-07-00653)
321
T3: pop()
Массив
T1: return(d)
T1: pop()
Т3: return(a)
Стек
head
a
T2: push(d)
b
c
T2: ok
Рис. Функциональная схема алгоритма elimination stack
В работе выполнено сравнение эффективности потокобезопасного стека на основе рассмотренного подхода с другими реализациями потокобезопасного стека в случае интенсивных обращений к структуре данных. Анализируется влияние частоты выполнения операций
со структурой и числа потоков на пропускную способность структуры. При выполнении экспериментов варьируются параметры алгоритма, такие как время ожидания поступления операций добавления и удаления элементов, размер вспомогательного массива для обнаружения
парных операций (elimination array). Получены рекомендации по использованию потокобезопасного стека и выбору параметров алгоритма.
Литература
1. Хорошевский В. Г. Распределѐнные вычислительные системы с программируемой структурой // Вестник СибГУТИ. 2010. №2 (10). С. 3−41.
2. Hendler D., Shavit N., Yerushalmi L. A scalable lock-free stack algorithm // Proceedings of the
sixteenth annual ACM symposium on Parallelism in algorithms and architectures. – ACM,
2004. – P. 206-215.
3. Agarwal A., Cherian M. Adaptive backoff synchronization techniques. – ACM, 1989. V. 17. –
№. 3. P. 396-406.
4. Calciu I., Gottschlich J. E., Herlihy M. Using elimination and delegation to implement a scalable NUMA-friendly stack // Proc. Usenix Workshop on Hot Topics in Parallelism (HotPar). –
2013.
5. Afek Y., Hakimi M., Morrison A. Fast and scalable rendezvousing // Distributed computing. –
2013. V. 26. №. 4. P. 243-269.
322
Алейников Михаил Андреевич
студент 3 курса факультета информатики и вычислительной техники СибГУТИ (630102,
Новосибирск, ул. Кирова, 86), тел. 8 (913) 472-93-00, e-mail: bobro-krab@bk.ru
Пазников Алексей Александрович
к.т.н., доцент кафедры вычислительных систем СибГУТИ (630102, Новосибирск, ул. Кирова, 86) тел. (383) 2-698-286, e-mail: apaznikov@gmail.com.
Lock-free elimination stack analysis
M. Aleynikov, A. Paznikov
This work about elimination stack analysis, with elimination of paired(push-pop) elements.
This algorithm avoid excess acsess to stack itself by passing paired elements of push an pop
operations between threads, without changing top of stack. Thats giving better perfomance than
some lock-free stack implementations. Also perfomed comparsion analysis with other lock-free
stack implementations and given some tips about elimination meckanism working.
Keywords: lock-free data structures, multithreading, scalable algorithms.
323
Исследование эффективности потокобезопасных ассоциативных массивов на базе программнои аппаратно-реализуемой транзакционной памяти
Исследование эффективности потокобезопасных
ассоциативных массивов на базе программнои аппаратно-реализуемой транзакционной памяти
Д. М. Берлизов, М. А. Позднышев, Р. В. Терешков, А. А. Пазников1
В работе проведен сравнительный анализ существующих реализаций программной и аппаратной транзакционной памяти при разработке потокобезопасных ассоциативных массивов. Алгоритмы реализованы на языке C++ и исследованы на кластерной вычислительной системе с аппаратной поддержкой транзакционной памяти. Построены рекомендации по использованию транзакционной памяти при разработке масштабируемых
структур данных.
Ключевые слова: параллельное программирование, транзакционная память, многопоточное программирование, вычислительные системы, STM, HTM.
1. Введение
С развитием многоядерных вычислительных систем (ВС) [1] с общей памятью (SMP и
NUMA-системы) особую актуальность приобретает решение проблем, связанных с организацией доступа параллельных потоков к разделяемым данным. В настоящее время наиболее
распространѐнным способом решения данной проблемы является использование блокировок. Разработка параллельных алгоритмов в данной методологии характеризуется незначительными трудозатратами и высокой эффективностью, но имеет такие недостатки, как последовательное выполнение критических секций (serialization), взаимные блокировки (deadlocks), инверсии приоритетов (priority inversion), последовательный захват блокировки (convoying) и голодание (starvation). Наравне с использованием блокировок развивается альтернативное направление: семейство алгоритмов и структур данных, свободных от блокировок
(lock-free). Данные методы позволяют достичь большей масштабируемости и обеспечивают
гарантированное время выполнения. Перспективным подходом к программированию без использования блокировок является транзакционная память (transactional memory) [2].
Существующие реализации транзакционной памяти включают в себя как программно[6, 7, 8], так и аппаратно-реализуемые алгоритмы [3, 4, 5]. Также следует отметить реализации, сочетающие в себе аппаратные и программные средства [9, 10, 11]. Данная работа концентрируется на исследовании программной транзакционной памяти, реализованной в компиляторе GCC, а также расширений набора инструкций в процессорах Intel микроархитектуры Haswell (технологии Hardware Lock Elision, Restricted Transactional Memory).
2. Программно-реализуемая транзакционная память
Транзакционная модель памяти предполагает выделение групп инструкций в атомарные
транзакции, аналогичные транзакциям в базах данных. Под транзакцией в данном контексте
понимается выполняемая потоком конечная последовательность инструкций, реализующая
операции транзакционных чтения и записи. Транзакции удовлетворяют свойствам сериализуемости и атомарности. Сериализуемость (serializability) предполагает последовательное
1
Работа выполнена при поддержке РФФИ (гранты № 15-07-02693, 15-07-00653).
324
выполнение транзакций, не приводящее к состояниям состязания (contention). Условие атомарности (atomicity) гарантирует, что транзакция вступает в силу мгновенно, при этом все
изменения в памяти единовременно становятся видимыми для всех потоков. В общем случае,
отдельно взятая транзакция выполняется полностью и успешно, либо не выполняется вообще, если возникает конфликт данных (рис. 1). Результаты успешно выполненных транзакций
записываются в специальный лог – журнал транзакций. Несомненными достоинствами транзакционной памяти, по сравнению с традиционным подходом на основе операции Compareand-swap (CAS) являются простота использования. Алгоритмы на основе транзакционной
памяти свободны от блокировок и обеспечивают прирост ускорения за счѐт одновременного
выполнения транзакций. К недостаткам относится сложность отладки программ, ограниченная область применения транзакционной памяти, а также падение производительности при
неправильном использовании. Текущие реализации транзакционной памяти характеризуются
высокими накладными расходами на создание и управление транзакциями.
Рис.1. Обобщѐнный вид выполнения транзакции
Транзакционная память реализована программно (например, в компиляторе GCC, начиная с версии 4.7). Также существует аппаратная поддержка некоторыми семействами процессоров (например, Intel Haswell x86).
Основная идея реализации программной транзакционной памяти в компиляторе GCC состоит в том, что критические секции помещается в блок __transactional_atomic {…}, указывающий на то, что данный участок кода является транзакцией (рис. 2).
Рис. 2. Реализация транзакций в компиляторе GCC
325
3. Аппаратно-реализуемая транзакционная память
Аппаратная поддержка транзакционной памяти заключается во введении новых команд в
набор инструкций микропроцессора. Например, в процессорах Intel микроархитектуры
Haswell введены так называемые расширения транзакционной синхронизации (Transactional
Synchronization Extensions, TSX). Одним из таких расширений Restricted Transactional
Memory (RTM).
Технология RTM (рис. 3, 4) предполагает выполнение резервного кода (fallback code) в
случае, если транзакция не может быть выполнена успешно. Вначале задаѐтся некоторый
лимит на количество попыток запуска транзакции. Если ни одна из этих попыток не заканчивается успешно, алгоритм переходит к выполнению резервного кода, гарантирующего выполнение транзакции, чаще всего – на основе блокировок. Расширение RTM вводит в набор
инструкций микропроцессора следующие команды: XBEGIN и XEND, обозначающие начало
и конец критической секции, и XABORT, явно отменяющая выполнение транзакции.
В работе предлагаются потокобезопасные ассоциативные массивы (хеш-таблицы и бинарные деревья поиска) на основе программной транзакционной памяти (Software
Transactional Memory, STM), реализованной в компиляторе GCC версии 4.9, а также с применением набора инструкций RTM для использования аппаратной поддержки транзакционной
памяти в процессорах Intel Core микроархитектуры Haswell. Проведено сравнение разработанных структур данных с аналогичными реализациями на основе блокировок. В докладе
представлены результаты анализа эффективности созданных ассоциативных массивов и рекомендации по применению различных реализаций транзакционной памяти. Показано (рис.
5), что использование программной транзакционной памяти позволяет повысить пропускную
способность хеш-таблиц и деревьев поиска по сравнению с потокобезопасными структурами
данных на основе блокировок.
326
Рис. 3. Выполнение транзакции в RTM
Рис. 4. Псевдокод алгоритма RTM
327
а
б
Рис. 5. Результаты сравнения структур данных, разработанных на базе программно- и аппаратнореализуемой транзакционной памяти, с реализациями на основе блокировок:
а – зависимость времени вставки (t) 108 элементов в бинарное дерево поиска от числа
используемых потоков (p);
б – зависимость пропускной способности (b) при вставке 108 элементов в бинарное дерево поиска от
числа используемых потоков (p).
■ – реализация на основе STM в GCC;
▼ – реализация на основе алгоритма RTM;
♦ – реализация на основе блокировок (мьютексов).
Литература
1. Хорошевский В. Г. Распределѐнные вычислительные системы с программируемой структурой // Вестник СибГУТИ. 2010. № 2 (10). С. 3−41.
2. Herlihy M., Shavit N. Transactional memory: beyond the first two decades // ACM SIGACT
News. – 2012. V. 43. № 4. P. 101-103.
3. Ananian C. S. et al. Unbounded transactional memory // High-Performance Computer Architecture, 2005. HPCA-11. 11th International Symposium on. IEEE, 2005. P. 316-327.
4. Rajwar R., Herlihy M., Lai K. Virtualizing transactional memory // Computer Architecture,
2005. ISCA'05. Proceedings. 32nd International Symposium on. – IEEE, 2005. – С. 494-505.
5. Yen L. et al. LogTM-SE: Decoupling hardware transactional memory from caches // High Performance Computer Architecture, 2007. HPCA 2007. IEEE 13th International Symposium on.
IEEE, 2007. P. 261-272.
6. Herlihy M. et al. Software transactional memory for dynamic-sized data structures // Proceedings of the twenty-second annual symposium on Principles of distributed computing. ACM,
2003. P. 92-101.
7. Dice D., Shalev O., Shavit N. Transactional locking II // Distributed Computing. – Springer Berlin Heidelberg, 2006. P. 194-208.
8. Marathe V. J., Scherer III W. N., Scott M. L. Adaptive software transactional memory // Distributed Computing. – Springer Berlin Heidelberg, 2005. P. 354-368.
9. Damron P. et al. Hybrid transactional memory // ACM Sigplan Notices. ACM, 2006. V. 41. –
№. 11. P. 336-346.
10. Lev Y., Maessen J. W. Split hardware transactions: true nesting of transactions using best-effort
hardware transactional memory // Proceedings of the 13th ACM SIGPLAN Symposium on
Principles and practice of parallel programming. ACM, 2008. P. 197-206.
328
11. Baugh L., Neelakantam N., Zilles C. Using hardware memory protection to build a highperformance, strongly-atomic hybrid transactional memory // ACM SIGARCH Computer Architecture News. 2008. V. 36. №. 3. P. 115-126.
Берлизов Даниил Михайлович
студент 3 курса факультета информатики и вычислительной техники СибГУТИ (630102,
Новосибирск, ул. Кирова, 86), тел. +7 (913) 466-95-47, e-mail: sillyhat34@gmail.com
Позднышев Максим Андреевич
студент 3 курса факультета информатики и вычислительной техники СибГУТИ (630102,
Новосибирск, ул. Кирова, 86), тел. +7 (952) 915-85-00, e-mail: maxpozdnishev@gmail.com
Терешков Роман Вадимович
студент 3 курса факультета информатики и вычислительной техники СибГУТИ (630102,
Новосибирск, ул. Кирова, 86), тел. +7 (923) 150-97-79, e-mail: rtereshkov@gmail.com
Пазников Алексей Александрович
к.т.н., доцент кафедры вычислительных систем СибГУТИ (630102, Новосибирск,
ул. Кирова, 86) тел. (383) 2-698-286, e-mail: apaznikov@gmail.com.
Efficiency analysis of thread-safe associative arrays based on software and hardware
transactional memory
D. Berlizov, M. Pozdnyshev, R. Tereshkov, A. Paznikov
This paper presents a comparison study of currently existing implementations of software and
hardware transactional memory for scalable data structures development. Proposed algorithms
are implemented in C++ and evaluated on a computer cluster with hardware transactional
memory support. Finally, recommendations are provided for using transactional memory for
scalable data structures development.
Keywords: parallel programming, transactional memory, multithreading, computer systems,
STM, HTM
329
Анализ применимости искусственных нейронных сетей в задачах самодиагностики
распределённых вычислительных систем
Анализ применимости искусственных нейронных
сетей в задачах самодиагностики распределённых
вычислительных систем1
К. Е. Крамаренко, О.В. Молдованова
В докладе приведены результаты анализа применимости искусственных нейронных сетей
к решению задачи самодиагностики распределѐнных вычислительных систем.
Ключевые слова: самодиагностика, распределѐнные вычислительные системы, искусственные нейронные сети.
1. Введение
Одной из основных задач построения распределѐнных вычислительных систем (ВС) является обеспечение их продолжительного надѐжного функционирования.Еѐ решение предполагает, в первую очередь, борьбу с неисправностями системы, порождаемыми отказами и
сбоями в работе.Основная функционально-структурная единица вычислительных ресурсовв
таких системах– элементарная машина (ЭМ). В качестве ЭМ могут быть использованы ЭВМ,
вычислительные ядра, многоядерные процессоры, вычислительные узлы, оснащѐнные средствами межмашинной коммутации.
Отказом называется событие, при котором ЭМ теряет способность выполнять заданные
функции по переработке информации [1].Отказ одной элементарной машины, участвующей
в вычислительном процессе, может привести к некорректному результату вычислений и
иметь разрушительные последствия в дальнейшем.Следовательно, организация отказоустойчивого функционирования распределѐнныхВС требует создания программных средств, обеспечивающих контроль и диагностику их функционирования.В вычислительной системе как
совокупности из N элементарных машин, взаимодействующих между собой через cеть связи,
может быть применѐн нетрадиционный подход к контролю и диагностике.Программируемость структуры позволяет в пределах ВС организовывать топологически
различные схемы из ЭМ, которые обеспечат полноту контроля работоспособности всей системы и диагностики неисправностей. Следовательно, по отношению к таким ВСдопустимо
применение терминов «самоконтроль» и «самодиагностика» [1].
Основной задачей самодиагностики является определение состояния (исправна/неисправна) каждойэлементарной машины.Были предложены различные диагностические
модели[2, 3, 4, 5], позволяющие идентифицировать исправные и неисправныеЭМ. К ним относятся модели, основанные на тестировании элементарными машинами друг друга, такие
как: модель Препараты-Метца-Чиена[2] (Preparata-Metze-Chien) и модель Барси-ГрандониМаестрини [3] (Barsi-Grandoni-Maestrini).Диагностическая модель, описанная в [4, 5, 6],
называется моделью сравнения и предполагает, что парам ЭМ назначаются некоторые тесты,
результаты выполнения которых затем сравниваются.
Определение полного и корректного подмножества неисправных элементарных машин
(образа неисправности) в системе является NP-трудной задачей [7].Но эта задача может быть
решена за полиномиальное время при введении ограничения количества неисправных ЭМ в
системе. Такие системы получили название t-диагностируемых [2], где t – максимальное ко1
Работа выполнена при поддержке Совета по грантам Президента РФ (грант МД-2620.2014.9), Российского
фонда фундаментальных исследований (гранты 15-07-00048-а, 15-07-00653-а).
330
личество неисправных элементарных машин, при котором возможно определение образа неисправности.
В настоящее время при решении задачи самодиагностики распределѐнных вычислительных систем широко используются генетические алгоритмы [8, 9], искусственные нейронные
сети [10, 11] и дажеалгоритмы, в основе которых лежит функционирование искусственной
иммунной системы [12].
В докладе представлен анализ применимости искусственных нейронных сетей к решению задачи самодиагностики распределѐнных вычислительных систем при диагностической
модели сравнения.
2. Диагностическая модель сравнения
Рассматривается распределѐнная вычислительная система, состоящая из Nэлементарных
машин (в дальнейшем – узлов), соединѐнных каналами связи. Каждый узел может находиться в исправном или неисправном состоянии. Паре узлов назначается на выполнение задача.
Сравнение полученных результатов еѐ решения даѐт информацию о состоянии узлов. Если
результаты совпадают, оба узла исправны, иначе один или оба узла являются неисправными.
Множество всех результатов сравнения называется синдромом [6].
Модель сравнения, предложенная в [4, 5], предполагает наличие центрального обозревателя (высоконадѐжной ЭМ), который назначает задачи из множества T = {T1, T2, …, Tk,
…,TM} парам узлов, затем собирает результаты выполнения этих задач и производит диагностику системы.
Диагностическая модель сравнения описывается двумя ненаправленными графами: графом связей и графом тестов или сравнений[10]. Граф связейG1 = (V, E) представляеттопологиювычислительнойсистемы, гдеV – множествоузлов, |V| = N; E – множестворѐбер. Каждоереброeij = (vi, vj) представляет собой канал связи между паройvi иvj узлов ВС. Граф сравнений
G2 = (V, C) показывает, какие пары узлов тестировались. Как и в случае с графом связей,V –
множествоузлов, |V| = N;а C = {cij} – множество рѐбер, соединяющих пары узлов (vi, vj), выполняющих одну и ту же задачу TkT.Обозначим множество узлов, с которым сравнивается
узел vi, как i = {vj : cijC}. Сравнение узлов vi иvjдаѐт 0, если их результаты выполнения задачи Tkсовпали; и 1 – в противном случае.Для двух исправных узлов результат сравнения
всегда равен 0. Если только один из узлов является неисправным, результат сравнения всегда
равен 1. А для двух неисправных узлов этот результат может принимать значение как 0, так
и 1.
Для проведения корректной самодиагностики распределѐнной ВС введено ограничение
на максимальное количество t неисправных узлов, называемое степенью диагностируемости
системы [2]. В[6] было показано, что для системы с N узлами, сравниваемыми попарно,
t = N – 2.
3. Нейронная сеть Хопфилда
Сеть, в которой сигналы с выходного слоя передаются во входной слой. Изображение сети Хопфилда представлено на рисунке 1.
331
Рис. 1. Сеть Хопфилда.
В процессе обучения сети формируются такие значения весов wij, при которых заданное
начальное состояние нейронов, близких к одному из обучающих векторов x, приводит к стабильному состоянию, в котором реакция сети y = x остается неизменной в любой момент
времени.
Выходные значения сети рассчитываются по следующей формуле[13]:
( )
(
(∑
)), (1)
с начальным условием yi(0) = xj,yi(k) – состояние сети на k-ом шаге.
3.1. Алгоритм диагностирования, основанный на нейронной сети Хопфилда
Данный алгоритм базируется на непрерывной сети Хопфилда, которая состоит
изN нейронов, где каждый нейрон соответствует узлу системы. Основная идея алгоритма –
определить состояние узлов по заданному синдрому.
Функция энергии для данной сети определяется по следующей формуле:
∑ ∑
.
(2)
Данная функция уменьшает свое значение при переходе из одного состояния сети в другое и достигает своего минимального значения в момент, когда текущее состояние равно
предыдущему. Для того чтобы нейронная сеть решала задачу диагностики, необходимо построить функцию энергии, которая будет содержать все ограничения нашей задачи и целевую функцию.
Функция энергии E = E1 + E2 + E3, где E1 представляет собой ограничение на количество
неисправных узлов в системе, Е2 – ограничение, исключающее ситуации, при которых ВС
становится не диагностируемой, Е3 представляет собой саму целевую функцию, описывающую связь между потенциальными неисправными узлами и синдромом.
332
На вход сети подаѐтся диагностический синдром, а на выходе получаются множества исправных и неисправных узлов.
4. Результаты
Диагностический алгоритм был реализован и исследован в интерактивной среде моделирования MATLAB. Исследования показали, что искусственная нейронная сеть Хопфилда
может быть использована для решения диагностической задачи в качестве альтернативного
подхода к самодиагностике распределѐнных вычислительных систем.
Литература
1. Хорошевский В.Г. Архитектура вычислительных систем: Учеб. пособие. – 2-е изд., перераб. и доп. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2008. – 520 с.
2. Preparata F.P., Metze G., Chien R.T. On the Connection Assignment Problem of Diagnosable
Systems. // IEEE Trans. Electron. Comput. 1967. V. EC-16. N 6. – pp. 848-854.
3. Barsi F., Grandoni F., Maestrini P. A Theory of Diagnosability of Digital Systems. // IEEE
Trans. Comput. 1976. V. C-25. N 6. – pp. 585-593.
4. Chwa K.Y., Hakimi S.L. Schemes for fault tolerant computing: a comparison of modularly redundant and t-diagnosable systems. // Information and Control 49, 1981. – pp. 212-238.
5. Malek M. A comparison connection assignment for diagnosis of multiprocessor systems // Proc.
7th International symposium on computer architecture, New York, 1980. – pp. 31-35.
6. Duarte Jr., E. P., Ziwich, R. P., Albini, L. C. P. A survey of comparison-based system-level diagnosis // ACM Comput. Surv.43, 3, Article 22, 2011. – 56 p.
7. Blough D., Sullivan G., Masson G. Intermittent fault diagnosis in multiprocessor systems //
IEEE Trans. on computers, 41, 1992. – pp. 1430-1441.
8. Elhadef M., Das Sh., Nayak A. A parallel genetic algorithm for identifying faults in large diagnosable systems. // The international journal of parallel, emergent and distributed systems, Vol.
20, No.2, June 2005. – pp. 113-125.
9. Elhadef M.,RomdhaneL.B.,AyebB.Performance analysis of an evolutionary algorithm for fault
detection in t-diagnosable multi-processor systems // International Journal of Parallel Emergent
and Distributed Systems 10/2007. – 22(5). – pp. 387-404.
10. ElhadefM. A modified Hopfield neural network for diagnosing comparison-based multiprocessor systems using partial syndromes //ICPADS, 2011, Parallel and Distributed Systems, International Conference on, Parallel and Distributed Systems, International Conference on 2011. –
pp. 646-653.
11. Radha J., Manjula Devi T.H. Efficient comparison based self diagnosis using backpropagation
artificial neural networks // International Journal of Innovative Research in Science, Engineering and Technology, Vol. 2, Issue 5, May 2013. – pp. 1546-1551.
12. Elhadef M., Das Sh., Nayak A.System-Level Fault Diagnosis Using Comparison Models: An
Artificial-Immune-Systems-Based Approach. // Journal of networks, Vol. 1, No. 5, September/October 2006. – pp. 43-53.
13. Осовский С. Нейронные сети для обработки информации / Пер. с польского И.Д. Рудинского. – М.: Финансы и статистика, 2004. – 344 с.
Крамаренко Константин Евгеньевич
Cтарший преподаватель Кафедры вычислительных систем СибГУТИ (630102, Новосибирск, ул. Кирова, 86) тел. (383) 269-82-86, e-mail: kostya_83@ngs.ru.
333
Молдованова Ольга Владимировна
к.т.н., доцент Кафедры вычислительных систем СибГУТИ (630102, Новосибирск, ул. Кирова, 86) тел. (383) 269-82-75, e-mail: ovm@csc.sibsutis.ru.
Analysis of artificial neural networks applicability in self-diagnosis problems for distributed computer systems
K. Kramarenko, O. Moldovanova
The report contains the results of analysis of artificial neural networks applicability for solving
the problem of distributed computer systems self-diagnosis.
Keywords: self-diagnosis, distributed computer systems, artificial neural networks.
334
Анализ обнаружения ложных конфликтов в приложениях с программной транзакционной памятью
Анализ обнаружения ложных конфликтов
в приложениях с программной транзакционной
памятью
И.И. Кулагин, М.Г. Курносов1
В работе выполнено исследование эффективности программной транзакционной памяти
в компиляторе GCC. Авторы уделяют внимание накладным расходам, возникающим в
процессе обнаружения конфликтующих операций, а именно ложным конфликтам. Экспериментальным путем показано влияние количества ложных конфликтов на время выполнения многопоточных программ, использующих программную транзакционную память.
Ключевые слова: транзакционная память, software transactional memory, многопоточное
программирование, синхронизация многопоточных программ.
Широкое распространение и стремительное развитие многоядерных процессоров требуют создания эффективных средств разработки многопоточных программ [1]. Потоки параллельных программ выполняются в адресном пространстве процесса. Синхронизация доступа
к разделяемым ресурсам является одной из важных и сложных задач при разработке параллельных алгоритмов для многопоточных программ. При реализации алгоритмов синхронизации программист должен не только обеспечивать корректное функционирование – отсутствие взаимных блокировок (deadlock, livelock) и состояний гонок за данными, но и минимизировать время ожидания доступа к разделяемым ресурсам. Простои из-за ожидания освобождения ресурсов не должны снижать масштабируемость и производительность параллельных программ с ростом числа вычислительных ядер.
Широко используемыми примитивами синхронизации доступа к разделяемым данным
являются: семафоры, мьютексы и др. [1]. Однако классические методы синхронизации, основанные на механизме блокировок, позволяют защитить не данные, к которым потоки осуществляют одновременный доступ, а код, одновременно выполняющийся множеством потоков. На самом же деле необходимо блокировать одновременный доступ к памяти.
На сегодняшний день большое внимание уделяется исследованию и разработке методов
и алгоритмов синхронизации, основанных на модели транзакций, в частности программной
транзакционной памяти (software transactional memory – STM [1, 2, 3]). Преимуществом программной транзакционной памяти (ПТП) является то, что потоки в рамках транзакции могут
одновременно без блокировок изменять общую память, но в случае возникновения конфликта – ситуация при которой два или более потока одновременно обращаются к одной и той же
области памяти и один поток выполняет операцию записи, транзакция прерывается и все изменения, произведенные до конфликта, отменяются.
Наиболее трудной задачей при реализации ПТП является обнаружение конфликтов. В
текущей реализации ПТП в компиляторе GCC 4.8 [3] активно используются алгоритмы, основанные на логических часах Лампорта, в которых каждое событие (чтение/запись общей
памяти) помечается временной меткой [4]. Проверка возникновения конфликтов в простейшем случае потребует ведения журнала всех изменений общей памяти, что является неприемлемым с точки зрения накладных расходов на хранения журнала и его анализа во время
фиксации транзакций.
1
Работа выполнена при поддержке РФФИ (гранты № 15-07-02693, 15-07-00653)
335
Альтернатива ведению журнала изменений, является массив записей о владении областями общей памяти [5]. Линейное адресное пространство процесса блоками отображается
на массив записей. Каждой записи массива соответствует несколько областей адресного пространства (рис. 1). При выполнении операции записи в область общей памяти соответствующий ей элемент массива помечается как заблокированный (если он еще не заблокирована,
иначе возникает конфликт). Чтение заблокированных областей памяти так же приведет к
возникновению конфликта. В результате необходимость вести журнал изменений исчезает,
все операции производятся над оригинальной памятью.
Рис 1. Отображение линейного адресного пространства на массив записей о владении областями
общей памяти
Недостаточный размер массива записей о владении приведет к возникновению ложных
конфликтов (ситуации при которой два или более потока оперируют над непересекающимися областями памяти, но отображаемые в один и тот же элемент массива, и как минимум
один из потоков выполняет операцию записи в память). Чрезмерная избыточность элементов
массива приводит к увеличению накладных расходов на организацию транзакционных операций (транзакционное чтение, транзакционная запись).
Для оценки эффективности реализации ПТП в компиляторе GCC, разработан профилировщик многопоточных приложений. В ходе экспериментального исследования, проведенного на тестовых программах из пакета STAMP, было установлено, что причиной 99% отмен
транзакций являются ложные конфликты. Очевидно, что сократив их количество можно существенно уменьшить время выполнения параллельных программ. На основании результатов профилирования, а также путем варьирования размера таблицы записей о владении областями общей памяти, удалось существенно сократить число ложных конфликтов (до 10 раз)
на тестовых программах построения цепочки генов (Genom), а также кластеризации методом
k-средних.
В докладе отражены архитектура профилировщика многопоточных программ, использующих программную транзакционную память, реализованную в компиляторе GCC 4.8. Также
представлены методы сокращения накладных расходов на поиск конфликтующих операций.
Литература
1. M. Herlihy, N. Shavit. The Art of Multiprocessor Programming. Morgan Kaufmann Publishers
Inc., San Francisco, CA, USA, 2008.
336
2. N. Shavit, D. Touitou. Software Transactional Memory. In PODC’95: Proceedings of the fourteenth annual ACM symposium on Principles of distributed computing, New York, NY, USA,
Aug. 1995. ACM, 204–213.
3. TM support in the GNU Compiler Collection. http://gcc.gnu.org/wiki/TransactionalMemory.
4. T. Riegel, C. Fetzer, P. Felber. Time-based Transactional Memory with Scalable Time Bases.
In 19th ACM Symposium on Parallelism in Algorithms and Architectures (SPAA), June 2007.
5. T. Riegel, P. Felber, C. Fetzer. A Lazy Snapshot Algorithm with Eager Validation. In 20th International Symposium on Distributed Computing (DISC), September 2006.
Кулагин Иван Иванович
аспирант Кафедры вычислительных систем СибГУТИ (630102, Новосибирск, ул.
Кирова, 86) тел. 8-913-772-09-19, e-mail: ivan.i.kulagin@gmail.com.
Курносов Михаил Георгиевич
к.т.н., директор Центра параллельных вычислительных технологий СибГУТИ (630102,
Новосибирск, ул. Кирова, 86) тел. (383) 2-698-275, e-mail: mkurnosov@gmail.com.
Analysis of detection the false conflicts in an applications using the software transaction
memory
I. Kulagin, M. Kurnosov
This work represents the result of experimental investigation of the efficiency software transactional memory in the GCC compiler. The authors attend to overhead on the detecting conflicting
operations, in particular false conflicts. This work shows how this effect influences to execution
time of the parallel programs with software transactional memory.
Keywords: software transactional memory, multithreading, profile guided optimization.
337
Балансировка нагрузки агрегированных каналов сетевого маршрутизатора
Балансировка нагрузки агрегированных каналов
сетевого маршрутизатора
М.В. Онищенко
Повышение роли телекоммуникаций в жизни общества в целом и каждого человека в
частности выдвигает все новые требования к самим сетевым технологиям, которые должны
обеспечить устойчивый доступ к постоянно расширяющемуся перечню информационно
коммуникационных услуг и связанную с этим обработку всевозрастающих объемов пользовательского трафика.
Высокая отказоустойчивость и потребность в построении высокопроизводительных вычислительных сетей в условиях ограниченных ресурсов послужили причинами развития технологий агрегации.
Агрегирование - объединение каналов передачи данных для построения канала с большей пропускной способностью, позволяющие не только повысить суммарную пропускную
способность сети, но и более эффективно использовать существующие каналы передачи
данных, увеличить показатели надежности.
Реализация эффективного распределения данных между каналами при объединении в
единую резервированную среду требует исследования методов балансировки нагрузки и
оценки их эффективности. В рамках данной работы произведено исследование алгоритмов
балансировки сетевой нагрузки, таких как Round Robin, Weighted Round Robin, Least Session,
Least Bandwidth, Least Load First.
Произведена опытная эксплуатация алгоритмов, реализованных в виде службы балансировки сервисного маршрутизатора ESR1000, собран стенд на основе модуля генерации сетевой нагрузки (IXIA).
Результат произведѐнных испытаний позволил дополнить алгоритмы коэффициентом
надежности позволяющий повысить качество распределения сессий между каналами.
Ключевые слова: балансировка сетевой нагрузки, агрегированные каналы, пропускная
способность сети.
Онищенко Максим Викторович
аспирант Кафедры вычислительных систем СибГУТИ, (630102, Новосибирск,
ул. Кирова, 86), e-mail: Onischenko.m.v@gmail.com.
Paper Preparation Manual for “Vestnik SibGUTI”
M. Onischenko
The implementation of efficient distribution of data between channels when combined into a
single redundant environment requires research methods of load balancing and evaluating their
effectiveness. As part of this work investigated the network load balancing algorithms, such as
the Round Robin, Random, Weighted Random, Least Session, Least Bandwidth, Least Load
First.
Keywords: network load balancing, aggregated channels, network bandwidth.
338
Расчет моментов случайных величин при эрланговском времени обслуживания
Расчет моментов случайных величин
при эрланговском времени обслуживания 
В.А. Павский, К.В. Павский
В рамках теории массового обслуживания построена математическая модель функционирования вычислительных систем при обслуживании потока задач. Рассматривается система M/En/1, в обозначениях Кендалла. Получено аналитическое решение для математического ожидания числа нерешенных задач в вычислительной системе и соответствующая дисперсия.
Ключевые слова: Вычислительные системы, математическая модель, обслуживание потока задач, расчет показателей.
1. Введение
Одним из режимов функционирования вычислительных систем (ВС) является обслуживание потока задач [1]. В работе рассматривается обслуживание потока пакетов задач. Каждый пакет состоит из нескольких задач одной сложности [1], которые обрабатываются последовательно. Требуется проанализировать эффективность функционирования ВС. В качестве основы для показателей эффективности, относящихся к группе осуществимости решения задач, используем математическое ожидание и дисперсию числа пакетов в ВС.
Для анализа функционирования таких систем применяются модели теории массового обслуживания (ТМО) [1]. Если потоки требований не являются простейшими, то решение
обычно находится численными методами.
В работе предлагается модель ТМО, в обозначениях Кендалла, это система M/En/1, рассмотренная, например, в [2]. Получено аналитическое решение для математического ожидания и дисперсии методом.
2. Математическая модель
На одноканальную систему массового обслуживания (СМО) поступает пуассоновский
поток требований интенсивностью α . Каждое требование проходит n этапов обслуживания.
Время обслуживания подчинено распределению Эрланга порядка n и параметром β [2]. По
завершении обслуживания сразу начинается обслуживание очередного требования.
Требуется найти математическое ожидание номера этапа, на котором находится система при
обслуживании требований и соответствующую дисперсию.
3. Исследование модели
Пусть Pk (t ) - вероятность того, что в момент времени t в СМО находится на этапе k,
k  0,1,... , t [0, ) . Считаем, что Pk (t )  0 при k  0 , тогда система дифференциальных
уравнений имеет вид [2]:

Работа выполнена при поддержке РФФИ (грант №13-07-00160).
339
2
P0' (t )  α  P0 (t )  nβ  P1 (t ),
 '
Pk (t )  (α  nβ ) Pk (t )  α  Pk  n (t )  nβPk 1 (t ),
(1)
с начальными условиями
P0 (0)  1 , Pk (0)  0
(2)
и условием нормировки

 Pk (t )  1 .
(3)
k 0
Получим аналитическое решение для математического ожидания числа требований и
дисперсии методом, предложенным в [3, 4]. Для системы (1), с учетом (2) и (3), введем производящую функцию

F ( z, t )   z k Pk (t ) .
(4)
k 0
Умножая уравнение k системы (1) на z k и суммируя, получим





k 0
k 0
k 1
k 0
k 0
 z k Pk' (t )  α  z k Pk (t )  nβ  z k Pk (t )  α  z k Pk  n (t )  nβ  z k Pk 1 (t ) .
Выражая каждое слагаемое полученного уравнения через производящую функцию (4),
будем иметь

nβ
nβ
F ( z, t )  αF ( z, t )  nβF ( z, t )  nβP0 (t )  αz n F ( z, t ) 
F ( z, t ) 
P0 (t ) .
t
z
z
После приведения подобных членов, получим линейное уравнение
nβ 

nβ 


F ( z, t )   α  nβ  αz n   F ( z, t )   nβ   P0 (t ) .
z 
t
z 


(5)
Найти решение уравнения (5) можно, используя преобразование Лапласа, но оно будет
громоздко и малопригодно в инженерных расчетах. Даже в стационарном режиме его
решение, приведенное в [2], предлагается искать численными методами. Найдем точное
решение для математического ожидания и дисперсии методом в стационарном режиме,
используемым в работе [4]. Поскольку модель относится к классу M / En / 1 , то она
эргодическая и стационарный режим существует всегда. Введем следующие
F ( z, t )
 0 , с учетом
обозначения: pk  lim Pk (t ) , F ( z )  lim F ( z, t ) , и, кроме того, lim
t
t 
t 
t 
которых уравнение (5) запишется в виде
F ( z) 
nβ (1  z ) p0
αz
n 1
 (α  nβ )  z  nβ
.
(6)
Из (4) следует, что F (1)  1 и, кроме того, в уравнении (6) z  1 является корнем и числителя и знаменателя. Воспользуемся этой информацией, чтобы найти p0 .Если z  1 то имеем
неопределенность {0/0}, поэтому, применяя к (6) правило Лопиталя, будем иметь
nβ  nα  nβ  p0 . Выражая p0  ( β  α) β через параметры, после деления числителя и знаменателя на (1  z ) , получим
340
3
n( β  α )
F ( z) 
n
nβ  α  z k
.
(7)
k 1
Вычислим производную функции (7). Имеем


d  n( β  α )
d
F ( z)  
n
dz
dz
 nβ  α  z k

k 1




.



После элементарных преобразований находим, что
n
d
F ( z) 
dz
nα ( β  α )  kz k 1
k 1
n
.
(nβ  α  z k ) 2
k 1
Вычисляя вторую производную, получим
d2
dz
2
F ( z) 
n
nα( β  α)
n
n
k 1
k 1
[(  k (k  1) z k 2 )(nβ  α  z k )  2α(  kz k 1 ) 2 ] .
n
(nβ  α  z k ) 3 k 1
k 1
Пусть ξ - случайная величина, характеризующая число требований находящихся в СМО.
Из свойства производящей функции (4) следует, что
Mξ 
2


2


F (1) , а Dξ 
F (1)  F (1)   F (1)  .
2
z

z

 z
 z
(8)
Учитывая (8), находим
(n  1)α

Mξ  2( β  α ) ,


α
 Dξ 
2

n ( β  α) 2

.
2

n
 n(n  1)  
2
n( β  α)  k (k  1)  2α
   Mξ  M ξ .
 2  

k 1
(9)
В частном случае, n  1, из (9) получаем известные формулы
Mξ 
αμ
α
, Dξ 
,
β α
( β  α) 2
при естественном ограничении α<μ.
Если n  2
Mξ 
10αβ  α 2
3α
, Dξ 
.
2( β  α)
4( β  α ) 2
Замечание. Применить метод моментов [3] для нахождения математического ожидания
непосредственно из уравнения (5), бессмысленно, поскольку неизвестно P0 (t ) . В самом деле,
учитывая (8), из (5) получаем уравнение
341
4
d
Mξ (t )  α  nβ  (n  1)α  nβP0 (t ) .
dt
(10)
Так как правая часть уравнения известна только для стационарного случая, то если t   , то
p0  1  α / β , а производная равна 0. Подставляя эти значения в уравнение (10), получаем
тождество. Это объясняется наличием корня z=1 в обеих частях уравнения (5).
4. Заключение
Во многих книгах и теоретических работах по теории массового обслуживания, ставших
классическими, приводятся модели, которые ограничиваются нахождением вероятностей состояний, то есть дают либо точные, но громоздкие формулы, либо их оценки, а о моментах
упоминают по мере необходимости. Такой подход, конечно, не популяризирует теорию массового обслуживания. В самом деле, в приложениях, по вполне понятным причинам, часто
достаточно знать моменты случайных величин, а исследователю неинтересны громоздкие и
труднообозримые формулы. А ведь, через использование понятия «среднего», можно получать результаты удобные для инженерных расчетов, но порой недоступные другим методам.
Литература
1. Хорошевский В.Г. Архитектура вычислительных систем. М.: МГТУ им. Баумана, 2008. –
520 с.
2. Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. – 432 с.
3. Павский В.А., Павский К.В., Хорошевский В.Г. Вычисление показателей живучести распределенных вычислительных систем и осуществимости решения задач // Искусственный интеллект. – 2006. – №4. – С. 28-34.
4. Хорошевский В.Г., Павский В.А., Павский К.В. Расчет показателей живучести распределенных вычислительных систем // Вестник Томского государственного университета.
Управление, вычислительная техника и информатика. – 2011. – №2 – С. 81-88.
Павский Валерий Алексеевич
Профессор, д.т.н., зав. кафедрой высшей математики Кемеровского технологического
института пищевой промышленности (650056, г. Кемерово, б-р Строителей, д.47), тел. (3842)
734200, e-mail: pavvm@kemtipp.ru.
Павский Кирилл Валерьевич
Доктор технических наук, доцент, доцент Кафедры ВС ФГОБУ ВПО СибГУТИ, научный
сотрудник Лаборатории ВС ИФП СО РАН (630090, Новосибирск, Лаврентьева, 13), тел. (383)
3332171, e-mail: pkv@isp.nsc.ru.
Calculation of random variates for Erlang distribution of service time
Valery A. Pavsky, Kirill V. Pavsky
The mathematical model of computer systems functioning for service of tasks flow is constructed. The model is based on the queuing theory. The system M/En/1 using Kendall's notation is consider. The analytical results of calculating mathematical expectation of servicing
tasks number and dispersions are obtained.
Keywords: computer systems, mathematical model, service of tasks flow, indices calculation.
342
Стохастическая модель функционирования распределенных вычислительных систем
с отказами и полным восстановлением
Стохастическая модель функционирования
распределенных вычислительных систем
с отказами и полным восстановлением
К.В. Павский
В рамках теории массового обслуживания построена математическая модель функционирования вычислительных систем для расчета показателей надежности. Рассматривается система с полным восстановлением. Получено аналитическое решение для математического ожидания количества неисправных машин вычислительной системе и соответствующая дисперсия.
Ключевые слова: Распределенные вычислительные системы, теория массового облуживания, математическая модель, надежность, математическое ожидание, дисперсия, аналитические решения.
1. Введение
Большемасштабные распределенные вычислительные системы (ВС) состоят из большого
числа N=104 ÷ 106 элементарных машин (ЭМ) [1]. Такие системы, в силу большемасштабности, не должны выходить из строя, т.е. могут находиться либо в состоянии высокой производительности, либо низкой, сохраняя при этом работоспособность основных своих подсистем,
в частности, восстанавливающей системы (ВУ).
Для анализа функционирования таких систем в данной работе применяется аппарат теории массового обслуживания [2].
2. Модель ВС
Имеется распределенная вычислительная система (ВС), состоящая из N элементарных
машин (ЭМ) [1]. Время работы каждой ЭМ является случайной величиной подчиненной экспоненциальному закону с параметром λ - интенсивностью выхода ЭМ из строя. Вышедшая
из строя ЭМ попадает в восстанавливающую систему (ВУ). Время восстановления является
случайной величиной, подчиненной экспоненциальному закону с параметром  - интенсивностью восстановления. Предполагается, что, независимо от числа ЭМ, находящихся в ВУ,
среднее время восстановления, любого числа k , k  N , ЭМ, находящихся на восстановлении, t cp  1 / μ (см. рисунок 1).

Работа выполнена при поддержке РФФИ (грант №13-07-00160).
343
2
Система восстановления
Вычислительная система
μ
(Nk) λ
Рис. 1. Модель функционирования распределенной вычислительной системы.
3. Математическая модель
На систему массового обслуживания (СМО) из бесконечного источника поступает пуассоновский поток требований интенсивностью ( N  k )  λ , 0  k  N . Требование, поступившее в СМО, вместе с другими k  1 требованиями ждет начала обслуживания. Через случайное время начинается обслуживание сразу всех k требований, с интенсивностью . Пусть
Pk (t ) − вероятность того, что в момент времени t в СМО находится k требований, t [0, ) ,
k  0,1,..., N .
Тогда система дифференциальных уравнений для вероятностей Pk (t ) будет записана в
виде
N
 '
 P0 (t )   N  λP0 (t )  μ  Pk (t ),
k 1

 '
P
(
t
)
((
N
k
)
λ
μ
)  Pk (t )  (( N  (k  1))  λ  Pk 1 (t ), k  1,2,..., n  1,





 k
 '
 PN (t )   μ  PN (t )  λ  PN 1 (t ),


(1)
начальные условия
Pi (0)  1,
Pk (0)  0, k  i.
(2)
и условие нормировки
N
 Pk (t )  1, t [0, ).
k 0
344
(3)
3
4. Расчет моментов
Получим аналитическое решение для математического ожидания M (t ) числа требований
(в модели функционирования ВС это отказавшие машины ВС) и дисперсии D(t ) методом,
предложенным в [3, 4]. Для системы (1), с учетом (2) и (3), введем производящую функцию

F ( z, t )   z k Pk (t ) .
(4)
k 0
Умножая уравнение k системы (1) на z k и суммируя, получим уравнение



F ( z , t )   μ  F ( z, t )  Nλ(1  z ) F ( z, t )  PN (t )  z N 
t


 λz (1  z ) F ( z, t )  NPN (t )  z N 1   μ .
 z

(5)
Возьмем производную по переменной z от правой и левой частей выражения (5), тогда
 



F ( z, t )   μ  F ( z, t )  Nλ( F ( z, t )  PN (t ) z N )  Nλ(1  z ) F ( z, t )  NPN (t ) z N 1  
z t
z
 z


 
N 1 
N 2 
(6)
 λ(1  2 z ) F ( z, t )  NPN (t ) z
F ( z, t )  N ( N  1) PN (t ) z
  λz (1  z )
.
 z

 z z

Полагаем в (6) z=1, получаем
d
M (t )  ( μ  λ) M (t )  Nλ .
dt
Возьмем производную по переменной z от правой и левой частей (6), тогда
2 
2


F ( z, t )   μ 
F ( z, t )  Nλ F ( z, t )  NPN (t ) z N 1  
2 t
2
z



z
z
 2



F ( z, t )  N ( N  1) PN (t ) z N  2  
 Nλ F ( z, t )  NPN (t ) z N 1   Nλ(1  z )
 z 2

 z



 2



F ( z, t )  N ( N  1) PN (t ) z N  2  
 2 λ F ( z, t )  NPN (t ) z N 1   λ(1  2 z )
2


 z

 z


 2

 3
 λz
F ( z, t )  N ( N  1) PN (t ) z N  2   λz (1  z )
F ( z, t )  N ( N  1)( N  2) PN (t ) z N  3 
 z 2

 z 3



 3
 λz (1  z )
F ( z, t )  N ( N  1)( N  2) PN (t ) z N  3 .
 z 3


Полагаем z=1 в последнем равенстве, тогда
d
Q(t )  ( μ  2 λ  Q(t )  2 λ( N  1)(M (t )  NPN (t ))  2 λN ( N  1) PN (t ) ,
dt
345
4
где Q(t ) 
2
z 2
F ( z, t )
.
z 1
Итак, после необходимых преобразований получаем
d
 dt M (t )  ( μ  λ) M (t )  Nλ,

d
 Q(t )  ( μ  2 λ)  Q(t )  2 λ( N  1)  M (t ),
 dt
Q(t )  D(t )  M (t )  M 2 (t ),


(7)
начальные условия определяем из (2)
M (0)  i, D(0)  0 .
(8)
С учетом начальных условий (8), решением для (7) будет
Nλ
μ  i  λ( N  i )  ( μ  λ)t

e
,
M (t )  μ  λ 
μλ


2 N ( N  1) λ2
 C  e  ( μ  2 λ)t 
 D(t ) 


(
μ
λ
)(
μ
2
λ
)


μ  i  λ( N  i )  ( μ  λ)t
 M (t )  M 2 (t ),
e
 2( N  1) 
μλ

(9)
2 N ( N  1) λ2
μ  i  λ( N  i )
.
 2( N  1)
( μ  λ)( μ  2 λ)
μλ
На рисунках 2 - 4 представлен расчет среднего числа отказавших машин находящихся в
где C  i 2  i 
ВУ и дисперсии (9) при λ  10 4 1/ч, N  210 4 ЭМ, i  0 ЭМ.
Рис. 2. Зависимость среднего числа отказавших машин в ВУ от времени t
4
при λ  10 1/ч, N  210 4 , i  0 , =0,1 1/ч.
Из рисунков видно, что при отсутствии резерва в среднем ожидает восстановления до 40,
9 и 5 ЭМ при суммарном восстановлении отказавших машин в течение 10, 2,0 и 1,0 ч, соот346
5
ветственно. Стабилизация числа ЭМ, ожидающих восстановления, происходит в течение 153
ч, 32 ч и 6 ч, соответственно.
Рис. 3. Зависимость среднего числа отказавших машин в ВУ от времени t
при λ  10 4 1/ч, N  210 4 , i  0 , =0,5 1/ч.
Рис. 4 Зависимость среднего числа отказавших машин в ВУ от времени t
4
при λ  10 1/ч, N  210 4 , i  0 , =1,0 1/ч.
Таким образом, анализ построенных моделей, позволяет утверждать, что для высокопроизводительной работы ВС необходимо обеспечить наличие избыточности (приблизительно
0,3% от объема, не более 105 ЭМ ВС) и эффективной восстанавливающей системы (суммарное восстановление не более 10 ч), причем уменьшение продолжительности восстановления
вышедших из стоя ЭМ, позволяет уменьшить объема избыточность без потери качества
функционирования вычислительной системы.
347
6
5. Заключение
В работах [5, 6] показывается, что предположение о выходе из строя вычислительных
модулей (ЭМ) по экспоненциальному закону не всегда дает хорошее приближение. Хорошо
приближение дает распределение Вейбула, либо логарифмически нормальное (т.е. нормальное распределение от логарифма случайной величины). В то же время, исследование функционирования ВС в предположении справедливости экспоненциального закона выхода из
строя ЭМ позволяет, благодаря хорошо развитой теории, получать глубокие результаты, в
отличие от использования других законов распределения [7].
Литература
1. Хорошевский В.Г. Архитектура вычислительных систем. М.: МГТУ им. Баумана, 2008. –
520 с.
2. Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. – 432 с.
3. Павский В.А., Павский К.В., Хорошевский В.Г. Вычисление показателей живучести распределенных вычислительных систем и осуществимости решения задач // Искусственный интеллект. – 2006. – №4. – С. 28-34.
4. Хорошевский В.Г., Павский В.А., Павский К.В. Расчет показателей живучести распределенных вычислительных систем // Вестник Томского государственного университета.
Управление, вычислительная техника и информатика. – 2011. – №2 – С. 81-88.
5. Schroeder В. A, Gibson Garth A. large-scale study of failures in high-performance computing
systems // Dependable Systems and Networks (DSN2006): proceedings of the International
Conference. – USA: Philadelphia, PA, 2006. – P. 10.
6. Gibson Garth A. Analyzing failure data: http://www.pdl.cmu.edu/FailureData/ (дата обращения 27.02.2015 г.).
7. Pavskii V.A., Pavskii K.V. Stochastic simulation and analysis of the operation of computing systems with structural redundancy // Optoelectronics, instrumentation and data processing, Allerton Press, Inc., 2014. Vol.50, No 4, pp. 363 - 369.
Павский Кирилл Валерьевич
Доктор технических наук, доцент, доцент Кафедры ВС ФГОБУ ВПО СибГУТИ, научный
сотрудник Лаборатории ВС ИФП СО РАН (630090, Новосибирск, Лаврентьева, 13), тел. (383)
3332171, e-mail: pkv@isp.nsc.ru.
Calculation of random variates for Erlang distribution of service time
Kirill V. Pavsky
The mathematical model of computer systems functioning to calculate reliability indices is constructed. The system with restoration of all is considered. The analytical solutions of mathematical expectation of failed machines and dispersions are obtained.
Keywords: Distributed computer systems, queuing theory, reliability, mathematical model,
mathematical expectation, dispersions, analytical solutions.
348
Модификация системы управления распределенными ресурсами TORQUE
Модификация системы управления
распределенными ресурсами TORQUE
Е. Н. Перышкова, С.Н. Мамойленко1
В статье рассматривается модификация системы управления ресурсами Torque, реализующая базовые функции обслуживания масштабируемых задач на пространственнораспределенных вычислительных системах.
Ключевые слова: распределенные вычислительные системы, система управления ресурсами torque, масштабируемые задачи.
1. Введение
Пространственно-распределѐнные вычислительные системы (ПРВС) относятся к перспективным средствами обработки информации и используются при решении сложных задач
науки и техники [1].
В архитектурном плане подсистема ПРВС представляет собой кластерную вычислительную систему (ВС) – композицию множества элементарных машин (ЭМ) и сетисвязеймеждуними. При создании подсистем могутбытьиспользованыкакстандартныепромышленные, такиспециальносозданные устройства. Элементарная машина является основным
структурным и функциональным компонентом кластерной ВС и формируется из локального
коммутатора (ЛК), процессора ипамяти. Кластерная ВС функционирует под управлением системного программного обеспечения [1], включающего, в том числе, систему управления ресурсами (СУР), например, TORQUE [2], Altair PBS Pro, SLURM [3], HTCondor и др.
Основным назначением ПРВС является обработка (решение) задач. Задача – это требование выполнить параллельную программу на ресурсах ПРВС. Описание необходимых для
решения задачи ресурсов ПРВС формируется пользователем и задается ресурсным запросом,
включающем: параллельную программу (созданную, например, в модели передачи сообщений) и паспорт задачи (написанный, например, на языке Job SubmissionDescriptionLanguage –
JSDL).
Процесс решения задач на ПРВС организован в пакетном режиме и предусматривает
следующие шаги:
1) размещение задачи пользователя в очереди задач. В ПРВС функционирует распределѐнная очередь задач, объединяющая локальные очереди задач СУР подсистем ПРВС. При
этом задачи могут поступать как в глобальную очередь (один поток задач), так и в локальные
очереди СУР подсистем ПРВС (множество потоков задач).
2) выделение необходимых ресурсов ПРВС и определение времени начала выполнения
параллельной программы;
3) выполнение параллельной программы на выделенных ресурсах подсистемы ПРВС.
4) сохранение результатов выполнения параллельной программы.
Повысить эффективность эксплуатации ресурсов ВС и снизить время нахождения задач в
очереди возможно, если, в частности, каждая из них будет допускать решение на различных
1
Работа выполнена при поддержке Совета по грантам Президента Российской Федерации (проект МД2620-2014.9) и Российского фонда фундаментальных исследований (гранты № 15-07-00048, 13-07-00160).
349
конфигурациях вычислительных ресурсов. В этомслучае задачи называют масштабируемыми, или пластичными (moldable).
Исследования показывают, что свойством масштабируемости обладают до 98 % задач,
решаемых на высокопроизводительных ВС [4]. Анализ существующих менеджеров и систем
планирования загрузки ресурсов распределенных ВС показывает, что большинство из них
имеют лишь базовую поддержку масштабируемых (moldable) задач, которая не позволяет
определить предпочтения (или приоритеты) на выделение конкретных рангов вычислительных подсистем.
Коллективом авторов была предложена модификация СУР TORQUE, реализующая базовые функции по обслуживанию масштабируемых задач.
2. Анализ и оптимизация системы управления ресурсами TORQUE
Как было сказано ранее, для управления ресурсами подсистем ПРВС используются СУР.
В рамках данной работы проведена модификация наиболее распространенной свободной реализаций данного класса программного обеспечения: TORQUE – TerascaleOpenSourceResourceandQUEueManager. В рамках данного раздела под ВС будем понимать подсистему ПРВС.
2.1. Программное обеспечение системы управления ресурсами РВС
TORQUE - одна из версий системы PBS (Portable Batch System - система пакетной обработки заданий). TORQUE управляет загрузкой вычислительных комплексов, состоящих из
определен- ного количества вычислительных узлов, работающих под управлением операционной системы семейства. Функциональная схема СУР TORQUE представлена на рисунке 1.
Рис. 1. Функциональная схема СУР TORQUE
Каждый вычислительный узел ВС оснащается локальным компонентом СУР:
PBS MOM – MachineOrientedMiniserver, который осуществляет управление ресурсами данного узла. Также предусмотрен централизованный компонент: PBS Server , который поддерживает очередь задач, взаимодействует с планировщиком ресурсов, а также, при помощи соответствующего локального компонента, координирует работу узлов ВС и осуществляет мониторинг их состояния. В качестве планировщика ресурсов в СУР предусмотрена возможность
использования как встроенного компонента PBS Scheduler , так и внешнего модуля, например, Maui Cluster Scheduler или Moab Workload Manager.
350
2.2. Паспорт задачи
Задача вTORQUE представляет собой абстрактную сущность, состоящую из набора команд и параметров. Задача представляется пользователю в виде паспорта (скрипта) для оболочки (shell), содержащего требования к ресурсам, атрибуты задания и набор команд, которые необходимо выполнить. Задачу сначала необходимо поставить в очередь Torque, затем
из этой очереди она будет передана на один узлов для выполнения.
Пример простого паспорта задачи представлен на рисунке 2.
Рис. 2. Паспорт задачи в СУР TORQUE
Строки со 1-й по 3-ю являются директивами TORQUE. Система будет читать паспорт задачи до тех пор, пока не найдет первую строку, которая не является валидной директивой
torque, и останавливается. Это означает, что оставшаяся часть сценария содержит список команд, которые пользователь желает запустить.
Строка 1 задает опцию «–N», определяющую название задачи. Строка 2 определяет опцию ресурса «–l», далее следует запрос определенного ресурса. Конкретно, строка 2 сообщает, что запрашиваются ресурсы, в объеме 4 процессоров. Опция «–j oe» требует, чтобы
TORQUE объединила потоки вывода stdout и stderr в единый поток stdout.
2.3. Понятие атрибута задачи
Задача обладает определенным набором атрибутов, значения которых задаются изначально при создании задачи и могут быть изменены в процессе его выполнения. Примеры
атрибутов задания - название задачи, время выполнения, путь к выходному файлу и
др.Атрибуты задачи задаются при постановке в очередь. Также их можно изменить уже после этого по различным причинам (например, была сделана ошибка при определении ресурсов или истекло время выполнения и его необходимо продлить).
Большинство атрибутов может изменить владелец задачи, которым может быть пользователь, поставивший задачу в очередь командой qsub, либо произвольная учетная запись,
указанная при постановке в очередь. Тем не менее, если задача уже выполняется, то лимиты
ресурсов не могут быть изменены. Такими ресурсами являются: процессорное время, обычное время, число задействованных процессоров, объем памяти. Примером атрибутов задания
может служить название задания, его идентификатора, желаемое время начала выполнения
задания.
351
2.4. Решение масштабируемых задач
В предложенной авторами модификации СУР TORQUEреализована возможность запуска масштабируемых задач. Каждая задача представлена вектором параметров. Элементы вектора задают допустимые значения ранга задачи (количество требуемых ЭМ) и приоритет выбора этих значений.
Для активации режима обработки масштабируемых задач достаточно в паспорте задачи
вместо атрибута «–l» использовать новый атрибут «–L». Формат опции идентичен использованию опции определения ресурсов для задачи, только после каждого запроса указывается и
приоритет выбора этих значений.
Пример паспорта масштабируемой задачи представлен на рисунке 3.
Рис. 3. Паспорт масштабируемой задачи в СУР TORQUE
При постановке масштабируемой задачи в очередь, планировщик выбирает тот набор параметров, у которого имеется максимальный приоритет.
Для оптимизации планирования решения масштабируемых задач было предложено модифицировать алгоритм планирования. Стандартный планировщик СУР TORQUE распределяет ресурсы для задач по алгоритму FCFS (First Come First Served). При его реализации задачи запускаются в том же порядке, в котором они были поставлены в очередь, как только
освобождается достаточное количество ресурсов кластера. Для оптимизации алгоритма FCFS
может быть использована техника Backfill.
В ходе работы алгоритма Backfill обрабатывается очередь задач, ожидающих запуска на
выполнение [4]. Задачи в очереди упорядочены по времени их регистрации в системе. При
каждой регистрации и каждом завершении задачи происходит выполнение следующих шагов алгоритма:
1) при наличии необходимого количества свободных процессоров для запуска первой в
очереди задачи эта задача удаляется из очереди и запускается на выполнение;
2) если для запуска первой в очереди задачи свободных процессоров не хватает, то вычисляется момент времени, когда их станет достаточно, и производится резервирование для
данной задачи;
3) продолжается движение по очереди с запуском на выполнение задач, не нарушающих
резервирование первой в очереди задачи. Задачи, требующие небольшого числа процессоров
или процессорного времени, могут запускаться на выполнение вне очереди при наличии необходимого количества доступных ресурсов. При этом их запуск не должен задерживать выполнение предыдущих по очереди задач. Таким образом удаѐтся задействовать вычислительные ресурсы, простаивающие во время выполнения первоочередных задач.
Результаты моделирования будут представлены в докладе.
352
Литература
1. Хорошевский В.Г. Распределѐнные вычислительные системы с программируемой структурой// Вестник СибГУТИ. 2010. №2 (10). С. 3−41.
2. Torque
Resource
Manager
[Электронныйресурс].
Режим
доступа:
http://www.adaptivecomputing.com/products/open-source/torque/ (дата обращения 03.09.2014).
3. SLURM: Simple Linux Utility for Resource Management, A. Yoo, M. Jette, and M. Grondona,
Job Scheduling Strategies for Parallel Processing, volume 2862 of Lecture Notes in Computer
Science, pages 44-60, Springer-Verlag, 2003.
4. Lifka D. The ANL/IBM SP scheduling system // Job Scheduling Strategies for Parallel Proc.
LNCS. Springer-Verlag, 1995. Vol. 949. P. 295–303.
Перышкова Евгения Николаевна
старший преподаватель кафедры вычислительных систем СибГУТИ,
Новосибирск,
ул.
Кирова,
86)
тел.
(383)
269-82-93,
e_perishkova@cpct.sibsutis.ru.
(630102,
e-mail:
Мамойленко Сергей Николаевич
д.т.н., доцент, профессор кафедры вычислительных систем СибГУТИ, (630102,
Новосибирск, ул. Кирова, 86) тел. (383) 269-82-93, e-mail: msn@sibsutis.ru.
353
Исследование алгоритмов делегирования выполнения критических секций
на выделенных процессорных ядрах
Исследование алгоритмов делегирования
выполнения критических секций
на выделенных процессорных ядрах
Н. Г. Рощупкин, А. А. Пазников1
Рассматривается метод делегирования выполнения критических секций на выделенных
ядрах процессора. Метод позволяет повысить масштабируемость многопоточных программ за счѐт снижения конкурентности доступа и уменьшения накладных расходов на
обращение к кэш-памяти. Предложены алгоритмы, позволяющие минимизировать время
выполнения критических секций. Алгоритмы учитывают архитектурные особенности современных вычислительных систем с общей памятью и загрузку процессорных ядер, выполняющих критические секции.
Ключевые слова: RCL, критические секции, многопоточное программирование, масштабируемость.
1. Введение
В последнее десятилетие происходит значительное увеличение количества процессорных
ядер в вычислительных системах (ВС) с общей памятью [1], относящихся к классам SMP и
NUMA. В связи с этим возрастает потребность в создании масштабируемых параллельных
программ. Для обеспечения масштабируемости применяются алгоритмы и структуры данных, не использующие блокировки (lock-free). Недостатками такого подхода являются ограниченная область применения и существенные трудозатраты, связанные с разработкой программ. В отличие от данного подхода, механизм блокировок значительно проще в использовании и реализации. Поэтому востребованным является создание масштабируемых алгоритмов реализации взаимного исключения.
Масштабируемость блокировок существенно зависит от решения проблем, связанных с
конкурентным доступом (access contention) и локальностью кэш-памяти (cache locality). Конкурентный доступ проявляется при одновременном обращении нескольких потоков к критической секции, защищѐнной одним объектом синхронизации, что приводит к увеличению
загруженности кэш-памяти. Локальность кэша имеет существенное значение в том случае,
когда внутри критической секции выполняется обращение к разделяемым данным, которые
перед этим использовались на другом ядре. Данное обстоятельство приводит к промахам по
кэшу (cache misses) и значительному увеличению времени выполнения критических секций.
Среди наиболее эффективных подходов к реализации масштабируемых блокировок
можно назвать CAS spinlocks, MCS-locks [2], Flat combining [3], СС-Synch [4], DSMSynch [4], Oyama lock [5]. Отдельно необходимо выделить ряд методов, предполагающих делегирование выполнения критический секций выделенному процессорному ядру для повышения локальности кэша [3, 6, 7, 8]. Работы [7, 8] посвящены разработке потокобезопасных
структур данных (списков и хеш-таблиц) на основе делегирования выполнения критических
секций. В статье [6] предлагается универсальное аппаратное решение, включающее набор
процессорных инструкций для передачи управления выделенному ядру процессора. Flat
Combining [3] относится к программно-реализуемым методам. В роли сервера, выполняюще1
Работа выполнена при поддержке РФФИ (гранты № 15-07-02693, 15-07-00653)
354
го критические секции, выступают все потоки. Однако выполнение процедуры передачи
управления критической секцией между потоками приводит к снижению производительности даже при незначительном конкурентном доступе. Кроме того, данные алгоритмы не поддерживают блокировки потоков внутри критических секций, как вследствие активного ожидания, так и из-за блокировки потока на уровне ядра операционной системы.
2. Делегирование выполнения критических секций
В работе рассматривается метод выполнения критических секций на выделенных узлах
процессора (Remote Core Locking, RCL) [9], позволяющий повысить производительность существующих многопоточных программ. Данный программно-реализуемый метод предполагает замену в существующих программах высоконагруженных критических секций на удалѐнный вызов процедур для выполнения на выделенных процессорных ядрах (рис.). Преимуществом RCL является сокращение накладных расходов на синхронизацию выполнения
критических секций за счет сокращения конкурентного доступа, приводящего к снижению
загрузки шины данных (bus saturation), и повышение локальности, позволяющая уменьшить
время обращений к кэш-памяти. Конкурентность доступа снижается за счѐт использования
отдельной выделенной кэш-линии для каждого потока-клиента, которая отвечает за хранение информации о критической секции и активного ожидания потока-клиента. Локальность
обеспечивается тем, что разделяемые данные с большой вероятностью находятся в локальной кэш-памяти ядра, на котором функционирует сервер, что обеспечивает снижение числа
промахов по кэшу.
В работе предлагаются алгоритмы, позволяющие минимизировать время выполнения
критических секций. В алгоритмах учитывается текущая загрузка процессорных ядер, выполняющих критические секции, и неоднородность доступа к памяти в NUMA-системах.
Предлагаются алгоритмы реализации потокобезопасных связных списков на основе метода
RCL. Проведено сравнение с аналогичными структурами данных, не использующими блокировки, а также основанными на известных алгоритмах взаимного исключения. Использование созданных структур позволяет повысить масштабируемость по сравнению с другими реализациями. Составлены рекомендации по использованию метода RCL.
T1
T2
T3
t
S
CS1
CS2
CS3
T1-T3 – рабочие потоки
S– сервер, функционирующий на выделенном ядре
CS1-CS3 – выполнение критических секций
v1,v2 – разделяемые переменные
v1
v2
Рис. Делегирования выполнения критических секций на выделенном процессорном ядре
Литература
1. Хорошевский В. Г. Распределѐнные вычислительные системы с программируемой структурой // Вестник СибГУТИ. 2010. №2 (10). С. 3−41.
355
2. Mellor-Crummey J. M., Scott M. L. Algorithms for scalable synchronization on shared-memory
multiprocessors //ACM Transactions on Computer Systems (TOCS). 1991. V. 9. №. 1.
P. 21-65.
3. Hendler D. et al. Flat combining and the synchronization-parallelism tradeoff // Proceedings of
the twenty-second annual ACM symposium on Parallelism in algorithms and architectures.
ACM, 2010. P. 355-364.
4. Fatourou P., Kallimanis N. D. Revisiting the combining synchronization technique //ACM
SIGPLAN Notices. ACM, 2012. Т. 47. №. 8. P. 257-266.
5. Y. Oyama, K. Taura, and A. Yonezawa. Executing parallel programs with synchronization bottlenecks efficiently // Proceedings of the International Workshop on Parallel and Distributed
Computing for Symbolic and Irregular Applications, PDSIA ’99. 1999. P. 1-24.
6. Suleman M. A. et al. Accelerating critical section execution with asymmetric multi-core architectures //ACM SIGARCH Computer Architecture News. ACM, 2009. Т. 37. №. 1. С. 253-264.
7. Metreveli Z., Zeldovich N., Kaashoek M. F. Cphash: A cache-partitioned hash table //ACM
SIGPLAN Notices. – ACM, 2012. V. 47. №. 8. P. 319-320.
8. Calciu I., Gottschlich J. E., Herlihy M. Using elimination and delegation to implement a scalable NUMA-friendly stack //Proc. Usenix Workshop on Hot Topics in Parallelism (HotPar). –
2013. P. 1-7.
9. Lozi J. P. et al. Remote Core Locking: Migrating Critical-Section Execution to Improve the
Performance of Multithreaded Applications // USENIX Annual Technical Conference. 2012.
P. 65-76.
Рощупкин Никита Геннадьевич
студент 3 курса кафедры вычислительных систем СибГУТИ (630102, Новосибирск,
ул. Кирова, 86) тел. 8-913-986-75-91, e-mail: roshhnikita@gmail.com.
Пазников Алексей Александрович
к.т.н., доцент кафедры вычислительных систем СибГУТИ (630102, Новосибирск,
ул. Кирова, 86) тел. (383) 2-698-286, e-mail: apaznikov@gmail.com.
Research of algorithms execution delegating critical sections on dedicated processor cores
N. G. Roschupkin, A. A. Paznikov
This paper examines a method of critical sections execution delegation on allocated processor
cores. Proposed method would significantly improve the scalability of multithreaded programs
by decreasing access concurrency and lowering cache-miss penalty. This article describes a
number of algorithms that can be used for shortening the critical sections execution time. These
algorithms are implemented taking into account shared-memory computer systems architectural
aspects and utilization of processor cores executing the critical sections.
Keywords: RCL, critical section, multithreaded programming, scalability.
356
Функциональное тестирование облачной платформы OpenStack
Функциональное тестирование облачной
платформы OpenStack1
А. А. Гусаров, В. О. Фульман, А. С. Смоляк
В докладе представлены результаты функционального тестирования свободно распространяемой облачной платформы OpenStack.
Ключевые слова: облачные вычисления, виртуализация, OpenStack.
Облачные вычисления представляют собой модель предоставления ресурсов пользователям по сети как сервис. Интерес, проявляемый к данной технологии, привѐл к росту количества программных продуктов, как коммерческих, так и распространяемых по свободной лицензии, предназначенных для построения различных конфигураций облачных инфраструктур. Среди свободно распространяемых проектов можно выделить наиболее крупные:
OpenStack [1], Opennebula [2], CloudStack [3] и Eucaliptus [4].
На данный момент наиболее активно развивающейся платформой является OpenStack,
первый релиз которой состоялся в 2010 г. OpenStack представляет собой совокупность компонентов, разделяющих между собой функционал управления хранилищами, контроля доступа, конфигурирования виртуальных сетей, тестирования и проведения вычислений.
В докладе представлены результаты тестирования функциональных возможностей свободно распространяемой облачной платформы OpenStack. Смоделирован жизненный цикл, и
собраны показатели производительности различных конфигураций виртуальных машин. Для
проведения исследования была сконфигурирована тестовая облачная инфраструктура на базе оборудования кафедры инновационных инфокоммуникационных систем (ИИКС), созданной в ФГОБУ ВПО «СибГУТИ» совместно с МРФ «Сибирь» ОАО «Ростелеком».
Литература
1. OpenStack: The Open Source Cloud Operating System [Электронный ресурс]. URL:
https://www.openstack.org/software/ (дата обращения: 25.12.2014).
2. OpenNebula
4.12
Documentation
[Электронный
ресурс].
URL:
http://docs.opennebula.org/4.12/ (дата обращения: 25.12.2014).
3. Apache CloudStack [Электронный ресурс]. URL: http://cloudstack.apache.org/
(дата обращения: 25.12.2014).
4. Eucalyptus. Open Source Private Cloud Software [Электронный ресурс]. URL:
https://www.eucalyptus.com/ (дата обращения: 25.12.2014).
Фульман Виталий Олегович
ассистент Кафедры вычислительных систем СибГУТИ, (630102, Новосибирск,
ул. Кирова, 86), e-mail: vitaliyfulman@gmail.com.
1
Работа выполнена при поддержке Совета по грантам Президента Российской Федерации (проект МД2620.2014.9) и Российского фонда фундаментальных исследований (гранты № 15-07-00048, 13-07-00160).
357
Смоляк Андрей Сергеевич
аспирант Кафедры вычислительных систем СибГУТИ, (630102, Новосибирск,
ул. Кирова, 86), e-mail: simpleandrew@gmail.com.
Гусаров Александр Алексндрович
аспирант Кафедры вычислительных систем СибГУТИ, (630102, Новосибирск,
ул. Кирова, 86), e-mail: alexandergusarov@gmail.com.
358
Эвристические алгоритмы распределения виртуальных машин
по узлам облачной вычислительной системы
Эвристические алгоритмы распределения
виртуальных машин по узлам облачной
вычислительной системы1
А. С. Смоляк, В. О. Фульман, А. А. Гусаров
В докладе представлены результаты исследования эвристических алгоритмов применяемых при распределении виртуальных машин по узлам облачной вычислительной системы. На основе полученных измерений предложены методы по повышению эффективности использования вычислительных ресурсов.
Ключевые слова: облачные вычисления, управление ресурсами, CloudSim.
Облачные вычисления – это новый подход к организации предоставления вычислительных ресурсов по требованию. Применение технологии виртуализации позволяет спроектировать гибкую масштабируемую инфраструктуру с высоким уровнем доступности.
Широкая популярность облачных технологий привела к росту нагрузки на центры обработки данных (ЦОД). В этой связи, актуальной является проблема эффективного управления
их ресурсами и разработка алгоритмов, позволяющих за счет повышения уровня консолидации виртуальных машин на узлах вычислительной системы, минимизировать количество потребляемой энергии и тем самым снизить стоимость владения ЦОД.
В облачной инфраструктуре каждая виртуальная машина характеризуется вектором требований, отражающим ее потребность в определенных ресурсах. Такими ресурсами могут
выступать количество процессорных ядер, объѐм оперативной памяти и дискового пространства. Назначение вычислительного узла происходит в зависимости от количества доступных
на нем ресурсов. Для выбора наиболее подходящего узла могут применяться различные эвристики, такие как FFD (First Fit Decreasing) - основанные на расчете совокупной потребности виртуальной машины в ресурсах, а также геометрические эвристики, принимающие во
внимание отношения между векторами требований и доступности.
В докладе описаны эвристические алгоритмы, основанные на геометрических и FFD эвристиках, и представлены результаты их моделирования в среде CloudSim [1]. Получены
данные по количеству задействованных узлов и количеству потреблѐнной энергии для различных наборов виртуальных машин. Предложены методы по повышению эффективности
распределения виртуальных машин по узлам облачной вычислительной системы.
Литература
1. Rajkumar Buyya, Rajiv Ranjan and Rodrigo N. Calheiros, "Modeling and Simulation of Scalable Cloud Computing Environments and the CloudSim Toolkit: Challenges and Opportunities",
Proc. of International Conference on High Performance Computing & Simulation, 2009, June
2009. Р. 1-11.
1
Работа выполнена при поддержке Совета по грантам Президента Российской Федерации (проект МД2620.2014.9) и Российского фонда фундаментальных исследований (гранты № 15-07-00048, 13-07-00160).
359
Фульман Виталий Олегович
ассистент Кафедры вычислительных систем СибГУТИ, (630102, Новосибирск,
ул. Кирова, 86), e-mail: vitaliyfulman@gmail.com.
Смоляк Андрей Сергеевич
аспирант Кафедры вычислительных систем СибГУТИ, (630102, Новосибирск,
ул. Кирова, 86), e-mail: simpleandrew@gmail.com.
Гусаров Александр Алексндрович
аспирант Кафедры вычислительных систем СибГУТИ, (630102, Новосибирск,
ул. Кирова, 86), e-mail: alexandergusarov@gmail.com.
360
361
ОБРАБОТКА ИНФОРМАЦИИ
И
МАТЕМАТИЧЕСКОЕ
МОДЕЛИРОВАНИЕ
РОССИЙСКАЯ НАУЧНО-ТЕХНИЧЕСКАЯ
КОНФЕРЕНЦИЯ
МАТЕРИАЛЫ КОНФЕРЕНЦИИ
Подписано в печать 15.04.2015
формат бумаги 60x84/16, отпечатано на ризографе,
печ.л.22,5, тираж 25 шт.
Отпечатано в типографии СибГУТИ
630102, Новосибирск, ул.Кирова, 86
362
Download