Барчан Константин гр.8204

advertisement
Барчан Константин гр.8204
 Мультимодель - это «множество
моделей М1,М2,... ,МС, снабженное
соответствующим механизмом переключения
между моделями, либо, если необходимо,
механизмом агрегации результатов,
предоставляемых отдельными моделями».
Педрич (Рейгусг 1996)
 С мультимодельной системой нельзя обращаться как с
одномодельной , ибо это может стать причиной
неправильной интерпретации результатов.
 Сравним теперь данную модель с моделью
химического процесса, которая описывает
взаимосвязь между температурой процесса Т и
числом Дамкелера d:
 Очевидно: Характеристика процесса не является
однозначной.
 Данная ситуация обусловлена тем, что размер-
ность пространства, в котором представлены
характеристики, является
недостаточной для однозначного представления
взаимосвязи между ними.
 Для реальных систем, демонстрирующих
неоднозначность своего поведения, должен
существовать дополнительный вход, который
определяет выбор некоторой части
характеристики системы в заданный момент
(подобно тому, что было изображено на рисунке
ранее).
 Однозначно определить выходное состояние а в
заданный момент t (d/t) можно только при
наличии дополнительной информации о
значениях двух переменных, задающих
направление возникающих в ходе процесса
изменений: d’(t), а также Т’(t).
 Представление характеристики процесса в 4мерной системе:
 Если модель системы не содержит (или не
учитывает) некоторые ее входы (из-за отсутствия
информации об их значениях либо нашей
неуверенности в их существовании), то выходное
состояние не может быть
однозначным.
 Первый способ заключается в выяснении того,
какие входы не были
учтены, с последующим представлением модели
системы в расширенном
пространстве.
 Обратимся к реляционной нечеткой модели
устанавливающей взаимосвязь между
умственными способностями ребенка и его
успеваемостью в школе.
 Данная модель обладает ярко выраженными
характеристиками мультимодели, в которой
выходное состояние является неоднозначным и
можно указать лишь одно из его вероятных
значений.
 Если принять во внимание еще один важный вход,
такой как трудолюбие (прилежание), то можно
сделать рассматриваемую модель в достаточной
степени однозначной.
 Другой причиной неоднозначности может также
являться не до конца установленная взаимосвязь между
входами и выходами системы, результатом чего
является невозможность определить выходное
состояние, даже если известны входные данные
(пример: прогноз погоды). Если неизвестны причинноследственные зависимости между входами и выходами
системы, или неизвестна часть входов, то можно
воспользоваться методом описания системы,
заключающимся в присвоении различным состояниям
выхода у вероятностей их возникновения
при заданном состоянии входного вектора X (как было
показано в примере)
 На основе измерений входных и выходных данных
необходимо устанавливать, является ли заданная
система однозначной (т. е. соответствует модели)
или неоднозначной (т. е. соответствует
мультимодели).
 Обычно входные данные зашумлены и/или
подвержены влиянию не учтённых в модели
входов.
 Если разброс (кстати тоже нечёткое понятие)
результатов измерений выхода небольшой (в
пределах погрешности измерительного
устройства), то для представления системы
следует использовать однозначную модель.
 При большом разбросе систему необходимо
представлять в форме мультимодели.
 Первые нечеткие модели создавались на основе
экспертных знаний о моделируемой системе.
 Получение информации о системе осуществлялось с помощью эксперта в соответствующей
предметной области.
 Затем эксперт в области нечеткого моделирования
выполнял преобразование этой информации в
нечеткую модель. Указанный метод называется
приобретением знаний (Ргеизз 1994а).
 Данный метод является эффективным в том
случае, когда эксперт полностью обладает
знаниями о системе и может
выразить эти знания в словесной форме и передать
их.
 На практике знания эксперта часто являются
неполными, неточными, слабо поддающимися
формулированию и могут даже содержать в себе
противоречия. Кроме того, эти знания
субъективны.
 Таким образом, представляется целесообразным,
чтобы в основе модели лежала объективная
информация о системе. Такой информацией
являются результаты измерения значений ее
входов и выходов. Процесс приобретения знаний
на основе этих данных называет извлечением
знаний. Подобной возможностью обладают
нейронные сети.
 Нейронечеткая сеть представляет собой особую
эквивалентную форму нечеткой модели.
Например, нечеткая модель с кусочно-линейными
функциями принадлежности Aij значений входных
параметров X1 и X2 одноточечными функциями Вк
для описания значений выходного параметра Y и базой правил вида:
Может быть преобразована к нейронечёткую сеть
следующего вида:
 1.
ННС обеспечивают возможность оптимизации
(настройки) параметров нечетких моделей на
основе данных измерения входов и выходов
реальных систем.
 2. ННС позволяют корректировать недостаточно
точные нечеткие модели, формируемые
экспертами.
 3. ННС дают возможность расширения
формируемых экспертами нечетких моделей на те
области пространства входов, экспертные знания
о которых отсутствуют.
 4. Структура и параметры ННС (множества типа “большой”
и “малый”, лингвистические правила) являются понятными
человеку, а также допускают обобщение знаний
содержащихся в зашумлённых измеряемых данных о
моделируемой системе, и представление их в форме хорошо
интерпретируемых лингвистических правил (извлечение
знаний). В этом отличие ННС от персептронных нейронных
сетей, параметры которых не несут никакой информации,
кроме числовой, и содержащиеся в них знания недоступны
для интерпретации человеком – подобную сеть можно
назвать сетью типа “чёрный ящик”.
 5. При наличии предварительных или частичных знаний о
моделируемой системе их можно легко отразить в ННС. В
персептронных сетях это сделать невозможно либо крайне
сложно.
 6. В случае ННС определение структуры сети представляет
собой значительно более простую задачу, чем в случае
персептронных сетей, где обычно используется метод проб и
ошибок. Знание правильной структуры сети ускоряет
процесс обучения и уменьшает влияние со стороны
локальных минимумов функции ошибок.
Нечеткие модели Мамдани имеют
следующиеособенности:
 а) они осуществляют прямоугольное (или
гиперпрямоугольное) разбиение входного
пространства.
 б) границы прямоугольных сегментов являются, как
правило, линейными.
 в) поверхности локальных сегментов являются
обычно “слабо” нелинейными (например,
полилинейными).
В зависимости от выбранного критерия оценки данные
особенности могут являться как достоинствами, так и
недостатками.
 Прямоугольное разбиение входного пространства
позволяет формулировать модель с помощью
понятных человеку правил.
 Поскольку функции принадлежности задаются
отдельно для каждой входящей в модель
переменной, попытка добавить в модель хотя бы
одну новую функцию приводит лишь к
значительному увеличению числа правил.
 Пусть дана некоторая поверхность моделируемой
системы y = f(x1, x2):
Особенности:
 Для точного моделирования “пиков” необходимо
большее число функций принадлежности.
 Для точного моделирования плато функций
принадлежности и правил требуется значительно
меньше.
 Диктуемая “пиками” большая плотность функций
принадлежности переносится на зоны плато
заставляя задавать их с использованием
необоснованно большого числа
правил.
 Увеличение же числа параметров модели
существенно усложняет процесс ее настройки, с
риском превысить пределы возможностей
последней (проклятие размерности).
 Использование нерегулярного (например,
треугольного) разбиения
пространства входов позволяет значительно
уменьшить количество сегментов и согласовать
плотность их распределения со степенью
нелинейности моделируемой области.
 В случае системы с тремя входами для задания
поверхности модели над одним кубоидальным
сегментом входного пространства требуется
измерение восьми значений входных и выходного
параметров системы. При использовании
тетраэдральных сегментов достаточно только
четырёх значений.
 P = 2^n
 P=n+1
 В случае нечеткой модели Мамдани
каждому узлу сетки разбиения соответствует одно
правило, определяющее выходное состояние
модели Y, вида:
Поверхность над прямоугольным сегментом “к”
входного пространства задаётся по следующему
правилу:
Каждому треугольному сегменту в модели
соответствует одно правило вида (модели Делоне):
 Модель однозначной статической системы,
реализующей отображение
fs : X-> Ys, должна в максимально возможной
степени удовлетворять двум принципам подобия:
принципу подобного отображения входного
вектора Хs в выходное значение YM и принципу
подобного отображения приращения dXs данного
вектора в приращение dYM.
1. Принцип подобного отображения входного вектора Xs
в выходное
значение YM определяется с помощью следующего
выражения:
2. Принцип подобного отображения приращения dXs
входного вектора
в приращение выходного параметра dY при
совпадающих входных
состояниях (Xs(0) = XM(0)) системы и ее модели
определяется с помощью выражения вида:
 Во всех предыдущих главах поверхность
отображения Y=F(X), соответствующее причинноследственным связям, характерным для
моделируемой системы.
 Пример::
 Помимо этого, теорию нечетких множеств часто
используют для решения задач классификации,
примером которой является оценка клиентов,
заинтересованных в получении банковского
кредита.
Клиенты:
- кредитоспособные (погасили кредит в срок)
- частично кредитоспособные (погасили
кредит не в срок)
- некредитоспособные(не погасили кредит)
Эта классификация также является нечёткой.
 Каждый клиент, желающий получить кредит, должен
предоставить банку ряд данных, например:
х1 — средняя величина чистого дохода,
х2 — количество материально зависимых лиц
(иждивенцев),
х3 — объем имеющихся долгов,
х4 — оценка стоимости его активов,
х5 — период занятости на текущем месте работы,
х6 — период занятости на предыдущих местах работы,
х7 — запрашиваемая сумма кредита.
Тогда каждый i-ый клиент будет характеризоваться
соответствующим вектором (х1i… х7i)
 На основе полученных данных создаётся нечёткий
классификатор.
Другими примерами классификации являются:
 распознавание личности человека по его лицу;
 распознавания блока рукописных букв на основе точечнорастрового
представления или других специально подобранных признаков,
таких
как число линий, пересекающих остроугольные изгибы буквы;
 распознавание самолетов по их силуэтам;
 распознавание личности человека по его голосу;
 распознавание типа танка по звуку работающего двигателя и
автоматическое принятие решения о взрыве противотанковой
мины.
 Условием корректной работы автоматического
классификатора является правильная настройка
использующихся в нем функций принадлежности
отдельным классам, т. е. правильное их
размещение в пространстве признаков {х1,х2, … х7}
 Упростим нашу модель, оставив лишь признаки х1 и
х7 и рассмотрим случай с чётким разделением:
 х1 — средняя величина чистого дохода;
 х7 — запрашиваемая сумма кредита.
 Но так бывает не всегда:
 В общем случае задача классификации
заключается в определении
размера, формы и местоположения функций
принадлежности отдельным
классам в пространстве признаков Х1 х Х2 х ... х Хn.
 Одномерные функции принадлежности
представляют собой наиболее
часто используемый в нечеткой логике тип
функций.
 Одномерные функции принадлежности являются
единственными функциями, которые эксперт в области
моделируемой системы может задать словесно на основе
своих “осознанных” знаний о ней. Они представляют
собой регулярные функции с прямоугольными носителями,
стороны которых параллельны осям координат.
 Вместе с тем, человек (эксперт) использует в процессе
принятия решений свои не только “осознанные”, но также и
«неосознанные» знания. Следовательно реальные функции
могут иметь б’ольшую размерность, не быть
прямоугольными и параллельными осям координат.
 Предположим, в процессе принятия решений,
эксперт сформулировал функцию:
 К сожалению не возможно словесно выразить
информацию о форме и угле поворота данной
функции - эксперт может предоставить лишь
информацию о ее одномерных
проекциях Аx1 и Аx2
 Таким образом задание формы и положения
подобных функций выполняется на основе
информации о тех решениях, которые были
приняты экспертом в реальных условиях
 . На основе обучающей выборки (например, точек,
задающих значения признаков для предыдущих
клиентов банка) в пространстве признаков Х1 х Х2 х ... х Хn образуется
кластер выбранного
класса.
 В основе метода двумерной проекции лежит
предположение о том, что
если какой-либо элемент принадлежит кластеру
рассматриваемого класса
в n-мерном пространстве, то его проекции также
принадлежат проекциям
этого кластера на любое из двумерных
подпространств Хi х Хj
 Таким
образом, чтобы определить n-мерную функцию
принадлежности кластера заданного класса
m(х1,х2,... ,хn), необходимо определить функции
 А затем определить n-мерную функцию
принадлежности (используя, например, оператор
PROD):
 В качестве функций принадлежности m(х1,…,хк)
проекций кластеров
могут использоваться различные типы функций,
например, обобщенные
вращаемые несимметричные гауссовы функции
вида:
 Оценка 49 предприятий сталелитейной
промышленности с использованием метода
двумерной проекции.
 Очень важной и интересной задачей является
определение зоны
влияния функций принадлежности отдельных
классов в областях,
не покрываемых элементами выборки измерений
(областях недостаточной информации).
 Менее рискованно применять: задачи с замкнутым
и ограниченным числом классов.
 Нежелательно применять: задачи с открытым
числом классов (распознавание лиц)
Download