Модели

advertisement
Глава 1. МЕТОДОЛОГИЧЕСКИЕ ОСНОВЫ
ИНФОРМАЦИОННОГО МОДЕЛИРОВАНИЯ
В истории научных исследований всегда можно проследить интерес к
использованию методов моделирования как к эффективному инструменту
решения фундаментальных и прикладных задач. Интерес к этим методам,
как правило, возрастает с появлением новых средств построения моделей и
успехами, полученными с их помощью в той или иной области. В настоящее время такой интерес стимулируется интенсивным развитием информационных технологий, позволяющим создавать самые разнообразные
виртуальные модели.
Продуктивное использование новых технологий моделирования в географических науках требует совершенствования и его методологии. В
настоящей главе делается попытка проанализировать информационную
сторону моделирования и на этой основе сформулировать некоторые предложения, позволяющие увеличить конструктивность этого метода в приложении к региональным гидрологическим и иным географическим задачам.
§ 1.1. МОДЕЛИ – ИНФОРМАЦИОННЫЕ ОТОБРАЖЕНИЯ ОБЪЕКТОВ
МОДЕЛИРОВАНИЯ
1.1.1. Понятие информационной модели
Термин или понятие «модель» имеет множество смысловых значений
и оттенков. Приведем два наиболее общих определения этого термина из
словаря Л.И.Лопатникова [1987]. «Модель – гомоморфное отображение
моделируемого объекта». «Модель – логическое или математическое описание компонентов и функций, отражающих существенные свойства моделируемого объекта или процесса». Первое из этих определений подчеркивает, что модель является более простой системой по сравнению с объектом, который она отображает, второе – относится к достаточно узкому
классу моделей.
В рамках настоящей работы под моделью объекта или процесса (оригинала) будет подразумеваться любой другой объект или процесс, содержащий в себе информацию о первом. Заметим, что существенным отличием этого определения от первого из вышеприведенных является более широкая интерпретация термина модель. Отличие от второго состоит в том,
что модель, хотя и отражает определенные свойства оригинала, является
13
самостоятельным объектом. Подчеркивание этого свойства модели важно
для понимания того, что при ее исследовании можно получить информацию, не имеющую никакого отношения к моделируемому объекту. Это
означает, что в рамках предложенного определения модель не обязательно
является гомоморфным отображением объекта. В предлагаемом определении выделена та ее характеристика (информация об объекте), которая
представляется наиболее принципиальной для обоснования рассматриваемых далее элементов технологии моделирования. По этой причине модели,
разрабатываемые по этой технологии, целесообразно назвать информационными. В отличие от информационных моделей А.Д.Арманда [1975], в
которых описывается передача информации от одних элементов природных систем к другим, в данном случае речь идет о наполнении модели (в
процессе ее разработки) информацией об объекте. Информационная модель, в нашем случае, по смыслу ближе к определению из словаря
А.В.Петровского и М.Г Ярошевского [Психология, 1990], в котором она
понимается как организованная по определенным правилам совокупность
данных об объекте. Соответственно, под информационным моделированием следует понимать процесс логического упорядочивания, системного
объединения, совместного анализа и преобразования информации.
Несмотря на то, что модели как самостоятельные единицы могут быть
и более сложными системами, чем сами моделируемые объекты, в практике прослеживается тенденция их упрощения по сравнению с реальными
аналогами. Эта тенденция обусловлена, в основном, действием двух факторов. Одним из них является стремление при создании модели выделить в
чистом виде отображаемые в ней свойства оригинала, другим - естественное ограничение сложности модели, вытекающее из возможностей разработчика. Таким образом, разрабатываемой модели соответствует не реальный, а некоторый упрощенный или идеализированный объект. Поэтому
широко распространенный термин – «адекватность модели» применим
только к соотношению между моделью и ее идеализированным аналогом,
а не реальным объектом или процессом. Сравнивая модель и реальный моделируемый объект, можно говорить не об их изоморфизме, а только о той
или иной степени отражения в модели свойств оригинала
1.1.2. Классификация моделей по способу отображения
информации об объектах
Изучая природные явления и процессы, мы формируем систему знаний об окружающем мире. Спецификой такой системы является множественность форм отображения и хранения сведений (или информации по
14
К.Шенону [1963]) об объектах исследования. Такими формами могут быть
тексты, числовые данные, графики, рисунки, фотографии, фильмы, математические уравнения, индивидуальные человеческие воспоминания, различные механизмы, приборы и устройства, принцип действия которых основан на известных законах природы, и так далее. Несмотря на все свое
многообразие, эта система является ограниченным и, поэтому упрощенным информационным описанием соответствующих объектов, явлений и
процессов. В соответствии с выше принятым определением, любая из перечисленных форм отображения сведений о реальном мире (или их комбинация) может быть названа моделью. Примеры подобного широкого толкования термина «модель» можно нередко встретить и в географической
литературе [Симонов, 1986].
Итак, можно сказать, что все модели являются более или менее приближенными информационными копиями своих оригиналов. Полные и
точные сведения о самом себе содержит только объект моделирования.
Поскольку способов копирования и различных копий одного и того же
оригинала может быть сколько угодно, то существует и множество самых
различных моделей, для упорядочивания которого целесообразно их объединение в однородные по тому или иному признаку группы. Существуют
различные классификации моделей [Лопатников, 1987; Гринин, Орехов,
Новиков, 2003]. Одна из наиболее развитых типологий представлена в работе [Вилкас, Майминас, 1981]. Однако общепринятых подходов к объединению моделей в однородные группы не существует. Каждая классификация чаще всего создается для облегчения решения какой-либо задачи.
Любая типизация предполагает введение некоторых признаков (параметров) и разделение множества объектов на группы в соответствии со
значениями этих признаков у каждого объекта. Для предлагаемой классификации в качестве такого признака выберем способ отображения (тип носителя) информации об объекте (оригинале). По этому признаку выделим
восемь классов моделей. Заметим, что для полноты классификации должен
присутствовать еще один класс, куда следует поместить все модели, не попавшие в ниже приведенный перечень. Но, поскольку свойства этого класса не определены, его описание опускается.
1. Экспертные представления. Наиболее древним способом накопления и отображения знания об окружающем мире является индивидуальный
человеческий опыт и человеческий мозг. Громадное количество ценнейшей информации о законах и явлениях содержится в памяти людей (экспертов) и часто теряется с их смертью. И хотя далеко не вся эта информация является достоверной, она позволяет людям предвидеть многие события и обеспечивает им выживаемость и определенный комфорт в далеко не
15
всегда благоприятной внешней среде. Экспертные представления обладают всеми признаками информационной модели и, поэтому, они включены
в данную классификационную схему.
2. Описательные модели (тексты). Экспертные представления, изложенные с помощью того или иного разговорного языка на бумаге или записанные на магнитной ленте (или других носителях), представляют собой
форму отображения информации о реальном мире, которую можно назвать
описательной моделью. Смысловые значения отдельных слов и их логическое объединение по правилам языка в предложения, позволяет накапливать и передавать от одних людей другим очень большое количество самых разнообразных сведений.
3. Визуальные модели (изображения). Особенностью человека является приоритетность зрительного канала восприятия информации. Поэтому в
моделировании широко используются и выделяются в отдельный класс
визуальные формы отображения явлений и описания характера взаимозависимости между переменными. Действительно, представление данных в
виде, полей точек, графиков функций, семейств кривых, диаграмм, карт,
картин и фотографий, фильмов и так далее обеспечивает очень быструю
передачу информации потребителю. Все перечисленные изображения содержат определенные сведения об объектах и, поэтому, являются их моделями.
4. Эмпирические модели или данные измерений. Переход к количественному или качественному, но более формализованному уровню отображения информации об объектах предполагает параметризацию их описания и разработку возможностей определения (измерения) значений вводимых параметров (переменных). Совокупность данных (числовых и качественных) о наблюдавшихся значениях параметров содержит определенные сведения об объекте и называется здесь его эмпирической моделью.
5. Статистические модели. Часто вместо исходных данных измерений параметров объекта используются некоторые их статистические характеристики: средние, дисперсии, коэффициенты вариации, корреляции,
параметры регрессии и так далее. Эти характеристики не измеряются
непосредственно, а получаются расчетным способом путем специальных
преобразований исходных данных. Они также содержат определенную
информацию (хотя и меньшую по сравнению с исходными данными) об
оригинале. Их совокупность обычно и называется статистической моделью
объекта.
6. Вероятностные модели. Одним из способов, применяемых для
описания возможных значений параметров состояния объекта, является
16
совместное распределение вероятностей. Эмпирических данных для сравнительно детальной и достоверной оценки этой характеристики, как правило, оказывается недостаточно. По этой причине при задании функции
распределения вероятностей используются теоретические или гипотетические соображения об ее математической структуре. Построенная с использованием всех перечисленных видов информации такая функция, дающая
возможность оценивать вероятность или плотность вероятности реализации той или иной комбинации параметров состояния объекта, и называется
его вероятностной моделью.
7. Математические модели. Функция совместного распределения вероятностей накладывает “мягкие” ограничения на возможные значения переменных. Она, как правило, не запрещает те или иные их комбинации, а
только говорит о меньшей вероятности их появления. Широко распространен другой способ более жесткого ограничения значений переменных путем формулировки системы уравнений и неравенств. Такие системы обычно называются математическими моделями. Этот способ менее универсален, по сравнению с предыдущим, но он более традиционен, и для него детально развит аппарат аналитического и численного исследования разрешенного поведения переменных. В связи с этим, математические модели
образуют одну из крупнейших групп, вообще, и в рассматриваемой классификации, в частности.
8. Компьютерные (имитационные) модели. Развитие в последние десятилетия технических систем, предназначенных для ввода, хранения, преобразования, передачи и вывода информации – компьютеров, позволило
выделить новый класс синтетических моделей – компьютерных или имитационных. Имитационные модели интегрируют в себе данные наблюдений и математические ограничения, позволяют рассчитывать статистические характеристики и вероятности реализации тех или иных событий,
представлять результаты в текстовой, графической, аудио и видео форме.
В отличие от книг, имитационные модели представляют собой более активную форму накопления информации об объектах, так как наряду с запоминанием определенных сведений позволяют реализовывать алгоритмы
их преобразования, необходимые для получения ответов на интересующие
пользователя вопросы.
1.1.3. Достоверность данных, используемых для построения
моделей
В соответствии с принятым определением, все модели отображают
информацию о законах природы, явлениях и процессах. Однако опосредо-
17
ванные через человека используемые в моделях данные всегда содержат
больший или меньший элемент субъективизма и недостоверности.
Игнорирование возможной недостоверности данных, использованных
для построения модели, автоматически вызывает и игнорирование возможной недостоверности результатов моделирования. В определенных ситуациях оно проявляется в возникновении парадоксов при интерпретации
данных и неустойчивости результатов математических алгоритмов их преобразования. Все это приводит к неоправданному преувеличению значимости выводов, получаемых на основе исследования моделей, и к завышению точности получаемых с их помощью расчетов. О подобных проблемах, возникающих в связи с долгосрочным прогнозированием ожидаемых
изменений климата, говорит К.Я.Кондратьев [2004]. Некритическое отношение к таким результатам может вызвать существенные потери как практического, так и теоретического характера. Это, в свою очередь, приводит
к необоснованному уменьшению доверия к моделированию как методу
решения прикладных и фундаментальных задач в научных исследованиях.
1.1.4. Переменные информационной модели и ограничения
их возможных значений
Обязательным признаком информационных моделей, рассматриваемых в данной работе, является использование некоторых характеристик,
значения которых описывают состояние объекта. Такие характеристики
обычно называют переменными модели.
Количество и качество переменных задают информационную емкость
пространства состояний объекта, которое контролируется в рамках модели, или, короче выражаясь, - информационную емкость модели. Количество переменных определяет размерность такого пространства. Качество
переменных (непрерывность, разрешение, дискретность, определение различия между значениями) формирует его метрику. Информационная емкость определяется числом различимых состояний объекта, которые могут
быть отражены в модели, при условии, что все эти состояния равновероятны. В качестве меры информационной емкости для пространства состояний можно использовать традиционную энтропию [Вентцель, 1962] соответствующего равномерного распределения вероятностей.
При разработке модели, наряду с введением новых характеристик,
увеличивающих информационную емкость модели, вводятся (на основании имеющихся данных об объекте) ограничения на возможные независимые или совместные значения таких характеристик. Эти требования могут
быть более или менее жесткими. Их введение, в сравнении с расширением
18
списка переменных, наоборот, уменьшает число допустимых совместных
значений переменных модели или энтропию их распределения. Чем больше такое уменьшение, тем больше информативность модели. Количественно информативность модели вычисляется как разность ее информационной емкости и энтропии совместного распределения ее переменных.
Множество накладываемых условий определяют соотношения (взаимосвязи) между переменными и поэтому могут быть названы структурой
модели. Структура модели описывает совокупность независимых ограничений на значения каждой из переменных и на характер взаимозависимости между ними. Переменные модели могут принимать различные (из
множества возможных) значения. Структура же модели должна быть инвариантной по отношению к изменениям, по крайней мере, одной из ее переменных. Чаще всего в качестве такой переменной выступает время.
Наиболее общие законы природы и вытекающая из них структура ограничений инвариантны также и по отношению к изменениям пространственных координат моделируемых объектов.
Переменные любой модели можно разделить на входные и выходные.
Значения входных переменных задаются. Значения выходных - рассчитываются (прогнозируются) по заданным значениям входных на основе их
взаимозависимости, описанной в рамках структуры рассматриваемой модели. Разделение переменных на входные и выходные в разных задачах
может меняться в зависимости от поставленных целей моделирования.
Таким образом, информационная модель представляет собой систему,
состоящую из переменных, описывающих состояние моделируемого объекта, и ограничений, накладываемых на их возможные совместные значения. Количество, характер и форма таких ограничений могут в различных
моделях существенно отличаться друг от друга. При разработке информационной модели следует принимать во внимание следующие обстоятельства.
1. Любая переменная модели должна иметь конечное число различимых значений. Точность контроля значений переменных не следует задавать выше, чем это необходимо для конкретной задачи.
2. Значение переменной может быть задано обычным точечным, интервальным [Алефельд, Херцбергер, 1987] или вероятностным способом
[Аверкин, 1986; Игнатов, 2000]. Наиболее полно информация о приближенной оценке значения переменной может быть передана с помощью
функции распределения, т.е. вероятностным способом (пояснения см. на
19
рис. 1.1).
3. Взаимозависимость переменных в модели может быть
описана любым подходящим способом, но наиболее универсальным является описание с использованием оценок совместного
распределения (плотности распределения) вероятностей.
4. Любая информация о значениях переменных и взаимосвязях между ними не является абсолютно достоверной, и это следует
учитывать при ее использовании
для построения моделей.
Рис.1.1. Различные оценки значения переменной.
1.1.5. Основные функции моделей
Рассматривая разработку и применение моделей в географических
науках, можно выделить три основных функции, которые они выполняют.
Первая из них - описательная. Любая модель по своей информационной сути представляет собой совокупность данных об объекте и поэтому
является его описанием. Формы такого описания могут быть разными, но
содержание информации о моделируемом объекте, в определенном смысле, одним и тем же. Копирование, преобразование и распространение моделей реализует тем самым и упорядочивание, систематизацию и распространение информации о моделируемых объектах и процессах.
Вторая важнейшая функция моделей – предсказательная, позволяющая делать оценки (предсказания) значений каких-либо характеристик
объекта. Предсказательная функция моделей основана на том, что ограничения на возможные совместные значения переменных, описывающих
объект, заложенные в ее структуре, позволяют при задании значений входных параметров получать условные оценки выходных. Прогнозирование с
помощью моделей является неотъемлемой составной частью многих, если
не всех, прикладных задач.
Третья функция – эвристическая. Она наиболее выражена у натур-
20
ных, математических и компьютерных моделей. Эта функция связана с использованием моделей для проверки закладываемой в них гипотетической
информации на непротиворечивость с имеющимися достоверными сведениями. Другая эвристическая задача состоит в изучении следствий совместного действия заложенных в модель ограничений на возможные значения ее переменных. В этом случае модель выступает в роли самостоятельного натурного объекта, так как, вообще говоря, ее аналога в природе
может и не существовать. Кроме того, модели позволяют получать новые
выводы из известных данных об объекте путем имитации его состояний,
редко имеющих место или не реализующихся в естественных условиях.
§ 1.2. ЭЛЕМЕНТЫ ТЕХНОЛОГИИ ПОСТРОЕНИЯ
ИНФОРМАЦИОННЫХ МОДЕЛЕЙ
1.2.1. Этапы моделирования
Процесс моделирования (рис.1.2) можно разделить на две основные
стадии. В течение первой (этапы 1-6) осуществляется разработка (создание) модели, в течение второй (этап 7) - применение модели в целях, для
достижения которых она создается. Если содержание второй стадии во
многом зависит от выбранных целей моделирования и значительно варьирует от задачи к задаче, то содержание первой более устойчиво и включает
в себя похожие элементы. Рассмотрим ее этапы более подробно.
Рис.1.2. Этапы моделирования
1-й этап. Выбор цели моделирования определяет, в первую очередь,
21
ту приоритетную основную функцию, для выполнения которой разрабатывается данная модель. Из этого, в свою очередь, вытекают некоторые особенности дальнейшей разработки модели. Если в качестве приоритетной
выбрана описательная функция, то в первую очередь следует обращать
внимание на понятность и доступность этого описания для ожидаемых
пользователей этой модели. В географии наиболее типичной моделью такого типа является карта. Из приоритета предсказательной функции вытекает первоочередность выбора прогнозируемых переменных и формулировки требований к точности и надежности прогноза. Наиболее типичной
задачей из этого класса является разработка моделей экстраполяции временных рядов. При разработке модели для эвристических задач проверки
гипотез или ее исследования как самостоятельного объекта, вся технология
ее построения исследования должна быть ориентирована на доказательность получаемых результатов. Среди моделей такого типа наиболее характерными являются математические модели, представляющие собой
совместную логически упорядоченную запись (систему) ряда условий
(уравнений, неравенств и т.д.), накладываемых на значения контролируемых переменных.
Сформулированная цель позволяет задать критерии, с помощью которых могут быть оценено отношение к предмету исследования используемой для построения модели информации, а также определена ее значимость [Орлов, 2000].
2-й этап. Поскольку процесс построения модели заключается в придании информации об объекте некоторой формы, то, естественно, этой информацией необходимо априори располагать. Можно выделить два типовых подхода к обеспечению полноты данных необходимых для достижения выбранных целей. Один из них состоит в разработке такой модели, для
которой имеющихся информационных материалов достаточно. При другом подходе, выявляющиеся по мере разработки модели информационные
пробелы заполняются специально собираемыми сведениями. Недостаток
первого пути заключается в том, что разработанная модель может оказаться недостаточно информативной для достижения поставленных целей, так
как на этапе сбора информации были пропущены какие то важные ее составляющие, ценность которых заранее не представлялась значительной.
Недостаток второго пути обусловлен тем, что при его реализации определяющим фактором информационного обеспечения модели становится не
цель работы, а используемая технология моделирования. В этом случае
22
неудачный выбор технологии или ошибки в ее выполнении приводят к неоправданным затратам на сбор ненужной информации. Кроме того, сам
процесс моделирования становится неустойчивым, так как требуемая по
мере его осуществления новая информация может быть не найдена, что
вызывает необходимость ее компенсации гипотетическими или случайными данными, или соответствующей корректировки модели. В результате
общие затраты на разработку модели оказываются заметно больше, чем в
первом случае, а полученная в результате модель не самым подходящим
инструментом для достижения поставленных целей. Исходя из опыта моделирования, можно сказать, что наилучший эффект достигается при выборе первого подхода в качестве основного, но с использованием, по мере
необходимости, и элементов второго.
3-й этап. Наличие сформулированных на первом этапе целей моделирования и собранных на втором информационных материалов позволяет
перейти к третьему этапу, когда определяется список контролируемых переменных. В этот список включаются характеристики, с использованием
значений которых формализуется описание целей моделирования, переменные, по которым имеются данные измерений, параметры, необходимые
для формулировки теоретических положений. Для каждой включаемой в
список переменных должны быть определены ее основные свойства, а
именно: наименование, тип, единица измерения, область изменчивости,
точность контроля значений. Составленный таким образом перечень переменных определяет согласованную с исходными данными и целями информационную емкость модели.
4-й этап. Разработка структуры модели заключается в формировании
системы ограничений на возможные значения переменных. При этом также определяются способы задания значений входных параметров и методы
оценки выходных. Необходимые количество и жесткость накладываемых
ограничений, а также точность задания и вычисления параметров связаны
с количеством и свойствами переменных модели, т.е. ее информационной
емкостью. Специфика этого этапа определяется, главным образом, выбором класса модели (математической, вероятностной, имитационной и т.д.),
которую предполагается построить для решения сформулированных на
первом этапе задач.
5-й этап. Оптимизация модели может выражаться в подборе наилучших, в некотором смысле, ее характеристик, например: значений постоянных коэффициентов, математической структуры соотношений между пе-
23
ременными, точности задания переменных модели, аргументов зависимых
переменных, логической схемы объединения модельных ограничений в
систему. Более подробно эти вопросы будут рассмотрены в пункте 1.2.2.
6 й этап. При создании любой модели не исключены непреднамеренные ошибки, совершаемые при ее построении. Для того, чтобы уменьшить
вероятность присутствия таких ошибок в модели, целесообразно произвести ее тестирование. Существует два основных приема тестирования модели. Первый заключается в независимой проверке логики ее построения,
второй сводится к имитации ситуаций, для которых априорно известно какими должны быть совместные значения модельных параметров.
На 4-м и 5-м этапах разработки моделей в них может непроизвольно
вноситься информация, не имеющая никакого отношения к моделируемому объекту. При разработке структуры это связано чаще всего с использованием излишне жестких ограничений, логически не вытекающих из исходных данных. При постановке некоторых оптимизационных задач это
может иметь место при формулировке критериев и других условий, генерации пробных функций и так далее. Вносимая при этих операциях информация формально восполняет существующие пробелы в данных, но, по
отношению к моделируемому объекту, носит гипотетический характер. Из
этого следует необходимость повышения требований к тестированию модели и более осторожной интерпретации результатов моделирования.
1.2.2. Оптимизация моделей
Наиболее простой, известной и распространенной оптимизационной
задачей, которая решается на стадии разработки модели является определение значений некоторых ее параметров. Для ее выполнения обычно используются данные измерений характеристик моделируемого объекта. В
большинстве случаев эти характеристики не являются искомыми параметрами, но, используя структуру модели, можно составить систему соотношений для определения последних. В силу приближенности модели, наличия ошибок в данных, нелинейности названной системы и т.д. оценки таких параметров оказываются неоднозначными. Для ликвидации этой неопределенности и формируется оптимизационная задача, в рамках которой
к модели предъявляются дополнительные требования, позволяющие сделать решение задачи единственным.
В другом типе оптимизационной задачи варьируются не постоянные
параметры некоторых функций, а их математическая структура. В этом
24
случае априорно задается более или менее обширный класс пробных
функций, из которых выбирается наилучшая по заданному критерию. Если
такие функции задаются с точностью до неизвестных постоянных коэффициентов, то данная оптимизационная задача включает в себя и предыдущую.
Принципиальной, в рамках информационного подхода, является задача определения оптимальной точности контроля переменных модели, так
как эта точность, при заданном списке переменных, определяет информационную емкость модели. Чаще всего эта задача возникает при построении
статистической или вероятностной модели на основе данных измерений.
Эти данные содержат определенное количество эмпирической информации о взаимосвязи контролируемых переменных. Вариация точности задания этих переменных позволяет согласовать информационную емкость
модели с используемым для ее построения количеством информации и добиться наилучшего соотношения «сигнал/шум» при вычислении условных
оценок выходных характеристик.
Следующий тип оптимизационной задачи возникает в связи с проблемой поиска закономерностей, скрытых в данных измерений. В этом случае
на этапе накопления информации формируется матрица совместных реализаций достаточно большого числа переменных и предполагается, что
некоторые из этих переменных могут быть взаимозависимы. При решении
оптимизационной задачи для каждой из переменных, которые рассматриваются как зависимые, находится наилучший список аргументов, по заданным значениям которых наиболее точно определяется значение функции.
Оптимизационная задача последнего (из упомянутых в предыдущем
пункте) типа возникает в том случае, когда необходимо некоторое множество модельных ограничений объединить в систему. Классическая система
уравнений математической модели – это требование совместного выполнения нескольких условий (объединение информации по логической схеме
«И») в предположении, что каждое из условий достоверно. Во многих математических задачах требуется еще и доказательство необходимости и
достаточности этих условий. Однако возможны и другие способы объединения в систему ограничений, накладываемых на значения переменных
модели, например: по схеме «ИЛИ», взвешенной схеме «ИЛИ» и т.д. Выбор оптимальной схемы объединения условий в систему становится особенно актуальным, когда используемую для построения модели информа-
25
цию нельзя считать абсолютно достоверной, или число условий формально
является избыточным. Постановка и решение оптимизационной задачи в
этом случае позволяет наилучшим в заданном смысле образом использовать всю имеющуюся информацию для построения модели.
Оптимизация моделей проводится обычно в соответствии с их основным целевым предназначением. Реальные оптимизационные задачи могут
включать в себя одновременно несколько из вышеперечисленных типов
оптимизации моделей. В прикладных задачах, чаще всего, критерий оптимальности задается из условия обеспечения наилучшей предсказательной
способности модели. При использовании моделей в фундаментальных исследованиях, когда основной задачей является наилучшее описание и объяснение наблюдаемых явлений, критерий оптимизации лучше задавать,
исходя из требований минимизации противоречий между всеми модельными положениями. Оптимизация моделей представляет собой мощный
прием, позволяющий существенно повысить их эффективность. При ее
выполнении удается выявить подозрительные на большие ошибки данные,
неудачно сформулированные гипотезы, существенно улучшить и увеличить информационное наполнение модели. В итоге этих действий возрастает как точность, так и надежность результатов моделирования.
В табл.1.1 приведен пример решения оптимизационной задачи, в которой выбиралась наилучшая по предсказательной способности регрессионная модель. Варьируемыми характеристиками в этой задаче были: число
предикторов, их наименование и точность задания при вычислении значения прогнозируемой переменной. Для построения всех пробных моделей
использовалась одна и та же информация, содержащаяся в исходной матрице 76 совместных реализаций 22 переменных. Сложность (информационная емкость) модели определялась числом предикторов предсказываемой переменной и точностью определения их значений. Критерий предсказательной способности модели оценивался по разнице между фактическими и рассчитанными по модели значениями прогнозируемой переменной. В соответствии с изложенными в пункте 1.2.3 информационными
принципами ожидалось существование модели оптимальной сложности,
при которой достигаются наилучшие результаты моделирования. Анализ
данных, приведенных в табл.1.1, показывает, что в рассмотренном примере
действительно наблюдается такой оптимум сложности модели, при котором достигается максимальная точность прогноза. В данном примере – это
модель с четырьмя предикторами, каждый из которых имеет разрешение в
26
2-3 градации.
Таблица 1.1
Поведение критерия предсказательной способности регрессионных
моделей в зависимости от их сложности
Точность задания
предикторов (в % от
размаха области их
изменчивости)
100
50
30
20
10
1
Число используемых в модели
предикторов
2
3
4
5
6
7
0,094
0,119
0,071
0,040
0,012
0
0,106
0,206
0,134
0,066
0,014
0
0,131
0,231
0,174
0,056
0,011
0
0,139
0,214
0,108
0,048
0,010
0
0,146
0,194
0,098
0,043
0,010
0
0,151
0,183
0,085
0,039
0,010
0
Формулировка оптимизационных задач является одним из важных
элементов моделирования. Необходимость в их постановке возникает тогда, когда нужно выбрать или синтезировать единственное решение из
множества возможных. Такая ситуация может быть обусловлена недостатком информации, используемой в модели для нахождения требуемого решения или ее формальным избытком. В первом случае неоднозначность
выражается в низкой точности решения задачи, во втором - вызывается
противоречивостью используемых данных. Субъективная целесообразность постановки и алгоритмизации решения оптимизационных задач обусловлена тем, что людям часто значительно легче удается договориться о
принципах разрешения противоречий, чем убедить других в правильности
своей точки зрения.
Постановка оптимизационной задачи обязательно включает в себя
формулировку критериев, вычисление которых позволяет сравнить между
собой различные решения. По своей сути такие критерии являются субъективными экспертными требованиями, предъявляемыми к искомому результату. Это дополнительная закладываемая в модель информация о качествах искомого, в некотором смысле наилучшего, решения. По математической структуре критерии оптимизации чаще всего являются функциями, определенными в пространстве аргументов, описывающих все разнообразие возможных альтернатив решения задачи.
Математическая формулировка оптимизационной задачи в своей основе представляет собой проблему, заключающуюся в нахождении коор-
27
динат экстремума целевой функции. Список аргументов и вид такой функции тесно связаны с критериями оптимизации, списком переменных и
структурой модели, в рамках которой формулируется оптимизационная
задача. Существует несколько основных способов для отыскания координат экстремума функции [Корн, Корн, 1977; www.91.ru/Education/Bo …].
Эти способы бывают аналитические и численные. Они связаны с видом
этой функции и, так или иначе, используют априорно известные признаки
искомого экстремума. Для одномодальных непрерывно дифференцируемых функций координаты экстремума обычно находятся путем решения
системы уравнений, получаемых частным дифференцированием функции
по всем ее аргументам и приравниванием этих производных нулю. Типичной иллюстрацией этого способа является метод наименьших квадратов.
Для функции с одним минимумом (максимумом) также часто применяются
приближенные итерационные методы отыскания координат оптимума,
например, метод скорейшего спуска [Бахвалов, 1973]. Для функций с дискретными аргументами удобным (а для функций с качественными значениями аргументов - единственно возможным) является метод полного перебора значений аргументов. Все названные приемы имеют свои плюсы и
минусы. Приоритетность конкретного приема определяется условиями задачи и вычислительными ресурсами, которые могут быть затрачены на ее
решение. Достаточно подробный обзор различных методов нахождения
экстремумов функции и рекомендации по их выбору в различных ситуациях сделан З.Брандтом [2003].
Еще одним существенным элементом постановки оптимизационной
задачи является априорное ограничение области возможных значений аргументов целевой функции. В отдельных случаях такая операция может
быть не обязательна, но в большинстве ситуаций - она необходима. Применяемые ограничения могут носить более или менее жесткий характер.
Чаще всего используются «минмаксные» ограничения, накладываемые на
разрешенные значения переменных из содержательных соображений, или
начальные приближения оптимальных значений аргументов, или то и другое вместе.
Использование разнообразных критериев при построении целевой
функции и различного рода ограничений на возможные значения ее аргументов позволяет формулировать информационно очень емкие оптимизационные задачи и находить сбалансированные компромиссы между очень
разными требованиями. Этот подход очень важен в задачах, результат решения которых сильно зависит от субъективных точек зрения, зачастую
прямо противоположных.
28
1.2.3. Информационные принципы моделирования
Обобщая проведенные методологические рассуждения, сформулируем несколько общих принципов (положений, постулатов), совокупность
которых составляет концептуальную основу информационного подхода к
решению задач с использованием метода моделирования.
1. Первый из них сводится к утверждению о том, что вся информация
об объекте (преднамеренно или нет) закладывается в модель на стадии ее
разработки. При исследовании модели производится преобразование использованных для ее построения данных, при котором может сохраняться
или в какой-то степени теряться их информативность. Исследуя модель,
нельзя получить принципиально новых данных об объекте. Результатами
моделирования являются лишь следствия, причем возможно искаженные
собственными свойствами модели, логически вытекающие из совместного
учета заложенных в нее сведений. Но эти следствия (другая форма информации) могут оказаться чрезвычайно полезными для более глубокого понимания свойств и сущности моделируемых процессов. Кроме того, они,
как правило, имеют значительную ценность и в практическом смысле. В
качестве иллюстрации таких полезных следствий можно назвать, например, график регрессии, отражающей характер статистической взаимосвязанности переменных, или прогностическую оценку какой-либо важной в
прикладном аспекте характеристики.
Моделирование – это действие, направленное на достижение определенной цели, которое реализуется путем накопления и преобразования информации об объекте. Оценка объема необходимой информации и выбор
методов ее преобразования существенно обусловлены требующей решения
проблемой. В связи с этим четкая априорная формулировка целей моделирования является важным условием его успешного выполнения.
2. Второй принцип - обеспечения высокой надежности информационных результатов моделирования, требует непременного достижения необходимой достоверности модельных оценок и выводов. Их низкая надежность может быть обусловлена тремя основными факторами:
 недостаточной достоверностью исходных данных;
 необоснованно завышенными требованиями к точности модельных
оценок;
 использованием некорректных методов преобразования информации.
29
При создании модели нужно стараться использовать всю необходимую для достижения поставленных целей, доступную информацию о моделируемых процессах и объектах. Но следует помнить, что используемые
для этого сведения не всегда являются достоверными и непротиворечивыми. Поэтому приоритет и форма учета отдельных блоков знания в структуре модели и степень их влияния на результаты моделирования должны
жестко контролироваться разработчиком и выбираться так, чтобы уменьшить, например, путем объединения оценок или оптимизации модели, отрицательные последствия возможных ошибок в исходных данных.
Практически всегда в используемых для моделирования материалах,
пусть в скрытой форме, содержится, по крайней мере, какая то часть объективной и достоверной информации об искомых свойствах объекта. В результате корректного исследования модели она преобразуется к другому
виду, но достоверность ее сохраняется. Однако, если формально задаваемая информативность модельных оценок превышает количество сведений
о соответствующих свойствах объекта, которое использовалось для построения модели, то их достоверность становится сомнительной. Например, при прогностических расчетах неоправданное искусственное завышение точности (информативности) предсказаний приводит к резкому снижению их достоверности.
В прикладных задачах требования к выходным результатам часто оказываются чрезмерными по отношению к реальным возможностям информационного обеспечения модели. Завышение требований к точности оценок выходных переменных обуславливает рост информационной емкости
модели. По мере увеличения последней, достоверность результатов сначала высока и не уменьшается или падает довольно медленно. Такое поведение наблюдается до тех пор, пока информационная емкость остается существенно меньше количества информации, содержащейся в исходных данных, используемых для построения модели. В области, где эти величины
сравнимы между собой, достоверность результатов начинает быстро
уменьшаться и далее асимптотически стремится к нулю. При отсутствии
другой возможности обеспечение необходимой достоверности результатов
моделирования должно быть сделано за счет уменьшения их информативности.
Минимизация третьего фактора, за счет которого может быть снижена
надежность результатов моделирования, требует, чтобы в процессе выпол30
нения последнего обязательно осуществлялся тщательный контроль правильности всех операций по преобразованию данных.
3. Последнее постулируемое утверждение можно назвать принципом
существования модели оптимальной сложности, означающим, что
наилучшее использование исходных данных для достижения поставленных
целей реализуется при подборе модели определенной информационной емкости. Результатом исследования параметрической модели, как правило,
является построение оценок условных значений или совместного поведения каких-либо переменных. Использование слишком грубой модели (с
малой информационной емкостью) приводит к неоправданным потерям
полезных сведений, содержащихся в исходных данных, и, тем самым, к
ухудшению информативности результатов. При построении чрезмерно подробной (сложной) модели, не обеспеченной в нужной мере исходными
данными, информационные пробелы приходится заполнять случайными
или сомнительными предположениями. Довольно часто данная операция
происходит без контроля со стороны разработчика модели, как косвенный
побочный эффект некоторых модельных построений. Такие действия существенно снижают адекватность модели и снижают достоверность результатов ее исследования. Многие выводы при этом могут оказаться чисто модельными эффектами, не имеющими отношения к объекту моделирования. Таким образом, эффективность модели как инструмента решения
определенных задач существенно зависит от сбалансированности ее информационной емкости и информативности исходных данных, используемых для её построения. Этот баланс может быть достигнут путем соответствующей оптимизации модели.
ВЫВОДЫ
Подводя итог, можно сказать, что:
1. Информационный подход к моделированию формирует определенную
его идеологию, задает рамочные условия и последовательность действий
при решении конкретных задач.
2. Его достоинства состоят в том, что он:
 дает возможность интегрировать в моделях самые различные сведения
об изменчивости и взаимосвязи характеристик исследуемых объектов;
 позволяет, используя вероятностное описание взаимосвязей между пе31
ременными, сравнительно легко и алгоритмически единообразно решать
задачи применения моделей путем вычисления соответствующих условных оценок на основе оценки совместного распределения;
 не запрещает рассматривать другие модели (математические, имитационные, графические, натурные и т.д.) как специфические оценки, содержащие информацию о некоторых характеристиках совместного распределения вероятностей контролируемых переменных;
 способствует более осторожной и правильной интерпретации результатов моделирования, так требует обязательного учета точности и достоверности, как исходных данных, так и получаемых на их основе моделей
и модельных оценок.
2. Информационная концепция позволяет облегчить и упростить процесс разработки модели за счет:
 возможности использования приближенных исходных данных и ослабления требований к их достоверности;
 отказа от стремления к получению чрезмерно точных оценок постоянных параметров, входных и выходных переменных модели;
 увеличения свободы действий разработчика при выборе способов и
форм описания соотношений между характеристиками модели.
3. Модели, построенные в соответствии с информационными принципами, оказываются лучше сбалансированными с исходными данными. Их
возможности оцениваются более правильно, откуда следует и более осторожное и адекватное отношение к результатам моделирования.
4. Моделирование, как процесс логического упорядочивания, системного объединения, совместного анализа и преобразования информации, не
увеличивая ее исходное количество, помогает выделить из нее сведения,
представляющие повышенную ценность в фундаментальном или прикладном смысле.
32
Download