Разработка модели поведения информационной системы

advertisement
Разработка модели поведения информационной системы
М.Ю. КОРОБОВ, А.С. КОТЕЛЬНИКОВ, А.Д. РЫСИНА, В.Н. ЯКУНИНА
Национальный исследовательский ядерный университет «МИФИ»
РАЗРАБОТКА МОДЕЛИ ПОВЕДЕНИЯ ИНФОРМАЦИОННОЙ СИСТЕМЫ
В работе приведено обоснование необходимости построения модели поведения информационной системы, дана
методика построения модели поведения, проведен анализ адекватности построенной модели.
В настоящее время существует большое количество информационных систем, предназначенных для поддержки бизнес процессов компании, позволяющих оптимизировать время обработки запроса клиента, предоставляющих возможность увидеть новые возможности в бизнесе,
упрощающих формирование бухгалтерской и управленческой отчетности. Успешное внедрение
подобной информационной системы в организации означало бы уменьшение времени ожидания
клиентами ответов, уменьшение времени вынужденных задержек, повышение эффективности
планирования и управления, то есть приобретение конкурентных преимуществ на рынке.
Проекты внедрения информационных систем являются высокорисковыми, в нашей стране
есть и позитивный, и негативный опыт внедрения ИС, при этом имеется информация о внедрении
и тиражируемого, и заказного программного обеспечения.
В любом случае этапу внедрения информационной системы предшествует ряд этапов, таких,
как проведение бизнес – анализа, выявление требований к системе, проектирование собственно
системы в случае заказного ПО или проектирование доработок тиражируемого продукта и других.
Соответствие информационной системы предъявляемым требованиям проверяется на этапе
тестирования, и в случае, если все оговоренные тесты системой пройдены успешно, принимается
решение о внедрении системы в промышленную эксплуатацию.
Риски, сопровождающие процесс разработки и внедрения информационной системы, в достаточной степени изучены, многие организации готовы ими управлять и по возможности снижать
их уровень. Управление рисками также осуществляется после внедрения системы – налаживается
и поддерживается механизм создания резервных копий, отрабатываются возможные варианты перехода на дублирующее оборудование в случае отказа основного.
Однако многими организациями не принимается в расчет возможное увеличение числа
пользователей информационной системы или значительное увеличение обрабатываемой системой
информации через несколько лет эксплуатации, что может повлечь ухудшение производительности информационной системы, вплоть до ее деградации. В настоящий момент качественное решение задачи оценки производительности информационной системы в будущих периодах эксплуатации сопряжено со значительными затратами и отличается высокой долей неопределенности. В
связи с этим была предпринята попытка оценить производительность системы в будущих периодах посредством разработки модели поведения информационной системы, построенной с учетом
скорости увеличения объема хранимых данных, прогнозирования объемов по прошествии некоторого периода времени с момента начала промышленной эксплуатации системы и проведения
нагрузочного тестирования для оценки временных характеристик информационной системы.
Для оценки производительности системы в будущих периодах эксплуатации было предложено разработать формальную модель поведения информационной системы. В ходе разработки
модели были предприняты следующие шаги:

разработана методика построения формальной модели поведения
информационной системы;

разработана модель поведения информационной системы;

проведен анализ и подтверждена адекватность построенной модели;

выбран инструмент для проведения нагрузочного тестирования;

проведено нагрузочное тестирование модели информационной системы;

проанализированы полученные результаты.
Модель поведения информационной системы была построена для информационной системы, предназначенной для автоматизации основных процессов деятельности мультибрендового
автомобильного холдинга, в настоящий момент информационная система находится на стадии
промышленной эксплуатации. Архитектура системы двухзвенная «клиент – сервер». «Толстый»
клиент реализован на языке Delphi, серверная часть представлена СУБД Oracle 10g. Режим работы
– 12/7/365.
Разработка модели поведения информационной системы
До начала процесса разработки модели было необходимо распределить все таблицы, имеющиеся в базе данных информационной системы, на несколько групп в зависимости от темпов роста числа записей. Вследствие того, что наибольшее влияние на временные характеристики системы оказывают активно изменяющиеся таблицы, при разработке модели учитывалась статистика
только для таких таблиц.
Кроме механизма аудита, который предоставляет СУБД, в описываемой системе действует
механизм темпоральности, заключающийся в том, что в любой момент времени конечный пользователь взаимодействует не с таблицей, а с соответствующим ей представлением. Любые изменения, вносимые пользователем, инициируют вставку новой строки в таблицу с указанием даты последнего изменения и автора изменения. Представления же спроектированы таким образом, что в
каждый момент времени они содержат последнюю актуальную версию каждой строки, тогда как
таблица хранит всю историю изменений, начиная с ввода новой строки, заканчивая ее удалением,
если эта операция имела место. Такой механизм хранения данных означает не только ведение
полной истории изменений, но и значительный рост числа записей в таблицах
Для моделирования поведения системы было необходимо собрать статистику роста числа
записей в каждой таблице и каждом представлении. Для каждой таблицы было необходимо получить значение двух статистических параметров – число добавленных за период уникальных строк,
число измененных за период строк, а также определить число строк, доступных пользователю через представление.
Для построения математической модели было необходимо найти аппроксимирующую
функцию, которая бы с величиной достоверности не менее 0,85 описывала темп добавления записей в таблицы и представления. Математическая модель поведения системы, таким образом,
должна была состоять из набора уравнений, описывающих динамику добавления числа записей в
таблице в период моделирования.
Уравнения для каждой таблицы должны были описывать зависимость числа уникальных записей, добавляемых в таблицу, и общее число записей, добавляемых в таблицу, от времени (от
месяца), уравнения для каждого представления должны были описывать зависимость увеличения
числа записей, доступных пользователю от месяца. Поэтому в рамках процесса построения модели
были осуществлены следующие действия:
 собрана статистика увеличения количества записей для каждой таблицы, имеющейся в базе данных;
 таблицы распределены по группам, выделена группа наиболее активно увеличивающихся таблиц;
 для каждой таблицы, принадлежащей группе наиболее активно увеличивающихся
таблиц, был построен график и подобрана аппроксимирующая функция, которая бы отражала динамику увеличения числа записей в таблицах;
 была проанализирована достоверность каждой найденной аппроксимирующей
функции;
 была подтверждена достоверность построенной модели поведения информационной системы.
На рисунке приведен пример построения графика и подбора аппроксимирующей функции,
отражающей динамику изменения числа уникальных записей одной из наиболее интенсивно растущих таблиц.
Статистические данные для количества уникальных значений в таблице, а также значения
аппроксимирующих функций для каждой точки, по которой строился исходный график, приведены в таблице.
В качестве критерия достоверности использовался коэффициент детерминации, R² – коэффициент оценки качества аппроксимирующего уравнении.
R2  1 
 ( yi  yˆ )2 ,
 ( yi  y )2
где yi – наблюдаемое значение зависимой переменной y; ŷ – значение зависимой переменной,
предсказанное по уравнению аппроксимации; y – среднее арифметическое зависимой переменной.
Разработка модели поведения информационной системы
Количество измененных строк, y
1800
1600
1400
1200
1000
800
600
400
1
2
3
4
5
6
Временной интервал x, мес.
7
8
9
Временной интервал, x, мес.
Динамика изменения числа уникальных записей в таблице «Карточка автомобиля»:
– статистические данные;
– результат аппроксимации функцией
y = 31,437x2 – 457,27x + 2238,7 (R2 = 0,977)
Карточка автомобиля, увеличение количества уникальных записей в таблице, значения различных
аппроксимирующих функций, их уравнения, критерии детерминации
№
Начало периода
Окончание
периода
Статистические данные
Полиномиальная функция
1
01.02.2009
28.02.2009
1810
1813
Экспоненциаль-ная функция
1528
2
01.03.2009
31.03.2009
1513
1450
1328
1314
3
01.04.2009
30.04.2009
1078
1150
1154
1045
4
01.05.2009
31.05.2009
820
913
1002
888
5
01.06.2009
30.06.2009
842
738
871
783
6
01.07.2009
31.07.2009
690
627
756
707
7
01.08.2009
31.08.2009
528
578
657
648
8
01.09.2009
30.09.2009
565
593
571
601
9
01.10.2009
31.10.2009
685
670
496
562
Степенная
функция
1942
Наиболее достоверно процесс увеличения количества уникальных записей в таблице ежемесячно описывает полиномиальная функция.
Аналогичная работа была проведена для анализа каждого их трех показателей (количество
добавляемых уникальных записей в таблицу, количество добавляемых записей в представление,
общее количество добавляемых записей в таблицу) для оставшихся таблиц, выделенных в группу
наиболее активно изменяющихся.
Средний для информационной модели коэффициент детерминации составил 0,913, что, в
соответствии со шкалой Чедвика позволило сделать вывод, что достоверность построения модели
является весьма высокой.
На основе разработанной модели поведения информационной системы можно сделать вывод
о динамике увеличения размера таблиц и прогноз о размерности таблиц через 6, 12, 18, 24, 30, 36
месяцев.
Программными средствами, предназначенными для проведения нагрузочного тестирования,
были реализованы основные сценария работы пользователей с информационной системой. Состояние информационной системы восстанавливалось для каждого периода моделирования. После
восстановления состояния базы было необходимо измерить времена отклика системы для различ-
Разработка модели поведения информационной системы
ных операций, для чего использовались компоненты программного средства проведения нагрузочного тестирования.
Статистика собиралась следующим образом: после генерации необходимого количества записей в таблицах начиналось моделирование работы основных групп пользователей, для генератора виртуальных пользователей было создано несколько сценариев, позволяющих моделировать
работу групп пользователей в информационной системе в течение одной виртуальной недели,
также несколько раз запускался сбор сводного отчета. По окончанию работы генератора пользователей начинался анализ полученных статистических данных.
Статистические данные, собранные в ходе проведения нагрузочного тестирования информационной системы показывают, что через три года промышленной эксплуатации ИС будет необходимо предпринимать ряд мер по уменьшению времени отклика системы.
В настоящий момент планируется продолжить работу над моделированием поведения информационной системы, собрать больший объем статистики и уточнить модель, разработать механизм автоматического наполнения базы данных информацией для будущих периодов не только
с учетом статистики роста таблиц, но и принимая во внимание распределение значений полей и
ограничений целостности и некоторые другие физические параметры базы данных, будет расширен спектр анализируемых статистических данных, получаемых при проведении нагрузочного тестирования, что позволит получить более точный прогноз временных характеристик информационной системы для будущих периодов и разработать комплекс мер, начиная с усовершенствования
схемы хранения данных, заканчивая разработкой механизма архивации данных. Все вышеперечисленные меры позволят обеспечить требуемый уровень производительности работы целевой
информационной системы настолько долго, насколько это будет необходимо.
СПИСОК ЛИТЕРАТУРЫ
1.
Слюсаренко А. Управление рисками в проектах внедрения информационных систем управления предприятием. [Электронный ресурс]. – Режим доступа: http://www.cio-world.ru/products/370199.
2.
Липаев В.В. Тестирование крупных комплексов программ на соответствие требованиям. М.:
Глобус, 2008.
3.
Котов С.Л. Методы и средства нагрузочного тестирования. [Электронный ресурс]. – Режим
доступа: http://tm.ifmo.ru/tm2005/src/111b.pdf.
4.
Пытьев Ю.П. Методы математического моделирования измерительно-вычислительных систем. 2-е изд. М.: ФМЛ, 2004.
Download