Инф. системы на БД

advertisement
ФАКТОГРАФИЧЕСКИЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ
СИСТЕМА
АКТУАЛИЗАЦИ
И БД
ПРЕДМЕТНАЯ
ОБЛАСТЬ
Отображ.
структуры ПО в
структуру БД
СИСТЕМА
ОБРАБОТКИ
ИНФОРМАЦИИ
СУБД
БД
Професс.
ориентиро
ванные
системы
Процедур
но
ориентиро
ванные
системы
Отображ.
состояни
я объектов ПО в
состояни
е БД
К.П
.
Организация работы
с пользователем
Рациональное хранение
информации
Защита БД
СИСТЕМА АДМИНИСТРИРОВАНИЯ БД
ОСРОБЕННОСТИ ПРЕДМЕТНОЙ ОБЛАСТИ, ХОРОШО
МОДЕЛИРУЕМОЙ ФАКТОГРАФИЧЕСКОЙ
ИНФОРМАЦИЕЙ
При информационном моделировании на ЭВМ предметная
область достаточно просто отображается в компьютерные данные
следующим образом:
Предметная область
Компьютерная модель
1. Параметр (свойство, характеристика)
1. Данное
2. Значение параметра
2. Значение данного
3. Перечень возможных значений
значений параметра для объектов
одного типа
3. Классификатор
(словарь)
4 Группа параметров, описывающих
однотипные объекты
с определенной стороны
4. Схема файла
4.1 Описание множества однотипных
объектов по этой группе параметров
4.1. Файл базы данных
4.2 Описание одного объекта по этой
группе параметров (значения параметров
объекта)
4.2. Одна либо несколько
записей файла
5. Описание однотипных объектов
предметной области с различных сторон
5. Система файлов
(база данных)
6. Описание предметной области в целом
(все множество типов объектов)
6. Система баз данных
Посмотреть на соответствие объектам РМД
Важную роль в фактографической информационной системе (как и в
документальной) играет информационный язык, основу которого
составляют словари возможных значений данных КЛАССИФИКАТОРЫ.
В реляционной модели данных им соответствуют ДОМЕНЫ
Система актуализации БД включает две подсистемы:
1. отображения структуры предметной области (ПО) в
структуру БД;
2. отображения состояния объектов ПО в состояние БД.
СИСТЕМА
ОБРАБОТКИ
ИНФОРМАЦИИ
СИСТЕМА
АКТУАЛИЗАЦ
ИИ БД
1
ПРЕДМЕТНАЯ
ОБЛАСТЬ
------------
СУБД
БД
Професс.
ориентиро
ванные
системы
Процедур
но
ориентиро
ванные
системы
2
К.П
.
Организация работы
с пользователем
Рациональное хранение
информации
Защита БД
СИСТЕМА АДМИНИСТРИРОВАНИЯ БД
1. Отображение структуры предметной области в структуру БД
может трактоваться как проектирование БД.
Процесс проектирования можно представить в виде трех основных
этапов:
 формирование концептуальной информационной модели
предметной области (КИМПО);
 выбор СУБД;
 отображение КИМПО в логическую и физическую структуру БД
выбранной СУБД.
Построение концептуальной модели самый сложный
и трудно формализуемый процесс.
Отсутствуют
конструктивные методики, процесс структуризации по существу
является искусством, опирающимся на опыт проектировщика и
участие профессионала – работника моделируемой предметной
области. Важнейшая причина такого положения - недостаточное
развитие теории структуризации данных. Вот уже в течение
нескольких десятилетий теория базируется на понятии: «сущность
- связь», формальных базовых отношениях между элементами 1 :1,
1:М, N : M, через которые определяют более сложные линейные,
иерархические и сетевые структуры. В рамках этих формализмов
строится концептуальная модель.
Реляционная модель данных (РМД) рассматривает
сложные структуры данных только на концептуальном
уровне.
Элементами структуры БД в реляционных СУБД являются простые
(нормализованные) таблицы. Поэтому, когда говорят о
проектировании БД в РМД то прежде всего имеют ввиду
нормализацию отношений, а уже потом установление связей между
ними.
Как в иерархической, сетевой, так и РМД отсутствуют
конструктивные методики проектирования концептуальной модели
(логической структуры) данных.
Анализ известных работ позволяет выделить
подхода к определению концептуальной модели.
два
основных
Наиболее распространен подход, основанный на анализе
потребностей пользователей в информации.
Считается,
что
потребности эти отражены в существующих документах
и
дополнительно могут быть выявлены в результате специального
опроса пользователей.
Такой подход назовем ИНТЕГРАЦИОННЫМ, т.к.
концептуальная модель строится в результате интеграции
анализируемых потребностей.
Кстати,
используемые нами отношения,
исходные
для
нормализации, как раз отражают конкретные информационные
потребности.
Основным недостатком такого (интеграционного)
подхода
является необходимость постоянного развития и модернизации
модели, связанного с естественным расширением информационных
потребностей пользователей с течением времени.
Второй подход базируется на системном анализе
предметной
области,
чаще
всего
посредством
последовательного, многоуровневого разбиения ее на подсистемы
до тех пор, пока не станет очевидным информационное поле
составных частей.
С учетом этой специфики
назовем такой подход
ДЕКОМПОЗИЦИОННЫМ и отметим сложность его реализации
(необходимо активное участие руководителей различных уровней)
и потребность в серьезном теоретическом обосновании.
Имея определенные достоинства и недостатки, оба этих подхода,
видимо, имеют право на существование. Так, если создается
новая система информатизации («на пустом месте»), то
предпочтение следует отдать декомпозиционному подходу. В то же
время для предметных областей, где уже функционируют средства
информатизации (более типичная ситуация) для перехода к единой
информационной модели,
эффективнее применить
интеграционный подход.
Одним из наиболее распространенных подходов к разработке
КИМПО является подход, предложенный одним из руководителей
корпорации ORACLE
Ричардом Баркером, отвечающим за
направления,
связанные
с
развитием
CASE-метода,
с
автоматизированным проектированием систем и с разработкой
прикладных программ с помощью СУБД ORACLE . Суть подхода
достаточно подробно изложена в работе Фирмы Oracle «CASE
Method – Entity Relationship Modelling by Richard Barker», !990 г.
Подход основывается на системном анализе предметной области,
реализуемым преимущественно посредством интервьюирования
специалистов предметной области и направлен на построение ERмодели (Entity-Relantion).
Общим недостатком этого подхода является низкий уровень
формализма в анализе предметной области, что делает процесс
создания ее концептуальной информационной модели по существу
искусством. Об этом свидетельствует и заключение Баркера
«Наблюдательность, здравый смысл и дедуктивное мышление
позволяет Вам разработать качественную модель».
Следует заметить, что если концептуальная модель
определена,
то
процесс
проектирования
физической структуры БД для всех современных
СУБД может быть автоматизирован с помощью
средств, имеющихся на рынке программного
обеспечения. ERWin, BPWin, ORACLE Designer и
др.
2. Отображение состояния объектов предметной
области в состояние БД осуществляется, как правило, в два
этапа:
 фиксации значений параметров объектов предметной области;
 корректировки значений соответствующих данных в БД.
СИСТЕМА
ОБРАБОТКИ
ИНФОРМАЦИИ
СИСТЕМА
АКТУАЛИЗАЦ
ИИ БД
1
ПРЕДМЕТНАЯ
ОБЛАСТЬ
------------
СУБД
БД
Професс.
ориентиро
ванные
системы
Процедур
но
ориентиро
ванные
системы
2
Организация работы
с пользователем
Рациональное хранение
информации
Защита БД
СИСТЕМА АДМИНИСТРИРОВАНИЯ БД
К.П
.
Если в месте возникновения значений параметров установлен
компьютер, то эти два этапа могут совпадать, т.е. значения данных
вносятся непосредственно в БД, но через заполнение экранной
формы документа. В этом случае, как правило, печатается и так
называемая «твердая» копия документа, которая визируется
ответственными лицами, возможно, ставится печать и бумажный
документ хранится в архиве.
Использование бумажных документов даже при компьютерной
реализации документооборота объясняется тем, что только личная
подпись и печать придают юридический статус документу, а также
более высокой надежностью длительного хранения информации на
бумажном носителе.
Фиксация значений параметров объектов на бумажных носителях
осуществляется в тех случаях, когда в месте возникновения
значения нет компьютера.
Разделение процесса актуализации БД на упомянутые два этапа
часто осуществляется еще и для защиты от случайных ошибок в
процессе первоначального ввода данных на этапе корректировки.
Для этого, в начале, первичные данные переносятся в память
компьютера, затем осуществляется контроль значений и их
исправление в случае обнаружения ошибок, и лишь после этого
осуществляются необходимые изменения в БД.
Значение эффективного контроля вводимых данных
трудно переоценить:
если в БД хранятся
недостоверные данные – теряет смысл вся система
хранения и обработки данных.
Существует много способов контроля значений данных,
называемых также проверкой ограничений целостности данных.
Контроль уровня данного:
 на соответствие типу данного (не цифра в числовом данном,
ограничение на число дней и месяцев в данном типа дата,
недопустимый код в логическом данном и т.п.);
 на размер значения данного;
 на обязательность наличия значения ( Not Null);
 на допустимый диапазон, в котором должно быть значение
(значение данного д.б. больше А и меньше В);
 на наличие в словаре ( в списке), например, оценка м.б. отлично,
хорошо, удовлетворительно, не удовлетворительно ;
 использование контрольного разряда.
Последний способ используется в России во всех федеральных
кодификаторах (их называют классификаторами). Смысл методики
заключается в следующем: цифровой код снабжается (последняя
цифра кода) контрольным разрядом, рассчитываемым по
специальному алгоритму. Если во введенном коде допущены ошибки
в написании цифр кода, то при расчете контрольного разряда по
цифрам введенного кода, он вероятнее всего не совпадает с
введенным контрольным разрядом.
Контрольный разряд рассчитывается следующим способом. Пусть
an ,, a3 , a2 , a1 цифры разрядов кода , не считая контрольного разряда
bn ,, b3 , b2 , b1 - постоянные весовые
(должен быть на месте a 0 ), а
коэффициенты. Тогда контрольный разряд рассчитывается как
остаток от деления  ai  bi на некоторое число, называемое модулем.
i
В России используется деление по модулю 11.
Например, имеем весовые коэффициенты b1  3, b2  7, b3  4, b4  8 . Тогда
числовой код 255 имеет контрольный разряд равный 3 ( 5  3 + 5  7
+ 2  4 = 58 остаток от деления на 11 равен 3), т.е. верный код 2553 .
Если при вводе допущено искажение кода, например, 2523, то в
результате расчета получаем контрольный разряд равный 5 (2  3 + 5
 7 + 2  4 = 49, остаток от деления на 11 равен 5), что не совпадает с
введенным контрольным разрядом 3.
Естественно ошибка (особенно двойная) может быть такой, что
контрольный разряд ошибочного кода совпадает с расчетным. Поэтому мы
вначале отметили, что при ошибке рассчитанный контрольный разряд
«вероятнее всего не совпадает с введенным контрольным разрядом».
Вероятность обнаружения ошибки тем выше, чем выше модуль на который
делится сумма произведений разрядов кода на весовые коэффициенты
(поэтому в России выбран модуль 11) и чем дальше отстоят друг от друга
значения коэффициентов соседних разрядов.
Контроль уровня записи:
 на размер записи;
 на соблюдение арифметико-логических выражений над
значениями данных, входящих в запись (типичные примеры –
наличие в исходных документах конструкций «всего, в том
числе…», «всего, из них…»).
Контроль на уровне групп записей:
 контроль по итоговой строке таблицы;
 контроль на обязательность заполнения строк таблицы.
Межзаписный контроль (уровень БД):
 арифметико-логические выражения (типичны для контроля
множества бухгалтерских документов);
 контроль ссылочной целостности, когда записи одного типа не
могут существовать без соответствующих записей другого типа (см.
описание иерархических структур данных). В реляционных СУБД
для этого используется описатель FORING KEY.
Далее о системе актуализации БД
Типовые процедуры корректировки БД:
 замена значений данных в некоторых записях;
 удаление записей;
 вставка новых записей.
Для осуществления замены или удаления
соответствующие записи вначале должны быть найдены, а при
вставке в БД не должно быть записи с тем же значением ключевых
данных, что и во вводимой.
Во всех случаях серьезное значение имеет соблюдение ограничений
ссылочной целостности.
Удаление «старшей» записи может автоматически привести к
удалению всех «подчиненных», замена значений данных ключа
записи может быть запрещена или может сопровождаться заменой
ссылки на нее от «старшей» и замене соответствующих данных
ключей «подчиненных» записей.
Вставка новых записей также может потребовать изменения ссылок
в части хранимых записей.
Система обработки баз может быть представлена
состоящей из:
3. профессионально-ориентированных средств;
4. процедурно-ориентированных программных средств.
СИСТЕМА
АКТУАЛИЗАЦИ
И БД
ПРЕДМЕТНАЯ
ОБЛАСТЬ
Отображ.
структуры ПО в
структуру БД
СИСТЕМА
ОБРАБОТКИ
ИНФОРМАЦИ
И
СУБД
3
БД
Отображ.
состояни
я объектов ПО в
состояни
е БД
4
Организация работы
с пользователем
Рациональное хранение
информации
Защита БД
СИСТЕМА АДМИНИСТРИРОВАНИЯ БД
К.П
.
3. Профессионально-ориентированные средства
обеспечивают прямую компьютерную поддержку
существующих информационных технологий на
рабочем месте и максимально учитывают их
специфику.
Поэтому такие средства часто называют
Автоматизированными рабочими местами или АРМами.
Несомненное достоинство таких систем – создание комфортных
условий для работников.
Основной недостаток – необходимость модификации
программного обеспечения при изменении информационных
технологий, связанных с их совершенствованием или директивными
решениями.
Для обеспечения минимальных затрат на модификацию таких
систем их необходимо делать открытыми и использовать средства
автоматизированного проектирования.
4. Процедурно-ориентированные средства реализуют
типовые процедуры поддержки информационных
технологий. Они являются универсальными средствами
типа информационно-справочных систем.
Для работы с базами данных, являющимися информационными
моделями очень широкого класса предметных областей, такими
процедурами являются:
 выбор записей, удовлетворяющих заданным ограничениям на
значения данных;
 отбор подмножества данных;
 установление требуемого порядка следования (сортировки)
записей;
 определение максимального, минимального, среднего, суммарного
значения данного в группе записей; отклонение или доля этих
значений – значения соответствующего данного в образующих их
записях;
 определение разности, долевого, процентного соотношения
данных в одной записи.
Нетрудно заметить, что средства экранного интерфейса
современных СУБД интерпретирующие команды SQL (операции
РА), относятся к процедурно-ориентированным.
Несомненным достоинством процедурно-ориентированных средств
является их универсальность, независимость от изменений в
конкретных информационных технологий.
Однако, реализовать с их помощью специфические технологии на
рабочем месте является трудоемкой задачей.
Типовость отмеченных процедур может быть обоснована с учетом
особенности систем организационного управления, связанной с
производством некоторых конечных продуктов. Это могут быть как
материальные объекты (детали, механизмы, приборы и т. п.) так и
некоторые сущности (знания, технологии, проекты, НИРы, услуги и
многое другое).
АНАЛИЗ СООТВЕТСТВИЯ
П
О
С
Т
А
В
Щ
И
К
И
ПРОИЗВОД
-СТВО
9
СНАБЖЕНИЕ
4
(обесп
ечение
ресурсами)
10
5
6
5
6
(мар-
2
3
Ф
1.
2.
3.
4.
СБЫТ
кетинг)
11
1
8
13
7
12
И
Н
7
А
Н
С
8
Ы
Потребность в конечных продуктах конкретных потребителей
Сводная потребность в конечных продуктах
Сводная потребность в материалах (ресурсах)
Договора на поставку материалов (ресурсов)
П
О
Т
Р
Е
Б
И
Т
Е
Л
И
АНАЛИЗ СООТВЕТСТВИЯ
П
О
С
Т
А
В
Щ
И
К
И
ПРОИЗВОД
-СТВО
9
СНАБЖЕНИЕ
4
(обесп
ечение
ресурсами)
СБЫТ
10
5
6
5
6
11
7
13
И
Н
1
кетинг)
8
7
12
Ф
(мар-
2
3
8
А
Н
С
П
О
Т
Р
Е
Б
И
Т
Е
Л
И
Ы
Поставки материалов (ресурсов)
Передача материалов (ресурсов) в производство
(13) Готовые конечные продукты
Отгрузка конечных продуктов потребления
Организация производства конечных продуктов
Материалы (ресурсы)
Оборудование
11. Работники
4.
5.
6.
7.
8.
9.
10.
Жизненный цикл производства конечных продуктов предусматривает, в
общем случае, выполнение процессов выявления потребности в конечных
продуктах, собственно их производства; обеспечение потребности в ресурсах
(исходных материалах, полуфабрикатах, сырье, оборудовании, кадрах и т.п.).
На всех этапах жизненного цикла в производстве конечных продуктов
участвуют люди, используются средства труда (оборудование, помещение и
т.п.) и предметы труда, преобразование которых последовательно ведет к
созданию конечных продуктов.
Процесс управления на любых этапах жизненного цикла производства
конечных продуктов предусматривает выполнение функций планирования
(выявления потребностей), учета, анализа и регулирования.
Типовость отмеченных процедур может быть обоснована с учетом
особенности систем организационного управления, связанной с
производством некоторых конечных продуктов. Это могут быть как
материальные объекты (детали, механизмы, приборы и т. п.) так и
некоторые сущности (знания, технологии, проекты, НИРы, услуги и
многое другое).
Cферы целесообразного использования:
 процедурно-ориентированные средства
целесообразно применять для информационной
поддержки руководящих работников, которым
необходим справочный режим работы с данными,
возникающими на самых разных рабочих местах;
 профессионально-ориентированные средства
наиболее предпочтительны для работников, связанных
с обработкой первичной информации, со спецификой в
информационной технологии (определенные
документы, последовательность действий,
определенные участники и т.п.).
Средства администрирования БД обеспечивают
поддержку следующих видов работ администрирования БД:
 организация работы с пользователями;
 совершенствование физической организации БД
(реорганизация БД);
 обеспечение защиты хранимой информации.
Организация работы с пользователями:



Регистрация пользователей;
Установление прав доступа;
Консультирование пользователей
Совершенствование физической организации БД:

Анализ эффективности (производительности) системы
обработки данных и БД;

Реорганизация (изменение физической структуры) БД;

Изменение логической структуры БД.
Обеспечение защиты хранимой информации:


Защита от несанкционированного доступа;
Защита от катастрофического разрушения.
Download