применение многомерных технологий при создании

advertisement
ПРИМЕНЕНИЕ МНОГОМЕРНЫХ ТЕХНОЛОГИЙ ПРИ СОЗДАНИИ ИНФОРМАЦИОННЫХ
СИСТЕМ ОТКРЫТОГО ОБРАЗОВАНИЯ
CREATION OF THE OPEN EDUCATION INFORMATION SYSTEMS USING MULTIDIMENSIONAL
TECHNOLOGIES
Б.Г.Ильясов, Ю.С.Кабальнов, О.И.Христодуло, А.А.Левков, Д.В.Ивлев
Уфимский государственный авиационный технический университет, Уфа
Тел.: (3472) 32-61-66, факс: (3472) 32-61-66, e-mail: Olga@tc.ugatu.ac.ru
В основе открытого образования лежит богатая и детально разработанная образовательная среда, в которой
обучаемый самостоятельно ориентируется, стремясь к достижению стоящих перед ним образовательных целей.
Применительно к высшему образованию принцип открытости означает:
– открытое поступление в любое высшее учебное заведение;
– открытое планирование обучения;
– свободу в выборе времени и темпов обучения;
– свободу в выборе места обучения.
Анализ основных принципов открытости говорит о том, что при успешном развитии открытого образования число
объектов (субъектов), принимающих участие в процессе образования будет огромным: это миллионы обучаемых,
тысячи преподавателей, десятки тысяч вспомогательного персонала, а также технические средства и сотни тысяч
всевозможных книжных изданий. Это позволяет говорить о том, что технология обучения переживает в настоящее
время качественно новый этап, характеризующийся становлением так называемой индустрии образования или
индустрией предоставления образовательных услуг. Это сопровождается вовлечением в образовательный процесс
большого числа вузов, находящихся в различных регионах, государствах. Тем самым можно утверждать, что по
аналогии с глобализацией экономики, в 21 веке будут идти процессы, направленные на глобализацию образования. В
связи с этим актуальным становится вопрос о создании новых информационных технологий хранения, переработки и
передачи информации.
В настоящее время все большее практическое распространение приобретают информационные системы
реального времени. Данные системы ориентированы не только на хранение информации, но и на активную,
непрерывную работу с ней. Если для простых ИСРВ, характеризуемых небольшим объемом хранимой информации
(порядка 104-108 байт) и относительно простыми запросами, не требующими сложной аналитической обработки
данных, можно использовать традиционные методы хранения и обработки информации (например, общеизвестный
реляционный подход), то для сложных больших ИСРВ применение этих методов не позволяет достичь необходимого
быстродействия.
Это связано с тем, что сложные ИСРВ характеризуются рядом следующих аспектов:
– большие массивы хранимой информации, порядка 109-1013 байт;
– высокие требования к надежности хранения и целостности данных;
– многопользовательский режим работы;
– активное применение пользователями сложных аналитических запросов, направленных на комплексную
обработку большого количества данных. Под аналитическими запросами подразумеваются запросы,
направленные на агрегацию данных, прогнозирование показателей, поиск по нечетким условиям и т.д.;
– режим работы в реальном времени;
– высокая степень динамизма структуры и содержания. Для такой системы невозможно предсказать ее состояние
и строение в заранее заданный момент времени.
Одним из наиболее перспективных и быстро развивающихся направлений, призванных решать
вышеперечисленные задачи, является технология многомерного представления информации, на основе которой
строятся многомерные базы данных (МБД). Такие БД способны оперировать большими массивами данных,
представляя гибкий язык запросов, способный выразить сложные операции посредством простых формализованных
выражений. Также, МБД изначально ориентированы на распараллеленную работу в многопользовательских системах.
Кроме того, по сравнению с РБД, в МБД значительно улучшена поддержка сложных аналитических запросов, которые
наиболее характерны для методов обработки данных.
Однако, на данный момент, этому подходу присущ ряд значительных недостатков, ограничивающих использование
многомерного подхода в больших сложных системах реального времени. Речь идет о недостаточной степени
обеспечения надежности хранения данных и их целостности, характерной для логически распределенных структур,
использующихся в концепции поли-кубического построения многомерных моделей данных. Также, МБД неспособны
функционировать в реальном режиме времени – их быстродействие находится в сильной зависимости от
обслуживаемых ими запросов, выполнение большей части которых, заранее непредусмотренной, как это бывает в СРВ,
приводит к значительному падению скорости работы МБД. Эта особенность функционирования связана с RISCархитектурой МБД.
В современных системах, представленных на рынке МБД, для решения проблемы хранения данных используются
алгоритмы резервирования и архивирования данных. Хотя при помощи этих методов и возможно добиться заданной
надежности, однако затраты на ее обеспечение слишком высоки и ресурсоемки. Средств же для работы МБД в
реальном режиме времени вообще не существует, что обусловлено RISC-архитектурой самих МБД.
По мнению авторов, все вышеперечисленные недостатки многомерных систем хранения данных, проистекают из
неправильного "разделения труда" между логической и физической структурами данных. Физическая и логическая
структуры СУБД должны выполнять каждая свои строго типизированные функции и никоим образом не пересекаться
друг с другом, кроме вопросов, связанных с поддержкой надежности хранения данных.
1
Исходя из этого, авторами предлагается четко разделять уровни абстрагирования многомерной системы хранения
данных как минимум на два:
– уровень логического представления данных (и, соответственно, логическая модель);
– уровень физического представления данных (физическая модель).
Разработку любой системы хранения информации следует начинать, в первую очередь, с распределения
функциональных требований между физической и логической моделями данных. Для каждого уровня должны быть
строго определены все обязательства самой абстракции, вынесенные в интерфейсы соответствующих моделей
данных. Обязательства абстракции могут быть заданы произвольным образом, главная их черта – постоянство и
стабильность.
На логическую модель представляется правильным возложить поддержку целостности данных на логическом
уровне, организацию диалога с пользователем через исчисление или алгебру взаимодействий виртуальной структуры
данных, поддержку сложных комплексных запросов через простые языковые конструкции.
На физическую же модель предлагается кроме забот о надежности хранения данных на физическом уровне и
отказоустойчивости, возложить еще и заботы об оптимальности хранения разреженных данных и быстрой навигации по
ним, вкупе с быстрыми алгоритмами добавления и удаления данных. Кроме всего прочего, стоит обратить внимание и
на то, что данные требования должны быть применимы не только к одной элементарной единице информации (как к
атрибуту в РБД), но и к достаточно большим ее спискам и множествам.
2
Download