Слои ядра

advertisement
Информационная модель
межведомственного
взаимодействия на основе
ядра данных
Липунцов Юрий
Московский Государственный Университет
lipuntsov@econ.msu.ru
План
1. Международный опыт в области
межведомственного взаимодействия
2. Ядро данных для межведомственного
взаимодействия
3. Примеры реализации отдельных
слоев Ядра данных
National Information Exchange Model
США
Текущее состояние:
введены стандарты
метаданных
Система
Интерфейсы
коммуникаций
Стандарты
метаданных
European Interoperability Reference
Architecture
European Interoperability Framework
Данные из репозитория
поставляются всем
заинтересованным
участникам
Поставка данных по
SPARQL
Загрузка данных
RDF Репозиторий базовых
компонент
RDF Репозиторий
предметной области
Общая модель данных
Онтология и Таксономия
предметной области
Инфраструктура LOGD
Infrastructure for Multilayer Interoperability (IMI)
Япония
Взаимодействие
Основной словарь (загрузка)
Словарь предметной
области (загрузка)
Предметно-ориентированный
словарь (ссылки)
Инфраструктура ЭП (Россия)
текущее состояние
Текущее состояние:
технологическая
инфраструктура
СМЭВ
ЕСИА
ЕСНСИ
Сводный
реестр
госуслуг
Система
Интерфейсы
коммуникаций
Инфраструктура ЭП
для госуслуг
Технологическое решение
Информационные
ресурсы
Межведомственное взаимодействие
на основе ядра данных
Система
Интерфейсы
коммуникаций
Инфраструктура ЭП
Общее ядро
Предметное ядро
Предметно
ориентированное ядро
Сравнительный анализ международного
опыта и предложений для ЭП2020
EIF
NIEM
IMI
ЭП Предложения
Тип информационной модели
LAV, глобальное
представление
LAV, глобальное
представления
LAV, глобальное
представления
LAV, глобальное
представления
Уровень обмена данными
Форматы данных
Семантика
Форматы данных
Семантика
Форматы данных
Семантика
Место хранения исходных данных
Метамодель
Федерация
Репозиториев
Репозиторий,
Метамодель
Репозиторий,
Метамодель
Технологии БД
RDBMS
RDF
RDBMS; RDF
RDBMS; RDF
Степень контроля среды
Контролируемая; Полу контролируемая
Полу - контролируемая; Контролируемая; Полу Слабосвязанная
контролируемая
Контролируемая; Полу контролируемая
Основное ядро;
Предметные области
Основное ядро;
Основное ядро;
Предметные области Предметные области;
Предметно
ориентированный
словарь
Основное ядро;
Предметные области;
Предметно
ориентированный слой
2
Слои ядра
9
Ядро данных для межведомственного взаимодействия
Концептуальная модель и логическая модель
• Концептуальная модель – модель предметной области
независимая от конкретного приложения или контекста
использования данных
• Логическая модель Ядра данных - модель для агрегации,
хранения и представления данных поступающих из внешних
источников.
Модель включает Онтологическую модель и Модель интеграции
данных.
Онтологическая модель и
Модель интеграции данных
Онтология - общее представление
предметной области в форме связей
между сущностями. Корни графа –
Базовые сущности, ветви графа
являются Производными сущностями.
Модель данных строится с использованием
трех типов сущностей:
• Базовые сущности
• Сущности пересечений
• Сущности хранения
Базовая
компонента
Базовая
компонента
Производная базовая
компонента
Базовая
компонента
Базовые сущности
и сущности пересечений
Базовая сущность – основной элемент модели.
Базовые сущности представляют собой
отражение объектов реального мира, либо
могут быть артефактами, отражающими
совокупность фактов реального мира.
Сущность пересечений - сущность,
отражающая взаимодействие базовых
компонент. Сущность пересечений
может быть связана с двумя или
несколькими БС.
Производные базовые сущности
и сущности хранения
Производные базовые сущности компоненты пересечений, которые
участвуют в связях как самостоятельные
сущности.
Сущность хранения - сущность хранения данных, поступающих из
внешних источников. Сущности хранения могут создаваться как для
БС, так и для СП.
Базовая
сущность
Сущность
хранения
Hash
Производная
сущность
Hash
Сущность
хранения
Сущность
пересечения
Базовая
сущность
Сущность
хранения
Физическая модель
1. Принципы создания каркаса Ядра данных для взаимодействия систем
Содержательный ключ (СК) : Два типа содержательных ключей – реальные (ОГРН
компании), и суррогатный (Персона). В случае суррогатного СK для генерации ключа
используется набор атрибутов.
Вывод: все атрибуты источника данных можно поделить на две категории:
– используемые для генерации СК первичных Базовых сущностей (Каркаса ядра данных)
– не используемые для этого
Для организации взаимодействия принципиальным является стандартизация первой
категории атрибутов
2. Технические атрибуты Ядра данных
для организации хранения данных Ядра используется ряд специальных атрибутов:
RecordSource , Load DATESTAMP, NotActual DATESTAMP, LastSeen DATESTAMP …
Примеры: Концептуальные модели
Вариант универсального ядра
Компания
Физическое
лицо
Универсальное
ядро
Местоположение
Объект
недвижимости
Описательное представление экспертами предметной области
15
Предметная область:
высшее образование
Регулирующие
органы
Образовательные
стандарты
Учащиеся
Аккредитация
Образовательные
учреждения
Высшее
образование
Компетенции
Профессиональные
стандарты
Работодатели
16
Предметно - ориентированная часть университет
Публикации
Темы
Практика
Мероприятия
Выпускная
работа
Персоны
Категории
Антиплагиат
Учебный план
Программы
Ведомости
Дисциплины
Периоды
17
Связи между моделями
Компания
Физическое
лицо
Универсальное
ядро
Объект
недвижимости
Местоположение
Регулирующие
органы
Учащиеся
Публикации
Темы
Практика
Мероприятия
Образовательные
стандарты
Аккредитация
Выпускная
работа
Персоны
Категории
Антиплагиат
Высшее
образование
Профессиональные
стандарты
Образовательные
учреждения
Работодатели
Учебный план
Программы
Ведомости
Дисциплины
Периоды
Компетенции
18
Логическая модель:
универсальное ядро
Person
ФИОРДРМР
N_Citizenship
Код Страны 3
N_СitizDoc
Код документа 2
Citizen
Код Гражданина
Organization
ОГРН
Reality
Кадастровый номер
Location
Код адреса
Reality
Location
Organization
Person
Citizenship
RealityLocation
OrgLocation
OrgFounder
PersonCitiz
Doc
Role
CitizLocation
Citizen
RealHolders
19
Логическая модель:
онтология обучения (университет)
Элементы для стандартизации
Набор 1 поз
Набор прог. 3 поз
Элементы общего ядра
Программа - 2 поз
Студ.гр 6 поз
Элементы ядра
предметной области
Студент 10 поз
Элементы предметноориентированного ядра
Группа 3 поз
Персоны - 4 поз
Подразделение 2 поз
Сотрудники 6 поз
Дисциплина 3 поз
Курс
Период
1 поз
Ведомость
9 поз
Эл.курс 15 поз
Поток 15 поз
Тип занятий 1 поз
Номер потока 1 поз
Занятие 22 поз
Пара 1 поз
Дата 1 поз
Аудитория 2 поз
Тип ресурса 1 поз
Ресурс 18 поз
Логический уровень:
Модель интеграции данных (университет)
BunchDate
TeacherBunch
Pair
Date
StudentBunch
Room
Lesson
Bunch
Parent
Bunch
CourseLtype
ResourseType
Lcourse
LessonResourse
Ltype
Dtype
CourseRtype
NBunch
PersonDep
EnrSubj
Resourse
Department
Course
Subject
Person
Period
StudentMark
StudentGroup
MarkSeet
Marksheet
Enrol
Program
ProgCoh
Cohort
Group
SylGroup
Stgroup
StudentScore
Базовые
Базовые
сущности
СущностиПересечений
Сущности
пересечений
Производные Базовые
Сущности
Физическая модель: универсальное ядро
Единый PersonID на весь период времени, независимо от изменения FamilyName. Атрибут для генерации СK
FamilyNameOnBirth
PersonGUID
7D2BA7DE..
7D2BA7DE..
7D2BA7DE..
PersonBK
РЕВИНАЕЛЕ..
РЕВИНАЕЛЕ..
РЕВИНАЕЛЕ..
LoadDST
18.01.2006
19.07.2012
24.06.2015
NADST
19.07.2012
24.06.2015
RSRC
ZAGS34
ZAGS34
ZAGS34
DataHash
776A415..
1F1B072..
7D2BA7D..
FamilyName
РЕВИНА
ЗАЧЕСОВА
РЕШЕТНИКОВA
FirstName
ЕЛЕНА
ЕЛЕНА
ЕЛЕНА
Справочник документов
UlgUID
LDST
RSRC
616B..
23.11.2015
3AF6..
7ED7..
NADST
UlgBK
Name
MNS45
1
Паспорт СССР
23.11.2015
MNS45
21
Паспорт России
23.11.2015
MNS45
22
Заграничный паспорт
России
Различные документы гражданина, отдельные из которых неактуальны (NADST)
CitizUID
73A3..
B6B3..
B6B3..
9CD9..
PersonGUID
7D2B..
7D2B..
7D2B..
7D2B..
UlgUID
616B..
3AF6..
3AF6..
7ED7..
StUID
9380..
BFFA..
BFFA..
BFFA..
LDST
RSRC
23.11.2015 PAS77
23.11.2015 PAS77
23.11.2015 PAS77
23.11.2015 PAS77
NADST
DocSerNum DataHash
18.01.1999 09МЮ681111 B643..
18.11.2006 4500991111 198CD..
4599961111 35D3..
1501361111 AD96..
BFamName
РЕВИНА
РЕВИНА
РЕВИНА
Физическая модель:
интегрированные данные университета
Глубокий содержательный ключ предоставляет широкие возможности для потребителей данных
PrimaryKey
EDD…
F84…
1C2…
EC6…
09C…
33F…
E53…
B63…
3E5…
C02…
A62…
Направление
BunchBK
B.M.3.5.FRI.OD.FK.L.CHTN.0
B.M.3.5.FRI.OD.FI.L.CHTN.0
B.E.3.5.BUK.OD.UA.C.LYDV.6
E.F.4.4.NTT.PS.EU.S.TYVP.0
B.E.4.3.TOC.DR.PE.S.SODB.1
B.E.4.3.GPH.DR.YF.L.SITE.0
B.E.3.5.NYG.FO.SN.S.KUIN.0
B.E.3.5.NYG.FO.SN.C.KUIN.0
B.E.3.5.KMY.DX.MM.L.KRVV.0
B.E.4.3.LOG.OD.MM.C.ROYA.4
B.F.1.9.MBC.DY.MK.Z.CHAV.0
Программа Период
Subj
Финансовые рынк..
Финансовые рынк..
Бухгалтерский у..
Научный семинар..
Теория обществе..
Гражданское пра..
Немецкий язык б..
Немецкий язык б..
Количественные ..
Логика..
Маркетинг..
Предмет
Tsubj
Общие дисциплин..
Общие дисциплин..
Общие дисциплин..
ПРОФЕССОРСКИЕ С..
Дисциплины по в..
Дисциплины по в..
Фак-вы[фАЯс+фНЯ..
Фак-вы[фАЯс+фНЯ..
Дисциплины по в..
Общие дисциплин..
Дисциплины по в..
Преподаватель
Концепция методологии систематизации и кодирования информации, а также совершенствования и актуализации
общероссийских классификаторов, реестров и информационных ресурсов.
Утверждена распоряжением Правительства РФ от 10 мая 2014 г. N 793-р (КСКИ).
Вопросы?
Download