Пятый Уровень в ИТ-Службе

advertisement
Мониторинг бизнес-приложений «глазами пользователей»
в ИТ-Службе
[Quality of Experience + Application Performance] Monitor
Платформа SLA-ON, (С) ProLAN, 2011
Бережливый ITSM и решения ProLAN
Повышение
производительн
ости труда (бэк
офиса)
Мониторинг Эффективной
Нагрузки работников
регламентированного труда
Предотвращение инцидентов
Ускорение
диагностики
инцидентов
ИТ - Бизнес
Мониторинг бизнес-приложений «глазами
пользователей»
Ускорение
квалификации
инцидентов
Корреляция информации об инцидентах с информацией
о здоровье ИТ-Инфраструктуры и производительности
приложений
Автоматическая регистрация инцидентов
Платформа SLA-ON, (С) ProLAN, 2011
Концепция
Платформа SLA-ON, (С) ProLAN, 2011
Концепция решения Пятый Уровень
Платформа SLA-ON, (С) ProLAN, 2011
Назначение Пятого Уровня
1. ИТ-Служба получает [Quality of Experience + Application
Performance] Monitor, - инструментарий для
повышения качества предоставления и поддержки ИТУслуг:
2. HR-Служба получает средство для нормирования труда
и оптимизации численности персонала.
3. Бизнес получает дополнительный индикатор
эффективности бизнес-процессов, работающий в
режиме реального времени.
Платформа SLA-ON, (С) ProLAN, 2011
Применение Пятого Уровня в ИТ-Службе
1. Управление качеством предоставления ИТ-Услуг:
•
Service Level Management (SLR  SLO  SLT  SLA)
2. Повышение качества поддержки ИТ-Услуг:
•
Чтобы узнавать о сбоях в работе до обращения пользователей в Service Desk.
•
Если сбой произошел, то иметь возможность быстро его квалифицировать, а
именно:
 Определить «уровень бедствия» (отдельный пользователь, группа, все пользователи
приложения).
 Оценить влияние сбоя на бизнес-процессы.
•
Автоматически получать информацию, позволяющую быстро определять
корневые причины сбоев.
 Если сбой в работе ИТ-Инфраструктуры, то где именно.
 Если неправильные действия пользователей, то какие именно.
Платформа SLA-ON, (С) ProLAN, 2011
Традиционный Real User Monitoring (RUM)
Платформа SLA-ON, (С) ProLAN, 2011
Ограничения традиционного RUM
1. ОЧЕНЬ СЛОЖНО, ОЧЕНЬ ТРУДОЕМКО, ОЧЕНЬ ДОРОГО. Для эффективного
использования традиционного RUM необходимы: адекватная объектная
модель + возможность контролировать ВСЁ + «супермозг».
2. Мониторинг псевдо реального QoE.
•
Вместо контроля реальных транзакций (как это видят пользователи) –
контролируется их «отражение» в сетевом трафике (что не всегда одно и
тоже).
3. Сложность мониторинга QoE в разрезе бизнес-процессов, ролей, и т.п.
4. Сложность диагностики корневых причин сбоев (отсутствие эффективной
системы анализа получаемой информации).
•
Четыре «измерения» (APM, NPM, QoE, Incidents), связанные друг с другом
только через Объектную Модель.
•
«Бедное» оповещение о сбоях.
5. Высокая стоимость и низкая масштабируемость.
•
Анализатор в центре сети (в месте консолидации трафика) – низкая
точность; на границе сети – высокая стоимость.
Платформа SLA-ON, (С) ProLAN, 2011
Архитектура решения Пятый Уровень
Платформа SLA-ON, (С) ProLAN, 2011
«Паспорт» решения Пятый Уровень
1. Сбор данных – Client Instrumentation.
2. Управление данными – NMS,поддерживающая SNMP.
3. Диагностика сбоев - агрегация информации, характеризующей
производительность ИТ-Инфраструктуры, бизнес-приложений, True
QoE, инцидентов в единой базе данных и проведение факторного
анализа.
•
•
•
«Привязка» всех метрик (APM, NPM, QoE, Incidents) к единой временной
шкале.
Корреляция Событий и Состояний.
Автоматическое определение Связанных Событий.
4. Triggers: время реакции приложений, системные и пользовательские
ошибки, APDEX.
5. Alarms: автоматическая отправка Снимка Инцидента (скриншот,
информация о пользователе, бизнес-операции и др.) в Service Desk
(HP Service Mananer, BMC Remedy, другие).
Платформа SLA-ON, (С) ProLAN, 2011
Преимущества решения Пятый Уровень
1. ПРОСТО, РОБАСТНО, ДОСТУПНО.
2. Адекватность получаемой информации - True QoE.
3. Возможность мониторинга QoE в разрезе бизнес-процессов, ролей,
географии и т.п.
4. Эффективная диагностика сбоев.
•
«Привязка» сбоев в работе бизнес-приложений к Оценкам Здоровью ИТИнфраструктуры (получаемыми средствами Экспертной Системы).
•
Содержательное Оповещение о Сбоях (Снимок Инцидента).
•
Факторный анализ
5. Поддержка APDEX.
•
Эффективность Service Level Management
•
Эффективность Incident Management, Availability Management, Capacity
Management.
Платформа SLA-ON, (С) ProLAN, 2011
Технология
Платформа SLA-ON, (С) ProLAN, 2011
Experience & Performance Agent (EPM-Агент)
Платформа SLA-ON, (С) ProLAN, 2011
Пример транзакции: «Выдача кредита в Diasoft FA#»
Платформа SLA-ON, (С) ProLAN, 2011
Метрики Quality of Experience
Метрики:
Атрибуты метрик:
1. Время выполнения системных и
пользовательских транзакций (RT).
1. Имя пользователя и домен (например,
Ivanov@prolan)
2. Ошибки при выполнении транзакций:
2. Бизнес-процесс (например, учет
товаров).


Системные ошибки.
Пользовательские ошибки.
3. Число выполненных транзакций:

Нормально завершенные транзакции.

Принудительно завершенные
транзакции (ошибка, тайм-аут).

Транзакции с нарушением
последовательности действий.
4. Application Performance Index

APDEX (www.apdex.org)

ProLAN 1DEX
Платформа SLA-ON, (С) ProLAN, 2011
3. Бизнес-приложение (например, 1С
Предприятие).
4. Местоположение пользователя
(например, московский офис).
5. Подразделение пользователя
(например, бухгалтерия)
6. Вид транзакции (например, Task).
7. Другое (на ваше усмотрение)
APDEX (www.apdex.org) – оценка Quality of Experience
APDEX и Service Level Management:
SLR  SLO  SLT  SLA
SLR – например, время выдачи кредита < 10 мин.
SLO = T, например – 2 сек.
SLT = Apdex [2], например 0.7
SLA – как соблюдается SLT
Платформа SLA-ON, (С) ProLAN, 2011
«Пятый Уровень + Красная Кнопка»
Платформа SLA-ON, (С) ProLAN, 2011
Состав решения: «Пятый Уровень + Красная Кнопка»
ПО на компьютере пользователя
+
EPM-Агент
Измерят QoE + «красная кнопка»
+/-
SelfTrace
Определяет, какую бизнес-операцию выполняет пользователь
+/-
Remote Hands
Удаленное управление компьютером пользователя
+/-
HelpMe
«Красная кнопка» + дополнительные возможности
Агрегатор Информации
+
SLA-ON
Operartions
Консоль управления здоровьем ИТ-Инфраструктуры + консоль удаленного управления
компьютерами пользователей + консоль управления событиями (Help Desk)
+
SLA-ON Probe
Измерительный зонд + Экспертная Система + Экспертизы + запись Снимков Инцидента
в консолидированную базу данных
+/-
Коннектор
Интеграция с Service Desk
+/-
AutoImport
Запись информации о здоровье ИТ-Инфраструктуры и выполняемых пользователями
операциях в консолидированную базу данных + управление этими данными
«+» - обязательно; «+/-» - опционально.
Платформа SLA-ON, (С) ProLAN, 2011
Интеграция
Платформа SLA-ON, (С) ProLAN, 2011
Интеграция «из коробки» с NMS
Платформа SLA-ON, (С) ProLAN, 2011
Root Cause Analysis (пример методики)
«Привязка» сбоев в работе бизнес-приложений к Оценкам Здоровья ИТ-Инфраструктуры
(получаемым средствами Экспертной Системы).
Платформа SLA-ON, (С) ProLAN, 2011
Проактивное управление QoE
Платформа SLA-ON, (С) ProLAN, 2011
Способы интеграции с Service Desk
Платформа SLA-ON, (С) ProLAN, 2011
Вместо заключения
Ключевые преимущества:
1. Адекватность получаемой информации.
2. Мощные диагностические возможности.
3. Экономичность.
Ограничения:
1. Необходимость разработки Шаблонов, однако:
•
Для тиражируемых приложений ProLAN разрабатывает Шаблоны бесплатно.
•
Шаблоны можно разрабатывать самостоятельно (предоставляется детальная инструкция).
2. В настоящее время в полной мере поддерживаются только Windows-приложения,
однако:
•
Для приложений другого типа предлагается другая методика управления QoE.
•
Поддерживается интеграция с Network Instruments GigaStor; возможна интеграция с
продуктами других вендоров.
Платформа SLA-ON, (С) ProLAN, 2011
Приложение №1
Пятый Уровень на платформе Network Instruments
Подробнее: http://www.prolan.ru/solutions/showcase/prolanplusni/index.html
Платформа SLA-ON, (С) ProLAN, 2011
Download