Зонтичный мониторинг нередко воспринимают как излишество. По сути это мониторинг мониторингов. Кажется, зачем эта надстройка, если данные о состоянии объектов
Для ответа на этот вопрос проведем аналогию: на кухне тоже множество разных продуктов. Но от того, что они там есть, ужин просто так не появится.
Признак 1: уже есть несколько корневых систем мониторинга
Распространенная ситуация: по мере развития компании разрастается и
С одной стороны, всё под присмотром. С другой, данные остаются разрозненными. Информация в разных форматах хранится в разных системах, и с ней работают разные специалисты. Никто не складывает их в единое целое, а инфраструктура похожа на разобранный пазл: части есть, а общей картины нет.
Зонтичный мониторинг, например, система Naumen Business Service Monitoring (BSM), и есть тот потенциальный единый центр, который умеет собирать информацию из корневых мониторингов. Он ее аккумулирует, систематизирует и показывает в виде
Признак 2: основной источник информации о сбоях в услугах — недовольные пользователи
Корневые мониторинги взаимодействуют с оборудованием. Но оборудование и предоставляемая услуга — разные вещи.
Представим ситуацию, в которой корневой мониторинг получает информацию, что на сервере занято 80% доступной ему памяти. Уведомление об этом приходит ответственному за данный сервер. Для него пока ситуация не выглядит критичной. Но на этом сервере развернута база данных компании. Чтобы она работала корректно, запас свободной памяти должен составлять не менее 40%. Ответственный за оборудование об этом не знает. В итоге начинаются сбои в работе базы данных — об этом сообщают пользователи в техподдержку. Причина далеко не очевидна, потому что сервер и услугу еще нужно связать.
С зонтичным мониторингом можно сработать быстрее, ведь на его уровне понятна связь конкретного оборудования с услугами. По сигналу от корневого мониторинга система понимает, какие сервисы пострадали и сообщает ответственному за них. Так он сможет сориентироваться в ситуации и расставить приоритеты в плане действий.
Еще некоторые сбои можно распознать только при одновременных сигналах об определенных показателях из разных корневых мониторингов. Например, в Naumen BSM можно создавать и настраивать триггеры, которые ориентируются на данные из разных систем. Если в комплексе показатели сигнализируют о нештатной ситуации, сбой не будет упущен. Начать ликвидировать его получится еще до того, как пользователи поднимут тревогу.
Признак 3: менеджер услуги не может сам отслеживать ее состояние
Пользователям важно получить услугу. За ее доступность отвечают одни специалисты. При этом услуга обеспечивается оборудованием. И за его работоспособность отвечают другие специалисты. Фактически корневой мониторинг — это инструмент для ответственных за оборудование.
А у менеджера услуги, при отсутствии зонтичного мониторинга, нет рабочего инструмента для определения работоспособности услуги. О сбое сервиса он скорее всего узнает, когда пользователи обратятся в техподдержку. И у него только один способ выяснить причину — идти к
Ответственный за услугу потратит время, чтобы выяснить первопричину и понять, сколько уйдет на ее восстановление. Тогда как пользователи будут оставаться без сервиса.
В свою очередь зонтичный мониторинг получит из корневого информацию о сбое в оборудовании, поймет, какая услуга может от этого пострадать, и уведомит ответственного специалиста. Naumen BSM преобразует информацию в понятный и читаемый вид — чтобы разобраться, не понадобятся навыки работы со специализированными системами. Менеджер сможет перейти от услуги к связанному с ней оборудованию и получить более детальные данные о том, какое именно устройство пострадало.
Признак 4: нет подготовки к регламентным работам
Оборудование не может выполнять свои функции, когда на нем ведутся технические работы. Значит, услуга, которую обеспечивает это оборудование, будет временно недоступна, а это — недовольство пользователей. Кроме того, от корневого мониторинга пойдет поток уведомлений о том, что с устройством
С помощью зонтичного мониторинга влияние профилактических работ можно заметно смягчить. За счет
А чтобы избежать тревоги на сигналы от корневых мониторингов, в зонтичной системе фиксируется время регламентных работ. Когда оно настанет, здоровье нужных устройств изменится на «Профилактические работы». Когда по ним из корневого мониторинга поступит уведомление о неработоспособности, это не повлечет создания аварийных инцидентов. Система зонтичного мониторинга будет понимать — аварии нет, ведутся регламентные технические работы.
Признак 5: медленная классификация событий из корневых мониторингов
Корневые мониторинги уведомляют не только о поломках. Они фиксируют отклонения от нормы, но эти события бывают нейтральными или позитивными. В любом случае важно определить, что именно произошло. Без зонтичного мониторинга это делается силами конкретного специалиста.
Зонтичный мониторинг автоматизирует этот процесс. Полученные из корневого мониторинга данные он обогащает ссылками:
- на оборудование, по которому пришло событие;
- ситуации, по которым можно классифицировать событие;
- услуги, которые обеспечиваются данным оборудованием.
Исходя из всей этой информации, по преднастроенным правилам система классифицирует это событие: закрыть, отложить или создать запрос.
Итак
Системы корневого мониторинга — это инструменты для специалистов, которые отвечают за работоспособность оборудования. Зонтичный мониторинг отражает связи оборудования с предоставляемыми сервисами и становится инструментом менеджеров услуг.
Если компания сталкивается хотя бы с одним из этих признаков, стоит задуматься о том, что корневых мониторингов уже недостаточно. Образуется некая слепая зона: неочевидно, какая услуга с каким оборудованием связана. Это мешает выявлять пострадавшую услугу и замедляет ее восстановление. А значит, пора сделать следующий шаг — внедрить зонтичный мониторинг. Система зонтичного мониторинга ликвидирует этот пробел и помогает из разрозненных частей пазла инфраструктуры собрать полную картину.