5 признаков того, что компании нужен зонтичный мониторинг

Зонтичный мониторинг нередко воспринимают как излишество. По сути это мониторинг мониторингов. Кажется, зачем эта надстройка, если данные о состоянии объектов ИТ-инфраструктуры и так исправно поступают из различных систем корневого мониторинга?

Для ответа на этот вопрос проведем аналогию: на кухне тоже множество разных продуктов. Но от того, что они там есть, ужин просто так не появится. Кому-то придется соединить все ингредиенты в единое целое. Мы сформулировали несколько признаков, по которым можно понять, что компании пора «готовить ужин», и без шеф-повара в лице зонтичного мониторинга здесь не обойтись.

Признак 1: уже есть несколько корневых систем мониторинга

Распространенная ситуация: по мере развития компании разрастается и ИТ-инфраструктура. Также постепенно, чтобы охватить все новые сегменты, внедряются системы корневого мониторинга (взаимодействуют напрямую с оборудованием и снимают с него нужные метрики).

С одной стороны, всё под присмотром. С другой, данные остаются разрозненными. Информация в разных форматах хранится в разных системах, и с ней работают разные специалисты. Никто не складывает их в единое целое, а инфраструктура похожа на разобранный пазл: части есть, а общей картины нет.

Зонтичный мониторинг, например, система Naumen Business Service Monitoring (BSM), и есть тот потенциальный единый центр, который умеет собирать информацию из корневых мониторингов. Он ее аккумулирует, систематизирует и показывает в виде ресурсно-сервисной модели, которая отображает, как объекты инфраструктуры связаны между собой и как влияют на услугу.

Признак 2: основной источник информации о сбоях в услугах — недовольные пользователи

Корневые мониторинги взаимодействуют с оборудованием. Но оборудование и предоставляемая услуга — разные вещи.

Представим ситуацию, в которой корневой мониторинг получает информацию, что на сервере занято 80% доступной ему памяти. Уведомление об этом приходит ответственному за данный сервер. Для него пока ситуация не выглядит критичной. Но на этом сервере развернута база данных компании. Чтобы она работала корректно, запас свободной памяти должен составлять не менее 40%. Ответственный за оборудование об этом не знает. В итоге начинаются сбои в работе базы данных — об этом сообщают пользователи в техподдержку. Причина далеко не очевидна, потому что сервер и услугу еще нужно связать.

С зонтичным мониторингом можно сработать быстрее, ведь на его уровне понятна связь конкретного оборудования с услугами. По сигналу от корневого мониторинга система понимает, какие сервисы пострадали и сообщает ответственному за них. Так он сможет сориентироваться в ситуации и расставить приоритеты в плане действий.

Еще некоторые сбои можно распознать только при одновременных сигналах об определенных показателях из разных корневых мониторингов. Например, в Naumen BSM можно создавать и настраивать триггеры, которые ориентируются на данные из разных систем. Если в комплексе показатели сигнализируют о нештатной ситуации, сбой не будет упущен. Начать ликвидировать его получится еще до того, как пользователи поднимут тревогу.

Признак 3: менеджер услуги не может сам отслеживать ее состояние

Пользователям важно получить услугу. За ее доступность отвечают одни специалисты. При этом услуга обеспечивается оборудованием. И за его работоспособность отвечают другие специалисты. Фактически корневой мониторинг — это инструмент для ответственных за оборудование.

А у менеджера услуги, при отсутствии зонтичного мониторинга, нет рабочего инструмента для определения работоспособности услуги. О сбое сервиса он скорее всего узнает, когда пользователи обратятся в техподдержку. И у него только один способ выяснить причину — идти к ИТ-командам, которые поддерживают нужное оборудование. Но какое оборудование нужно проверить и починить — тоже не сразу понятно, ведь услуга обеспечивается разными устройствами.

Ответственный за услугу потратит время, чтобы выяснить первопричину и понять, сколько уйдет на ее восстановление. Тогда как пользователи будут оставаться без сервиса.

В свою очередь зонтичный мониторинг получит из корневого информацию о сбое в оборудовании, поймет, какая услуга может от этого пострадать, и уведомит ответственного специалиста. Naumen BSM преобразует информацию в понятный и читаемый вид — чтобы разобраться, не понадобятся навыки работы со специализированными системами. Менеджер сможет перейти от услуги к связанному с ней оборудованию и получить более детальные данные о том, какое именно устройство пострадало.

Признак 4: нет подготовки к регламентным работам

Оборудование не может выполнять свои функции, когда на нем ведутся технические работы. Значит, услуга, которую обеспечивает это оборудование, будет временно недоступна, а это — недовольство пользователей. Кроме того, от корневого мониторинга пойдет поток уведомлений о том, что с устройством что-то не так.

С помощью зонтичного мониторинга влияние профилактических работ можно заметно смягчить. За счет ресурсно-сервисной модели сразу понятно, какие сервисы будут недоступны, пока оборудование не работает. Можно заранее оповестить пользователей, чтобы это не стало для них неприятной неожиданностью.

А чтобы избежать тревоги на сигналы от корневых мониторингов, в зонтичной системе фиксируется время регламентных работ. Когда оно настанет, здоровье нужных устройств изменится на «Профилактические работы». Когда по ним из корневого мониторинга поступит уведомление о неработоспособности, это не повлечет создания аварийных инцидентов. Система зонтичного мониторинга будет понимать — аварии нет, ведутся регламентные технические работы.

Признак 5: медленная классификация событий из корневых мониторингов

Корневые мониторинги уведомляют не только о поломках. Они фиксируют отклонения от нормы, но эти события бывают нейтральными или позитивными. В любом случае важно определить, что именно произошло. Без зонтичного мониторинга это делается силами конкретного специалиста.

Зонтичный мониторинг автоматизирует этот процесс. Полученные из корневого мониторинга данные он обогащает ссылками:

  • на оборудование, по которому пришло событие;
  • ситуации, по которым можно классифицировать событие;
  • услуги, которые обеспечиваются данным оборудованием.

Исходя из всей этой информации, по преднастроенным правилам система классифицирует это событие: закрыть, отложить или создать запрос.

Итак

Системы корневого мониторинга — это инструменты для специалистов, которые отвечают за работоспособность оборудования. Зонтичный мониторинг отражает связи оборудования с предоставляемыми сервисами и становится инструментом менеджеров услуг.

Если компания сталкивается хотя бы с одним из этих признаков, стоит задуматься о том, что корневых мониторингов уже недостаточно. Образуется некая слепая зона: неочевидно, какая услуга с каким оборудованием связана. Это мешает выявлять пострадавшую услугу и замедляет ее восстановление. А значит, пора сделать следующий шаг — внедрить зонтичный мониторинг. Система зонтичного мониторинга ликвидирует этот пробел и помогает из разрозненных частей пазла инфраструктуры собрать полную картину.