Вы успешно подписались на блог Naumen
Статьи доступны к чтению
Добро пожаловать! Регистрация прошла успешно.
Отлично! Ваш аккаунт активирован, контент доступен.
Success! Your billing info is updated.
Billing info update failed.
Почему необходимо распространять мониторинг на целостные ИТ-услуги

Почему необходимо распространять мониторинг на целостные ИТ-услуги

7 минут чтения

Мониторинг ИТ-оборудования давно стал обязательным требованием для бизнеса. Однако он не дает представления, как отдельные части инфраструктуры влияют на услуги и процессы в целом. Поэтому многие компании переходят к комплексному мониторингу ИТ-услуг. О том, в чем заключается этот подход, какие проблемы позволяет решить и какие выгоды получает бизнес, читайте в материале.

Что такое классический ИТ-мониторинг и зачем он нужен

ИТ-мониторинг можно сравнить с пожарной сигнализацией, которая срабатывает при определенных признаках происшествия или опасности. Только в случае с ИТ это «пожары» в инфраструктуре. В режиме реального времени отслеживаются и фиксируются сбои в работе оборудования, нарушения сетевых соединений, системные ошибки, перегрузки серверов или виртуальных машин и прочие отклонения.

Специалисты оперативно узнают о проблемах и устраняют их, что позволяет избежать негативных последствий для бизнеса. Скажем, срыва участия компании в электронных торгах из-за отсутствия интернет-соединения или остановки рабочих процессов по причине аварии в ЦОД.

При этом следить за состоянием различных инфраструктурных элементов вручную не требуется. Такие функции выполняют специализированные системы инфраструктурного мониторинга. Они получают информацию с серверов, виртуальных машин, локальных сетей и других объектов наблюдения. В систему собираются метрики работы оборудования и задаются определенные пороги (триггеры), которые говорят об отклонениях или их риске. При достижении критических значений автоматически генерируется оповещение для ИТ-специалистов (событие).

Почему классический мониторинг недостаточен для управления ИТ-услугами на высоком уровне

Зачастую в компании параллельно используется несколько систем мониторинга. Например, в одной контролируют работу сетевого оборудования, в другой — серверов и виртуальных машин на базе Linux, в третьей — Windows-инфраструктуры.

В территориально распределенных корпорациях и вовсе выстраивается целый лабиринт информационных систем, и комплексной картины по целостной услуге нет ни в одной из них. Каждым инструментом оперируют отдельные специалисты, которые поддерживают определенный инфраструктурный участок и не мотивированы выходить за его пределы. А специалисты, что отвечают за целостные ИТ-услуги и бизнес-функции (менеджеры услуг, руководители ИТ), не имеют доступа к этим системам и технических навыков для работы в них.

Менеджеру, который курирует ИТ-услуги, разобраться во всех применяемых системах еще сложнее. Даже если мониторинг метрик и событий налажен идеально, нет полного видения состояния сервисов. В результате менеджер услуги сталкивается с комплексом проблем. Обозначим основные из них.

Нет понимания, как события в инфраструктуре влияют на услуги. Допустим, обнаружен перегруз мощностей виртуальной машины. Угрожает ли это работе корпоративного портала или другого сервиса? Ответить на такой вопрос менеджер может далеко не всегда. Когда услуга прерывается, ему приходится узнавать у ИТ-специалистов о зафиксированных отклонениях и выяснять, какие из них повлияли на доступность сервиса. В итоге индиденты устраняются недостаточно оперативно, а услуги подолгу простаивают.

Нет разделения по приоритетам, какие услуги и инфраструктурные элементы наиболее критичные. Из-за этого сложно определить, какие из них требуют пристального контроля и к каким именно ИТ-специалистам обращаться при прекращении их работы. Вдобавок настройка триггеров для метрик в нескольких системах приводит к повторяющимся или противоречащим друг другу реакциям.

Нет возможности предотвращать простои услуг. Об отклонениях и сбоях приходится узнавать постфактум вместо того, чтобы действовать превентивно и предотвращать угрозы. Ведь работоспособность каждой услуги может обеспечиваться несколькими инфраструктурными элементами, события по которым фиксируют отдельные системы мониторинга. Данные не получается связать воедино, чтобы комплексно оценить состояние сервиса и вовремя узнать о возможных проблемах.

Нет заданного алгоритма, как реагировать на фиксируемые отклонения и сбои в работе сервисов. Система мониторинга лишь сообщает о событиях, но решить проблему с ее помощью нельзя. Даже если коренная причина прерывания сервиса обнаружена, нужен четкий алгоритм действий в таких ситуациях.

Для достижения высокого уровня ИТ-услуг, требования к которому безусловно предъявляются современным бизнесом, подход к мониторингу тоже должен быть современным и комплексным.

Что может помешать изменить подход к мониторингу

К сожалению, обозначенные выше проблемы очевидны не всем. Некоторые стараются сохранить классический подход к ИТ-мониторингу, при котором внимание уделяется исключительно инфраструктурным компонентам. К примеру, это могут быть ИТ-специалисты, отвечающие за всю инфраструктуру или ее части. На предложения менеджеров услуг поменять привычную схему работы и перейти к мониторингу ИТ-сервисов они обычно приводят несколько контраргументов:

  1. Это зона моей ответственности: сам знаю, как правильно.
  2. Менять подход нет времени, поскольку нужно постоянно реагировать на сбои и управлять инфраструктурой.
  3. Все и так нормально работает в имеющейся системе мониторинга.

Не все специалисты имеют мотивацию к глубоким изменениям. Менеджер услуги оказывается в непростой ситуации, ведь из-за частых прерываний сервисов страдает его профессиональная репутация. Он задается логичным вопросом: а зачем вообще нужен мониторинг, который не дает понимания работы ИТ-сервисов? Ведь именно доступность и эффективность услуги, а не серверов или виртуальных машин, интересуют пользователей (сотрудников компании или внешних клиентов).

Как обосновать необходимость мониторинга ИТ-услуг

Чтобы начать контролировать состояние ИТ-сервисов, а не только инфраструктуру, менеджеру услуг нужно обосновать такую необходимость перед коллегами и бизнес-заказчиками. Последние рассуждают на языке денег. Для них главное — чтобы все работало исправно при минимальных расходах. А переход к мониторингу услуг потребует определенных вложений на начальном этапе, поэтому позиция «ничего не менять» вполне может оказаться бизнесу ближе.

Другое дело, если менеджер услуг и ИТ-специалист достигнут согласия в этом вопросе и вместе донесут до высшего руководства компании ценность нового подхода. Как же склонить ИТ-специалиста на свою сторону, с помощью каких доводов?

  1. Никто не собирается лезть в чужую зону ответственности и вмешиваться в управление инфраструктурой. Задача — понять, как работает услуга в связке с оборудованием и ПО.
  2. Нехватка времени и аврал в управлении инфраструктурой связаны с отсутствием комплексного мониторинга услуг. В случае прерывания сервисов ИТ-специалистам приходится долго разбираться, где именно произошел сбой.
  3. Даже если в конкретной системе мониторинга все четко налажено, возможны ложные срабатывания и ошибки. Настройка триггеров для метрик в нескольких системах зачастую приводят к повторяющимся или противоречащим друг другу реакциям. Если менеджер услуг будет видеть точную картину по состоянию сервисов, он не станет отвлекать ИТ-специалистов в подобных ситуациях.

Для бизнеса же основной аргумент в пользу мониторинга услуг заключается в том, что ИТ-сервисы лучше работают и реже прерываются. Непрерывность услуг позволяет избежать финансовых и репутационных потерь. При этом для достижения результата не нужно увеличивать численность технического персонала. Комплексный мониторинг ускоряет процесс решения проблем, что требует меньше специалистов. Не стоит забывать и о том, что комплексный ИТ-мониторинг может помочь в вопросах информационной безопасности, что особенно актуально в текущих условиях.

Если бизнес-заказчики осознали все это и одобрили новый подход к мониторингу, можно переходить к его реализации на практике. То есть к внедрению единого зонтичного решения, которое интегрирует данные из всех систем инфраструктурного мониторинга. Кроме того, оно формирует ресурсно-сервисную модель целостных ИТ-услуг, где детально отражаются связи оборудования, ПО и других инфраструктурных элементов и их взаимодействие для достижения бизнес-ценности.

Что дает комплексный мониторинг ИТ-услуг

Перечислим основные выгоды, которые приносит комплексный мониторинг ИТ-услуг.

Получение сводных данных из разных источников. Собранные в ходе мониторинга данные концентрируются в единой системе. Это дает информационную базу для формирования 360-view целостной ИТ-услуги.

Понятная взаимосвязь между элементами инфраструктуры и ИТ-услугами. В режиме реального времени фиксируются сбои в работе инфраструктурных элементов и выявляется, на какие сервисы и как они воздействуют. Например, менеджер услуг не просто узнает о перегруженности сервера, но и поймет, что это грозит отключением корпоративной почты, а портал и интернет-сайт никак не пострадают.

Прогнозирование отклонений в предоставлении ИТ-услуг. В зонтичной системе мониторинга реализуются возможности предиктивной аналитики. С их помощью получается заранее предсказывать сбои. Для этого проводится автоматический анализ исторических данных о прошлых инцидентах, выявляются закономерности и отклонения. Такие прогнозы позволяют специалистам принимать превентивные меры и не допускать критической ситуации.

Построение процесса управления событиями. Это позволяет реализовать единые правила реагирования на отклонения и автоматизировать реакцию на них. К примеру, если в организации применяется инструмент Service Desk для управления поддержкой пользователей, то из системы зонтичного мониторинга можно отправлять туда критичные события, влияющие на услуги. Там автоматически будут создаваться и направляться нужным специалистам заявки на устранение зафиксированных инцидентов.

Повышение точности данных и исключение ошибок. Приведение метрик и триггеров в единый формат и настройка их по общим параметрам позволят избежать возникновения противоречащих событий и ложных срабатываний.

Аналитика и визуализация состояния ИТ-услуги. Зонтичная система мониторинга включает настраиваемые дашборды и информационные карточки объектов инфраструктуры, которые дают представление о технических и процессных параметрах услуг. Можно контролировать зафиксированные события по услуге, количество инцидентов, время реакции на них и другие важные показатели. Кроме того, в системе комплексного мониторинга может собираться статистическая отчетность, в том числе для управления взаимоотношениями с подрядчиками по определенным видам услуг, к примеру, с провайдерами каналов связи.

Конечно, построение мониторинга ИТ-услуг потребует от бизнеса затрат на внедрение единой зонтичной системы. А от ИТ-специалистов — оторваться от рутины и приложить немало усилий, чтобы создать ресурсно-сервисную модель. Но лучше единоразово вложить силы и средства в наведение порядка, чем нести расходы из-за прерывания услуг и бороться с постоянно возникающими инцидентами.