Как организовать комплексный ИТ-мониторинг: подходы и технологии

Что такое мониторинг ИТ-инфраструктуры и как организовать его с помощью современных технологий в интервью рассказал Никита Кардашин, руководитель практики комплексной цифровизации процессов компании NAUMEN.

— Какие средства для организации мониторинга инфраструктуры, приложений, бизнес-процессов сейчас есть в арсенале ИТ?

На верхнем уровне все решения для мониторинга делятся на инфраструктурные и зонтичные. Первые применяются для сбора информации непосредственно с объектов мониторинга агентским или безагентским способом. С их помощью можно вести реестр метрик, реагировать на обнаруженные отклонения и оповещать об этом технических специалистов. В свою очередь, зонтичный мониторинг ориентирован не на прямой сбор «сырых» значений с оборудования, а на консолидацию данных, которые поступают из множества различных источников: систем инфраструктурного мониторинга, учетных и управляющих систем.

Если привести пример, то при инфраструктурном мониторинге сотен серверов придется подключиться к каждому из них отдельно и собрать нужную информацию. При зонтичном — серверная инфраструктура направляет данные в систему виртуализации или управления, из которой их и забирает решение мониторинга.

— А как эти два типа систем соотносятся между собой: дополняют или применяются по отдельности?

Такие решения тесно взаимосвязаны. В целом для управления ИТ-инфраструктурой используется целый комплекс инструментов, таких как системы мониторинга, инвентаризации, решения класса Service Desk, CMDB. Все они действуют в тесной «спайке» и закрывают определенную зону функциональности в зависимости от конкретных потребностей компании и ИТ-подразделения.

Возможны случаи, когда в небольшой организации или отдельном подразделении крупной компании используется исключительно инфраструктурный мониторинг. С его помощью контролируется ограниченный объем компонентов ИТ-ландшафта (к примеру, отдельный сервис), где нет необходимости в агрегации данных.

Иногда инфраструктурный мониторинг вовсе не нужен. Например, если компания перевела свою инфраструктуру в облачную среду. Данные собираются системой управления, откуда их можно сразу направлять в «зонтичный» слой.

— Как организовать грамотный мониторинг?

При оценке требований к мониторингу можно выделить несколько ключевых моментов. Первый — это полнота получаемой информации. Как правило, ИТ-инфраструктура состоит из множества технологических доменов: серверного и сетевого оборудования, систем виртуализации, баз данных. Особенно высокой гетерогенностью отличается инфраструктура крупных компаний.

Все эти компоненты необходимо контролировать, чтобы ИТ-специалисты организации вовремя реагировали на возникающие отклонения. Иначе всегда будет сохраняться точка нестабильности и опасность инцидентов. Конкретные способы мониторинга и применяемые цифровые системы могут различаться для каждого из технологических доменов.

Второе, что важно для грамотного мониторинга, — целостность информации. Получаемые данные должны передаваться в единый центр, где они будут агрегироваться и коррелироваться, то есть накладываться друг на друга. Только так получится сформировать 360 view, чтобы получить ответ на вопрос, а что сейчас происходит в любом из компонентов ИТ-инфраструктуры.

Зачастую компании применяют различные системы мониторинга, которые действуют обособленно. Данные из них никак не консолидируются. В итоге, чтобы понять причину сбоя в работе корпоративной почты, ИТ-специалистам потребуется изучить показания всех используемых цифровых решений. Разумеется, это неэффективно и создает риск, что проблема не будет своевременно выявлена. Не говоря уже о быстрой реакции на нее. Именно здесь поможет «зонтичный» слой.

Третий нюанс — получаемые данные бесполезны без привязки к учету и ресурсно-сервисной модели компании. Для понимания, что именно пошло не так, нужно четко представлять нормальную ситуацию, к которой следует стремиться. В этих целях и формируется ресурсная-сервисная модель, которая описывает взаимосвязи элементов ИТ-инфраструктуры. К примеру, поясняет, что для корректной отправки электронных писем должны исправно работать почтовый сервер, СУБД, каналы связи, инфраструктурные фермы, вплоть до технологического уровня: систем питания, кондиционирования ЦОД и т.д.

Четвертый ключевой момент — это объединение данных мониторинга с процессами поддержки. Например, при регистрации инцидентов от пользователей. В таком случае глубокая интеграция процессов поддержки и мониторинга позволяет получить петлю обратной связи, когда, допустим, при поломке оборудования или прерывании услуги автоматически создается задача на восстановление. После ее выполнения система мониторинга подтверждает, что проблема действительно устранена. Таким образом, процессный мир, в котором работают люди, взаимодействует и обменивается информацией с технической средой.

Наконец, пятое условие эффективной организации потоков данных — применение технологий предиктивной аналитики. Сегодня мало реагировать на инциденты. Лучше не допускать ситуаций, когда пользователи звонят в службу поддержки и сообщают, что важные сервисы не работают. Нужен проактивный подход, чтобы выявлять и устранять подобные сбои заранее. А в идеале пользователи вообще не должны замечать неполадки. В сочетании с консолидацией данных технологии предиктивной аналитики позволяют принимать упреждающие меры еще до того, как произойдет авария и нанесет ущерб бизнесу.

— Насколько соблюдение этих требований помогает улучшить ситуацию с мониторингом и в целом организацией процессов?

Оцифровать и зафиксировать такой прогресс бывает непросто. Ведь сравнивать приходится уровни низкой и высокой зрелости процессов. Прежде чем анализировать изменения к лучшему, нужно понимать изначальную ситуацию. Это требует определенной процессной зрелости уже на старте проекта по внедрению комплексного мониторинга.

Не все компании до начала автоматизации ведут надлежащий учет возникающих инцидентов. Нередко большинство вопросов решается «по старинке»: если что-то ломается, пользователь дозванивается до ИТ-специалиста. Тот устраняет проблему, и это нигде не фиксируется. При таком ведении статистики трудно говорить о количественных метриках прогресса, который, несомненно, достигается путем автоматизации и мониторинга.

В целом внедрение качественного мониторинга позволяет значительно (в разы) сократить число инцидентов и периоды простоя ИТ-услуг, повысить удовлетворенность бизнес-пользователей и клиентов, а также сократить нагрузку на и без того перегруженный ИТ-персонал.

— Каким опытом обладает в данной сфере NAUMEN? Какие технологии и решения есть у компании, какими достижениями гордится?

Наша компания работает в сфере автоматизации ИТ-подразделений фактически 20 лет. За этот продолжительный период мы накопили большой проектный опыт по построению процессов мониторинга, управления инфраструктурой и ИТ-активами.

Наша продуктовая линейка закрывает различные потребности бизнеса, начиная от инфраструктурного мониторинга и заканчивая полноценным выстраиванием процессов по модели ITIL 4. Это продукты Naumen Network Manager, Naumen Business Service Monitoring и Naumen Service Desk, которые позволяют решать полный спектр вопросов ИТ-подразделения. Важно отметить, что в этих цифровых продуктах широко применяются технологии предиктивной аналитики и роботизации.

Вместе с тем мы обладаем большим опытом с позиции как вендора, так и интегратора. NAUMEN не только разрабатывает и поставляет автоматизированные решения, но и реализует «под ключ» проекты внедрения и перестройки бизнес-процессов.

— Ваше экспертное мнение о перспективах развития направления мониторинга ИТ и подходах, которые будут актуальны в ближайшие годы.

Безусловно, продолжат активно развиваться технологии предиктивной аналитики. Не потеряет актуальности тренд на роботизацию и автоматизацию процессов. Уже сегодня можно полностью автоматизировать значительную часть процедур в рамках ИТ-процессов и делегировать принятие ряда решений системам автоматизации.

В плане выстраивания сквозных процессов сохранится текущая тенденция консолидации и переиспользования информации в единой системе. Имеется в виду автоматизация смежных процессов (финансовое, бюджетное планирование, проектное управление и т.д.), в которых сведения из систем мониторинга и поддержки ИТ-услуг также помогают выполнить множество задач. Это определение эффективности использования вычислительных ресурсов компании, выявление точек недогрузки или перегрузки, оптимизация плана закупок и многое другое.

Не исчезнет тренд на высокую значимость клиентского сервиса, в том числе в ИТ. На успех бизнеса все больше будут влиять качество и оперативность предоставляемых потребителю услуг.

— Насколько развиты эти тренды уже сегодня?

Для каждой организации рост зрелости осуществляется по своему уникальному сценарию. Если говорить про российский ИТ-рынок, то лишь небольшое число компаний сегодня имеет по-настоящему зрелые процессы управления. Многие либо вовсе не применяют средства автоматизации, либо делают это ограниченно.

Разумеется, в нашей стране есть примеры компаний, где достигнута высокая процессная зрелость. Значительная часть из них использует программное обеспечение разработки NAUMEN. В целом таких продвинутых организаций пока не так много, и в этом плане рынку есть куда расти.