Вы успешно подписались на блог Naumen
Статьи доступны к чтению
Добро пожаловать! Регистрация прошла успешно.
Отлично! Ваш аккаунт активирован, контент доступен.
Success! Your billing info is updated.
Billing info update failed.
Что должна уметь система ИТ-мониторинга: 6 параметров, на которые стоит ориентироваться

Что должна уметь система ИТ-мониторинга: 6 параметров, на которые стоит ориентироваться

5 минут чтения

Любой ИТ-сервис, который получают сотрудники компании или ее клиенты, базируется на определенном оборудовании и программном обеспечении. Чтобы сервисы всегда были доступны, необходимо следить за работоспособностью каждого объекта ИТ-инфраструктуры, как можно быстрее узнавать о неполадках и оперативно их устранять. Справиться с этой задачей помогает система мониторинга. Посмотрим, на какие параметры стоит обратить особое внимание при выборе такого программного продукта, чтобы он решал максимум задач.

Подключаться к объектам разного типа

Инфраструктура включает огромное количество разных устройств. Чем больше из них может опросить мониторинг, тем лучше. Даже если компания использует не одну систему мониторинга и какие-то данные будут дублироваться, это только на пользу, меньше рисков. Если мониторинг универсален и умеет подключаться к любым объектам, большой плюс. А если к каким-то не умеет, то его архитектура должна позволять этому «научиться».

У продукта Naumen Network Manager (NNM) как раз такая архитектура. Система имеет встроенную библиотеку шаблонов для обращения к устройствам разного типа. Если в инфраструктуре есть такие, которые она пока не знает, для них разрабатываются соответствующие шаблоны. Они применяются при агентском и безагентском мониторинге и добавляются в библиотеку.

Определять первопричины сбоев

Скорость устранения неполадок в ИТ-инфраструктуре, зависит от трех факторов:

  • насколько быстро о них узнает ответственное лицо;
  • насколько быстро будет обнаружена причина;
  • насколько быстро будет решена проблема.

Поэтому хорошо, когда мониторинг сообщает о событии — ненормативных показателях на объекте. Еще лучше, если он помогает найти причину.

В Naumen Network Manager реализована модель Root Cause Analysis (RCA). Она содержит данные о различных объектах, событиях, которые с ними происходили, причинах и взаимосвязях. Благодаря этому система не просто сообщает информацию об отклонении от нормы, но и собирает данные со смежных устройств и связывает их друг с другом.

Допустим, один мониторинг сообщит о перегреве сервера. Сотрудник, который отвечает за его поддержку, получает информацию и идет искать причину. Из NNM будут получены сведения, что сервер перегревается, при этом температура в ЦОД выше нормы. Значит, нужно обратить внимание на климат-контроль в этом ЦОД.

Взаимодействовать с устройствами отечественного производства

Компании внедряют все больше отечественного оборудования. Но далеко не все системы мониторинга, которые сегодня представлены на рынке, умеют корректно собирать данные с устройств. И не все вендоры готовы развивать свои ИТ-решения в этом направлении. Поэтому их возможности на инфраструктуре, где планируется увеличение доли российского оборудования, будут все более ограничены.

Архитектура Naumen Network Manager изначально разработана так, чтобы система могла обратиться к любому новому устройству и снять все необходимые атрибуты и метрики. Еще лучше, когда новое оборудование вводится планово. Тогда у разработчиков мониторинга есть возможность собрать данные и на их основе подготовить шаблон, который будет собирать с устройства нужные атрибуты с заданной частотой.

Расширять возможности за счет регулярных обновлений

Новое оборудование будет появляться всегда, и системе мониторинга важно успевать за этим процессом: учиться взаимодействию с новыми объектами не только под запрос, а постоянно. Поэтому в Naumen Network Manager разработка и добавление шаблонов — это перманентная работа. В результате пользователи раз в квартал получают обновленные библиотеки шаблонов.

Более того, для компаний, которые пользуются NNM, разработан специальный обучающий курс. С его помощью ИТ-специалисты заказчика могут научиться самостоятельно писать шаблоны для новых устройств и корректировать уже действующие шаблоны: добавлять или убирать атрибуты, менять частоту опроса.

Масштабироваться под новые задачи бизнеса

Если компания развивается, важно, чтобы система мониторинга была достаточно производительна и легко масштабировалась. Здесь два аспекта, на которые стоит обратить внимание:

  1. Возможность масштабирования самой платформы.
  2. Распространение правил на новые устройства.

Возможности масштабирования Naumen Network Manager обеспечены тем, что для обращения к устройствам используются коллекторы и агенты. Они взаимодействуют напрямую с ядром. Если есть необходимость выделить отдельный сегмент, у которого нет сетевой связанности с другой частью инфраструктуры, разворачивается дополнительное ядро с коллекторами и агентами. А данные мониторинга в дальнейшем объединяются единым интерфейсом.

Что касается масштабирования правил, которые применяются к новым объектам инфраструктуры, то здесь важно, чтобы система корректно распознавала новый объект:

  • понимала, что это за устройство, от какого производителя;
  • определяла его в нужном сегменте;
  • понимала связи в инфраструктуре;
  • ставила на мониторинг и реагировала на события с ним, исходя из преднастроенных для этого типа объектов фактов и действий.

Предоставлять аналитику на основе собираемых данных

Информация об объектах инфраструктуры и событиях с ними, которые хранятся в системе мониторинга, представляют собой полезный материал для анализа. Необходимо, чтобы система предоставляла удобные инструменты для работы с данными.

Например, интеллектуальный поиск. Так, Naumen Network Manager умеет находить и собирать информацию по устройству, вендору, ID и т. д. Можно посмотреть, сколько свободной памяти на серверах, сколько виртуальных машин, где они базируются: в облаке или на железе. И далее с помощью предиктивной аналитики рассчитывать требуемые объемы в ресурсах или заранее спрогнозировать какие-либо события. А за счет того, что NNM общается с каждым устройством напрямую, полученные данные можно детализировать, в т.ч. внаглядном виде.

Главное

При оценке различных систем ИТ-мониторинга стоит обращать внимание на ее ключевые возможности:

  • по подключению к объектам различного типа;
  • определению первопричины события;
  • взаимодействию с устройствами российского производства;
  • обновлению;
  • масштабированию;
  • сбору и представлению нужных данных для аналитики.

Компании нужно понимать, каковы перспективы развития ее ИТ-инфраструктуры, какими ресурсами она располагает для внедрения систем мониторинга, и главное — свои потребности и приоритеты в части мониторинга.