Skip to content

Monitoring

Мониторинг - это сбор, обработка, агрегирование и отображение в реальном времени количественных и качественных показателей системы. Мониторинг позволяет улучшать, либо оставлять на приемлемом уровне качество обслуживания пользователей.

Мониторинг помогает понять: Жив ли сервер? Сколько ресурсов он потребляет. Не упал ли сайт? Есть ли ошибки в приложении?

Мониторинг в ИТ сегодня – это система, которая позволяет в режиме реального времени выявлять проблемы в ИТ инфраструктуре, а также оценивать тренды использования ресурсов. Как правило состоит из нескольких базовых компонентов – сбора сырых данных, обработки данных с целью их анализа, рассылки уведомлений и пользовательского интерфейса для просмотра графиков и отчетов.

Мониторинг можно представлять в виде приборной панели на которой в режиме реального времени отображается происходящие с объектами вашего наблюдения.

Зачем нужен мониторинг:

  • Анализ долгосрочных тенденций. Получение качественных характеристик в обеспечение дальнейшей работоспособности системы. Например размер БД и его близость к критическим значениям.
  • Сравнение версий ПО. Насколько изменения ПО повлияли на качество обслуживания.
  • Оповещение. Превентивное выявление возможных отклонений в качестве обслуживания и увеличение скорости реакции на сбои.
  • Телеметрия текущей работоспособности приложения. Получение текущей оценки характеристик информационной системы в режиме real-time.
  • Ретроспективный анализ, Выявление узких мест информационной системы на основе полученных ранее данных мониторинга

Два типа мониторинга:

  • White-box monitoring. Наблюдение за системой “изнутри”. Сбор данных профилирования, логов, системные журналы.
  • Black-box monitoring. Наблюдение, видимое извне. Например сбор возникших ошибок системы технической поддержкой или отделом тестирования.

Деление мониторинга по доменам ответственности.

Домены ответственности мониторинга можно разделить по системам сбора метрик:

  • Система сбора временных рядов. Prometheus, Influxdb.
  • Система сбора логов. ELK.
  • Система перехватчик-ошибок. Sentry.