Перейти к содержанию

Диагностика системы в веб-интерфейсе установщика

Что такое optimus-agent?

optimus-agent — это агент отвечающий за автоматизирванную проверку инфраструктуры перед началом установки/обновления.

  • optimus-agent позволяет выявить некоторые инфраструктурные проблемы, чтобы во время эксплуатации/установки можно было быстро диагностировать возникающие проблемы.
  • optimus-agent предоставляет единый интерфейс (gRPC API) для получения состояний инфраструктуры.

Основные компоненты optimus-agent

  • Агент — отдельный инстанс optimus-agent, который устанавливается на каждом узле инфраструктуры (гипервизоре Docker или ноде k8s). Задачи агента:

    • Выполнение локальных проверок.
    • Отправка результатов проверок через gRPC API.
    • Предоставление gRPC-сервиса для проверки своего состояния (HealthCheckService).
  • Yaml — конфигурация, в которой описаны параметры для сервера (gRPC-порт) и параметры проверок (количество пингов, их таймауты).

  • gRPC API — интерфейс взаимодействия с агентом. Включает в себя запуск проверок и получение результата.

Включить диагностику для установки на 1 ВМ

На моноинсталляции VK WorkSpace optimus-agent будет установлен автоматически при первичной установке или обновлении. После обновления или установки станет доступна вкладка Диагностика системы в разделе Обслуживание.

Вкладка Диагностики

Также появится возможность запускать диагностику перед автоустановкой.

Чекбоксы диагностики

Включить диагностику на кластерной инсталляции

Чтобы использовать диагностику системы в кластерной инсталляции, создайте на каждом сервере роль optimus-agent перед началом автоустановки.

По завершении установки вам станет доступен интерфейс Диагностики системы и чекбоксы проверок перед автоустановкой.

Перечень проверок системы

Проверка peer-to-peer

Используются gRPC HealthCheck -- проверяется DNS и Calico.

Peer-to-peer

Проверка node-to-node

Проверяется ICMP ping связность между серверами.

Node-to-node

От Deployer по gRPC API каждому optimus-agent передается информация о том, какой адрес ему нужно пропинговать. Для пинга используются белые IP-адреса.

Такая проверка позволяет убедиться, что есть связность на уровне L3. Также можно будет узнать средние задержки между гипервизорами, что позволит выявить проблемы на ранней стадии.

Критические порты

Проверяется, что в VK WorkSpace открыты и не заняты все критически важные порты.

Проверка флагов ядра

Проверяет корректность значений флагов ядра. Корректные значения указаны в документации по установке Почты VK WorkSpace: «Технические требования».

Флаги ядра

Целостность

Проверяется, что файлы конфигурации Deployer никто не изменял.

Версия Docker

Проверяется корректность установленной версии Docker.