Перейти к содержанию

Диагностика системы в веб-интерфейсе установщика

Внимание

Часть проверок производится установщиком, без участия optimus-agent. До установки optimus-agent у вас будут проверяться:

  • Версия Docker.
  • Целостность конфигурационных файлов
  • Доступность критических портов.

Все остальные проверки до установки optimus-agent работать не будут.

Что такое optimus-agent?

optimus-agent — это агент отвечающий за автоматизирванную проверку инфраструктуры перед началом установки/обновления.

  • optimus-agent позволяет выявить некоторые инфраструктурные проблемы, чтобы во время эксплуатации/установки можно было быстро диагностировать возникающие проблемы.
  • optimus-agent предоставляет единый интерфейс (gRPC API) для получения состояний инфраструктуры.

Основные компоненты optimus-agent

  • Агент — отдельный инстанс optimus-agent, который устанавливается на каждом узле инфраструктуры (гипервизоре Docker или ноде k8s). Задачи агента:

    • Выполнение локальных проверок.
    • Отправка результатов проверок через gRPC API.
    • Предоставление gRPC-сервиса для проверки своего состояния (HealthCheckService).
  • Yaml — конфигурация, в которой описаны параметры для сервера (gRPC-порт) и параметры проверок (количество пингов, их таймауты).

  • gRPC API — интерфейс взаимодействия с агентом. Включает в себя запуск проверок и получение результата.

Как включить диагностику для установки на 1 ВМ

На моноинсталляции VK WorkSpace optimus-agent будет установлен автоматически при первичной установке или обновлении. После обновления или установки станет доступна вкладка Диагностика системы в разделе Обслуживание.

Вкладка Диагностики

Также появится возможность запускать диагностику перед автоустановкой.

Чекбоксы диагностики

Как включить диагностику на кластерной инсталляции

Чтобы использовать диагностику системы в кластерной инсталляции, необходимо создать на каждом сервере по роли optimus-agent:

  1. На странице со списком ролей нажмите кнопку Добавить -> Несколько контейнеров внизу страницы.
  2. В открывшемся окне в поиске введите optimus-agent.
  3. Отметьте чекбоксом роль optimus-agent.
  4. Выберите с помощью чекбоксов все гипервизовы.
  5. В режиме генерации выберите На каждом гипервизоре.
  6. Нажмите кнопку Добавить. В списке ролей отобразяться роли optimus-agent по количеству гипервизоров в инсталляции.
  7. Запустите все шаги у первого optimus-agent и дождитесь установки роли.
  8. Повторите шаг 7 для всех optimus-agent в инсталляции.

По завершении установки вам станет полностью доступен интерфейс Диагностики системы и все чекбоксы проверок перед автоустановкой.

Перечень проверок системы

Проверка peer-to-peer

Используются gRPC HealthCheck -- проверяется DNS и Calico.

Peer-to-peer

Проверка node-to-node

Проверяется ICMP ping связность между серверами.

Node-to-node

От Deployer по gRPC API каждому optimus-agent передается информация о том, какой адрес ему нужно пропинговать. Для пинга используются белые IP-адреса.

Такая проверка позволяет убедиться, что есть связность на уровне L3. Также можно будет узнать средние задержки между гипервизорами, что позволит выявить проблемы на ранней стадии.

Критические порты

Проверяется, что в VK WorkSpace открыты и не заняты все критически важные порты.

Проверка флагов ядра

Проверяет корректность значений флагов ядра. Корректные значения указаны в документации по установке Почты VK WorkSpace: «Технические требования».

Флаги ядра

Целостность

Проверяется, что файлы конфигурации Deployer никто не изменял.

Версия Docker

Проверяется корректность установленной версии Docker.