Диагностика системы в веб-интерфейсе установщика
Что такое optimus-agent?
optimus-agent — это агент отвечающий за автоматизирванную проверку инфраструктуры перед началом установки/обновления.
optimus-agentпозволяет выявить некоторые инфраструктурные проблемы, чтобы во время эксплуатации/установки можно было быстро диагностировать возникающие проблемы.optimus-agentпредоставляет единый интерфейс (gRPC API) для получения состояний инфраструктуры.
Основные компоненты optimus-agent
-
Агент — отдельный инстанс
optimus-agent, который устанавливается на каждом узле инфраструктуры (гипервизоре Docker или ноде k8s). Задачи агента:- Выполнение локальных проверок.
- Отправка результатов проверок через gRPC API.
- Предоставление gRPC-сервиса для проверки своего состояния (
HealthCheckService).
-
Yaml — конфигурация, в которой описаны параметры для сервера (gRPC-порт) и параметры проверок (количество пингов, их таймауты).
- gRPC API — интерфейс взаимодействия с агентом. Включает в себя запуск проверок и получение результата.
Включить диагностику для установки на 1 ВМ
На моноинсталляции VK WorkSpace optimus-agent будет установлен автоматически при первичной установке или обновлении. После обновления или установки станет доступна вкладка Диагностика системы в разделе Обслуживание.
Также появится возможность запускать диагностику перед автоустановкой.
Включить диагностику на кластерной инсталляции
Чтобы использовать диагностику системы в кластерной инсталляции, создайте на каждом сервере роль optimus-agent перед началом автоустановки.
По завершении установки вам станет доступен интерфейс Диагностики системы и чекбоксы проверок перед автоустановкой.
Перечень проверок системы
Проверка peer-to-peer
Используются gRPC HealthCheck -- проверяется DNS и Calico.
Проверка node-to-node
Проверяется ICMP ping связность между серверами.
От Deployer по gRPC API каждому optimus-agent передается информация о том, какой адрес ему нужно пропинговать. Для пинга используются белые IP-адреса.
Такая проверка позволяет убедиться, что есть связность на уровне L3. Также можно будет узнать средние задержки между гипервизорами, что позволит выявить проблемы на ранней стадии.
Критические порты
Проверяется, что в VK WorkSpace открыты и не заняты все критически важные порты.
Проверка флагов ядра
Проверяет корректность значений флагов ядра. Корректные значения указаны в документации по установке Почты VK WorkSpace: «Технические требования».
Целостность
Проверяется, что файлы конфигурации Deployer никто не изменял.
Версия Docker
Проверяется корректность установленной версии Docker.




