Основные задачи:
-
Мониторинг работоспособности информационных систем;
-
Обеспечение уровня доступности сопровождаемых информационных систем;
-
Определение требований к мониторингу сопровождаемых информационных систем, составление моделей здоровья;
-
Восстановление работоспособности систем мониторинга в случае возникновения нештатной ситуации;
-
Взаимодействие с разработчиком по доработкам и устранению ошибок в работе систем;
-
Выявление потребности и планирование регламентных работ в части эксплуатации информационных систем;
-
Обеспечение круглосуточного мониторинга информационных систем и сервисов;
-
Разработка и актуализация технической документации по сопровождению информационных систем, проверки различных сервисов;
-
Создание инструкций для решения обращений пользователей;
-
Анализ планируемых работ, выполнение задач на экспертизу;
-
Обеспечение функционирования информационных систем и их компонентов;
-
Экспертное заключение по определению технической и экономической целесообразности передачи на аутсорсинг элементов ИС;
-
Обеспечение непрерывности функционирования информационных систем и их операционной устойчивости
-
Менторинг сотрудников дежурной смены ситуационного центра (СЦ);
-
Организация работы дежурной смены ситуационного центра (СЦ);
Возможный опыт и навыки:
-
Высшее техническое образование;
-
Знание протоколов и стандартов SNMP, IPMI, JMX, HTTP/HTTPS;
-
Опыт поддержки и администрирования систем мониторинга - Zabbix, Grafana;
-
Знание и понимание архитектуры построения мониторинга Zabbix (понимание работы серверов, агентов, прокси и базы данных);
-
Настройка мониторинга (шаблоны, узлы сети, триггеры, элементы данных, графики и экраны визуализации, действия);
-
Работа с Zabbix API: использование REST API для автоматизации задач (добавления узлов, получения данных);
-
Навыки администрирования серверов и знания операционных систем: Linux/Unix (в частности, CentOS, Debian или Ubuntu), включая (управление сервисами, настройка сети);
-
Опыт работы с БД PostgreSQL, MySQL, MariaDB (настройка, оптимизация и резервное копирование БД Zabbix);
-
Опыт настройки интеграции (Slack, Telegram, Teams и т.д);
-
Работа с метриками (нагрузка CPU, утилизация памяти, дисков);
-
Опыт работы с Docker, Kubernetes и облачными сервисами (AWS, Azure, GCP);
-
Опыт настройки безопасности (контроль доступа, настройка HTTPS для web-интерфейса Zabbix, роли и права доступа, защита от несанкционированного доступа Zabbix Agent/Proxy);
-
Знание языков программирования для написания скриптов автоматизации (Python, Bash, Perl/PHP, JSON и REST API);
-
Соблюдение ключевых показателей доступности систем мониторинга;
-
Будет преимуществом опыт настройки корреляционных сценариев и сценариев автоматизации и авторегистрации аварий;