Старший инженер мониторинга

Дата размещения вакансии: 25.02.2025
Работодатель: Т1
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Основные задачи:

  • Мониторинг работоспособности информационных систем;

  • Обеспечение уровня доступности сопровождаемых информационных систем;

  • Определение требований к мониторингу сопровождаемых информационных систем, составление моделей здоровья;

  • Восстановление работоспособности систем мониторинга в случае возникновения нештатной ситуации;

  • Взаимодействие с разработчиком по доработкам и устранению ошибок в работе систем;

  • Выявление потребности и планирование регламентных работ в части эксплуатации информационных систем;

  • Обеспечение круглосуточного мониторинга информационных систем и сервисов;

  • Разработка и актуализация технической документации по сопровождению информационных систем, проверки различных сервисов;

  • Создание инструкций для решения обращений пользователей;

  • Анализ планируемых работ, выполнение задач на экспертизу;

  • Обеспечение функционирования информационных систем и их компонентов;

  • Экспертное заключение по определению технической и экономической целесообразности передачи на аутсорсинг элементов ИС;

  • Обеспечение непрерывности функционирования информационных систем и их операционной устойчивости

  • Менторинг сотрудников дежурной смены ситуационного центра (СЦ);

  • Организация работы дежурной смены ситуационного центра (СЦ);

Возможный опыт и навыки:

  • Высшее техническое образование;

  • Знание протоколов и стандартов SNMP, IPMI, JMX, HTTP/HTTPS;

  • Опыт поддержки и администрирования систем мониторинга - Zabbix, Grafana;

  • Знание и понимание архитектуры построения мониторинга Zabbix (понимание работы серверов, агентов, прокси и базы данных);

  • Настройка мониторинга (шаблоны, узлы сети, триггеры, элементы данных, графики и экраны визуализации, действия);

  • Работа с Zabbix API: использование REST API для автоматизации задач (добавления узлов, получения данных);

  • Навыки администрирования серверов и знания операционных систем: Linux/Unix (в частности, CentOS, Debian или Ubuntu), включая (управление сервисами, настройка сети);

  • Опыт работы с БД PostgreSQL, MySQL, MariaDB (настройка, оптимизация и резервное копирование БД Zabbix);

  • Опыт настройки интеграции (Slack, Telegram, Teams и т.д);

  • Работа с метриками (нагрузка CPU, утилизация памяти, дисков);

  • Опыт работы с Docker, Kubernetes и облачными сервисами (AWS, Azure, GCP);

  • Опыт настройки безопасности (контроль доступа, настройка HTTPS для web-интерфейса Zabbix, роли и права доступа, защита от несанкционированного доступа Zabbix Agent/Proxy);

  • Знание языков программирования для написания скриптов автоматизации (Python, Bash, Perl/PHP, JSON и REST API);

  • Соблюдение ключевых показателей доступности систем мониторинга;

  • Будет преимуществом опыт настройки корреляционных сценариев и сценариев автоматизации и авторегистрации аварий;