Старший инженер по разработке инфраструктуры

Дата размещения вакансии: 18.02.2026
Работодатель: БЮРО 1440
Уровень зарплаты:
з/п не указана
Город:
Москва
Большая кольцевая линия метро Петровский парк
Требуемый опыт работы:
От 3 до 6 лет

Чем предстоит заниматься:

- Непрерывным мониторингом инфраструктуры и приложений, настройкой и поддержкой алертов;
- Настройкой и оптимизацией коллекторов метрик (Node Exporter, cAdvisor, JMX, приложения, API-запросы и т.д.);
- Диагностикой инцидентов, проведением пост‑мортемов, разработкой автоматических действий при сбоях (auto‑remediation);
- Интеграцией мониторинга с CI/CD, CMDB, системой ServiceDesk, системами оповещения;
- Помощью в определении метрик, установке Service‑Level Indicators (SLI) и Service‑Level Objectives (SLO);
- Проведением воркшопов, обучением коллег работе с дашбордами и системами алертинга;
- Поддержанием актуальной документации (архитектура мониторинга, процедуры реагирования);
- Разработкой и внедрением best‑practice по мониторингу и observability.

Что мы ожидаем:

- Опыт работы от 3 лет в роли инженера мониторинга, SRE или DevOps (с акцентом на систему мониторинга);
- Глубокое понимание принципов работы систем мониторинга: Zabbix, Prometheus, Grafana, Alertmanager;
- Опыт настройки мультисайтовой или геораспределённой системы мониторинга;
- Опыт настройки и масштабирования Prometheus (включая кастомные экспортеры, relabeling, remote write/read, Thanos/Cortex);
- Уверенное владение Grafana: создание сложных дашбордов, использование переменных, визуализация, темы, шаринг;
- Понимание архитектуры и практик микросервисной среды (containerization, Kubernetes, Helm);
- Опыт работы с Kubernetes (настройка мониторинга для подов, нод, сервисов, использование kube-state-metrics, cAdvisor);
- Знание языков и инструментов: Bash, Python, JSON, YAML, REST API;
- Умение работать с системами управления конфигурациями (Ansible, Terraform, SaltStack);
- Опыт работы с системами оповещения и управления инцидентами (в т.ч. через API);
- Навыки анализа логов и метрик;
- Понимание принципов SLI/SLO, error budget, incident management;
- Ответственность, аналитическое мышление, умение работать в команде и документировать процессы

Мы предлагаем:

- ⁠Работу в аккредитованной ИТ-компании;
- ⁠Шаг в космос - для тех, кто вдохновлен идеей покорения космоса и мечтает быть к этому причастным;
- Комфортный офис на метро "Динамо" с графиком 5/2 (с 10 до 19) в гибридном формате;
- ⁠Оформление в соответствии с ТК РФ;
- ⁠Конкурентный уровень заработной платы - на уровне лидеров ИТ/телеком-индустрии.