SRE - инженер по обеспечению надёжности инфраструктуры

Дата размещения вакансии: 08.05.2026
Работодатель: Веретенникова Ольга Викторовна
Уровень зарплаты:
от 250000 до 400000 RUR
Город:
Москва
Павелецкая набережная
Требуемый опыт работы:
От 3 до 6 лет

Ищем Site Reliability Engineer (SRE)

Вы будете заниматься поддержкой, эволюцией и наблюдаемостью legacy-инфраструктуры на Rancher 1.6, IPsec mesh и HAProxy.

Мы ищем человека, который пишет инструменты сам, глубоко понимает сети и готов разбираться в low-level проблемах (DNS, перезагрузка балансировщиков, туннели).

Задачи:

· Поддержка и развитие инфраструктуры на Rancher 1.6 (контейнеризация, управление окружениями)

· Работа с IPsec mesh и overlay-сетями — диагностика, оптимизация, отказоустойчивость

· Настройка и тюнинг HAProxy (L4/L7) в связке с контейнерной средой

· Разработка инструментов автоматизации и наблюдаемости на Python

· Построение мониторинга на Prometheus: кастомные метрики, алерты, сбор данных с legacy-компонентов

· Troubleshooting production-инцидентов без готовых алертов

· Работа с сопутствующими сервисами: PostgreSQL, RabbitMQ

· Написание документации и runbook’ов для типовых проблем

Требования (обязательно):

· Опыт в DevOps / SRE от 4 лет

· Docker на практике — уверенная работа с контейнерами

· HAProxy или аналогичные L7/L4 балансировщики (настройка, релоады, debugging)

· Prometheus — не только базовые метрики, но и написание кастомных экспортеров/метрик

· Глубокое понимание сетей: TCP/IP, VPN (особенно IPsec), overlay, маршрутизация

· Опыт реального troubleshooting production-инцидентов

· Умение писать код на Python для автоматизации, мониторинга, вспомогательных инструментов

· Опыт работы с нестандартной / legacy инфраструктурой

· Готовность разбираться в low-level проблемах (сеть, DNS, механика перезагрузки HAProxy, Rancher 1.6)

Желательно / будет плюсом:

· Опыт с Rancher 1.x

· PostgreSQL и RabbitMQ (диагностика, мониторинг)

· Опыт построения mesh / cluster-мониторинга

Мы предлагаем:

· Реальные задачи с высокой инженерной сложностью

· Минимум бюрократии — максимум самостоятельности

· Возможность влиять на архитектуру наблюдаемости и надёжности

· Заработную плату в зависимости от уровня от 250 000 до 400 000 гросс руб.