DevOps / SRE specialist

Дата размещения вакансии: 24.04.2026
Работодатель: Отельлинк
Уровень зарплаты:
з/п не указана
Город:
Санкт-Петербург
Банковский переулок 3
Требуемый опыт работы:
От 1 года до 3 лет

Привет! Мы — дочерняя IT-компания сети отелей «Друзья».
Сейчас мы в поиске инженера, который возьмёт на себя развитие и поддержку инфраструктуры: от Kubernetes и CI/CD до мониторинга, безопасности и отказоустойчивости.

Инфраструктура уже построена, но её нужно развивать, упрощать и делать надёжнее.

О проекте

  • ~25 микросервисов
  • Kubernetes-кластер (self-hosted)
  • ~50 виртуальных машин + bare-metal
  • PostgreSQL (Patroni), MySQL, Redis, RabbitMQ
  • ~20 TB бэкапов (S3/MinIO + Proxmox Backup Server)
  • CI/CD — self-hosted GitLab
  • Частые релизы
  • Основной продукт: система управления сетью отелей (PMS)

Стек

  • Kubernetes
  • Docker / cri-o
  • GitLab CI/CD
  • HAProxy / Nginx / CrowdSec
  • Vault (secrets)
  • Prometheus + Alertmanager + Grafana
  • ELK stack
  • S3 / MinIO
  • Proxmox VE + PBS
  • Linux (Debian / Talos)
  • KeyCloak

Задачи

  • Поддержка и развитие Kubernetes-кластеров
  • Развитие CI/CD (GitLab pipelines, деплой, environments)
  • Работа с мониторингом и алертингом (Prometheus, Alertmanager)
  • Повышение отказоустойчивости системы
  • Настройка и сопровождение бэкапов и DR
  • Работа с сетями и балансировкой (HAProxy, ingress)
  • Управление секретами (Vault)
  • Разбор инцидентов и устранение причин (а не симптомов)
  • Поддержка других приложений компании

Что важно

  • Опыт с Kubernetes в production
  • Понимание, как работает сеть (L4/L7, прокси, балансировка)
  • Умение читать логи и дебажить проблемы
  • Опыт построения CI/CD
  • Опыт с мониторингом (метрики, алерты, golden signals)
  • Понимание отказоустойчивости (replication, failover, DR)

Будет плюсом

  • Опыт с Patroni / PostgreSQL кластерами
  • Работа с Vault
  • Опыт с Proxmox / bare-metal
  • Опыт построения платформ (platform engineering)
  • Знание Terraform / IaC подходов

Не подойдёт, если

  • “Я просто деплою через helm и всё работает”
  • Нет опыта production-инцидентов
  • Нет понимания, как устроен Kubernetes “под капотом”
  • Страх лезть в чужие системы и разбираться

Как мы работаем

  • Без бюрократии, но с ответственностью
  • Инциденты → разбор → фиксы → улучшения
  • Минимум ручных действий, максимум автоматизации
  • Решаем причины, а не симптомы

Условия

  • Офис / гибрид
  • ЗП: обсуждается (ориентир middle)
  • Свобода в выборе инструментов (если обосновано)
  • Возможность реально влиять на инфраструктуру