з/п не указана
Санкт-Петербург
Банковский переулок 3
Банковский переулок 3
От 1 года до 3 лет
Привет! Мы — дочерняя IT-компания сети отелей «Друзья».
Сейчас мы в поиске инженера, который возьмёт на себя развитие и поддержку инфраструктуры: от Kubernetes и CI/CD до мониторинга, безопасности и отказоустойчивости.
Инфраструктура уже построена, но её нужно развивать, упрощать и делать надёжнее.
О проекте
- ~25 микросервисов
- Kubernetes-кластер (self-hosted)
- ~50 виртуальных машин + bare-metal
- PostgreSQL (Patroni), MySQL, Redis, RabbitMQ
- ~20 TB бэкапов (S3/MinIO + Proxmox Backup Server)
- CI/CD — self-hosted GitLab
- Частые релизы
- Основной продукт: система управления сетью отелей (PMS)
Стек
- Kubernetes
- Docker / cri-o
- GitLab CI/CD
- HAProxy / Nginx / CrowdSec
- Vault (secrets)
- Prometheus + Alertmanager + Grafana
- ELK stack
- S3 / MinIO
- Proxmox VE + PBS
- Linux (Debian / Talos)
- KeyCloak
Задачи
- Поддержка и развитие Kubernetes-кластеров
- Развитие CI/CD (GitLab pipelines, деплой, environments)
- Работа с мониторингом и алертингом (Prometheus, Alertmanager)
- Повышение отказоустойчивости системы
- Настройка и сопровождение бэкапов и DR
- Работа с сетями и балансировкой (HAProxy, ingress)
- Управление секретами (Vault)
- Разбор инцидентов и устранение причин (а не симптомов)
- Поддержка других приложений компании
Что важно
- Опыт с Kubernetes в production
- Понимание, как работает сеть (L4/L7, прокси, балансировка)
- Умение читать логи и дебажить проблемы
- Опыт построения CI/CD
- Опыт с мониторингом (метрики, алерты, golden signals)
- Понимание отказоустойчивости (replication, failover, DR)
Будет плюсом
- Опыт с Patroni / PostgreSQL кластерами
- Работа с Vault
- Опыт с Proxmox / bare-metal
- Опыт построения платформ (platform engineering)
- Знание Terraform / IaC подходов
Не подойдёт, если
- “Я просто деплою через helm и всё работает”
- Нет опыта production-инцидентов
- Нет понимания, как устроен Kubernetes “под капотом”
- Страх лезть в чужие системы и разбираться
Как мы работаем
- Без бюрократии, но с ответственностью
- Инциденты → разбор → фиксы → улучшения
- Минимум ручных действий, максимум автоматизации
- Решаем причины, а не симптомы
Условия
- Офис / гибрид
- ЗП: обсуждается (ориентир middle)
- Свобода в выборе инструментов (если обосновано)
- Возможность реально влиять на инфраструктуру