Проект Сбера
Мы ищем DevOps-инженера, который поможет поддерживать и развивать нашу микросервисную платформу в on-prem и российских облаках, повышать надёжность продакшна и ускорять доставку изменений. Работать предстоит в тесном сотрудничестве с разработкой (Java-микросервисы), инфраструктурой и кибербезопасностью.
Технологический стек:
• Kubernetes (on-prem + российские облака);
• Helm - Написание чартов / поддержка существующих / версионирование;
• Cетевые плагины: Calico/Cilium;
• Политики Kyverno;
• PostgreSQL: on-prem (standby/Patroni), managed, Postgres Operator в Kubernetes;
• Terraform / Terragrunt, Ansible (IaC/конфигурационный менеджмент);
• Linux: CentOS / RHEL / Debian;
• Git: Bitbucket, GitLab;
• CI/CD: TeamCity, GitLab CI;
• Артефакты и реестры: Nexus, Harbor;
• Брокеры/кэши/поиск: Kafka, Redis, OpenSearch / ELK;
• Observability: OTLP (OpenTelemetry), трейсинг — Jaeger;
• Скриптинг и утилиты: Bash / Python / Go.
Обязанности:
- Эксплуатация и развитие Kubernetes-кластеров в окружениях dev/test/preprod/prod (on-prem и Cloud.ru/др.);
- Обеспечение бесперебойной работы микросервисов: доступность, отказоустойчивость, производительность;
- Поддержка команд разработки в части DevOps: окружения, пайплайны, деплой, отладка инцидентов;
- Проектирование, внедрение и улучшение CI/CD процессов (TeamCity, GitLab CI);
- Автоматизация рутинных операций, максимум IaC;
- Тесная работа с кибербезопасностью: закрытие уязвимостей, поддержка инструментов контейнерной безопасности, участие в постмортемах;
- Поддержка и эксплуатация GitLab/TeamCity, Nexus/Harbor (репозитории артефактов/образов);
- Участие в проектировании архитектуры микросервисной инфраструктуры;
- Декомпозиция и «распиливание» legacy-систем на сервисы;
- Наблюдаемость и трассировка: метрики/логи/трейсы, алерты, SLO/SLA.
Требования:
- Практический опыт эксплуатации Kubernetes в продакшне;
- Опыт построения и поддержки CI/CD для микросервисов;
- Уверенный Linux: сеть, системные службы, безопасность, троблшутинг;
- Опыт IaC (Terraform/Terragrunt) и конфигурационного менеджмента (Ansible);
- Понимание Kafka/Redis и логирования/поиска (OpenSearch/ELK);
- Навыки наблюдаемости: метрики, логи, трейсы (OTLP/Jaeger), настройка алертов;
Будет плюсом:
- Глубокое понимание Kubernetes на низком уровне (контрол-плейн, CNI/CNI-плагины, планировщик, контроллеры);
- Работа в гетерагенных инфраструктурах - связки OnPrem ЦОД и облачных провайдеров;
- Умение развернуть кластер по рекомендациям CIS Benchmarks (безопасные конфиги, контроль политик, аудит);
- Продвинутое владение Calico/Cilium, политиками Kyverno;
- Эксплуатация PostgreSQL в HA и через операторы в Kubernetes;
- Умение разрабатывать и поддерживать Terraform-модули (дизайн интерфейсов variables/outputs, переиспользуемость, версионирование, тестирование);
- Понимание облачных сетей, сетевого стека Linux, маршрутизации и коммутации;
- Разработка утилит/операторов на Go или Python;
- Опыт миграций и декомпозиции legacy-систем;
- Коммуникация и софт-скиллы;
- Умеете объяснять сложное простыми словами, вести продуктивный диалог с разработчиками и стейкхолдерами;
- Готовность брать ответственность, принимать решения и действовать нестандартно, когда это требуется;
- Проактивность, дисциплина изменений (RFC/ADR/чат-Ops), внимательность к SLA/SLO;
- Умение работать в условиях неопределённости и доводить задачи до результата.