Москва
Обязанности:
- Контейнеризация и оркестрация: -Проектирование и эксплуатация кластеров Docker Swarm (overlay-сети, secrets/configs, rolling-update/rollback, zero-downtime деплой). -Стандартизация Dockerfile и docker-compose (dev/stage/prod), управление через Portainer, сбор метрик средствами cAdvisor.
- Мониторинг и алёртинг: -Поддержка Prometheus (node_exporter, cAdvisor, Blackbox, Kafka/Postgres-exporters), дашборды в Grafana. -Инцидент-менеджмент в Zabbix: шаблоны, триггеры, зависимости, эскалации, интеграции с мессенджерами.
- Service Discovery & конфигурации: -Эксплуатация HashiCorp Consul (health-checks, service mesh/DNS, KV), интеграция с приложениями и балансировщиками.
- Хранение и БД: -Администрирование MinIO (политики, репликация/erasure coding, lifecycle, бэкапы, S3-keys). -PostgreSQL: базовый HA (standby/replication), мониторинг.
- Стриминг: -Apache Kafka: настройка брокеров, топиков/партиций, ретеншен, DLQ, безопасность (SASL/mTLS). -Kafka Connect: управление коннекторами (S3, JDBC, HTTP), обработка ошибок/offsets, Schema Registry/Debezium.
- Надёжность и безопасность:
-CI/CD (желательно GitLab CI) для контейнерных релизов, образов и инфраструктуры.
-TLS/mTLS, секреты, базовые hardening-практики Linux, аудит доступов, backup/restore-плейбуки. - BIRT:
-Эксплуатация BIRT, логирование и мониторинг отчётного сервиса.
Требования:
- Опыт работы от 3 лет в роли DevOps/SRE/Platform-инженера.
- Уверенный Linux (networking, systemd, namespaces/cgroups), Bash; желательно Python/Go для утилит.
- Опыт в Docker/Compose/Swarm (стековые файлы, secrets/configs, overlay-сети, Portainer, cAdvisor).
- Практика с Prometheus/Grafana и Zabbix на проде.
- Опыт эксплуатации Kafka/Kafka Connect (базовая диагностика lag, offsets, ретраи, коннекторы).
- Знание PostgreSQL (план выполнения, индексы, бэкапы/WAL), опыт миграций.
- Опыт с MinIO/S3-совместимыми хранилищами (политики, репликация/бэкапы).
- Понимание Consul (service discovery, health-checks, KV).
- Базовые знания сетей: L3/L4, TCP/TLS, балансировка, Nginx/HAProxy.
- Ответственность за SLA.
Приветствуется: Ansible, опыт работы с Schema Registry (Confluent/Apicurio). Логи: Loki/ELK, OpenTelemetry. HA для Postgres (Patroni/Pgpool-II), sharding/partitioning.
Условия:
- График работы 5-ти дневная рабочая неделя (Гибрид или удаленно);
- Комфортабельный офис в пешей доступности от метро Новокузнецкая;
- Оформление согласно ТК РФ, в аккредитованную ИТ компанию;
- «Белая» заработная плата и годовой бонус;
- ДМС (широкая сеть клиник, стационары, стоматология и т.д.).