Пресненская набережная 12
Привет! Я Катя, занимаюсь подбором в AWX и наконец-то пришел черед найти того самого DevOps-инженера в IT команду компании.
Кто мы: AWX — международная финтех-платформа, создающая передовые решения для управления цифровыми активами и взаимодействия с ними. Наша миссия — дать пользователям инструменты, которые упрощают финансовые операции, повседневные финансовые задачи, делают их безопасными и прозрачными.
Почему сейчас? Потому что твое время пришло...
Потому что проект растет, а задачи становятся сложнее. Нам не достаточно «чтобы просто работало». Нужна надежность, автоматизация и спокойная уверенность в инфраструктуре.
-
Зеленая зона: Никакого наследия (legacy). Сам выбираешь стек и архитектуру.
-
Технический вызов: Highload, репликация Postgres, K8s, полная автоматизация бекапов и восстановления.
-
100% удаленка с гибким графиком (редкие дежурства по инцидентам).
-
CI/CD с нуля: Настроить GitLab CI, интегрировать с gitflow, написать пайплайны для Maven/pnpm, добавить SAST и линтеры;
-
Оркестрация и БД: Поднять Kubernetes, настроить репликацию PostgreSQL (Master-Slave), обеспечить автоматическое восстановление;
-
Наблюдаемость: Развернуть Prometheus + Loki + Grafana. Настроить алерты в Telegram так, чтобы мы узнавали о проблемах раньше пользователей;
-
DevSecOps: WireGuard, файрволы, Network Policies в K8s, сканирование образов Trivy;
-
Документирование: Писать runbooks и RCA (анализ инцидентов) — у нас культура «знания в коде и вики».
-
Опыт: от 4 лет коммерческой работы DevOps в продуктовых компаниях (highload приветствуется);
-
GitLab CI: Пайплайны, интеграция с gitflow, автоматизация билдов;
-
Контейнеризация: Docker (безопасность, оптимизация слоев), Kubernetes (деплой, сетевые политики);
-
Базы данных: PostgreSQL (репликация, бекапы/восстановление);
-
Мониторинг: Prometheus + Loki + Grafana + Alertmanager;
-
Скриптинг: Bash или Python для автоматизации бекапов;
-
Network: Nginx (балансировка);
-
Будет плюсом: CKA/CKAD, сертификаты по Prometheus/Grafana, опыт с Chaos Engineering (симуляция падений).
-
Проактивность: Ты замечаешь проблему до алерта. Не ждешь задачу «настроить бекапы» — делаешь это автоматически;
-
Дисциплина: После настройки сервиса сразу появляется страница в Wiki. RCA — в течение 24 часов после инцидента;
-
Стрессоустойчивость: Во время аварии действуешь по чек-листу, восстанавливаешь сервис, а не ищете виноватых;
-
Ответственность: Не бросаешь задачу на 90%. Доводишь до работающего алерта, бекапа и восстановления.
-
Удаленка: 100%, полная занятость;
-
Занятость: полная, редкая работа в выходные при инцидентах (по согласованию);
-
Зарплата: обсуждается с успешным кандидатом (рыночный уровень Senior DevOps);
-
Команда: взрослые инженеры 30+, без микроменеджмента.
Интервью с HR (20–30 мин);
Техническое интервью с CTO (глубокий разбор кейсов, архитектуры);
Оффер.