проспект Андропова 18к3
Привет!
А ДЕНЬГИ — это команда единомышленников с гибким подходом к разработке финтех-продуктов. Мы — часть большого холдинга Альфа-Банка со своим независимым подходом к ведению бизнеса. Вместе мы создаем лучший финансовый сервис для миллионов клиентов. Не боимся рисковать, ищем новые решения и получаем прорывные результаты.
Мы ищем Инцидент Менеджера для работы в полностью удалённом формате.
Присоединяйся и создавай новую историю с нами!
Чем предстоит заниматься:
Мы ищем Incident Manager, который будет отвечать за управление инцидентами в продакшене end-to-end: от первого сигнала до внедрения улучшений после постмортема.
Роль предполагает операционное лидерство, принятие решений в условиях неопределённости и ответственность за стабильность сервисов.
Полный цикл управления инцидентами
- Координация всех этапов инцидента: обнаружение → реакция → восстановление → постинцидентный анализ.
- Организация и ведение War Room, распределение ролей (Incident Lead, технические эксперты, коммуникатор).
- Контроль выполнения SLA/SLO, снижение MTTR, MTTA, MTTT.
Эскалация и оперативное реагирование
- Привлечение профильных команд (SRE, DevOps, разработка, инфраструктура, вендоры).
- Управление приоритетами и фокусом команд в условиях высокого давления.
- Принятие решений при неполной информации.
Коммуникация и прозрачность
- Регулярные и понятные апдейты для стейкхолдеров, включая нетехнические команды и бизнес.
- Формирование итоговых отчётов по инцидентам (impact, timeline, root cause, action items).
Постмортемы и улучшение процессов
- Проведение RCA с использованием 5 Why, Fishbone, FMEA.
- Контроль реализации action items по итогам постмортемов.
- Улучшение runbooks, алертинга, сценариев реакции, автоматизации.
Развитие reliability-культуры
- Участие в обучении команд best practices работы с инцидентами.
- Участие в инициативах по повышению отказоустойчивости и снижению incident rate.
Каким мы тебя видим:
Опыт и мышление
- Опыт от 1 года в управлении инцидентами в высоконагруженных и распределённых системах.
- Умение структурировать хаос и принимать решения под давлением.
- Понимание процессов Incident / Problem Management (ITIL — на практике, не формально).
Координация и коммуникация
- Опыт работы с кросс-функциональными командами 24/7.
- Чёткая письменная и устная коммуникация.
Технический кругозор
-
Понимание принципов работы:
- сетей,
- БД (PostgreSQL),
- брокеров и очередей (Kafka, Redis).
-
Опыт работы с мониторингом и алертингом:
-
Prometheus, Grafana, Zabbix (или аналоги).
- Умение читать метрики (latency, error rate, traffic) и логи.
Метрики и анализ
- Знание и применение MTTR, MTTA, MTTT, SLA/SLO/SLI.
- Практический опыт RCA.
Будет плюсом
- Опыт работы в SRE-подходе.
- SQL для несложных аналитических запросов.
- Опыт снижения alert noise и повторных инцидентов.
МЫ:
Соблюдаем ТК РФ:
-
Официальное трудоустройство в штат компании по ТК РФ;
Предлагаем гибкий формат работы:
-
Возможность удалённо работать ;
-
А если тебе захочется поработать оффлайн - в твоём распоряжении офис в Москве в урбанистическом стиле, в одной минуте ходьбы от м. Технопарк;
Заботимся о здоровье:
- С первого дня работы ты можешь выбрать расширенную программу ДМС со стоматологией или компенсацию расходов на оплату спорта;
- Линия психологической поддержки;
- Врач в офисе и массажные кресла (для сотрудников в Москве);
- Бесплатные посещения фитнес-клуба А-sport на ст. м. Технопарк;
Профессионально развиваемся:
-
Корпоративная программа профессионального обучения совместно с Альфа Групп (внутренние и внешние программы);
-
Возможность участия в профильных конференциях;
-
Онлайн-библиотека;
-
Карьерное развитие. Ты развиваешься и растешь вместе с командой;
-
Программа наставничества;
-
Профессиональные коммьюнити;
Думаем о каждом:
-
Корпоративные мероприятия и тимбилдинги в онлайн и оффлайн формате;
-
Подарки к праздникам и материальная помощь по особым случаям;
-
+ 3 дня 100% оплачиваемых day off в году.