Москва
Стабильность Авито зависит от слаженной работы тысячи сервисов, которые обновляются много раз в день. Иногда случаются инциденты, которые приводят к ухудшению опыта пользователя. В таком случае необходимо в кратчайшие сроки собрать команду, которая может решить инцидент, убедиться что все необходимые ресурсы у них есть и сохраняя высокий уровень прозрачности, помочь решить инцидент за минимальное возможное время.
Таких людей мы называем Incident Manager, они работают в юните Incident & Problem Management.
Основная задача Incident Manager - координация работ по устранению инцидента.
Вам предстоит:
- Управлять решением инцидентов масштаба всего Авито: локализация проблем, призыв и координация дежурных, коммуникация до стейкхолдеров;
- Сопровождать технические работы: отработка рисков, контроль влияния на пользователей;
- Развивать процессы надежности на уровне компании — мы выступаем заказчиками инструментов траблшутинга, управляем процессом технических работ.
Мы ждём,что вы:
- Обладаете опытом координации инцидентов в B2C/B2B-продуктах;
- Умеете работать с системами мониторинга, например Grafana, Kibana, Jaeger UI;
- Можете провести траблшутинг распределенной многокомпонентной системы (back-end, mobile, web).
Работа у нас — это:
- Возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
- Возможность увидеть, потрогать, пощупать весь технологический стек (тысячи серверов и микросервисов) Авито с первого дня работы;
- Работа в гибридном формате, основная часть команды в Москве, но готовы обсудить полностью удаленный формат из любой точки мира;
- Комфортные условия работы: ДМС, фитнес, компенсация питания;
- Возможность проходить обучение за счет компании, участие во внутренних митапах, хакатонах, тренингах.