Лесная улица 7
Стабильность Avito зависит от слаженной работы тысячи сервисов, которые обновляются много раз в день. Иногда случаются инциденты, которые приводят к ухудшению опыта пользователя. Чтобы инциденты случались еще реже, нужно найти корневую проблему и координируя действия команд, убрать ее до возможного повторения.
Людей, которые могут обрабатывать проблемы мы называем менеджер по управлению проблемами.
Основная задача Менеджера по управлению проблемами - определить причины проблем (и связанных с ней нескольких или одного инцидента) и скоординировать разные команды, чтобы их устранить, проконтролировать устранение, и убедиться, что проблема действительно решена.
Что предстоит делать:
- после того как инцидент или инциденты удалось успешно закрыть, нужно:
- обогатить релевантными данными, сделать анализ последствий инцидентов, сформулировать проблему, и оценить объем урона;
- категоризировать источник проблемы — это единичная проблема и
ли повтор; - собрать участников и провести разбор проблемы, дополнить анализ мнениями, определить шаги для устранения проблемы;
- оформить post-mortem по результатам разбора;
- проконтролировать, что причины проблемы будут устранены и инцидентов стало меньше;
- предлагать способы улучшения процесса работы над проблемами.
Мы считаем, что для этого у вас должны быть:
- релевантный рабочий опыт по анализу комплексных технических проблем — delivery manager, системный администратор, аналитик, Devops, SRE;
- практический опыт в анализе проблем и написании post-mortem'ов по инцидентам и проблемам (согласно модели ITIL);
- большой технический кругозор, представление как строятся современные IT решения (back-end, mobile, web);
- умение работать с monitoring системами (например, Grafana) для поиска связанных с инцидентом аномалий;
- опыт работы с распределенными много-компонентными системами будем плюсом (сервисов в компании больше тысячи, найти источник проблемы непросто).
Работа у нас — это:
- возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
- возможность увидеть, потрогать, пощупать весь технологический стек (тысячи серверов и микросервисов) Авито с первого дня работы
- работа в гибридном формате, основная часть команды в Москве, но готовы обсудить полностью удаленный формат из любой точки мира;
- комфортные условия работы: ДМС, фитнес, компенсация питания;
- возможность проходить обучение за счет компании, участие во внутренних митапах, хакатонах, тренингах.