Технический менеджер в Рекламные технологии

Дата размещения вакансии: 27.08.2024
Работодатель: Яндекс
Уровень зарплаты:
з/п не указана
Город:
Москва
Центральный административный округ, район Хамовники, квартал Красная Роза
Требуемый опыт работы:
Более 6 лет

Рекламные технологии — один из сложнейших IT-продуктов. Это множество сервисов, которые обрабатывают большие объёмы данных с помощью сотен моделей машинного обучения. Сложная бизнес-логика обеспечивает потребности всех участников рынка.

Чтобы эффективно работать с растущими объёмами данных, необходимо внедрять передовые технологии. При этом всегда есть вероятность сбоя. Поэтому команды Рекламных технологий активно развивают культуру и инструменты SRE.

Мы ищем технического менеджера, который разбирается в технологиях, может наладить взаимодействие между командами и умеет определять приоритетные задачи для обеспечения стабильности.

Какие задачи вас ждут

Стратегическое планирование развития сервисов Рекламных технологий
Чтобы сервисы Рекламных технологий работали стабильно и надёжно, нужно развивать методологию управления. Она должна учитывать ключевые требования к сервисам и правила оценки качества их работы. Планировать, как будет выглядеть процесс через пять лет, нужно уже сегодня, — и это одна из ваших задач.

Управление бэклогом задач по развитию инструментов инцидент-менеджмента
Инцидент-менеджмент начинается с планирования инструментов автоматической диагностики и продолжается вплоть до установления приоритетов для задач выявленного технологического долга. Инструменты обнаружения и устранения проблем на любом этапе должны быть удобными, функциональными и понятными. Поэтому необходимо непрерывно анализировать пользовательские сценарии и на их основе формулировать запросы на добавление новых функций в систему управления инцидентами.

Ведение проектов по устранению технологического долга
Иногда случаются небольшие поломки в конкретном сервисе, а иногда — серьёзные инциденты, которые могут нарушить бизнес-процессы и повлиять на пользователей. Вам предстоит анализировать каждую поломку и разрабатывать меры их предотвращения, которые помогут избежать проблем в будущем. Это могут быть как точечные задачи, так и сложные кросс-командные проекты. Ими нужно управлять так, чтобы они достигали результата оптимальным путём.

Развитие SRE-культуры
В любой структуре есть команды разного уровня зрелости. Некоторые команды самостоятельно обеспечивают стабильность сервисов и развивают процессы, другим нужна помощь. Важно погружать сотрудников в ценность и смысл работы, организовывать встречи для обмена опытом. В работе с инцидентами нужно поддерживать позитивную атмосферу, развивать умение признавать ошибки, делать выводы и делиться ими с коллегами.

Мы ждём, что вы

  • Разрабатывали SLI/SLO/SLA и владеете принципами их формирования
  • Проектировали и эксплуатировали высоконагруженные системы

Будет плюсом, если вы

  • Имеете опыт в качестве solution- или корпоративного архитектора
  • Отвечали за надёжность сервиса или информационной системы
  • Выстраивали процесс приёмки релизов, внедряли quality gates
  • Владеете инструментами мониторинга, автоматизации управления инфраструктурой
  • Знакомы с практиками SRE/DevOps
  • Умеете управлять кросс-сервисной командой в нештатной ситуации, координировать дебаг инцидента и починку сервиса
  • Понимаете процесс фиксирования postmortems и мер предотвращения
  • Знаете, что такое 99,99%, на практике