Разработчик Go, Платформа, Группа разработки инструментов алертинга и инцидент менеджмента

Дата размещения вакансии: 04.07.2026
Работодатель: Ozon
Уровень зарплаты:
з/п не указана
Город:
Москва
Пресненская набережная 10с2
Требуемый опыт работы:
От 3 до 6 лет

Привет! Это команда разработки инструментов алертинга и инцидент менеджмента.

Мы ищем инженера в команду разработки инструментов алертинга и инцидент менеджмента, который поможет нам строить систему, облегчающую поиск и оперативное реагирование на проблемы, возникающие на самых разных участках инфраструктуры Ozon.

Задача команды – обеспечить инженеров удобными инструментами мониторинга.

Мы строим абсолютно новую платформу в Ozon, основанную на современных технологиях. Одним из важнейших аспектов новой платформы является её высокая доступность в связке с уже существующими технологиями Ozon.

Наш стек

  • Go, Postgresql, Kafka, Redis,Clickhouse, PromQL.

Вы будете

  • Разрабатывать систему доставки алертов и управления дежурствами.

  • Разрабатывать систему написания и управления алертами.

  • Разрабатывать систему управления и отчетов по инцидентам.

  • Обеспечивать команды инструментами для отладки и мониторинга – дашбордами и алертами.

  • Интегрировать с существующей системой мониторинга на базе Prometheus, Alertmanager и Thanos.

  • Консультировать разработчиков и технических специалистов по интеграции с системой мониторинга и сопровождение интеграции.

Нам важно

  • Опыт написания понятного и тестируемого кода на Go от 3-х лет.

  • Вы работали с Postgresql.

  • Вы свободно пользуетесь терминалом в Linux.

  • Вы работали с распределёнными системами (микросервисы, service discovery) и соответствующими инструментами (Docker, orchestration systems).

  • Вы понимаете принципы обеспечения высокой доступности приложений и слышали о балансировщиках нагрузки и rate-limiter'ах.

  • Вы проактивный, не боитесь высказывать свое мнение.

Будет плюсом

  • Опыт работы с Kafka, Redis, Clickhouse.

  • Вам интересен анализ и решение проблем в масштабных системах, состоящих из большого числа компонентов.

  • Вы работали с системами мониторинга (Prometheus, Nagios, Zabbix).

  • Вы писали алерты на PromQL.

  • Вы умеете дебажить и оптимизировать код, автоматизировать рутинные операции.

  • Опыт работы с системами трейсинга и логирования.