Ведущий SRE инженер, Message Bus

Дата размещения вакансии: 14.07.2025
Работодатель: Ozon
Уровень зарплаты:
з/п не указана
Город:
Москва
Пресненская набережная 10
Требуемый опыт работы:
Более 6 лет

Отдел MessageBus отвечает за ряд важных инфраструктурных сервисов. Вам предстоит вместе с нами строить шину данных на основе Kafka, выдерживающую миллионы rps и «прокачивающую» через себя все асинхронные коммуникации микросервисов. А еще предоставлять ее, как ресурс во внутреннем облаке и поднимать новые маршруты «по кнопке».

Мы вместе будем развивать экосистему вокруг хранилища секретов, на базе Vault. И предоставлять сервисам конфигурации в realtime-режиме с помощью ETCD.

Задача нашей команды, как и всей Платформы — обеспечение высокой надежности микросервисов и поддержка высокого уровня инженерной культуры в компании. А так же забота о developer experience.

Вам предстоит:

  • Решать фундаментальные платформенные проблемы, возникающие при эксплуатации >5k микросервисов и highload-ready инфраструктуры.
  • Развивать и поддерживать инфраструктуру, улучшать интеграции микросервисов с инфраструктурой и их инструментирование.
  • Обеспечивать максимально высокую надежность и доступность Kafka, Vault, etcd.
  • Работать с командами как с заказчиками платформенных фичей.
  • Участвовать в решении возникающих инцидентов, разрабатывать и внедрять способы их предотвращения.

Нам важно:

  • Опыт работы с высоконагруженными системами.
  • Опыт работы с Kafka, Vault, etcd.
  • Экспертное знание Linux
  • Уверенное владение инструментами управления конфигурациями: ansible, terraform, helm.
  • Владение и понимание систем мониторинга: Prometheus stack, Grafana, Graylog, OpenTelemetry.
  • Понимание принципов работы сети и знание сетевых протоколов.
  • Понимание принципов обеспечения высокой доступности приложений, балансировки нагрузки и rate-limiter.
  • Умение автоматизировать рутинные операции.
  • Опыт работы с распределёнными системами (микросервисы, service discovery) и соответствующими инструментами (docker, k8s).

Будет плюсом:

  • Интерес к анализу, проектированию и решению проблем в масштабных распределенных системах.
  • Умение дебажить и оптимизировать код, автоматизировать рутинные операции.
  • Умение читать и понимать код на Go, понимать процессы платформенной разработки. Владение языком программирования будет очень большим плюсом.

С нами классно работать:

  • Масштабные и значимые задачи — мы строим ведущий e-com в стране.
  • Нам не всё равно — ценим инициативу и самостоятельность, доверяем команде и даём свободу в принятии решений.
  • Открытая культура, где ошибки — часть роста, а решение проблемы важнее поиска виноватых.
  • Сильная команда, которой мы гордимся — обсуждаем идеи, обмениваемся экспертизой, просим совета и поддерживаем друг друга.