Старший Data Scientist, ML ценообразование

Дата размещения вакансии: 07.05.2026
Работодатель: Ozon
Уровень зарплаты:
з/п не указана
Город:
Москва
Пресненская набережная 10блокС
Требуемый опыт работы:
От 3 до 6 лет

Привет! Это команда ML ценообразования. Сейчас в команде 2 человека, которые сделали MVP – на A/B тестах стабильно позитивные результаты. Основная цель на ближайшее время – определить стратегию дальнейшего развития системы. Цель на долгосрок – разработать устойчивое решение, которое учитывает не только краткосрочную выгоду, но и сайд-эффекты и последствия. Сейчас пайплайн переводится с hadoop в сервисы, и в дальнейшем поддержкой production и всей технической стороной проекта будет заниматься соседняя команда, а мы сосредоточимся на математической составляющей задачи.

Этот проект – борьба с шумными данными, сложными метриками и неочевидными решениями. Мы ищем человека, который готов бороться за каждую десятую процента на А/Б, за качество и безопасность решений, за долгосрочный эффект. Который не ищет легких путей, но хочет побеждать вместе с командой. Если процесс преодоления доставляет вам особое удовольствие, и вы хотите привнести в сильную команду свое видение – нам точно стоит познакомиться!

Вы будете

  • Анализировать большие объёмы данных с помощью PySpark для поиска неочевидных закономерностей.
  • Исследовать и улучшать ML-решения на реальных шумных данных – от гипотезы до оценки влияния на А/Б-тесты (без погружения в production-инженерию: пайплайн и поддержку возьмёт соседняя команда).
  • Разрабатывать и проверять новые факторы для моделей, добиваясь стабильного прироста метрик.
  • Проектировать эксперименты и инструменты валидации, чтобы отделить реальный эффект от шума и случайностей.
  • Оценивать долгосрочные последствия решений, выявлять и анализировать сайд-эффекты.
  • Участвовать в архитектурных обсуждениях (как лучше строить фичи, валидацию, сценарии использования) без рутинной поддержки кода в проде.

Нам важно

  • Отличная математическая база.
  • Коммерческий опыт в DS от 4 лет – обязательно с задачами, где данные были шумными или недостаточно разнообразными.
  • Опыт работы с PySpark на реальных объёмах данных (именно для анализа и генерации фичей, а не для написания production-пайплайнов).
  • Опыт постановки и интерпретации А/Б-тестов.
  • Умение и желание копать в глубину: не остановиться на первом сработавшем решении, а проверять устойчивость, смотреть на сайд-эффекты, пробовать альтернативные подходы.
  • Прагматизм и ориентацию на результат – умение быстро проверять гипотезы, при этом не скатываясь в бесконечный research.

Будет плюсом

  • Опыт в ML ценообразовании.
  • Опыт успешного применения Causal Inference подходов.