Senior Data Scientist (ML Pricing), Модели матчинга

Дата размещения вакансии: 17.06.2025
Работодатель: Ozon
Уровень зарплаты:
з/п не указана
Город:
Москва
Пресненская набережная
Требуемый опыт работы:
От 3 до 6 лет

Команда занимается развитием автоматического матчинга (поиска одинаковых товаров) как внутри Ozon, так и между Ozon и другими маркетплейсами. Среди текущих целей команды есть такие, как повышение полноты матчинга за счёт обучения новых текстовых и мультимодальных моделей.

Вам предстоит:

  • Полный цикл — от аналитики и сбора датасета до обучения и выкатки в прод новых моделей.
  • Разработка для расширения функционала пайплайна.
  • Построение инструментов для валидации результатов.
  • Добавление новых факторов в ML модели.
  • Исследование новых подходов для решения задачи.
  • Написание и оптимизация алгоритмов обработки данных на PySpark.

Наш стэк: Python, Pyspark, Hive, Pytorch, Catboost, Kafka, Airflow, Gitlab, Mlflow, Clickhouse, Vertica

Что мы ожидаем:

  • Коммерческий опыт в DS от 5 лет.
  • Опыт в ценообразовании или прогнозе спроса.
  • Опыт в классическом MLE (полный цикл: аналитика, сбор датасета, обучение, выкатка, поддержка).
  • Знание Python и PySpark (у нас пайплайны на них).
  • Проактивность, большое желание развиваться и развивать людей вокруг.

Будет плюсом:

  • Успешное участие в соревнованиях по ML.

С нами классно работать:

  • Масштабные и значимые задачи — мы строим один из крупнейших e-commerce в стране.
  • Нам не всё равно — ценим инициативу и самостоятельность, доверяем команде и даём свободу в принятии решений.
  • Открытая культура — мы учимся на ошибках и фокусируемся на решении проблем, а не на поиске виноватых.
  • Сильная команда, которой мы гордимся — обсуждаем идеи, обмениваемся экспертизой, просим совета и поддерживаем друг друга.
  • Современный стэк и развитая инженерная культура — реализуем амбициозные проекты и создаём решения, которых ещё нет на рынке.