Data Scientist/Вертикальные поиски

Дата размещения вакансии: 19.05.2026
Работодатель: Ozon
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет
Привет! Это команда вертикальных поисков.
Современный поиск на маркетплейсе — это не плоский список из тысяч карточек, а умная витрина, которая понимает намерение пользователя и сама группирует товары по тому, что ему важно. Покупатель, который вбивает «ноутбук», на самом деле ищет «игровой», «для учёбы ребёнку» или «тонкий для работы» — и наша задача показать ему эти тематические полки прямо в выдаче, без лишних кликов и фильтров.
Мы называем такие полки нави-колдунами — это автоматически собираемые кластеры товаров внутри поисковой выдачи, которые упорядочивают её по понятным пользователю осям: сценарий использования, ценовой сегмент, тип покупателя, ключевая характеристика. Каждый колдун имеет название, описание и подборку релевантных товаров. Мы ищем DS-специалиста, который будет развивать стрим нави-колдунов: от выделения семантических осей категории до продакшн-ранжирования полок в реальной выдаче Ozon.

Вы будете:

  • Разрабатывать и внедрять модели кластеризации товаров для построения тематических полок в поисковой выдаче.
  • Проектировать пайплайны автоматической генерации названий и описаний кластеров (в т.ч. с использованием LLM).
  • Строить модели ранжирования полок и товаров внутри полок под интент пользователя.
  • Работать с товарными эмбеддингами, признаками поведения пользователей и атрибутами карточек для повышения качества кластеризации.
  • Заниматься построением пайплайнов обработки и сбора данных, разметкой и обучением моделей.
  • Участвовать в полном ML-цикле: от исследования и создания прототипов до продакшн-внедрения, A/B-тестов и мониторинга моделей.
Нам важно:
  • Наличие фундаментальной математической базы, знание алгоритмов, математической статистики, классического ML и нейросетей.
  • Понимание методов кластеризации, построения эмбеддингов и алгоритмов ранжирования (LTR).
  • Опыт работы с современными архитектурами языковых моделей и эмбеддинг-моделей, в том числе обучение/дообучение своих моделей.
  • Опыт работы с продуктами в области поиска, рекомендательных систем или рекламных технологий.
  • Понимание принципов оценки качества ML-моделей в проде, постановки и анализа A/B-тестов.
Будет плюсом:
  • Опыт построения ассистентов или продуктов на базе LLM, генерация структурированного контента (названий/описаний).
  • Знание технологий обработки больших данных, таких как Hadoop, Spark или аналогичные.
  • Навыки работы с инструментами автоматизации ML-пайплайнов.
  • Опыт работы с e-commerce данными: товарные графы, каталоги, пользовательские сессии.