Data Scientist, Факторы ранжирования

Дата размещения вакансии: 10.12.2024
Работодатель: Ozon
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

У нас петабайты реальных логов событий пользователей и возможности быстро проверять гипотезы, которые влияют на продукт, которым пользуются десятки миллионов людей. Мы делаем прогрессивные вещи и применяем cutting edge технологии. Направление поиска возглавляет Игорь Кураленок, в прошлом руководитель отдела оценки качества поиска Yandex, R&D лаборатории в Huawei и автор десятков научных пейперов про поиск, ML и распределенные вычисления. Мы ищем DS в новообразованную группу “Факторов ранжирования”. Группа отвечает за весь процесс разработки и внедрения факторов: от первичного анализа данных до организации хранения и реализации расчета факторов в поисковом runtime.

Наш стек: Python, Pyspark, Clickhouse, Airflow, Mlfow, Pytorch, Catboost, Java.

Вам предстоит:

  • Заниматься полным циклом разработки факторов для моделей ранжирования со стороны ML: исследование исходных данных, автоматизации пайплайнов для регулярных расчетов факторов и агрегатов на pyspark, проведение приемки разработанных факторов.
  • Разрабатывать новые сложные факторы ранжирования в поиске и каталоге: текстовые на основе foundation-моделей, персонализация, факторы из рекомендаций и др.
  • Искать подходящие ML решения для бизнес-задач, планировать и проводить оффлайн и онлайн (А/Б) эксперименты.

Примеры задач:

  • Разработка процедуры приемки для offline-оценки полезности разработанных факторов.
  • Разработка факторов под нужды отдельных товарных категорий (одежда, продукты с express-доставкой и др.).
  • Разработка факторов для достижения различных бизнес-целей компании: снижение сроков доставки заказанных из поиска товаров, достижение более конкурентной цены товаров в поисковой выдаче и др.
  • Оптимизация хранения и процесса расчета факторов за счет разделения на расчет агрегатов в hadoop и вычисления конечных факторов по агрегатам в поисковом runtime.
  • Улучшение существующего DSSM-фактора с помощью использования foundation-модели карточки товара с целью улучшить релевантность поисковой выдачи.

​​​​​​Мы ожидаем:

  • Опыт работы в Data Science от 3-х лет
  • Уверенные теоретические знания ML
  • Сильный python
  • Уверенное знание hadoop-стека, опыт работы с большими данными

Как плюс:

  • Опыт работы с рекомендательными системами / NLP
  • Опыт работы с высоконагруженными системами
  • Опыт разработки на Java

Мы предлагаем:

  • Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce.
  • Свободу действий в принятии решений.
  • Достойный уровень заработной платы.
  • Профессиональную команду, которой мы гордимся.
  • Возможность развиваться вместе с нашим бизнесом.