Data Scientist, Факторы ранжирования

Дата размещения вакансии: 10.12.2024

Работодатель: Ozon

Уровень зарплаты:

з/п не указана

Город:

Москва

Требуемый опыт работы:

От 3 до 6 лет

У нас петабайты реальных логов событий пользователей и возможности быстро проверять гипотезы, которые влияют на продукт, которым пользуются десятки миллионов людей. Мы делаем прогрессивные вещи и применяем cutting edge технологии. Направление поиска возглавляет Игорь Кураленок, в прошлом руководитель отдела оценки качества поиска Yandex, R&D лаборатории в Huawei и автор десятков научных пейперов про поиск, ML и распределенные вычисления. Мы ищем DS в новообразованную группу “Факторов ранжирования”. Группа отвечает за весь процесс разработки и внедрения факторов: от первичного анализа данных до организации хранения и реализации расчета факторов в поисковом runtime.

Наш стек: Python, Pyspark, Clickhouse, Airflow, Mlfow, Pytorch, Catboost, Java.

Вам предстоит:

Заниматься полным циклом разработки факторов для моделей ранжирования со стороны ML: исследование исходных данных, автоматизации пайплайнов для регулярных расчетов факторов и агрегатов на pyspark, проведение приемки разработанных факторов.
Разрабатывать новые сложные факторы ранжирования в поиске и каталоге: текстовые на основе foundation-моделей, персонализация, факторы из рекомендаций и др.
Искать подходящие ML решения для бизнес-задач, планировать и проводить оффлайн и онлайн (А/Б) эксперименты.

Примеры задач:

Разработка процедуры приемки для offline-оценки полезности разработанных факторов.
Разработка факторов под нужды отдельных товарных категорий (одежда, продукты с express-доставкой и др.).
Разработка факторов для достижения различных бизнес-целей компании: снижение сроков доставки заказанных из поиска товаров, достижение более конкурентной цены товаров в поисковой выдаче и др.
Оптимизация хранения и процесса расчета факторов за счет разделения на расчет агрегатов в hadoop и вычисления конечных факторов по агрегатам в поисковом runtime.
Улучшение существующего DSSM-фактора с помощью использования foundation-модели карточки товара с целью улучшить релевантность поисковой выдачи.

Мы ожидаем:

Опыт работы в Data Science от 3-х лет
Уверенные теоретические знания ML
Сильный python
Уверенное знание hadoop-стека, опыт работы с большими данными

Как плюс:

Опыт работы с рекомендательными системами / NLP
Опыт работы с высоконагруженными системами
Опыт разработки на Java

Мы предлагаем:

Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce.
Свободу действий в принятии решений.
Достойный уровень заработной платы.
Профессиональную команду, которой мы гордимся.
Возможность развиваться вместе с нашим бизнесом.

Откликнуться

Data Scientist, Факторы ранжирования

Похожие вакансии: Москва