У нас петабайты реальных логов событий пользователей и возможности быстро проверять гипотезы, которые влияют на продукт, которым пользуются десятки миллионов людей. Мы делаем прогрессивные вещи и применяем cutting edge технологии. Направление поиска возглавляет Игорь Кураленок, в прошлом руководитель отдела оценки качества поиска Yandex, R&D лаборатории в Huawei и автор десятков научных пейперов про поиск, ML и распределенные вычисления. Мы ищем DS в новообразованную группу “Факторов ранжирования”. Группа отвечает за весь процесс разработки и внедрения факторов: от первичного анализа данных до организации хранения и реализации расчета факторов в поисковом runtime.
Наш стек: Python, Pyspark, Clickhouse, Airflow, Mlfow, Pytorch, Catboost, Java.
Вам предстоит:
- Заниматься полным циклом разработки факторов для моделей ранжирования со стороны ML: исследование исходных данных, автоматизации пайплайнов для регулярных расчетов факторов и агрегатов на pyspark, проведение приемки разработанных факторов.
- Разрабатывать новые сложные факторы ранжирования в поиске и каталоге: текстовые на основе foundation-моделей, персонализация, факторы из рекомендаций и др.
- Искать подходящие ML решения для бизнес-задач, планировать и проводить оффлайн и онлайн (А/Б) эксперименты.
Примеры задач:
- Разработка процедуры приемки для offline-оценки полезности разработанных факторов.
- Разработка факторов под нужды отдельных товарных категорий (одежда, продукты с express-доставкой и др.).
- Разработка факторов для достижения различных бизнес-целей компании: снижение сроков доставки заказанных из поиска товаров, достижение более конкурентной цены товаров в поисковой выдаче и др.
- Оптимизация хранения и процесса расчета факторов за счет разделения на расчет агрегатов в hadoop и вычисления конечных факторов по агрегатам в поисковом runtime.
- Улучшение существующего DSSM-фактора с помощью использования foundation-модели карточки товара с целью улучшить релевантность поисковой выдачи.
Мы ожидаем:
- Опыт работы в Data Science от 3-х лет
- Уверенные теоретические знания ML
- Сильный python
- Уверенное знание hadoop-стека, опыт работы с большими данными
Как плюс:
- Опыт работы с рекомендательными системами / NLP
- Опыт работы с высоконагруженными системами
- Опыт разработки на Java
Мы предлагаем:
- Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce.
- Свободу действий в принятии решений.
- Достойный уровень заработной платы.
- Профессиональную команду, которой мы гордимся.
- Возможность развиваться вместе с нашим бизнесом.