У нас петабайты реальных логов событий пользователей и возможности быстро проверять гипотезы, которые влияют на продукт, которым пользуются десятки миллионов людей. Мы делаем прогрессивные вещи и применяем cutting edge технологии. Направление поиска возглавляет Игорь Кураленок, в прошлом руководитель отдела оценки качества поиска Yandex, R&D лаборатории в Huawei и автор десятков научных пейперов про поиск, ML и распределенные вычисления.
Наш стек:
- Python, Pyspark, Clickhouse, Airflow, Mlfow.
Вам предстоит:
- Заниматься полным циклом DS/ML задач для улучшения качества алгоритма ранжирования товаров в поисковой выдаче.
- Работать с данными от их исследования до автоматизации пайплайнов для регулярных расчетов датасетов и фичей на pyspark.
- Искать подходящие ML решения для бизнес-задач, планировать и проводить оффлайн и онлайн (А/Б) эксперименты.
Примеры задач:
- Оптимизация сложных целей компании с помощью ранжирования (multi-objective ranking, дизайн композитных функций потерь).
- Устранение различных bias-ов из моделей (positional bias, cold start problem).
- Дизайн и разработка оффлайн-метрик, которые будут хорошо предсказывать результаты А/Б экспериментов.
- Адаптация алгоритмов под нужды отдельных товарных категорий (одежда, продукты)
Мы ожидаем:
- Опыт работы в Data Science от 3х лет
- Уверенные теоретические знания ML
- Сильный python
- Уверенное знание hadoop - стека, опыт работы с большими данными
Как плюс:
- Опыт работы с рекомендательными системами / NLP
- Опыт работы с высоконагруженными системами
- Опыт дизайна и проведения AB тестов
Мы предлагаем:
-
Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce.
-
Свободу действий в принятии решений.
-
Достойный уровень заработной платы.
-
Профессиональную команду, которой мы гордимся.
-
Возможность развиваться вместе с нашим бизнесом.