В команде сейчас 3 человека. Мы отвечаем за обучение моделей, проведение и анализ новых экспериментов. Работаем по Agile с двухнедельными спринтами.
У нас петабайты реальных логов событий пользователей и возможности быстро проверять гипотезы, которые влияют на продукт, которым пользуются десятки миллионов людей. Мы делаем прогрессивные вещи и применяем cutting edge технологии. Направление поиска возглавляет Игорь Кураленок, в прошлом руководитель отдела оценки качества поиска Yandex, R&D лаборатории в Huawei и автор десятков научных пейперов про поиск, ML и распределенные вычисления.
Наш стек:
- Python, PySpark, ClickHouse, Airflow, MLflow, DVC.
Вам предстоит:
- Улучшать качество алгоритма ранжирования товаров в поисковой выдаче.
- Работать с данными на всех этапах: от исследования до автоматизации пайплайнов расчета датасетов на PySpark.
- Подбирать ML-решения для бизнес-задач, планировать и проводить офлайн- и онлайн-эксперименты (А/Б тесты).
Примеры задач:
- Моделирование принятия решений пользователя для создания интерпретируемых моделей.
- Разработка модели “текстовой релевантности” и предсказание качества товара.
- Моделирование “честной цены товара” и учет ее в итоговом ранжировании.
- Адаптация алгоритмов с учетом географических особенностей.
Мы ожидаем:
- Опыт работы в Data Science от 3х лет;
- Глубокие знания теории машинного обучения.
- Сильные навыки Python.
- Опыт работы с Hadoop-стеком и большими данными.
Как плюс:
- Опыт работы с рекомендательными системами / NLP.
- Опыт работы с высоконагруженными системами.
- Опыт дизайна и проведения AB тестов.
Мы предлагаем:
-
Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce.
-
Свободу действий в принятии решений.
-
Достойный уровень заработной платы.
-
Профессиональную команду, которой мы гордимся.
-
Возможность развиваться вместе с нашим бизнесом.