Привет! Это команда Research-проектов поиска Ozon
Мы работаем над инновационными DS-задачами, которые напрямую влияют на качество поисковой выдачи и пользовательский опыт миллионов клиентов. Направление поиска возглавляет Игорь Кураленок, в прошлом руководитель отдела оценки качества поиска Yandex, R&D лаборатории в Huawei и автор десятков научных пейперов про поиск, ML и распределенные вычисления.
Мы решаем сложные и интересные задачи на стыке машинного обучения, аналитики и бизнеса, вот пример основных проектов на ближайший период:
-
Разработка системы агрегации статистики по "реальным" товарам — создаем интеллектуальные алгоритмы для сбора и анализа данных, которые становятся ключевыми фичами в основной модели ранжирования поиска Ozon.
-
Аналитика продвижения новых товаров — применяем Look-alike моделирование для прогнозирования успешности новинок и выявления факторов, влияющих на их продвижение.
-
Построение системы поиска товаров-конкурентов — разрабатываем алгоритмы кластеризации для формирования групп схожих конкурирующих товаров, что помогает улучшать релевантность поисковой выдачи.
Сейчас мы ищем старшего Data Scientist.
Почему стоит присоединиться к нам:
- Проекты с реальным impact — ваша работа будет напрямую влиять на алгоритм ранжирования и, как следствие, на ключевые метрики бизнеса и пользовательский опыт.
- Глубокое погружение в сложные задачи — никакой операционки, только интересные проекты, требующие глубокой экспертизы и творческого подхода.
- Сильная команда и развитая инфраструктура — работа с опытными коллегами в условиях современной технологической экосистемы, где можно быстро внедрять решения в PROD и наблюдать результаты своей работы.
Наш стек:
- Python, PySpark, ClickHouse, Airflow, MLflow, DVC.
Вы будете:
-
Разрабатывать и внедрять ML-модели для решения задач агрегации статистики по товарам, анализа новинок и поиска конкурентов.
- Работать с данными на всех этапах: от исследования до автоматизации пайплайнов расчета датасетов на PySpark.
- Подбирать ML-решения для бизнес-задач, планировать и проводить офлайн и онлайн-эксперименты (А/Б тесты).
Нам важно:
- Опыт работы в Data Science от 3х лет.
- Глубокие знания теории вероятностей и машинного обучения.
- Сильные навыки Python.
- Опыт работы с Hadoop-стеком и большими данными.