Сейчас мы ищем Middle+/Senior Data Scientist в команду Прогноза спроса.
О продукте:
Продукт «Прогноз спроса» предназначен для автоматизации процесса прогнозирования регулярных и промо продаж. Результаты прогнозов позволяют другим продуктам и подразделениям эффективно планировать ресурсы логистики, рассчитывать промо акции и оперативно реагировать на изменение спроса.
От успешного соискателя мы ожидаем:
- Опыт работы в Data Science от 3-х лет;
- Знание и опыт работы с классическими алгоритмами машинного обучения (линейные/логистические модели, деревья решений, ансамбли и др.);
- Опыт разработки полного цикла моделей машинного обучения с учетом бизнес-ценности, доведение до production;
- Уверенное владение Python и основными библиотеками для анализа данных и машинного обучения: pandas, scikit-learn, pyspark;
- Опыт работы с моделями градиентного бустинга: CatBoost, LightGBM и др.;
- Опыт работы с SQL базами данных и написание SQL-запросов (PostgreSQL, MS SQL, MySQL и др.);
- Желание прокачивать свои навыки в направлении прогнозирования спроса.
Будет плюсом:
-
Опыт работы с задачами прогнозирования спроса;
-
Математический бэкграунд;
-
Использование алгоритмов из статей arxiv/paperswithcode для решения задач;
-
Опыт с Hadoop/PySpark, Polars;
-
Навыки работы с Git, AirFlow, Docker.
Чем предстоит заниматься:
- Прогнозирование ежедневного спроса для регулярных, промо и комбо продаж на уровне товар-даркстор;
-
Улучшение существующих моделей прогнозирования;
-
Разработка и тестирование новых архитектур и подходов;
-
Формулировка и проверка гипотез, прототипирование решений;
-
Вывод моделей в production на Python;
-
Взаимодействие с продуктовыми и бизнес-командами.
Стек:
ML: прогнозирование временных рядов, модели регрессии, деревья, ансамбли, CatBoost, LightGBM, XGBoost, Prophet, sklearn, numpy, pandas, scipy;
Разработка: Python, GitLab, Docker, AirFlow;
Данные: MsSQL, PostgreSQL, MySQL, Kafka, S3, Greenplum
Процессы: Jira, Confluence.