Middle+/Senior Data Scientist (Прогноз спроса)

Дата размещения вакансии: 22.09.2025

Работодатель: Ecom.tech

Уровень зарплаты:

з/п не указана

Город:

Москва

Требуемый опыт работы:

От 3 до 6 лет

Сейчас мы ищем Middle+/Senior Data Scientist в команду Прогноза спроса.

О продукте:

Продукт «Прогноз спроса» предназначен для автоматизации процесса прогнозирования регулярных и промо продаж. Результаты прогнозов позволяют другим продуктам и подразделениям эффективно планировать ресурсы логистики, рассчитывать промо акции и оперативно реагировать на изменение спроса.

От успешного соискателя мы ожидаем:

Опыт работы в Data Science от 3-х лет;
Знание и опыт работы с классическими алгоритмами машинного обучения (линейные/логистические модели, деревья решений, ансамбли и др.);
Опыт разработки полного цикла моделей машинного обучения с учетом бизнес-ценности, доведение до production;
Уверенное владение Python и основными библиотеками для анализа данных и машинного обучения: pandas, scikit-learn, pyspark;
Опыт работы с моделями градиентного бустинга: CatBoost, LightGBM и др.;
Опыт работы с SQL базами данных и написание SQL-запросов (PostgreSQL, MS SQL, MySQL и др.);
Желание прокачивать свои навыки в направлении прогнозирования спроса.

Будет плюсом:

Опыт работы с задачами прогнозирования спроса;
Математический бэкграунд;
Использование алгоритмов из статей arxiv/paperswithcode для решения задач;
Опыт с Hadoop/PySpark, Polars;
Навыки работы с Git, AirFlow, Docker.

Чем предстоит заниматься:

Прогнозирование ежедневного спроса для регулярных, промо и комбо продаж на уровне товар-даркстор;
Улучшение существующих моделей прогнозирования;
Разработка и тестирование новых архитектур и подходов;
Формулировка и проверка гипотез, прототипирование решений;
Вывод моделей в production на Python;
Взаимодействие с продуктовыми и бизнес-командами.

Стек:

ML: прогнозирование временных рядов, модели регрессии, деревья, ансамбли, CatBoost, LightGBM, XGBoost, Prophet, sklearn, numpy, pandas, scipy;

Разработка: Python, GitLab, Docker, AirFlow;

Данные: MsSQL, PostgreSQL, MySQL, Kafka, S3, Greenplum

Процессы: Jira, Confluence.

Откликнуться