з/п не указана
Москва
От 1 года до 3 лет
Обязанности:
- Переводить бизнес-цели в ML-задачи, формулировать гипотезы и определять метрики успеха (ML-метрики и бизнес-метрики);
- Проводить EDA, статистический анализ и проверку гипотез;
- Разрабатывать признаки (feature engineering) и обучать модели на данных из DWH;
- Создавать и тестировать модели сегментации клиентов и рекомендательные алгоритмы (ALS/BPR, бустинг, похожесть, ранжирование);
- Обеспечивать интерпретируемость решений (FE, SHAP/LIME и др.) и подготовку понятных выводов для бизнеса;
- Совместно с DE и BI-командой интегрировать результаты (сегменты, скоринги) в витрины данных, Power BI или иные системы;
- Оценивать эффекты кампаний (uplift, ROI), участвовать в дизайне и анализе A/B-тестов;
- Документировать подходы (ноутбуки, Confluence/репозиторий) и обеспечивать воспроизводимость решений;
- Участвовать в полном цикле ML-разработки: от постановки задачи и подготовки данных до запуска, мониторинга и итерационного улучшения моделей;
- Инициировать улучшения — предлагать новые модели и подходы, которые могут дать дополнительный бизнес-эффект.
Требования:
- Уверенный Python: pandas/polars, numpy, scikit-learn, xgboost/catboost и другие типовые библиотеки DS;
- Классический ML: регрессия, бустинг, кластеризация, ранжирование (понимание, когда и что применять);
- SQL на уровне уверенной работы с витринами и аналитическими запросами;
- Понимание метрик качества моделей и бизнес-эффекта (uplift, ROI, конверсия, LTV и т.п.);
- Опыт работы с транзакционными/клиентскими данными (ритейл, e-commerce, программы лояльности или схожие домены);
- Умение донести результаты и предложить бизнес-интерпретацию (графики, дашборды, презентации);
- Хорошая база по математической статистике: распределения, доверительные интервалы, критерии значимости, регрессия, бутстрэп и т.д.;
- Опыт работы с Git (ветвление, pull request, code review) и умение аккуратно вести репозиторий проектов;
- Уверенная работа в среде Linux (терминал, работа с файлами и логами, базовые команды);
- Английский язык на уровне чтения технической документации и статей.
-
Будет плюсом
- Опыт деплоя моделей: batch-скоринг, сохранение результатов в витрины, трекинг экспериментов (MLflow или аналоги);
- Навык настройки простых оркестраций (Airflow, Prefect или аналоги);
- Опыт проведения A/B-тестов, применение техник CUPED, стратификация, анализ неоднородных эффектов;
- Знание PyTorch/TensorFlow, опыт в NLP/LLM — как направление развития (в компании есть текущие проекты);
- Опыт работы с ClickHouse/Postgres;
- Опыт построения рекомендательных систем, скорингов лояльности, churn-моделей, next-best-offer / next-best-action;
- Понимание принципов MLOps (мониторинг деградации моделей, переобучение, управление версиями моделей);
- Опыт работы в связке с BI (Power BI, Tableau и др.): формирование витрин, метрик, дашбордов для пользователей.