Data Scientist / Дата-сайентист

Дата размещения вакансии: 27.11.2025
Работодатель: Трейд Ойл
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Обязанности:

  • Переводить бизнес-цели в ML-задачи, формулировать гипотезы и определять метрики успеха (ML-метрики и бизнес-метрики);
  • Проводить EDA, статистический анализ и проверку гипотез;
  • Разрабатывать признаки (feature engineering) и обучать модели на данных из DWH;
  • Создавать и тестировать модели сегментации клиентов и рекомендательные алгоритмы (ALS/BPR, бустинг, похожесть, ранжирование);
  • Обеспечивать интерпретируемость решений (FE, SHAP/LIME и др.) и подготовку понятных выводов для бизнеса;
  • Совместно с DE и BI-командой интегрировать результаты (сегменты, скоринги) в витрины данных, Power BI или иные системы;
  • Оценивать эффекты кампаний (uplift, ROI), участвовать в дизайне и анализе A/B-тестов;
  • Документировать подходы (ноутбуки, Confluence/репозиторий) и обеспечивать воспроизводимость решений;
  • Участвовать в полном цикле ML-разработки: от постановки задачи и подготовки данных до запуска, мониторинга и итерационного улучшения моделей;
  • Инициировать улучшения — предлагать новые модели и подходы, которые могут дать дополнительный бизнес-эффект.

Требования:

  • Уверенный Python: pandas/polars, numpy, scikit-learn, xgboost/catboost и другие типовые библиотеки DS;
  • Классический ML: регрессия, бустинг, кластеризация, ранжирование (понимание, когда и что применять);
  • SQL на уровне уверенной работы с витринами и аналитическими запросами;
  • Понимание метрик качества моделей и бизнес-эффекта (uplift, ROI, конверсия, LTV и т.п.);
  • Опыт работы с транзакционными/клиентскими данными (ритейл, e-commerce, программы лояльности или схожие домены);
  • Умение донести результаты и предложить бизнес-интерпретацию (графики, дашборды, презентации);
  • Хорошая база по математической статистике: распределения, доверительные интервалы, критерии значимости, регрессия, бутстрэп и т.д.;
  • Опыт работы с Git (ветвление, pull request, code review) и умение аккуратно вести репозиторий проектов;
  • Уверенная работа в среде Linux (терминал, работа с файлами и логами, базовые команды);
  • Английский язык на уровне чтения технической документации и статей.
  • Будет плюсом

  • Опыт деплоя моделей: batch-скоринг, сохранение результатов в витрины, трекинг экспериментов (MLflow или аналоги);
  • Навык настройки простых оркестраций (Airflow, Prefect или аналоги);
  • Опыт проведения A/B-тестов, применение техник CUPED, стратификация, анализ неоднородных эффектов;
  • Знание PyTorch/TensorFlow, опыт в NLP/LLM — как направление развития (в компании есть текущие проекты);
  • Опыт работы с ClickHouse/Postgres;
  • Опыт построения рекомендательных систем, скорингов лояльности, churn-моделей, next-best-offer / next-best-action;
  • Понимание принципов MLOps (мониторинг деградации моделей, переобучение, управление версиями моделей);
  • Опыт работы в связке с BI (Power BI, Tableau и др.): формирование витрин, метрик, дашбордов для пользователей.