Наша команда — это центр экспертизы в области прогнозирования Customer Lifetime Value (CLTV) для клиентов Сбербанка. Мы находимся на стыке передовых R&D-исследований и их бизнес-внедрения в реальные процессы одного из крупнейших банков Европы. Наша цель — создавать полноценные AI-продукты, которые не только предсказывают будущее, но и помогают его формировать.
Сейчас мы ищем сильного Senior Data Scientist, который усилит нашу команду в области классического Machine Learning и глубоко разбирается в работе с последовательностями событий. Вы будете работать с огромными массивами данных, строить и внедрять state-of-the-art модели, которые напрямую влияют на стратегию работы с десятками миллионов клиентов.
Обязанности
- Разработка и имплементация ML-моделей для прогнозирования CLTV на основе данных о 100+ млн розничных клиентов.
- Создание и тестирование представлений (embeddings) клиентов на основе их транзакционной и поведенческой истории для улучшения прогнозов.
- Работа с SOTA-подходами: применение и адаптация современных архитектур для моделирования последовательностей событий (Transformer, LSTM, RNN) и классического машинного обучения (Gradient Boosting, Random Forest) на табличных данных.
- Разработка методологии расчета эластичности и чувствительности прогнозов CLTV к действиям банка и изменениям свойств клиентов (Causal AI подходы).
- Поиск, объединение и нормализация данных из различных источников для обогащения модельных признаков.
- Взаимодействие с внешними R&D-исследователями: интеграция передовых академических наработок в наш продуктовый контур.
- Менторство и лидерство: руководство командой DS-разработчиков, постановка задач, ревью кода и методологий.
Мы ищем кандидата, который:
- Имеет глубокий опыт (3+ года) в разработке и внедрении машинных моделей в продакшн
- В идеале силен в классическом ML: уверенно владеет алгоритмами (Gradient Boosting, Random Forest), feature engineering и валидацией моделей на табличных данных
- Обладает опытом работы с моделями последовательностей (Transformer, LSTM, RNN) и понимает, как их применять для прогнозирования.
- Имеет серьезный опыт работы с большими данными (Spark, Hadoop, GreenPlum)
- Понимает или имеет практический интерес к областям Causal Inference и Uplift-моделированию
- Имеет общее понимание корпоративных продуктов и бизнес-процессов в крупных компаниях (желательно, но не обязательно в финтехе)
- Обладает лидерскими качествами, готов брать на себя ответственность и менторить коллег
- Имеет степень в области Computer Science, Mathematics, Physics или другой смежной технической специальности.
Будет преимуществом:
- Опыт в построении и применении embeddings для сущностей (клиентов, продуктов, событий)
- Знакомство с фреймворками для глубокого обучения (PyTorch, TensorFlow)
- Опыт работы в кросс-функциональной product-oriented команде
- Навыки эффективного взаимодействия с командой исследователей (R&D).
Условия
- Очень сильная команда с которой можно расти вместе
- Масштабные, сложные и разнообразные задачи
- Есть возможность влиять на развитие продукта и результат
- Гибкий график для оптимального баланса работы и личной жизни
- Самые инновационные, амбициозные проекты и задачи
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- Ипотека для сотрудников выгоднее до 4%
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- Вознаграждение за рекомендацию друзей в команду Сбера.