Data Scientist (СбербанкОнлайн)

Дата размещения вакансии: 02.06.2026
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Ищем Data Scientist инженера в команду СБОЛа.

Обязанности

  • разрабатывать и внедрять классические ML-модели для улучшения ИИ-сценариев агентов и помощника (классификация интентов, предсказание следующего действия пользователя, детекция аномалий, ранжирование ответов).
  • проводить исследовательский анализ данных (EDA) логов взаимодействий пользователей с мобильным приложением и помощником.
  • формировать признаки (feature engineering) на основе событий в СберБанк Онлайн, истории операций, поведения в диалогах.
  • участвовать в A/B-тестировании моделей: готовить данные, рассчитывать метрики, интерпретировать результаты.
  • автоматизировать процессы валидации и переобучения моделей (пайплайны на Python/SQL).
  • настраивать и обучать baseline-модели для задач LLM-приложений (например, рулевые модели, детекторы токсичности, классификаторы отказов).
  • взаимодействовать с аналитиками и разработчиками для интеграции ML-решений в прод (через API или признаковые таблицы).
  • анализировать качество работы ИИ-сценариев с точки зрения данных: полнота покрытия интентов, доля неуверенных ответов, корреляция с бизнес-метриками.
  • участвовать в проработке метрик модели (precision, recall, F1, lift) и мониторинга дрейфа данных/таргета.

Требования

  • аналитика данных — уверенное владение SQL (PostgreSQL). Умение писать сложные запросы, оконные функции, агрегации.
  • классический ML — деревья решений, случайный лес, градиентный бустинг (XGBoost / LightGBM / CatBoost), логистическая регрессия, кластеризация (KMeans, DBSCAN), снижение размерности (PCA).
  • Python — pandas, numpy, scikit-learn, matplotlib/seaborn. Умение писать production-подобный код без Jupyter-грязи.
  • понимание метрик ML — accuracy, precision, recall, ROC-AUC, PR-AUC, logloss, MSE/MAE для бизнес-кейсов.
  • Feature engineering — работа с категориальными переменными, временными рядами, агрегатами событий.
  • понимание жизненного цикла ML-модели (обучение, валидация, тестирование, мониторинг дрейфа).
  • работа с логами и событиями — умение извлекать целевую переменную из сырых логов приложения и ИИ-помощника.

Будет плюсом:

  • опыт работы с Greenplum / Hadoop (Hive) / PySpark — для работы с большими объёмами логов мобильного приложения.
  • базовое понимание LLM, RAG, эмбеддингов (например, уметь использовать sentence-transformers как источник признаков).
  • знание, как оценить качество ИИ-агента не только моделью, но и пользовательскими метриками (CR, CSAT, retention).
  • опыт в финтехе или продуктах с высокой нагрузкой и требованиями к безопасности/Опыт работы с мобильными приложениями
  • понимание, как деплоить модель в виде микросервиса (Flask/FastAPI + Docker).

Условия

  • формат работы гибрид из Москвы
  • офис Кутузовская 32к1
  • срочный трудовой договор (декретная ставка) на период от года
  • стабильный оклад и социальная поддержка сотрудников
  • расширенный ДМС с первого дня и льготное страхование для близких
  • корпоративное обучение за счет компании
  • бесплатную подписку СберПрайм+ и скидки на продукты компаний-партнеров
  • мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы
  • многофункциональный спортивный зал (бесплатно).