з/п не указана
Москва
От 3 до 6 лет
Ищем Data Scientist инженера в команду СБОЛа.
Обязанности
- разрабатывать и внедрять классические ML-модели для улучшения ИИ-сценариев агентов и помощника (классификация интентов, предсказание следующего действия пользователя, детекция аномалий, ранжирование ответов).
- проводить исследовательский анализ данных (EDA) логов взаимодействий пользователей с мобильным приложением и помощником.
- формировать признаки (feature engineering) на основе событий в СберБанк Онлайн, истории операций, поведения в диалогах.
- участвовать в A/B-тестировании моделей: готовить данные, рассчитывать метрики, интерпретировать результаты.
- автоматизировать процессы валидации и переобучения моделей (пайплайны на Python/SQL).
- настраивать и обучать baseline-модели для задач LLM-приложений (например, рулевые модели, детекторы токсичности, классификаторы отказов).
- взаимодействовать с аналитиками и разработчиками для интеграции ML-решений в прод (через API или признаковые таблицы).
- анализировать качество работы ИИ-сценариев с точки зрения данных: полнота покрытия интентов, доля неуверенных ответов, корреляция с бизнес-метриками.
- участвовать в проработке метрик модели (precision, recall, F1, lift) и мониторинга дрейфа данных/таргета.
Требования
- аналитика данных — уверенное владение SQL (PostgreSQL). Умение писать сложные запросы, оконные функции, агрегации.
- классический ML — деревья решений, случайный лес, градиентный бустинг (XGBoost / LightGBM / CatBoost), логистическая регрессия, кластеризация (KMeans, DBSCAN), снижение размерности (PCA).
- Python — pandas, numpy, scikit-learn, matplotlib/seaborn. Умение писать production-подобный код без Jupyter-грязи.
- понимание метрик ML — accuracy, precision, recall, ROC-AUC, PR-AUC, logloss, MSE/MAE для бизнес-кейсов.
- Feature engineering — работа с категориальными переменными, временными рядами, агрегатами событий.
- понимание жизненного цикла ML-модели (обучение, валидация, тестирование, мониторинг дрейфа).
- работа с логами и событиями — умение извлекать целевую переменную из сырых логов приложения и ИИ-помощника.
Будет плюсом:
- опыт работы с Greenplum / Hadoop (Hive) / PySpark — для работы с большими объёмами логов мобильного приложения.
- базовое понимание LLM, RAG, эмбеддингов (например, уметь использовать sentence-transformers как источник признаков).
- знание, как оценить качество ИИ-агента не только моделью, но и пользовательскими метриками (CR, CSAT, retention).
- опыт в финтехе или продуктах с высокой нагрузкой и требованиями к безопасности/Опыт работы с мобильными приложениями
- понимание, как деплоить модель в виде микросервиса (Flask/FastAPI + Docker).
Условия
- формат работы гибрид из Москвы
- офис Кутузовская 32к1
- срочный трудовой договор (декретная ставка) на период от года
- стабильный оклад и социальная поддержка сотрудников
- расширенный ДМС с первого дня и льготное страхование для близких
- корпоративное обучение за счет компании
- бесплатную подписку СберПрайм+ и скидки на продукты компаний-партнеров
- мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы
- многофункциональный спортивный зал (бесплатно).