ИТ B2C — самая крупная экосистема в Сбере. Нас более 8000 человек в 18 городах России. Мы занимаемся разработкой и развитием розничных решений, помогая сделать сервисы Банка доступнее, безопаснее и удобнее.
Ждем именно тебя!
Мы – команда экспертов, объединенных общей страстью к искусственному интеллекту и рекомендательным системам (RecSys).
Нашей главной задачей является создание современной, масштабируемой рекомендательной платформы, способной предвосхищать ожидания пользователей, предлагая персонализированные рекомендации на каждом этапе их взаимодействия с экосистемой Сбер. Наши решения охватывают широкий спектр отраслей: от финансов и e-commerce до индустрии развлечений и здравоохранения.
Развитие нашей платформы строится вокруг внедрения новых SOTA-моделей. Мы следим за мировыми трендами, экспериментируем с новыми подходами, внедряем их как часть платформы и доводим до конкретного применения в бизнесе. Ищем Machine Learning Engineer в команду для вывода в ПРОМ рекомендательных моделей Банка. Мы работаем с огромным количеством данных, и высоконагруженными сервисами, что делает нашу работу не только важной, но и технически интересной. Также от нас напрямую зависит развитие самого продукта рекомендательной платформы в Банке, так как именно мы определяем ключевые точки ее роста. Если вам близка идея быть первопроходцем, и вы хотите стоять у истоков новой технологии, присоединяйтесь к нам!
Обязанности
- разработка и совершенствование End-to-End ML-пайплайнов
- разработка продакшен-пайплайнов обработки данных
- работа с огромными объёмами данных Сбера (петабайты) на PySpark, исследование подходов применения их в моделях
- писать эффективный и масштабируемый код для тренировки и инференса моделей на PyTorch, проводить эксперименты на GPU-кластере
- performance оптимизации кода по обработке больших массивов данных или онлайн сервисов рекомендаций с высокой нагрузкой;
- менторинг младших членов команды, обмен знаниями и экспертизой.
Требования
- математический бэкграунд
- хорошее знание Python и ключевых фреймворков для работы с данными (PySpark, PyArrow, Pandas)
- опыт написания качественного production кода
- опыт написания промышленных пайплайнов обработки данных, содержащих множество шагов, зависимостей и сложную логику
- опыт использования Airflow (или другого industry-standard оркестраторов пайплайнов, т.к. Luigi, Dagster и т.д.)
- хорошее понимание баз данных SQL / NoSQL
- опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки.
Стек технологий:
- Python, PySpark, Airflow, Kubernetes, FastAPI, S3, PyTorch, MLFlow, Jira, Confluence, Git.
Условия
- гибридный/офисный формат работы (опционально)
- годовой бонус и ежегодный пересмотр
- расширенный ДМС с первого дня + стоматология и льготное страхование для семьи
- корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
- офис на Кутузовской с зонами отдыха и спортзалом
- 90 дней удаленной работы из любого региона РФ (не применимо для сопровождения)
- льготная ипотека в Сбере, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.