Москва
Мы развиваем современные нейросетевые подходы для обработки огромного количества данных. Наша цель — разработать мощную базовую модель, которая станет ядром для множества продуктов и решений компании. Мы работаем на стыке различных направлений, таких как RecSys, NLP, TimeSeries и др. Перед нами стоит множество задач по исследованию новых и адаптации текущих подходов из индустрии.
Обязанности
- Разрабатывать и обучать модели в распределенном режиме
- Исследовать новые подходы для разных этапов обучения: pretraining и адаптации модели под конкретные задачи
- Исследовать multi-task подходы
- Работать с огромным количеством данных, в том числе с текстами
- Пилотировать модели, тестировать их в продакшн-среде и влиять на ключевые бизнес-решения
- Оптимизировать инфраструктуру для обучения и инференса больших моделей.
Требования
- Опыт в DL, отлично понимать архитектуры трансформеров и тонкости их обучения
- Работа с распределенным обучением (DDP, DeepSpeed, FSDP)
- Уметь писать эффективный код на Python и PyTorch.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Формат работы - офис
- Ежегодный пересмотр зарплаты, годовая премия
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- Вознаграждение за рекомендацию друзей в команду Сбера.