з/п не указана
Москва
От 3 до 6 лет
Разрабатываем и внедряем передовые методы оптимизации обучения и инференса сверхкрупных нейронных сетей (десятки миллиардов параметров) для мультимодальных генеративных моделей.
Обязанности
- разработка и обучение диффузионных моделей для инструктивного редактирования видео и изображений
- исследование архитектур для совместной генерации видео и синхронизированного аудио по текстовому промпту
- создание пайплайна RLHF для тонкой настройки моделей: обучение мультимодальных reward-моделей (видео/аудио/текст).
- интеграция алгоритмов RL (PPO, DPO, GRPO) в диффузионный пайплайн
- проектирование экспериментов, анализ результатов
- тесная коллаборация с Distributed Engineers для эффективной имплементации идей.
Требования
- экспертный уровень Python, PyTorch
- опыт работы с ML-компиляторами и оптимизацией инференса и обучения
- глубокое понимание методов квантизации, дистилляции и спарсификации
- навыки профилирования и оптимизации производительности (PyTorch Profiler, Nsight Systems, perf)
- понимание архитектур современных LLM и Diffusion-моделей
Бонус: Опыт оптимизации на CPU/ASIC/FPGA, публикации на NeurIPS/ICML/MLSys, знание C++.
Условия
- комфортный современный офис рядом с м. Кутузовская
- формат работы гибрид
- ежегодный пересмотр зарплаты, квартальная и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- программа адаптации и помощь руководителя на старте
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека выгоднее до 7% для каждого сотрудника
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера