Москва
Команда RnD CV занимается исследованиями мультимодальных моделей в области компьютерного зрения. Мы стремимся довести результаты исследований до прикладного применения и сделать флагманскую модель GigaChat умнее, лучше и полезнее.
Обязанности
- работать с большими мультимодальными языковыми моделями, VLM (LLaVA, QwenVL, DeepSeekVL и т.д.)
- обучать, валидировать и имплементировать новые state-of-the-art подходы для задач CV
- работать с VLM в домене видео и омни-модальности
- публиковать результатв исследований в топовых научных конференциях.
Требования
- практический опыт в компьютерном зрении, включая обработку видео (распознавание, трекинг, анализ временных последовательностей)
- опыт дообучения моделей (Supervised Fine-Tuning)
- публикации уровня А/А* и опыт написания статей (при желаниии)
- призовые места в соревнованиях по машинному обучению (Kaggle, etc.)
Условия
- комфортный современный офис рядом с м. Кутузовская
- возможность выбрать удобный график – офис/гибрид/удаленка (РФ)
- годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников по дисконтной прогамме
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.