Москва
Команда RnD CV занимается исследованиями мультимодальных моделей в области компьютерного зрения. Мы стремимся довести результаты исследований до прикладного применения и сделать флагманскую модель GigaChat умнее, лучше и полезнее.
Обязанности
- Практический опыт в компьютерном зрении, включая обработку видео (распознавание, трекинг, анализ временных последовательностей)
- Работа с большими мультимодальными языковыми моделями, VLM (LLaVA, QwenVL, DeepSeekVL и т.д.)
- Обучение, валидация и имплементация новых state-of-the-art подходов для задач компьютерного зрения
- Работа с VLM в домене видео и омни-модальности
- Публикация результатов исследований в топовых научных конференциях
Требования
- Опыт дообучения моделей (Supervised Fine-Tuning)
- Публикации уровня А/А* и опыт написания статей
- Призовые места в соревнованиях по машинному обучению (Kaggle, etc.)
Условия
- отсутствие проблем с вычислительными мощностями
- удаленка или современный agile-офис по желанию
- ДМС, программы лояльности для сотрудников
- бесплатный фитнес-зал, бесплатная парковка
- конкурентная зарплата!