Садовническая улица 82
Мы ищем эксперта в области компьютерного зрения, который готов присоединиться к нашей RnD-команде для создания и совершенствования ключевых технологий, решающих задачи визуального анализа на платформах VK. Ваши разработки станут основой для улучшения пользовательского опыта, автоматизации процессов и масштабирования наших сервисов. Вы будете создавать технологии для задач поиска видео и клипов на платформах компании VK, разрабатывать методы распознавания текстов, улучшать модели для модерации и категоризации визуальной информации, а также исследовать мультимодальные языковые модели (VLM) для решения задач внутренних продуктов компании.
Задачи
- Обучать большие языковые модели работать с визуальной информацией
- Улучшать CV-технологии для извлечения информации из визуальных данных
- Строить дата-пайплайны для сбора обучающих выборок и формирования бенчмарков
- Развивать пайплайны обучения и инференса моделей на GPU-кластере
- Изучать и реализовывать идеи и алгоритмы из актуальных научных статей
- Адаптировать модели и методы под продуктовые задачи
Требования
- Знаете алгоритмы и структуры данных, а также глубоко понимаете современные подходы в машинном обучении
- Уверенно владеете Python и имеете индустриальный опыт работы с PyTorch
- Обучали и внедряли модели LLM, сегментации, детекции, image и видео retrieval, а также другие нейросетевые решения в продакшен-окружение
- Интересуетесь последними достижениями в областях Vision-Language Models (VLM), Large Language Models (LLM), Computer Vision (CV) и Natural Language Processing (NLP)
- Умеете самостоятельно ставить исследовательские задачи, планировать эксперименты и доводить их до результата