Чем предстоит заниматься:
• Разработка и внедрение моделей машинного обучения для обработки и анализа данных из визуальных и текстовых источников.
• Исследование и реализация современных подходов в области Vision-Language Models (VLM).
• Оптимизация существующих моделей для повышения их производительности и точности.
• Сотрудничество с командой исследователей и инженеров для интеграции ML решений в производственные системы.
• Участие в процессе сбора, очистки и подготовки данных для обучения моделей.
• Проведение экспериментов и анализ результатов для улучшения качества моделей.
Требования:
- Высшее образование (компьютерные науки, инженерия, статистика, математика или смежные области)
- Минимум 3 года опыта работы в управлении тематическими или техническое данными,инжиниринге данных или анализе данных
- Уверенное знание Python и основных библиотек анализа данных
- Уверенное знание SQL, опыт работы с различными типами СУБД
-Знание основ Data Science, хорошие аналитические способности
- Опыт разработки RESTful API и интеграция с внешними сервисами
- Опыт в сфере NLP
- Опыт работы с популярными LLM : Gpt3.5/4, LLama2, Falcon
- Опыт работы с генеративными моделями, транcформерами
- Понимание архитектуры современных языковых моделей
- Навыки работы с библиотеками PyTorch, TensorFlow (для возможности fine-tuning LLM под
конкретную задачу)
- Разработка векторизованных баз знаний
- Умение работать с Git
- Успешный опыт работы с извлечением и обработкой данных из разных источников
- Знание английского языка, достаточного для чтения документации
Условия:
-График работы 5/2 с 10-00 до 19.00 по московскому времени;
-Удаленный формат работы из любой страны.