Чем предстоит заниматься:
- Построение и обучение моделей машинного обучения
- Проведение исследований в новых направлениях с использованием нейронных сетей
- Разработка моделей анализа информации
- Разработка ассистентов и чат-ботов под нужны организации с учетом базовых скриптов и сценариев взаимодействия с пользователями
- Поддержка и обновление нейросетей в соответствии с изменениями в бизнесе
- Аналитика качества моделей
Требования:
- Высшее образование (компьютерные науки, инженерия, статистика, математика или смежные области)
- Минимум 3 года опыта работы в управлении тематическими или техническое данными,инжиниринге данных или анализе данных
- Уверенное знание Python и основных библиотек анализа данных
- Уверенное знание SQL, опыт работы с различными типами СУБД
-Знание основ Data Science, хорошие аналитические способности
- Опыт разработки RESTful API и интеграция с внешними сервисами
- Опыт в сфере NLP
- Опыт работы с популярными LLM : Gpt3.5/4, LLama2, Falcon
- Опыт работы с генеративными моделями, транcформерами
- Понимание архитектуры современных языковых моделей
- Навыки работы с библиотеками PyTorch, TensorFlow (для возможности fine-tuning LLM под
конкретную задачу)
- Разработка векторизованных баз знаний
- Умение работать с Git
- Успешный опыт работы с извлечением и обработкой данных из разных источников
- Знание английского языка, достаточного для чтения документации
Приветствуется:
- Опыт работы с фреймворками Langchain, LlamaIndex, OpenAI
- Практические знания в областях хранения данных, моделирования, управления и визуализации данных
- Разработка проектов LLM (ассистенты, чат-боты)
Условия:
-График работы 5/2 с 10-00 до 19.00 по московскому времени;
-Удаленный формат работы из любой страны.