Обязанности:
Работа с данными
- Первичный анализ данных
- Подготовка наборов данных в соответствии с требованиями проектов
- Постановка задач на создание витрин и разметки данных
Разработка и экспериментирование с моделями
- Проведение экспериментов с видами и структурами моделей
- Тестирование и оценка качества моделей
- Оптимизация моделей (ускорение работы, снижение ошибок)
- Регулярное переобучение моделей при появлении новых данных
Внедрение и интеграция LLM в процессы
- Участие в разработке RAG-системы на базе LLM
- Использование LangChain
- Написание вспомогательных скриптов для подготовки и предобработки данных
- Взаимодействие с веб-разработчиками для интеграции ML-моделей в существующие сервисы
- Подготовка документации о работе с моделями
Обучение и развитие
- Изучение современных подходов и библиотек для LLM (PyTorch, LangChain, LoRA и др.)
- Участие в митапах, мероприятиях, командных обсуждениях для обмена знаниями
- Постоянное совершенствование навыков
Требования:
1. Опыт работы с моделями ML
2. Знание современных библиотек и подходов ML (например, Attention, transformers).
3. Опыт работы с RAG-системами и LangChain.
4. Хорошие навыки в области разработки (Python, streamlit).
5. Умение работать в команде и способность быстро обучаться новым технологиям.
6. Понимание Agile-практик. Желателен опыт участия в Scrum или Kanban-процессе
Будет плюсом:
- Опыт использования Docker, базовое представление об MLOps-инструментах
- Работа с SQL/NoSQL-базами данных для хранения и подготовки аудиоматериалов
- Участие в конкурсах (Kaggle, ML-трек хакатонов) или активность в open-source проектах
- Пройденные онлайн-курсы или сертификации в области Data Science/ML.
Условия:
- Работа в молодом и дружном коллективе, где ценится инициатива и желание учиться
- Наставничество со стороны более опытных специалистов и регулярная обратная связь
- Участие в реальных проектах, влияющих на продукты компании.