з/п не указана
Москва
Смольная 14
Смольная 14
От 1 года до 3 лет
Обязанности:
- Отвечать за разработку, адаптацию и внедрение ML/LLM-моделей, используемых в прикладных ИИ-сервисах: ассистентах, RAG-системах, классификаторах, анализе звонков/текста, генерации и рекомендациях.
-
Роль включает в себя работу с собственными и с open-source моделями: их выбор, настройку, finetune и подготовку к продакшну.
-
Основной фокус — качество моделей и стабильность инференса в продуктивной эксплуатации.
Требования:
- Python, PyTorch, HuggingFace Transformers (опыт использования в проектах).
-
Опыт fine-tuning open-source моделей (LoRA/QLoRA/PEFT) и подготовки к продакшену.
-
Практический опыт в NLP-задачах: классификация, генерация, RAG, семантический поиск.
- Опыт работы с данными: сбор, очистка, балансировка, создание воспроизводимых пайплайнов (SQL, Pandas).
- Опыт с RAG-системами (Qdrant, Pinecone), мультимодальными моделями, мониторингом качества в продакшене.
- Понимание ML-метрик и методов оценки качества (F1, BLEU, Recall@k).
- Опыт работы с инференсом (Triton/vLLM/ONNX).
- Опыт с мультимодальными моделями (аудио/изображения/документы).
- Навыки работы в команде: согласование API, документирование, версионирование.
Условия:
- График работы гибридный (посещение офиса 2 дня в неделю);
- Дополнительная ежеквартальная премия;
- Оформление в соответствии с ТК РФ в IT аккредитованную компанию;
- Кафетерий льгот на выбор (питание, спорт-карта, ДМС);
- 10% скидки на покупки в магазинах, бонусы по корпоративной карте лояльности.