Промпт/NLP/LLM-инженер (Middle)

Дата размещения вакансии: 23.04.2025
Работодатель: KVINT
Уровень зарплаты:
з/п не указана
Город:
Санкт-Петербург
Требуемый опыт работы:
От 1 года до 3 лет

Компания KVINT – ведущая компания по разработке и внедрению голосовых роботов/виртуальных ассистентов.

Основной продукт – голосовые виртуальные ассистенты, способные заменить живого человека на телефоне на входящих и исходящих звонках, во время которых роботы полностью имитируют живое человеческое общение по телефону, и люди не догадываются, что общаются с роботом.
Решение построено на нейронных моделях, содержит технологии синтеза и распознавания речи, обработки естественного языка и управления диалогом.
Мы ищем человека, который хочет принимать участие в создании крупного и интересного проекта, обладает высокой квалификацией и готов работать в команде. Если вы уверены в своих способностях и ищете новые вызовы, мы будем рады видеть вас в нашей команде!

Кого мы ищем:

Мы ищем инженера, который усилит нашу команду NLP промпт инженеров и поможет нам усовершенствовать голосовых ботов на основе LLM.

Ваши задачи:

  • Проектирование и настройка цепочек LLM (prompt engineering, retrieval augmented generation, инструменты типа LangChain/LlamaIndex)

  • Интеграция моделей с базами знаний (векторные базы, SQL/Graph, документы)

  • Построение систем голосового взаимодействия с поддержкой сложных пользовательских сценариев

  • Разработка и бенчмаркинг промптов под разные задачи (инструкционные, множественные шаги, reasoning и т.д.)

  • Классические задачи NLP (NER, классификация, embedding-based поиск) — по необходимости

  • Анализ качества моделей, настройка пайплайнов оценки, участие в R&D по выбору архитектур и подходов

Требования:

  • Уверенная база в современных NLP-подходах: трансформеры, эмбеддинги, семантический поиск, генерация

  • Опыт работы с BERT-Like и LLM моделями (GPT, Mistral, LLaMA, Claude, Gemini и др.), понимание их ограничений и тонкостей работы

  • Умение работать с retrieval-augmented generation, vector store’ами (FAISS, Qdrant, Weaviate и др.)

  • Навыки prompt engineering: от базовых до продвинутых методов (chain-of-thought, tool usage, reasoning)

  • Опыт разработки на Python (в т.ч. с использованием PyTorch и/или Hugging Face Transformers)

  • Опыт контейнеризации с Docker

Будет плюсом:

  • Опыт работа с RAG

  • Опыт настройки LangChain, LlamaIndex или аналогичных фреймворков

  • Опыт тонкой настройки (fine-tuning), LoRA, quantization

  • Понимание архитектур multi-agent систем

Условия:

  • Участие в проекте на переднем крае voice+LLM технологий

  • Возможность экспериментировать и внедрять самые свежие подходы из мира AI

  • Команда, с которой не скучно: опытные ML и backend инженеры, продукт, маркетинг

  • Конкурентная заработная плата + бонусы

  • Возможность работать на полной удаленке
  • Зарплатные ожидания обсуждаются на собеседовании и всегда принимаются во внимание при оффере