AI Engineer (LLM)

Дата размещения вакансии: 03.05.2026
Работодатель: Оператор связи Комфортел
Уровень зарплаты:
от 80000 до 120000 RUR
Город:
Санкт-Петербург
проспект Сизова 9
Требуемый опыт работы:
От 1 года до 3 лет

Комфортел — оператор связи для бизнеса с 17-летним опытом. Работаем со средним и крупным бизнесом, госучреждениями и другими операторами.

Мы — не бюрократическая корпорация, а компания, где решения принимаются быстро, и управление строится на здравом смысле, а не на сотнях регламентов.

Наши сотрудники — наша главная ценность. Средний срок работы в компании — 3,5 года, и это не случайность: мы инвестируем в людей, а они — в нас.

Мы растём ежегодно: по выручке, географии (офисы в СПб, Москве и Алматы) и команде.

Сейчас мы в поисках AI Engineer, которому интересна системная работа с большими языковыми моделями на всех этапах — от исследования и прототипирования до промышленного внедрения. В твоей зоне ответственности будет: выбор и адаптация моделей, проектирование архитектуры решений, построение автоматизированных пайплайнов, а также оценка качества и сопровождение в продуктивной среде.

Что мы предлагаем:

  • Свободу вместо регламентов: гибкий график, общение на «ты» и минимум бюрократии;

  • Просторный светлый офис у м. Комендантский проспект со всеми благами: чай, кофе, корпоративная библиотека, зона отдыха, кикер, автоматы со снеками, уютный сквер для обедов на свежем воздухе;

  • Официальное трудоустройство и работу в офисе (удаленный или гибридный формат работы предложить не можем);

  • Работу в сильной команде с возможностью многому научиться;
  • Карьеру без потолка: руководителей растим внутри, а не ищем на стороне;
  • Удобные рабочие места, оснащенные всем необходимым;
  • Дружный коллектив и непринужденную атмосферу.

Что нужно будет делать:

  • Проектирование и построение RAG-систем: подбор эмбеддингов, векторных баз данных, стратегий чанкинга и ранжирования;
  • Дообучение и адаптация LLM под задачи компании (fine-tuning, LoRA/QLoRA, PEFT);
  • Развёртывание и оптимизация локальных LLM (vLLM, llama.cpp, Ollama, TGI);
  • Prompt engineering: разработка системных промптов, цепочек рассуждений, few-shot стратегий;
  • Построение агентных систем и мультиагентных пайплайнов (tool use, function calling, планирование);
  • Проектирование и реализация автоматизированных рабочих процессов на базе no-code/low-code платформ (n8n, Make, Flowise, Langflow и аналоги);
  • Интеграция LLM через API и фреймворки (LangChain, LlamaIndex, CrewAI, AutoGen и др.);
  • Оценка качества ответов моделей: разработка eval-пайплайнов, бенчмарков и метрик;
  • Работа с мультимодальными моделями (vision, аудио, документы);
  • Исследование новых моделей, подходов и open-source решений, подготовка рекомендаций;
  • Настройка инфраструктуры: Docker-контейнеры, управление GPU-ресурсами, мониторинг;

Что мы ожидаем от вас:

  • Глубокое понимание принципов работы LLM: архитектура Transformer, токенизация, контекстное окно, температура, стратегии генерации;
  • Практический опыт работы с открытыми LLM (LLaMA, Mistral, Qwen, Gemma и т. д.);
  • Умение разворачивать модели локально и через API;
  • Опыт построения RAG-систем или понимание архитектуры на уровне, достаточном для самостоятельного проектирования;
  • Опыт работы с no-code/low-code платформами автоматизации (n8n, Make, Flowise, Langflow): построение сценариев, интеграция с внешними сервисами, подключение LLM-нод;
  • Знание Linux на уровне уверенного пользователя;
  • Умение работать с Docker;
  • Базовое владение хотя бы одним языком программирования или скриптинга для автоматизации и интеграций;
  • Умение читать техническую документацию на английском языке;
  • Навык быстро осваивать новые фреймворки и инструменты.

Будет преимуществом

  • Опыт prompt engineering в продуктовом контексте;
  • Знакомство с векторными БД (Qdrant, Milvus, ChromaDB, Weaviate);
  • Опыт работы с платформами для экспериментов (MLflow, W&B);
  • Понимание квантизации моделей (GPTQ, AWQ, GGUF);
  • Опыт с речевыми моделями (Whisper, TTS) или computer vision моделями;
  • Знакомство с Kubernetes;
  • Pet-проекты, публикации или активность в open-source сообществе.

Если ты самостоятельный специалист, готовый оперативно осваивать новые инструменты и способен трансформировать результаты экспериментов в устойчивые рабочие решения - ждём твоего отклика!