LLM разработчик

Дата размещения вакансии: 01.07.2026
Работодатель: БЮРО 1440
Уровень зарплаты:
з/п не указана
Город:
Москва
улица Мнёвники
Требуемый опыт работы:
От 3 до 6 лет

Мы запускаем AI‑направление в молодой растущей компании и ищем сильного инженера, который станет ключевой фигурой в формировании этого трека. Роль предполагает не только глубокую техническую проработку решений, но и ответственность за архитектуру, экономику и качество AI‑продуктов внутри компании.
Наша основная цель — закрыть класс задач по внутренней автоматизации: техподдержка, онбординг, чат‑боты, обработка обращений, работа со справочниками и базой знаний. Список задач будет расширяться по мере роста зрелости направления.

Чем предстоит заниматься:

  • Проектировать и реализовывать AI‑решения на базе готовых LLM для задач внутренней автоматизации (техподдержка, онбординг, чат‑боты, поиск по корпоративным данным, работа со справочниками).
  • Формировать архитектурные решения направления: определять общие подходы и создавать инфраструктуру, которую можно переиспользовать в разных проектах.
  • Участвовать в выборе следующих пилотов: оценивать техническую реализуемость и стоимость, приоритизировать по соотношению эффекта и сложности.
  • Собирать, очищать и подготавливать данные из разрозненных корпоративных систем для AI‑проектов.
  • Развёртывать и эксплуатировать AI‑решения, в том числе на собственной инфраструктуре.
  • Поддерживать систему оценки качества: формировать тестовые наборы, проводить регрессионное тестирование.
  • Контролировать стоимость эксплуатации: мониторить расход токенов, подбирать оптимальные модели под конкретные задачи.
  • Проводить code review и осуществлять техническое наставничество двух инженеров команды.
  • Готовить и защищать технические решения перед руководителем направления.

Что мы ожидаем:

  • От 1 года в продуктовых проектах с LLM в эксплуатации (ChatGPT, Claude или аналоги в проде). Формальный стаж в разработке не является определяющим — важнее содержание и масштаб реализованных решений.
  • Опыт построения retrieval‑систем (RAG), доведённых до реальных пользователей.
  • Опыт сбора и подготовки данных из нескольких разрозненных корпоративных систем: выгрузка, очистка, приведение к единому виду.
  • Опыт развёртывания LLM на собственной инфраструктуре (vLLM, Ollama, llama.cpp или аналоги).
  • Регулярный опыт проведения code review и работы с младшими коллегами в составе команды.
  • Понимание подхода к оценке качества LLM‑систем: работа с тестовыми наборами, выбор и применение мет:рик. Опыт построения таких систем будет преимуществом.

Что для нас важно:

  • Python production‑уровня: грамотная структура проектов, написание тестов, обработка ошибок, работа с асинхронностью.
  • Retrieval‑пайплайны: чанкование, работа с эмбеддингами, использование векторных баз (pgvector, Qdrant, Chroma), гибридный поиск (BM25 + векторный), реранкинг.
  • Prompt‑инжиниринг: версионирование промптов, структурированный вывод, применение few‑shot‑примеров, декомпозиция сложных задач.
  • Работа с LLM API (OpenAI‑совместимые, Anthropic) и self‑host‑решениями (vLLM, Ollama, llama.cpp): развёртывание, оценка требований к железу, применение квантизации.
  • Инженерия данных: выгрузка данных из БД, API и корпоративных систем, очистка и обработка неполных данных.
  • Бэкенд‑навыки: разработка REST API, работа с очередями, обработка ошибок, настройка ретраев, логирование, контроль расходов на токены.
  • MLOps: логирование запросов к LLM, мониторинг качества и расхода токенов в проде, настройка алертинга.

Мы предлагаем:

  • Работу в аккредитованной ИТ-компании
  • ДМС с первого дня работы
  • Шаг в космос - для тех, кто вдохновлен идеей покорения космоса и мечтает быть к этому причастным
  • Гибридный или удаленный формат работы;
  • Оформление в соответствии с ТК РФ;
  • Конкурентный уровень заработной платы - на уровне лидеров ИТ/телеком-индустрии.