LLM разработчик

Дата размещения вакансии: 01.07.2026

Работодатель: БЮРО 1440

Уровень зарплаты:

з/п не указана

Город:

Москва
улица Мнёвники

Требуемый опыт работы:

От 3 до 6 лет

Мы запускаем AI‑направление в молодой растущей компании и ищем сильного инженера, который станет ключевой фигурой в формировании этого трека. Роль предполагает не только глубокую техническую проработку решений, но и ответственность за архитектуру, экономику и качество AI‑продуктов внутри компании.
Наша основная цель — закрыть класс задач по внутренней автоматизации: техподдержка, онбординг, чат‑боты, обработка обращений, работа со справочниками и базой знаний. Список задач будет расширяться по мере роста зрелости направления.

Чем предстоит заниматься:

Проектировать и реализовывать AI‑решения на базе готовых LLM для задач внутренней автоматизации (техподдержка, онбординг, чат‑боты, поиск по корпоративным данным, работа со справочниками).
Формировать архитектурные решения направления: определять общие подходы и создавать инфраструктуру, которую можно переиспользовать в разных проектах.
Участвовать в выборе следующих пилотов: оценивать техническую реализуемость и стоимость, приоритизировать по соотношению эффекта и сложности.
Собирать, очищать и подготавливать данные из разрозненных корпоративных систем для AI‑проектов.
Развёртывать и эксплуатировать AI‑решения, в том числе на собственной инфраструктуре.
Поддерживать систему оценки качества: формировать тестовые наборы, проводить регрессионное тестирование.
Контролировать стоимость эксплуатации: мониторить расход токенов, подбирать оптимальные модели под конкретные задачи.
Проводить code review и осуществлять техническое наставничество двух инженеров команды.
Готовить и защищать технические решения перед руководителем направления.

Что мы ожидаем:

От 1 года в продуктовых проектах с LLM в эксплуатации (ChatGPT, Claude или аналоги в проде). Формальный стаж в разработке не является определяющим — важнее содержание и масштаб реализованных решений.
Опыт построения retrieval‑систем (RAG), доведённых до реальных пользователей.
Опыт сбора и подготовки данных из нескольких разрозненных корпоративных систем: выгрузка, очистка, приведение к единому виду.
Опыт развёртывания LLM на собственной инфраструктуре (vLLM, Ollama, llama.cpp или аналоги).
Регулярный опыт проведения code review и работы с младшими коллегами в составе команды.
Понимание подхода к оценке качества LLM‑систем: работа с тестовыми наборами, выбор и применение мет:рик. Опыт построения таких систем будет преимуществом.

Что для нас важно:

Python production‑уровня: грамотная структура проектов, написание тестов, обработка ошибок, работа с асинхронностью.
Retrieval‑пайплайны: чанкование, работа с эмбеддингами, использование векторных баз (pgvector, Qdrant, Chroma), гибридный поиск (BM25 + векторный), реранкинг.
Prompt‑инжиниринг: версионирование промптов, структурированный вывод, применение few‑shot‑примеров, декомпозиция сложных задач.
Работа с LLM API (OpenAI‑совместимые, Anthropic) и self‑host‑решениями (vLLM, Ollama, llama.cpp): развёртывание, оценка требований к железу, применение квантизации.
Инженерия данных: выгрузка данных из БД, API и корпоративных систем, очистка и обработка неполных данных.
Бэкенд‑навыки: разработка REST API, работа с очередями, обработка ошибок, настройка ретраев, логирование, контроль расходов на токены.
MLOps: логирование запросов к LLM, мониторинг качества и расхода токенов в проде, настройка алертинга.

Мы предлагаем:

Работу в аккредитованной ИТ-компании
ДМС с первого дня работы
Шаг в космос - для тех, кто вдохновлен идеей покорения космоса и мечтает быть к этому причастным
Гибридный или удаленный формат работы;
Оформление в соответствии с ТК РФ;
Конкурентный уровень заработной платы - на уровне лидеров ИТ/телеком-индустрии.

Откликнуться

LLM разработчик

Похожие вакансии: Москва