Prompt-инженер

Дата размещения вакансии: 02.07.2026
Работодатель: Медийные Технологии
Уровень зарплаты:
з/п не указана
Город:
Москва
Ленинградский проспект 15с14
Требуемый опыт работы:
От 1 года до 3 лет

Рувики - новая интернет-энциклопедия.

Наш продукт – Онлайн-энциклопедия, предоставляющая доступ к миллионам статей, изображений и видеороликов по самым различным темам - от истории и науки до искусства и технологий.

О проекте:

Мы развиваем инструменты и сервисы для автоматизации написания, проверки и обогащения статей в Рувики. Используем искусственный интеллект и большие языковые модели (LLM), чтобы повысить эффективность работы авторов и редакторов.

Обязанности:

  • Проектирование и улучшение промптов для классификации, генерации, суммаризации, верификации и LLM-судей.
  • Разработка тест-кейсов для типовых, сложных и граничных сценариев.
  • Анализ FP/FN, ошибок разметки, галлюцинаций, форматных сбоев и prompt injection.
  • Сбор и поддержка golden datasets и regression-наборов.
  • Проверка structured output: JSON/schema, обязательные поля, стабильность формата.
  • Документирование дефектов и передача спорных кейсов аналитику, редактору или разработчику.
  • Базовые batch-проверки через Python/таблицы и анализ логов через SQL

Требования:

  • Практический опыт работы с LLM в задачах, где важны качество, факты и воспроизводимость результата;
  • Умение проектировать промпты для классификации, суммаризации, генерации, проверки фактов и сравнения результатов;
  • Понимание QA-подхода к LLM: тест-кейсы, golden datasets, регрессионные прогоны, сравнение версий промптов и моделей;
  • Умение анализировать ошибки LLM-пайплайна: FP/FN, спорная разметка, галлюцинации, prompt injection, ошибки формата, дат и чисел;
  • Понимание задач кластеризации и дедупликации на уровне логики: отличать похожую тему от того же события;
  • Опыт или готовность работать с verifier / LLM judge-подходом, где модель проверяет, сравнивает или маршрутизирует результат;
  • Навык grounded generation: генерация только по входным данным, без внешних фактов и неподтверждённых утверждений;
  • Умение работать со structured output: JSON, обязательные поля, допустимые значения, проверка стабильности формата;
  • Базовые знания Python или уверенная работа с таблицами для batch-прогонов, расчёта метрик и анализа ошибок;
  • Базовый SQL для анализа логов, промежуточных результатов и качества пайплайна;
  • Умение понятно оформлять выводы: что чинить промптом, что проверкой/guard-ом, что выносить на аналитика, редакцию или разработку;
  • Отличная письменная грамотность, внимательность к фактам, датам, числам, формулировкам и источникам;
  • Английский не ниже Intermediate для работы с документацией моделей, API и инструментов.

Будет плюсом:

  • Опыт с новостными, энциклопедическими, редакционными или фактологически строгими продуктами;
  • Опыт с LLM evals, golden sets, regression-наборами и сравнением качества промптов/моделей;
  • Опыт с RAG, embeddings, semantic search, кластеризацией, дедупликацией или LLM judge;
  • Опыт анализа разметки: поиск ошибок в labels, описание policy conflicts, подготовка спорных кейсов для аналитика/редакции;
  • Навыки работы с Git, Docker, REST API, облачными сервисами;
  • Опыт сбора и систематизации обратной связи от редакторов, аналитиков или пользователей.

Условия:

  • Уровень дохода обсуждается с финальным кандидатом по итогам собеседования.
  • Интересные задачи, крутые кейсы, возможность выйти на новый профессиональный уровень.

  • 100% «белая» заработная плата, официальное трудоустройство по ТК РФ с первого дня.

  • Полная занятость, удаленный формат работы

  • Пятидневная рабочая неделя, с пн-пт.

  • Дружный и неравнодушный коллектив профессионалов.

  • Программа ДМС после успешного прохождения испытательного срока.