ML-инженер

Дата размещения вакансии: 21.01.2026
Работодатель: Национальный исследовательский университет Высшая школа экономики
Уровень зарплаты:
з/п не указана
Город:
Москва
Покровский бульвар 11
Требуемый опыт работы:
От 3 до 6 лет

Обязанности:

  • Проектирование и разработка LLM-приложений: чат-боты, Q&A системы, автоматизация обработки текстов
  • Построение и оптимизация RAG-пайплайнов для работы с корпоративными данными
  • Разработка и тестирование системных промптов, улучшение качества генерации
  • Интеграция LLM-сервисов с внешними API и корпоративными системами
  • Работа с векторными базами данных: индексирование документов, настройка поиска
  • Создание REST/GraphQL API для ML-сервисов
  • Мониторинг и улучшение качества моделей: сбор метрик, анализ ошибок, A/B-тестирование
  • Оптимизация производительности: снижение latency, эффективное использование ресурсов
  • Написание технической документации и участие в code review
  • Взаимодействие с продуктовой командой для определения требований и приоритетов.

Требования:

  • Опыт работы с Python не менее 2–3 лет, включая асинхронное программирование (asyncio, aiohttp)
  • Глубокое понимание LLM и NLP: работа с языковыми моделями, prompt engineering, structured generation (JSON schema), chain-of-thought
  • Опыт построения RAG-систем: retrieval-augmented generation, гибридный поиск (dense + sparse embeddings)
  • Знание векторных баз данных: Qdrant, Pinecone, Milvus или аналоги — индексирование, поиск по similarity
  • Опыт с embedding-моделями: Sentence Transformers, FastEmbed, cross-encoder reranking
  • Создание production API: FastAPI, Pydantic для валидации, обработка ошибок, логирование
  • Контейнеризация и деплой: Docker, базовое понимание оркестрации
  • Работа с базами данных: SQL (ClickHouse, PostgreSQL), Redis для кэширования
  • Понимание метрик качества NLP: precision, recall для retrieval; оценка качества ответов LLM.

Будет плюсом

  • Опыт работы с OpenAI API, YandexGPT, Claude, GigaChat или другими LLM-провайдерами
  • Знание LangChain, LlamaIndex или аналогичных фреймворков
  • Опыт fine-tuning моделей, работа с HuggingFace Hub
  • Понимание few-shot learning, chain-of-thought prompting, self-consistency
  • Опыт с evaluation frameworks для LLM (RAGAS, LangSmith, DeepEval)
  • Знание Next.js/React/TypeScript для разработки интерфейсов
  • Опыт работы с Kubernetes, CI/CD пайплайнами
  • Навыки prompt optimization: снижение токенов, улучшение качества без увеличения стоимости
  • Опыт работы в Agile-командах
  • Знание русского и английского языков для работы с документацией

Условия:

  • Работа в одном из ведущих ВУЗов страны;
  • Конкурентоспособная заработная плата, официальное трудоустройство согласно ТК РФ;
  • Современный комфортный офис в центре Москвы (12 минут пешком от м. Курская);
  • Возможности для обучения и профессионального роста;
  • Участие в интересных проектах, связанных с развитием университетских цифровых сервисов;
  • Бесплатные спортивные и тренажерные залы на территории университета;
  • Обучающие мероприятия, курсы повышения квалификации, изучение языков;
  • Уютные кофейни на территории кампуса: Jeffrey’s Coffee и «Груша».