ML-инженер

Дата размещения вакансии: 20.02.2026

Работодатель: Национальный исследовательский университет Высшая школа экономики

Уровень зарплаты:

з/п не указана

Город:

Москва
Покровский бульвар 11

Требуемый опыт работы:

От 3 до 6 лет

Обязанности:

Проектирование и разработка LLM-приложений: чат-боты, Q&A системы, автоматизация обработки текстов
Построение и оптимизация RAG-пайплайнов для работы с корпоративными данными
Разработка и тестирование системных промптов, улучшение качества генерации
Интеграция LLM-сервисов с внешними API и корпоративными системами
Работа с векторными базами данных: индексирование документов, настройка поиска
Создание REST/GraphQL API для ML-сервисов
Мониторинг и улучшение качества моделей: сбор метрик, анализ ошибок, A/B-тестирование
Оптимизация производительности: снижение latency, эффективное использование ресурсов
Написание технической документации и участие в code review
Взаимодействие с продуктовой командой для определения требований и приоритетов.

Требования:

Опыт работы с Python не менее 2–3 лет, включая асинхронное программирование (asyncio, aiohttp)
Глубокое понимание LLM и NLP: работа с языковыми моделями, prompt engineering, structured generation (JSON schema), chain-of-thought
Опыт построения RAG-систем: retrieval-augmented generation, гибридный поиск (dense + sparse embeddings)
Знание векторных баз данных: Qdrant, Pinecone, Milvus или аналоги — индексирование, поиск по similarity
Опыт с embedding-моделями: Sentence Transformers, FastEmbed, cross-encoder reranking
Создание production API: FastAPI, Pydantic для валидации, обработка ошибок, логирование
Контейнеризация и деплой: Docker, базовое понимание оркестрации
Работа с базами данных: SQL (ClickHouse, PostgreSQL), Redis для кэширования
Понимание метрик качества NLP: precision, recall для retrieval; оценка качества ответов LLM.

Будет плюсом

Опыт работы с OpenAI API, YandexGPT, Claude, GigaChat или другими LLM-провайдерами
Знание LangChain, LlamaIndex или аналогичных фреймворков
Опыт fine-tuning моделей, работа с HuggingFace Hub
Понимание few-shot learning, chain-of-thought prompting, self-consistency
Опыт с evaluation frameworks для LLM (RAGAS, LangSmith, DeepEval)
Знание Next.js/React/TypeScript для разработки интерфейсов
Опыт работы с Kubernetes, CI/CD пайплайнами
Навыки prompt optimization: снижение токенов, улучшение качества без увеличения стоимости
Опыт работы в Agile-командах
Знание русского и английского языков для работы с документацией (уровень не ниже B1)

Условия:

Работа в одном из ведущих ВУЗов страны;
Конкурентоспособная заработная плата, официальное трудоустройство согласно ТК РФ;
Современный комфортный офис в центре Москвы (12 минут пешком от м. Курская);
Возможности для обучения и профессионального роста;
Участие в интересных проектах, связанных с развитием университетских цифровых сервисов;
Бесплатные спортивные и тренажерные залы на территории университета;
Обучающие мероприятия, курсы повышения квалификации, изучение языков;
Уютные кофейни на территории кампуса: Jeffrey’s Coffee и «Груша».

Откликнуться