з/п не указана
Москва
Покровский бульвар 11
Покровский бульвар 11
От 3 до 6 лет
Обязанности:
- Проектирование и разработка LLM-приложений: чат-боты, Q&A системы, автоматизация обработки текстов
- Построение и оптимизация RAG-пайплайнов для работы с корпоративными данными
- Разработка и тестирование системных промптов, улучшение качества генерации
- Интеграция LLM-сервисов с внешними API и корпоративными системами
- Работа с векторными базами данных: индексирование документов, настройка поиска
- Создание REST/GraphQL API для ML-сервисов
- Мониторинг и улучшение качества моделей: сбор метрик, анализ ошибок, A/B-тестирование
- Оптимизация производительности: снижение latency, эффективное использование ресурсов
- Написание технической документации и участие в code review
- Взаимодействие с продуктовой командой для определения требований и приоритетов.
Требования:
- Опыт работы с Python не менее 2–3 лет, включая асинхронное программирование (asyncio, aiohttp)
- Глубокое понимание LLM и NLP: работа с языковыми моделями, prompt engineering, structured generation (JSON schema), chain-of-thought
- Опыт построения RAG-систем: retrieval-augmented generation, гибридный поиск (dense + sparse embeddings)
- Знание векторных баз данных: Qdrant, Pinecone, Milvus или аналоги — индексирование, поиск по similarity
- Опыт с embedding-моделями: Sentence Transformers, FastEmbed, cross-encoder reranking
- Создание production API: FastAPI, Pydantic для валидации, обработка ошибок, логирование
- Контейнеризация и деплой: Docker, базовое понимание оркестрации
- Работа с базами данных: SQL (ClickHouse, PostgreSQL), Redis для кэширования
- Понимание метрик качества NLP: precision, recall для retrieval; оценка качества ответов LLM.
Будет плюсом
- Опыт работы с OpenAI API, YandexGPT, Claude, GigaChat или другими LLM-провайдерами
- Знание LangChain, LlamaIndex или аналогичных фреймворков
- Опыт fine-tuning моделей, работа с HuggingFace Hub
- Понимание few-shot learning, chain-of-thought prompting, self-consistency
- Опыт с evaluation frameworks для LLM (RAGAS, LangSmith, DeepEval)
- Знание Next.js/React/TypeScript для разработки интерфейсов
- Опыт работы с Kubernetes, CI/CD пайплайнами
- Навыки prompt optimization: снижение токенов, улучшение качества без увеличения стоимости
- Опыт работы в Agile-командах
- Знание русского и английского языков для работы с документацией
Условия:
- Работа в одном из ведущих ВУЗов страны;
- Конкурентоспособная заработная плата, официальное трудоустройство согласно ТК РФ;
- Современный комфортный офис в центре Москвы (12 минут пешком от м. Курская);
- Возможности для обучения и профессионального роста;
- Участие в интересных проектах, связанных с развитием университетских цифровых сервисов;
- Бесплатные спортивные и тренажерные залы на территории университета;
- Обучающие мероприятия, курсы повышения квалификации, изучение языков;
- Уютные кофейни на территории кампуса: Jeffrey’s Coffee и «Груша».