Senior+ Machine Learning Engineer (NLP/LLM)

Дата размещения вакансии: 04.10.2025
Работодатель: Автомакон
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
Более 6 лет

Сейчас мы ищем Senior+ Machine Learning Engineer (NLP/LLM) к нашему партнеру «Даталаб».

Даталаб — IT-компания, которая разрабатывает сложные решения в области искусственного интеллекта и предоставляет услуги аутстаффинга профессиональных команд. Наши клиенты — технологические компании по всему миру. Мы строим долгосрочные и надежные отношения как с заказчиками, так и с нашими специалистами.

Что предстоит делать:

Стратегическое развитие направления

  • Построение roadmap внедрения и оптимизации LLM-решений в области PLP

  • Оценка и интеграция новых моделей и API (GPT-4, open-source LLMs)

  • Разработка стратегии выбора и комбинирования различных LLM для разных задач

  • Формирование технического видения развития LLM-capabilities компании

Hands-on разработка и оптимизация

  • Личное участие в разработке сложных промпт-стратегий и multi-agent систем

  • Прототипирование инновационных решений на базе готовых LLM

  • Разработка и оптимизация RAG-систем для повышения качества генерации

  • Построение каскадных и гибридных пайплайнов с использованием разных моделей

  • Реализация advanced промпт-техник: Chain-of-Thought, Tree-of-Thoughts, ReAct, Self-Consistency

Инфраструктура и масштабирование

  • Дизайн инфраструктуры для эффективного использования LLM API и self-hosted моделей

  • Оптимизация затрат на API-вызовы и вычислительные ресурсы

  • Построение систем оркестрации LLM: роутинг запросов, кэширование, fallback-стратегии

  • Обеспечение надежности и низкой латентности LLM-систем в production

  • Реализация мониторинга качества промптов и LLM-ответов

Ждем от тебя:

  • 5+ лет в Machine Learning, из них минимум 2 года работы с LLM в production

  • Опыт технического лидерства команд от 5 человек

  • Proven track record успешного внедрения LLM-решений с измеримым бизнес-импактом

  • Глубокая экспертиза в применении современных LLM:

    • Работа с API различных провайдеров (OpenAI, Anthropic)

    • Self-hosted решения (Llama, Mistral, Qwen через vLLM/TGI)

    • Промпт-инжиниринг и оптимизация промптов

    • Few-shot и zero-shot learning стратегии

Технические навыки

  • RAG-системы и семантический поиск:

    • Векторные БД (Qdrant, pgvector)

    • Embedding модели и их оптимизация

    • Hybrid search (keyword + semantic)

    • Чанкинг-стратегии и metadata filtering

  • LLM оркестрация и оптимизация:

    • Фреймворки: LangChain, LlamaIndex, Semantic Kernel, DSPy

    • Промпт-менеджмент и версионирование

    • Токен-оптимизация и батчинг запросов

    • Кэширование и дедупликация

  • Production LLM:

    • API gateway patterns для LLM

    • Rate limiting и retry стратегии

    • A/B тестирование промптов

    • Evaluation frameworks для LLM-приложений

Специализированные знания

  • Опыт построения multi-step reasoning систем для complex generation

  • Знание современных подходов:

    • Advanced RAG: HyDE, Multi-Query, Contextual Compression

    • Agent frameworks и tool use

    • Constitutional AI и guardrails

    • Semantic caching и промпт-компрессия

  • SQL экспертиза и опыт валидации LLM-генерированных запросов

Инфраструктура и DevOps

  • Опыт развертывания self-hosted LLM (vLLM, Text Generation Inference, Ollama)

  • Kubernetes, Docker для LLM workloads

  • Мониторинг: Langfuse, DataDog для LLM

Лидерские качества

  • Стратегическое мышление и умение выбирать правильные инструменты под задачи

  • Коммуникационные навыки для работы с техническими и нетехническими стейкхолдерами

  • Опыт найма и построения высокоэффективных команд

  • Умение принимать решения по выбору моделей и подходов

  • Баланс между качеством, скоростью и стоимостью решений

Дополнительные преимущества

  • Опыт работы с локальными LLM 70B+ параметров

  • Вклад в open-source проекты в области LLM-приложений

  • Опыт построения evaluation датасетов для LLM

  • Знание prompt injection защиты и LLM security

  • Опыт работы с multimodal моделями

  • Участие в разработке domain-specific промпт-библиотек или фреймворков