Сейчас мы ищем Senior+ Machine Learning Engineer (NLP/LLM) к нашему партнеру «Даталаб».
Даталаб — IT-компания, которая разрабатывает сложные решения в области искусственного интеллекта и предоставляет услуги аутстаффинга профессиональных команд. Наши клиенты — технологические компании по всему миру. Мы строим долгосрочные и надежные отношения как с заказчиками, так и с нашими специалистами.
Что предстоит делать:
Стратегическое развитие направления
-
Построение roadmap внедрения и оптимизации LLM-решений в области PLP
-
Оценка и интеграция новых моделей и API (GPT-4, open-source LLMs)
-
Разработка стратегии выбора и комбинирования различных LLM для разных задач
-
Формирование технического видения развития LLM-capabilities компании
Hands-on разработка и оптимизация
-
Личное участие в разработке сложных промпт-стратегий и multi-agent систем
-
Прототипирование инновационных решений на базе готовых LLM
-
Разработка и оптимизация RAG-систем для повышения качества генерации
-
Построение каскадных и гибридных пайплайнов с использованием разных моделей
-
Реализация advanced промпт-техник: Chain-of-Thought, Tree-of-Thoughts, ReAct, Self-Consistency
Инфраструктура и масштабирование
-
Дизайн инфраструктуры для эффективного использования LLM API и self-hosted моделей
-
Оптимизация затрат на API-вызовы и вычислительные ресурсы
-
Построение систем оркестрации LLM: роутинг запросов, кэширование, fallback-стратегии
-
Обеспечение надежности и низкой латентности LLM-систем в production
-
Реализация мониторинга качества промптов и LLM-ответов
Ждем от тебя:
-
5+ лет в Machine Learning, из них минимум 2 года работы с LLM в production
-
Опыт технического лидерства команд от 5 человек
-
Proven track record успешного внедрения LLM-решений с измеримым бизнес-импактом
-
Глубокая экспертиза в применении современных LLM:
-
Работа с API различных провайдеров (OpenAI, Anthropic)
-
Self-hosted решения (Llama, Mistral, Qwen через vLLM/TGI)
-
Промпт-инжиниринг и оптимизация промптов
-
Few-shot и zero-shot learning стратегии
-
Технические навыки
-
RAG-системы и семантический поиск:
-
Векторные БД (Qdrant, pgvector)
-
Embedding модели и их оптимизация
-
Hybrid search (keyword + semantic)
-
Чанкинг-стратегии и metadata filtering
-
-
LLM оркестрация и оптимизация:
-
Фреймворки: LangChain, LlamaIndex, Semantic Kernel, DSPy
-
Промпт-менеджмент и версионирование
-
Токен-оптимизация и батчинг запросов
-
Кэширование и дедупликация
-
-
Production LLM:
-
API gateway patterns для LLM
-
Rate limiting и retry стратегии
-
A/B тестирование промптов
-
Evaluation frameworks для LLM-приложений
-
Специализированные знания
-
Опыт построения multi-step reasoning систем для complex generation
-
Знание современных подходов:
-
Advanced RAG: HyDE, Multi-Query, Contextual Compression
-
Agent frameworks и tool use
-
Constitutional AI и guardrails
-
Semantic caching и промпт-компрессия
-
-
SQL экспертиза и опыт валидации LLM-генерированных запросов
Инфраструктура и DevOps
-
Опыт развертывания self-hosted LLM (vLLM, Text Generation Inference, Ollama)
-
Kubernetes, Docker для LLM workloads
-
Мониторинг: Langfuse, DataDog для LLM
Лидерские качества
-
Стратегическое мышление и умение выбирать правильные инструменты под задачи
-
Коммуникационные навыки для работы с техническими и нетехническими стейкхолдерами
-
Опыт найма и построения высокоэффективных команд
-
Умение принимать решения по выбору моделей и подходов
-
Баланс между качеством, скоростью и стоимостью решений
Дополнительные преимущества
-
Опыт работы с локальными LLM 70B+ параметров
-
Вклад в open-source проекты в области LLM-приложений
-
Опыт построения evaluation датасетов для LLM
-
Знание prompt injection защиты и LLM security
-
Опыт работы с multimodal моделями
-
Участие в разработке domain-specific промпт-библиотек или фреймворков