з/п не указана
Москва
Новинский бульвар 18с1
Новинский бульвар 18с1
От 3 до 6 лет
Обязанности:
- Разработка и поддержка микросервисов на Python;
- Развёртывание, настройка и оптимизация локальных нейросетей (self-hosted LLM, модели компьютерного зрения, NLP);
- Интеграция ML-моделей в продуктовые сервисы: REST/gRPC API, пайплайны;
- Ведение технической документации по API и deployment-процедурам.
Требования:
- Коммерческий опыт разработки на Python от 3 лет;
- Опыт работы с ML-фреймворками: PyTorch, Hugging Face Transformers, vLLM, Ollama или аналоги;
- Опыт развёртывания и обслуживания ML-моделей в продакшене (не только Jupyter-ноутбуки);
- FastAPI или aiohttp — разработка асинхронных API;
- PostgreSQL, Redis — на уровне уверенного использования;
- Docker (Dockerfile, Compose, работа с GPU в контейнерах);
- Понимание архитектуры микросервисов: очереди (RabbitMQ, Celery, NATS), контракты между сервисами;
- Написание тестов (pytest).
Будет плюсом:
- Опыт с LLM: fine-tuning, RAG, prompt engineering, LoRA/QLoRA;
- Опыт работы с ONNX Runtime, TensorRT, Triton Inference Server;
- Опыт с компьютерным зрением (OpenCV, YOLO, OCR);
- Опыт работы с Kubernetes и GPU-нодами;
- Prometheus/Grafana — мониторинг ML-сервисов;
- MLflow, Weights & Biases — трекинг экспериментов.
Условия:
- Гибкое начало рабочего дня;
- Работа в крупной международной компании;
- Социальный пакет;
- Проекты федерального и международного масштаба.