MLOps инженер/консультант

Дата размещения вакансии: 06.10.2025

Работодатель: БЕРГЕР

Уровень зарплаты:

з/п не указана

Город:

Москва
Волгоградский проспект 43к3

Требуемый опыт работы:

От 1 года до 3 лет

О КОМПАНИИ:

ServerICT— мы эксперты в области передовых AI-решений. Специализируемся на поставках современных GPU-систем от Lenovo, Supermicro, NVIDIA, Dell и других ведущих производителей, предлагая полный цикл услуг — от подбора серверов до внедрения промышленных ML-систем. Наши клиенты — банки, телеком и промышленные предприятия.

---

ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ

Консалтинг и внедрение:

Подбор и проектирование GPU-решений под задачи клиентов (обработка данных, обучение моделей, генеративный ИИ);
Развёртывание и оптимизация LLM на GPU-кластерах;
Внедрение RAG-систем с векторными БД (Qdrant, FAISS);
Технические консультации для клиентов: выбор серверов, сопровождение пилотных внедрений.

R&D (исследования и разработка):

Тестирование и внедрение китайских GPU (например, MooreThread, Metax, Biren и др.);
Перенос экосистемы (PyTorch, Triton, Kubernetes) на альтернативное железо;
Оптимизация пайплайнов, развёртывание LLM, адаптация Triton/Prometheus.

---

ЧТО ДЛЯ НАС ВАЖНО :

Опыт работы с LLM и MLOps от 1 года;
Уверенное владение PyTorch, Docker, Kubernetes;
Опыт развёртывания LLM, построения MLOps пайплайнов (обучение → деплой → мониторинг);
Опыт или понимание Triton Inference Server, Prometheus, CUDA, TensorRT;
Умение объяснять технические решения нетехническим клиентам;
Приветствуется: знание RAG, FAISS, Qdrant, vLLM, LoRA/PEFT, TensorRT-LLM.

---

ТЕХСТЕК:

Обязательные технологии: PyTorch, Kubernetes, Docker, Triton InferenceServer, CUDA;
Дополнительные: TensorRT, Prometheus, FAISS, Qdrant, vLLM, LoRA/PEFT.

---

ЧТО МЫ ПРЕДЛАГАЕМ:

Гибридный формат работы: офис в Москве (БЦ класса А) + удалёнка;
Возможна частичная занятость: готовы рассматривать кандидатов на part-time;
Конкурентная зарплата: обсуждается индивидуально, зависит от опыта и зоны ответственности;
Работа с современным и экспериментальным оборудованием: NVIDIAB200 / H200, китайские GPU;
Участие в пилотных проектах: генеративный ИИ, промышленные решения, оптимизация ML-инфраструктуры;
Рост до Tech Lead при желании;
Оплата обучения, сертификаций, конференций;
Внутренние митапы, техревью, корпоративная культура с акцентом на развитие.

Оставляйте отклик — будем рады видеть вас частью нашей команды :)

Откликнуться

MLOps инженер/консультант

Похожие вакансии: Москва