MLOps инженер/консультант

Дата размещения вакансии: 06.10.2025
Работодатель: БЕРГЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Волгоградский проспект 43к3
Требуемый опыт работы:
От 1 года до 3 лет

О КОМПАНИИ:

ServerICT— мы эксперты в области передовых AI-решений. Специализируемся на поставках современных GPU-систем от Lenovo, Supermicro, NVIDIA, Dell и других ведущих производителей, предлагая полный цикл услуг — от подбора серверов до внедрения промышленных ML-систем. Наши клиенты — банки, телеком и промышленные предприятия.

---

ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ

Консалтинг и внедрение:

  • Подбор и проектирование GPU-решений под задачи клиентов (обработка данных, обучение моделей, генеративный ИИ);
  • Развёртывание и оптимизация LLM на GPU-кластерах;
  • Внедрение RAG-систем с векторными БД (Qdrant, FAISS);
  • Технические консультации для клиентов: выбор серверов, сопровождение пилотных внедрений.

R&D (исследования и разработка):

  • Тестирование и внедрение китайских GPU (например, MooreThread, Metax, Biren и др.);
  • Перенос экосистемы (PyTorch, Triton, Kubernetes) на альтернативное железо;
  • Оптимизация пайплайнов, развёртывание LLM, адаптация Triton/Prometheus.

---

ЧТО ДЛЯ НАС ВАЖНО :

  • Опыт работы с LLM и MLOps от 1 года;
  • Уверенное владение PyTorch, Docker, Kubernetes;
  • Опыт развёртывания LLM, построения MLOps пайплайнов (обучение → деплой → мониторинг);
  • Опыт или понимание Triton Inference Server, Prometheus, CUDA, TensorRT;
  • Умение объяснять технические решения нетехническим клиентам;
  • Приветствуется: знание RAG, FAISS, Qdrant, vLLM, LoRA/PEFT, TensorRT-LLM.

---

ТЕХСТЕК:

  • Обязательные технологии: PyTorch, Kubernetes, Docker, Triton InferenceServer, CUDA;
  • Дополнительные: TensorRT, Prometheus, FAISS, Qdrant, vLLM, LoRA/PEFT.

---

ЧТО МЫ ПРЕДЛАГАЕМ:

  • Гибридный формат работы: офис в Москве (БЦ класса А) + удалёнка;
  • Возможна частичная занятость: готовы рассматривать кандидатов на part-time;
  • Конкурентная зарплата: обсуждается индивидуально, зависит от опыта и зоны ответственности;
  • Работа с современным и экспериментальным оборудованием: NVIDIAB200 / H200, китайские GPU;
  • Участие в пилотных проектах: генеративный ИИ, промышленные решения, оптимизация ML-инфраструктуры;
  • Рост до Tech Lead при желании;
  • Оплата обучения, сертификаций, конференций;
  • Внутренние митапы, техревью, корпоративная культура с акцентом на развитие.

Оставляйте отклик — будем рады видеть вас частью нашей команды :)