Инженер по интеграции/SRE (ML-инфраструктура)

Дата размещения вакансии: 20.03.2026
Работодатель: Магнус Тех
Уровень зарплаты:
от 250000 до 350000 RUR
Город:
Москва
1-й Красногвардейский проезд 15
Требуемый опыт работы:
От 3 до 6 лет

Magnus Tech — сплочённая команда из 300+ специалистов. Мы много лет шаг за шагом создаём надёжные программные продукты для крупнейших российских заказчиков.
Наша миссия состоит в создании систем и средств для решения сложных задач современного бизнеса. Для выполнения этой миссии мы используем новейшие технологии в современной культуре разработки и стремимся создавать лучшие продукты для наших бизнес-партнеров. Наш приоритет — комфорт и развитие наших сотрудников.

Сейчас мы ищем в свою команду Инженер по интеграции/SRE с опытом работы в сфере ML.
Вам предстоит спроектировать, собрать и запустить пилотный вычислительный комплекс (ПАК) для ML-платформы.

Что предстоит делать:

  • Проектирование архитектуры узлов: compute, storage, сеть
  • Изучение технологии оркестрации GPU внутри платформ
  • Изучение методов NVLINK для GPU
  • Расчет VRAM под LLM / RAG / агенты
  • Изучение аппаратной реализации GPU-shared
  • Работа с сервером YADRO G4208P G3 как центральным блоком ПАК
  • Работа с различными GPU, включая NVIDIA Tesla: H100/A100
  • Проектирование надежности: резервирование питания, мониторинг температуры/нагрузки, управление энергопотреблением, подготовка к отказам GPU (overprovisioning 5–20%)
  • Сборка и тестирование ПАК

Наши ожидания от кандидата:

  • Знание архитектуры и технологий GPU
  • Понимание программных фреймворков: CUDA, NVLink / NVSwitch, PCIe topology
  • Навыки проектирования надежных систем
  • Умение работать с серверным оборудованием
  • Ответственность и внимательность к деталям

Условия, которые мы предлагаем:

Команду экспертов в сфере ML.
Оформление:
официальное трудоустройство в аккредитованной IT-компании.
График и формат работы: возможность в формате гибрида без тайм-трекеров.
Расширенная программа ДМС.
Оплата обучения по профильному направлению, с целью развития профессиональных навыков (от 50% до 100%).
Дружная команда, свободная от излишних формальностей и иерархии.