1-й Красногвардейский проезд 15
Magnus Tech — сплочённая команда из 300+ специалистов. Мы много лет шаг за шагом создаём надёжные программные продукты для крупнейших российских заказчиков.
Наша миссия состоит в создании систем и средств для решения сложных задач современного бизнеса. Для выполнения этой миссии мы используем новейшие технологии в современной культуре разработки и стремимся создавать лучшие продукты для наших бизнес-партнеров. Наш приоритет — комфорт и развитие наших сотрудников.
Сейчас мы ищем в свою команду Инженер по интеграции/SRE с опытом работы в сфере ML.
Вам предстоит спроектировать, собрать и запустить пилотный вычислительный комплекс (ПАК) для ML-платформы.
Что предстоит делать:
- Проектирование архитектуры узлов: compute, storage, сеть
- Изучение технологии оркестрации GPU внутри платформ
- Изучение методов NVLINK для GPU
- Расчет VRAM под LLM / RAG / агенты
- Изучение аппаратной реализации GPU-shared
- Работа с сервером YADRO G4208P G3 как центральным блоком ПАК
- Работа с различными GPU, включая NVIDIA Tesla: H100/A100
- Проектирование надежности: резервирование питания, мониторинг температуры/нагрузки, управление энергопотреблением, подготовка к отказам GPU (overprovisioning 5–20%)
- Сборка и тестирование ПАК
Наши ожидания от кандидата:
- Знание архитектуры и технологий GPU
- Понимание программных фреймворков: CUDA, NVLink / NVSwitch, PCIe topology
- Навыки проектирования надежных систем
- Умение работать с серверным оборудованием
- Ответственность и внимательность к деталям
Условия, которые мы предлагаем:
Команду экспертов в сфере ML.
Оформление: официальное трудоустройство в аккредитованной IT-компании.
График и формат работы: возможность в формате гибрида без тайм-трекеров.
Расширенная программа ДМС.
Оплата обучения по профильному направлению, с целью развития профессиональных навыков (от 50% до 100%).
Дружная команда, свободная от излишних формальностей и иерархии.