з/п не указана
Москва
Более 6 лет
Наша команда в поиске ключевого специалиста, отвечающего за проектирование, развертывание и оптимизацию высокопроизводительной вычислительной AI инфраструктуры. Ваша работа напрямую повлияет на скорость исследований, эффективность обучения крупнейших моделей и надежность их промышленной эксплуатации.
Задачи:
- проектирование и архитектура масштабируемых AI-кластеров для распределенного обучения и инференса моделей глубокого обучения
- разработка технического дизайна размещения кластеров в дата-центрах (ЦОД): планирование стоек, энергопотребления, охлаждения, сетевой инфраструктуры
- выбор и оптимизация интерконнекта между GPU-узлами для минимизации задержек и максимизации пропускной способности
- определение требований к аппаратному обеспечению (серверы, GPU, системы хранения данных, сетевые коммутаторы) и взаимодействие с вендорами
- подготовка технических требований для конкурсных процедур
- разработка стратегий масштабирования инфраструктуры с учетом роста вычислительных потребностей и новых технологий
- создание и поддержание документации по архитектуре, стандартам и процедурам развертывания.
Требования:
- опыт работы от 4 лет в проектировании и построении высоконагруженной, отказоустойчивой ИТ-инфраструктуры
- глубокие практические знания в области аппаратного обеспечения для AI/ML: архитектуры GPU (NVIDIA), специализированные ускорители, серверные платформы
- опыт выбора, настройки и оптимизации высокоскоростных сетевых технологий для HPC/AI (InfiniBand, ROCE, Ethernet) на уровне архитектуры
- понимание принципов работы дата-центров: проектирование под мощность, охлаждение, размещение оборудования
- знание программного стека для управления кластерами (Kubernetes, Slurm, аналоги) и систем хранения для больших данных
- понимание жизненного цикла ML-моделей и их требований к инфраструктуре на разных этапах
- инструментальное владение AI для анализа, генерации и автоматизации.
Мы предлагаем:
- офис рядом с м. Кутузовская
- офисный формат работы, после испытательного срока гибридный формат (3 дня офис + 2 дня удалённо)
- ежегодный пересмотр зарплаты и годовая премия
- уникальная система обучения Сбера для профессионального
- и карьерного развития
- расширенный ДМС и льготное страхование для семьи
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа.