Главный SRE-инженер

Дата размещения вакансии: 10.03.2026
Работодатель: Альфа-Банк
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
Более 6 лет

Корпоративная инфраструктура для генеративного AI с поддержкой Large Language Models (LLM). Платформа обеспечивает отказоустойчивость, масштабируемость и высокую скорость инференса моделей. Она включает оптимизацию инференса, квантизацию, управление GPU-ресурсами и автоматизацию развертывания на Kubernetes. На этой платформе разворачиваются все AI-решения Банка, и инженер SRE будет отвечать за надежность, мониторинг и автоматизацию инфраструктуры.

Чем предстоит заниматься:

  • Развитие и поддержка системы observability: сбор метрик, логов, алертов, dashboards
  • Анализ инцидентов и проведение post-mortem, повышение надежность платформы
  • Обеспечениие высокой доступности и отказоустойчивости инфраструктуры
  • Автоматизация рутиннных операций и эксплуатационных процессов (Infrastructure as Code)
  • Настройка, поддержка Kubernetes-кластеров и сопутствующих сервисов
  • Поддержка Linux-серверов и системных ПО платформы
  • Взаимодействие с командой DevOps и инженеров инфраструктуры для решения комплексных задач
  • Разработка и поддержка скриптов и утилит для автоматизации на Python/Go
  • Участие в планировании и внедрении новых сервисов и компонентов платформы
  • Содействие улучшению процессов мониторинга, алертинга и документации

Наши пожелания к кандидатам:

  • Опыт работы SRE / Platform / Infrastructure Engineer от 5 лет
  • Опыт эксплуатации Kubernetes в production
  • Опыт работы с Linux-серверами и системным ПО
  • Опыт работы с системами мониторинга и логирования (metrics, dashboards, alerts)
  • Опыт автоматизации инфраструктуры (Infrastructure as Code, Ansible/Terraform).
  • Навыки программирования или автоматизации на Python, знание Go — преимущество
  • Опыт анализа инцидентов и проведения post-mortem
  • Понимание работы распределённых систем и микросервисной архитектуры
  • Высшее техническое образование

Что мы предлагаем:

  • Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI
  • Гибкий график работы: вы сможете планировать время так, как удобно вам и вашей команде
  • Удалённый формат работы, а также уютный ИТ-хаб в Москве и сезонный коворкинг в Сочи
  • Сложные и интересные задачи, современный стек технологий
  • Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного
  • Возможность вертикального и горизонтального карьерного роста: регулярно проходят тренинги, вебинары, митапы и демо-дни
  • Оплату посещения профильных конференций и курсов, помогаем с подготовкой к публичным выступлениям и написанием статей на Хабр
  • Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий
  • Предложения от Банка только для сотрудников: собственные спортзалы (Москва, Санкт-Петербург, Екатеринбург), а также скидки на услуги туристических агентств, продукты питания, в рестораны, бары, магазины