з/п не указана
Москва
Более 6 лет
Корпоративная инфраструктура для генеративного AI с поддержкой Large Language Models (LLM). Платформа обеспечивает отказоустойчивость, масштабируемость и высокую скорость инференса моделей. Она включает оптимизацию инференса, квантизацию, управление GPU-ресурсами и автоматизацию развертывания на Kubernetes. На этой платформе разворачиваются все AI-решения Банка, и инженер SRE будет отвечать за надежность, мониторинг и автоматизацию инфраструктуры.
Чем предстоит заниматься:
- Развитие и поддержка системы observability: сбор метрик, логов, алертов, dashboards
- Анализ инцидентов и проведение post-mortem, повышение надежность платформы
- Обеспечениие высокой доступности и отказоустойчивости инфраструктуры
- Автоматизация рутиннных операций и эксплуатационных процессов (Infrastructure as Code)
- Настройка, поддержка Kubernetes-кластеров и сопутствующих сервисов
- Поддержка Linux-серверов и системных ПО платформы
- Взаимодействие с командой DevOps и инженеров инфраструктуры для решения комплексных задач
- Разработка и поддержка скриптов и утилит для автоматизации на Python/Go
- Участие в планировании и внедрении новых сервисов и компонентов платформы
- Содействие улучшению процессов мониторинга, алертинга и документации
Наши пожелания к кандидатам:
- Опыт работы SRE / Platform / Infrastructure Engineer от 5 лет
- Опыт эксплуатации Kubernetes в production
- Опыт работы с Linux-серверами и системным ПО
- Опыт работы с системами мониторинга и логирования (metrics, dashboards, alerts)
- Опыт автоматизации инфраструктуры (Infrastructure as Code, Ansible/Terraform).
- Навыки программирования или автоматизации на Python, знание Go — преимущество
- Опыт анализа инцидентов и проведения post-mortem
- Понимание работы распределённых систем и микросервисной архитектуры
- Высшее техническое образование
Что мы предлагаем:
- Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI
- Гибкий график работы: вы сможете планировать время так, как удобно вам и вашей команде
- Удалённый формат работы, а также уютный ИТ-хаб в Москве и сезонный коворкинг в Сочи
- Сложные и интересные задачи, современный стек технологий
- Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного
- Возможность вертикального и горизонтального карьерного роста: регулярно проходят тренинги, вебинары, митапы и демо-дни
- Оплату посещения профильных конференций и курсов, помогаем с подготовкой к публичным выступлениям и написанием статей на Хабр
- Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий
- Предложения от Банка только для сотрудников: собственные спортзалы (Москва, Санкт-Петербург, Екатеринбург), а также скидки на услуги туристических агентств, продукты питания, в рестораны, бары, магазины