CRO SRE (Data Platform)

Дата размещения вакансии: 10.10.2025

Работодатель: Т-Банк

Уровень зарплаты:

з/п не указана

Город:

Москва

Требуемый опыт работы:

Более 6 лет

В Data Platform 10+ sre команд, основной целью которых является достижение высокой степени надежности и доступности своих сервисов и продуктов. Основная обязанность CRO координация работы команд, выстраивание инцидент менеджмента, проведение централизованных учений, распространение и контроль практик от единого в банке центра надежности.

Задачи, которыми предстоит заниматься:

Работа над улучшениями надежности SRE-команд: процессы, observability, работа со сбоями
Участие в устранении сбоев, работа с фризами, работа с пользователями
Поиск и обсуждение возможностей автоматизации рутины
Рекомендации по улучшению архитектуры систем для повышения надежности
Аудит процессов и систем для улучшения надежности
Написание различного SRE-тулинга для работы со сбоями, maintenance, релизами
Разработка индикаторов доступности систем и бизнес-процессов
Контроль за соблюдением SLA на масштабе десятков сервисов и бизнес-процессов Incident Management

Ты нам подходишь, если:

Ты выстраивал процессы работы SRE с нуля
Участвовал в тушении большого числа инцидентов и имеешь богатый опыт в этом
Понимаешь важность автоматизации рутины
Работал с несколькими командами разработки и погружался в особенности каждого продукта
Знаком со спецификой работы с большим объемом данных (Data Platform) (nice to have)
Разрабатывал и поддерживал требуемый уровень SLA для своих систем

Требуемые навыки и компетенции:

Знание и понимание инструментов observability: prometheus, логи (любой стек), grafana
Навыки troubleshooting уровня Senior
Опыт работы с высоконагруженными системами
Опыт работы в on-call ротации (но сами дежурства не предполагаются)
Опыт выстраивания процессов дежурств
Опыт работы с большими инсталяциями баз данных
Знание одного из языков автоматизации: Python, Go
Знакомство с принципами работы Kubernetes

Откликнуться

CRO SRE (Data Platform)

Похожие вакансии: Москва