Lead SRE инженер

Дата размещения вакансии: 27.02.2025

Работодатель: Токл Девелопмент

Уровень зарплаты:

з/п не указана

Город:

Санкт-Петербург

Требуемый опыт работы:

Более 6 лет

Ищем SRE-инженеров для работы над инфраструктурой, обеспечения бесперебойной работы сервисов, наблюдения за производительностью сервисов, масштабируемостью и обеспечения всеми необходимыми ресурсами.

Задачи:

Оптимизация имеющихся систем, уменьшение нагрузки на сопровождение и обслуживание систем за счет автоматизации.
Изучение имеющихся систем и поддержание актуальных знаний по ним, взаимодействии подсистем, механизмов влияния подсистем на сервис в целом.
Активный и проактивный поиск возможных проблем в архитектуре систем и их устранение.
Участие в жизни проекта на всех его этапах — дизайн, разработка, внедрение, обновление, улучшение, поддержка и т. д.
Обслуживание работающих сервисов, включая мониторинг как системных, так и бизнес метрик (все показатели здоровья систем).
Автоматизация и улучшение всех процессов, связанных с обслуживанием систем, усилением их отказоустойчивости, масштабированием и т. д.
Участие в устранении и расследовании причин сбоев.

Требования:

Опыт в построении мониторинга на основе золотых сигналов SRE
Опыт в разработке и реализации моделей восстановления после сбоев (Disaster Recovery), включая идентификацию критически важных компонентов системы и создание эффективных планов восстановления.
Опыт работы с асинхронными многокомпонентными системами.
Опыт работы со следующим стэком: helm, terragrun\terraform, kubernetes, argocd
Опыт работы с Java приложениями
Понимание принципов архитектуры многокомпонентных систем и умение применять эти знания на практике (балансировка нагрузки, обеспечение отказоустойчивости и т.д.)

Какие опыт и знания ищем?

Опыт работы лидом SRE от 2 лет.
Опыт работы системным администратором / devops'ом / разработчиком в бэкграунде.
Практический опыт написания и поддержки документации.
Опыт настройки готовых инструментов мониторинга (например, grafana) и опыт их проектирования для разработки своих.
Опыт регулярного общения с разработкой, инфраструктурой, клиентским саппортом, бизнесом.

Условия:

Удаленная работа
40 часов в неделю

Откликнуться

Lead SRE инженер

Похожие вакансии: Санкт-Петербург