Senior/Lead SRE

Дата размещения вакансии: 14.11.2024

Работодатель: LLC Omniverse

Уровень зарплаты:

з/п не указана

Город:

Москва

Требуемый опыт работы:

От 3 до 6 лет

Omniverse — рекрутинговое агентство, состоящее из команды профи, которые помогают находить лучших сотрудников для крупных IT и Digital компаний.

Наша цель — идеально сочетать ваши навыки и ожидания, чтобы помочь вам найти работу мечты.

Один из наших основных клиентов — международный холдинг, который управляет 12 продуктами и запустил уже более 40 проектов, охватывающих десятки стран на всех континентах, сейчас ищет себе в команду Senior/Lead SRE.

Основные задачи:

1. Разработка и интеграция:

Участие в разработке и внедрении новых систем и сервисов.
Создание внутренних инструментов для автоматизации и повышения эффективности работы.
Активное участие в процессе проектирования архитектуры и выборе технологий.

2. Надежность и отказоустойчивость:

Аудит надежности систем и разработка стратегий повышения устойчивости.
Проектирование и внедрение высокоотказоустойчивой архитектуры.
Разработка стратегий Disaster Recovery и обеспечения непрерывности бизнеса.
Внедрение SLO (Service Level Objectives) и управление Error Budget.

3. Безопасность и соответствие стандартам:

Поддержка высокого уровня информационной безопасности систем.
Обеспечение соответствия систем нормативным требованиям и стандартам (GDPR, ISO, PCI DSS).

4. Оптимизация и масштабирование:

Оптимизация производительности систем и сервисов.
Планирование емкости и масштабирование инфраструктуры под потребности бизнеса.
Оптимизация затрат на облачные ресурсы.

5. Автоматизация и процессы:

Автоматизация процессов с использованием подходов IaC (Terraform, Ansible).
Настройка и улучшение CI/CD процессов.
Улучшение мониторинга, алертинга и быстрого реагирования на инциденты.

6. Инцидент-менеджмент:

Реагирование на инциденты, проведение постмортемов и разработка предложений по улучшению.
Участие в on-call дежурствах и оперативное реагирование на инциденты.

7. Взаимодействие и поддержка разработки:

Тесное сотрудничество с командами разработки для повышения надежности и эффективности процессов.
Интеграция лучших практик разработки в инфраструктурные процессы.
Менторство и обучение команды, развитие инженерных практик.
Документирование процессов и решений.

Наши ожидания:

Глубокие знания AWS и других облачных решений (Azure, Google Cloud, Yandex.Cloud и т.п.).
Опыт работы с системами виртуализации и контейнеризации.
Опыт работы с Kubernetes: управление, настройка, мониторинг и обеспечение отказоустойчивости приложений.
Понимание архитектуры современных распределённых систем и умение применять лучшие практики проектирования.
Опыт построения и управления геораспределённой инфраструктурой с использованием нескольких зон доступности (AZ) для
Обеспечения отказоустойчивости и высокой доступности.
Навыки backend разработки на Node.js и TypeScript.
Опыт настройки и оптимизации CI/CD пайплайнов (например, с помощью GitLab CI и/или Argo CD).
Умение строить надежные системы мониторинга, логирования и трассировки (Prometheus, Grafana, Jaeger и пр.).
Опыт работы с базами данных (PostgreSQL, MySQL, Redis) и навыки их оптимизации.
Знание брокеров и очередей сообщений (Kafka, Rabbit MQ, NATS) и опыт их интеграции.
Отличное понимание DevOps-подходов и автоматизации инфраструктуры с помощью Terraform, Ansible и других IaC
инструментов.
Навыки устранения проблем в продакшне, участие в инцидент-менеджменте.
Опыт планирования восстановления после сбоев и реализации стратегий Disaster Recovery.
Опыт в оптимизации производительности систем, снижении затрат и планировании ресурсов.
Отличные навыки коммуникации и лидерства, способность работать в команде и менторить младших инженеров.

Будет плюсом:

Опыт применения практик и инструментов Chaos Engineering.
Знание других языков программирования (Python, PHP, Java, Kotlin, Go и т.д.).
Опыт управления инфраструктурой в multicloud и hybrid средах.
Опыт работы с serverless-архитектурами (AWS Lambda, API Gateway, S3 и пр.).
Знания стандартов и практик соответствия требованиям (GDPR, ISO, PCI DSS).
Понимание принципов информационной безопасности, управление доступами и секретами, опыт работы с DevSecOps
практиками.
Опыт миграции легаси-систем на современные технологии.
Знания в области оптимизации высоконагруженных приложений.

Мы предлагаем:

Дружную команду крутых специалистов и максимально комфортную рабочую атмосферу;
Полностью оборудованное рабочее место;
Офис в бизнес-центре класса «А» или возможность полностью удаленной работы;
5/2, гибкое начало рабочего дня (с 9 до 12), сокращённый рабочий день (7 ч);
Частичную компенсацию занятий в фитнес-зале и английского языка;
Корпоративную библиотеку;
Корпоративы с выездами на природу и призами, тимбилдинги, мастер-классы и тд.

Откликнуться

Senior/Lead SRE

Похожие вакансии: Москва