з/п не указана
Москва
От 3 до 6 лет
Что предстоит делать:
- Обеспечение мониторинга и стабильной работы сервисов (облачная система управления отелями Sonata PMS).
- Реакция на инциденты и участие в их расследовании.
- Автоматизация процессов развертывания и эксплуатации.
- Улучшение отказоустойчивости и производительности инфраструктуры.
- Совместная работа с командами разработки для внедрения лучших практик SRE.
Что мы ожидаем от кандидата:
- 4+ лет опыта в роли SRE, DevOps или системного инженера.
- Уверенные знания Linux и принципов построения отказоустойчивых распределённых систем.
- Практический опыт работы с контейнерными технологиями: Docker Swarm и Kubernetes.
- Опыт работы с облачными платформами (в приоритете — Яндекс Cloud, будет плюсом опыт AWS/GCP/Azure).
- Понимание сетевых протоколов, принципов балансировки нагрузки и масштабирования сервисов.
- Опыт настройки и эксплуатации систем мониторинга и алертинга (Prometheus, Grafana, Loki, OpenTelemetry).
- Навыки настройки централизованного логирования (ELK/EFK, Loki).
- Опыт администрирования и оптимизации работы PostgreSQL, Elasticsearch, Redis, RabbitMQ, Kafka.
- Опыт работы с системами управления секретами и аутентификацией (HashiCorp Vault, FusionAuth).
- Владение одним из языков программирования (Go или Python) для автоматизации и разработки внутренних инструментов.
- Знание практик SRE: работа с SLO/SLI/SLA, управление инцидентами, постмортем-анализ, планирование ресурсов (capacity planning).
- Английский язык на уровне Intermediate (для чтения и написания документации).
Мы предлагаем:
- Ценный опыт работы в международной, дружной и готовой к сотрудничеству команде.
- Возможности карьерного роста в быстрорастущей компании.
- Полный рабочий график с конкурентоспособной заработной платой.
- Годовой бонус, основанный на производительности и достижении KPI.
- Привлекательный социальный пакет.