з/п не указана
Москва
Более 6 лет
Мы — российский вендор в сфере информационной безопасности. Разрабатываем решение класса VM и EASM - по сканированию на уязвимости.
Сейчас мы ищем опытного Senior SRE-инженера, который поможет развивать внутреннюю платформу компании, повышать надежность сервисов, автоматизировать инфраструктуру и внедрять лучшие практики Site Reliability Engineering.
Обязанности:
- Эксплуатация, развитие и автоматизация Kubernetes-кластеров в production.
- Поддержка и развитие платформы виртуализации и корпоративной инфраструктуры.
- Обеспечение высокой доступности, производительности и надежности внутренних сервисов.
- Автоматизация процессов развертывания, обновления и сопровождения инфраструктуры.
- Развитие observability-платформы: мониторинг, логирование, алертинг, метрики и трассировка.
- Развитие решений по резервному копированию, Disaster Recovery и обеспечению отказоустойчивости.
- Внедрение и развитие Infrastructure as Code и GitOps-подходов с использованием Terraform, Ansible, Helm/Helmfile.
- Участие в расследовании инцидентов, проведении postmortem и устранении причин возникновения сбоев.
- Совместная работа с командами разработки над повышением надежности сервисов и развитием CI/CD-процессов.
- Разработка внутренних платформенных инструментов и сервисов на Go.
Требования:
- Опыт эксплуатации Kubernetes в production.
- Понимание принципов Site Reliability Engineering: SLA, SLI, SLO, Error Budget, Incident Management, Postmortem.
- Практический опыт работы с Terraform (Terragrunt), Ansible, Helm/Helmfile.
- Опыт работы с платформами виртуализации и контейнеризации.
- Опыт построения систем мониторинга и observability на базе Prometheus, VictoriaMetrics, Loki, VictoriaLogs, Fluent Bit или аналогичных решений.
- Уверенные знания Linux и понимание работы сетевых сервисов (DNS, VPN, TLS/SSL, маршрутизация).
- Опыт эксплуатации PostgreSQL.
- Опыт сопровождения внутренних инженерных сервисов и платформенной инфраструктуры.
- Понимание принципов резервного копирования, восстановления и обеспечения отказоустойчивости.
- Опыт автоматизации инфраструктуры и стремление минимизировать ручные операции.
- Будет плюсом опыт разработки на Go.
Условия:
- Аккредитованная IT-компания.
- Полностью удаленный формат работы — можно работать из любой точки мира.
- Оформление в российское юридическое лицо (ТК РФ или ИП).
- Конкурентная заработная плата с выплатами в рублях.
- Гибкий график работы.
- Возможность влиять на развитие платформы и инфраструктуры компании.
- Современный технологический стек и интересные инженерные задачи.
- Молодая команда профессионалов без бюрократии и микроменеджмента.