з/п не указана
Москва
не требуется
Всем привет!
Мы - международная компания в сфере сетевой безопасности, работаем на глобальном рынке с 2017 года, имеем более 40 млн активных пользователей ежемесячно
- Инфраструктура включает:
- контейнеры (Kubernetes, Docker)
- микросервисный backend
- Развёртывание в Hetzner, AWS и Cloudflare с полной автоматизацией через GitOps
- Надёжность и наблюдаемость — ключевые принципы нашей работы
- Ищем Senior Monitoring Engineer, который будет отвечать за весь стек наблюдаемости и развивать AI-assisted monitoring
Обязанности:
- Разработка, внедрение и развитие системы мониторинга и observability для распределённой инфраструктуры (VPN, контейнеры, облака)
- Настройка и поддержка мониторинга Kubernetes/Docker, веб-сервисов и backend-инфраструктуры
- Построение и оптимизация системы алертинга (без alert fatigue), создание SLO/SLI и контроль error budget
- Организация и развитие централизованного логирования (Fluent Bit, Kafka, Vector, Loki/Elasticsearch), анализ и корреляция логов
- Внедрение автоматизированных проверок доступности (blackbox monitoring) из разных регионов
- Анализ инцидентов, участие в RCA, разработка runbooks и повышение надёжности систем
- Развитие интеллектуального мониторинга (AIOps): детекция аномалий, прогнозирование, автоматизация реагирования
Требования:
- 4+ года опыта (SRE / DevOps / Monitoring)
- Prometheus, Grafana, Zabbix
- Kubernetes и Docker мониторинг
- Логирование: Fluent Bit, Kafka, Vector, Loki / Elasticsearch
- Опыт с VPN (OpenVPN, IKEv2, XRay)
- Python или Go
- GitOps: Helm, Terraform, Ansible, GitLab CI
Условия:
- Полностью удалённая работа, гибкий график
- Работа с высоконагруженной глобальной инфраструктурой
- Современный стек (Hetzner, AWS, Cloudflare, GitOps)
- Минимум бюрократии
- Конкурентная зарплата