Огородный проезд 16/1с5
Мы группа компаний «Астра» – один из лидеров российской IT-индустрии, ведущий производитель программного обеспечения, в том числе защищенных операционных систем и платформ виртуализации. Разработка флагманского продукта, ОС семейства Astra Linux, ведется с 2008 года. На сегодня в штате компании более 2 200 сотрудников.
Сейчас мы ищем активного и целеустремленного DevOps в команду AstraMonitoring.
Подразделение: Продуктовая команда разработки системы мониторинга.
Цель позиции: Обеспечение надежности, автоматизации и эффективности процессов разработки и развертывания продукта.
Обязанности:
1. Внедрение и пилотирование платформы мониторинга:
- Участие в подготовке и проведении пилотных запусков платформы мониторинга.
- Разработка CRD/Helm-чартов и docker-compose конфигураций для автоматического развёртывания агента и сервисов мониторинга.
-
Настройка агента мониторинга, отладка и кастомизация под особенности приложений пилота.
-
Сбор обратной связи от пилотных команд: анализ требований, доработка шаблонов мониторинга и правил алертов.
2. Поддержка разработки и релизов:
- Настройка и сопровождение CI/CD-пайплайнов для автоматической сборки, тестирования и деплоя микросервисов.
- Интеграция процессов непрерывного тестирования (unit, integration, smoke) и анализаторов кода в конвейер.
- Разработка автоматизаций для процессов разработки.
- Обеспечение доступа и прав команд разработки к необходимым средам (dev, stage, prod).
- Быстрое реагирование на сбои и откаты — диагностика причин неудачного релиза и восстановление работоспособности.
3. Разработка и оптимизация инфраструктуры:
- Проектирование и поддержка инфраструктуры Kubernetes (K8s) в облаке: настройка кластера, ingress-контроллеров, сетевых политик и RBAC.
- Автоматизация создания и управления ресурсами (VPC, субсети, балансировщики) через Terraform/Ansible.
- Обеспечение отказоустойчивости и масштабируемости компонентов мониторинга: настройка sharding, репликации и резервного копирования ClickHouse и PostgreSQL.
- Организация процессов управления конфигурацией.
4. Настройка наблюдаемости и алертинга:
- Разработка метрик и дашбордов: выбор ключевых SLI/SLO, настройка качественных графиков и таблиц.
- Формирование и тестирование правил алертов в движке: описание условий, временные окна и подавление шумовых уведомлений.
- Мониторинг производительности платформы мониторинга и логирование собственных сервисов: настройка self-monitoring.
5. Документирование и аналитика:
- Участие в подготовке и аналитике пользовательских историй для On-call, DevOps и SRE-команд.
- Постоянное обновление документации по архитектуре, процессам CI/CD, правилам алертинга и best practices.
Требования:
- Глубокие знания Linux и понимание сетей:
•Практический опыт администрирования ОС Linux (умение работать в командной строке, диагностировать проблемы, анализировать логи, понимание системы инициализации, прав доступа).
•Понимание сетевой модели OSI/TCP-IP на практическом уровне (настройка firewall, диагностика сетевых соединений, понимание работы протоколов TCP/UDP, DNS, HTTP/S).
•Чёткое понимание концепции контейнеризации (namespace, cgroups), отличий контейнеров от виртуальных машин. - Опыт работы с Kubernetes (K8s):
•Практический опыт развертывания и управления приложениями в Kubernetes.
•Понимание ключевых концепций: Pods, Deployments, StatefulSets, Services, Ingress, ConfigMaps, Secrets.
•Опыт работы в облачной среде. - Экосистема CI/CD:
•Глубокое понимание принципов CI/CD.
•Опыт настройки и поддержки пайплайнов в GitLab CI/CD или в аналогичной системе. - Автоматизация и кодирование:
•Умение писать скрипты для автоматизации на Bash.
•Навыки программирования на Python/golang или любом другом языке. - Инфраструктура как код (IaC):
•Опыт работы с Ansible для управления конфигурациями.
•Знание и применение одного из инструментов для описания инфраструктуры: Terraform (крайне желательно) или CloudFormation. - Мониторинг и наблюдаемость:
•Опыт работы с экспортерами для Prometheus (написание, настройка, понимание их метрик).
•Базовое понимание кода на Python/Go для возможности анализа и модификации экспортеров. - Общие навыки:
•Опыт работы с системами контроля версий Git.
Условия:
- Уверенность в будущем. Мы чтим ТК РФ: у нас стабильный и прозрачный "белый" доход.
- Забота о здоровье. Оформим полис ДМС со стоматологией.
- Спорт — это про нас. У нас многие увлекаются сноубордом, лыжами, дайвингом, бегом и пр. – найти кого-то для afterwork-активности не проблема. Мы спонсируем тренировки футбольной и волейбольной команд, поддерживаем инициативы по киберспорту и приходим на турниры по настольному футболу просто поболеть.
- Конкурентная заработная плата.
- Добираться легко. Гибрид.