DevOps-инженер

Дата размещения вакансии: 20.10.2025
Работодатель: Группа компаний Астра
Уровень зарплаты:
з/п не указана
Город:
Москва
Огородный проезд 16/1с5
Требуемый опыт работы:
От 3 до 6 лет

Мы группа компаний «Астра» – один из лидеров российской IT-индустрии, ведущий производитель программного обеспечения, в том числе защищенных операционных систем и платформ виртуализации. Разработка флагманского продукта, ОС семейства Astra Linux, ведется с 2008 года. На сегодня в штате компании более 2 200 сотрудников.

Сейчас мы ищем активного и целеустремленного DevOps в команду AstraMonitoring.

Подразделение: Продуктовая команда разработки системы мониторинга.
Цель позиции: Обеспечение надежности, автоматизации и эффективности процессов разработки и развертывания продукта.

Обязанности:

1. Внедрение и пилотирование платформы мониторинга:

  • Участие в подготовке и проведении пилотных запусков платформы мониторинга.
  • Разработка CRD/Helm-чартов и docker-compose конфигураций для автоматического развёртывания агента и сервисов мониторинга.
  • Настройка агента мониторинга, отладка и кастомизация под особенности приложений пилота.

  • Сбор обратной связи от пилотных команд: анализ требований, доработка шаблонов мониторинга и правил алертов.

    2. Поддержка разработки и релизов:

  • Настройка и сопровождение CI/CD-пайплайнов для автоматической сборки, тестирования и деплоя микросервисов.
  • Интеграция процессов непрерывного тестирования (unit, integration, smoke) и анализаторов кода в конвейер.
  • Разработка автоматизаций для процессов разработки.
  • Обеспечение доступа и прав команд разработки к необходимым средам (dev, stage, prod).
  • Быстрое реагирование на сбои и откаты — диагностика причин неудачного релиза и восстановление работоспособности.

    3. Разработка и оптимизация инфраструктуры:

  • Проектирование и поддержка инфраструктуры Kubernetes (K8s) в облаке: настройка кластера, ingress-контроллеров, сетевых политик и RBAC.
  • Автоматизация создания и управления ресурсами (VPC, субсети, балансировщики) через Terraform/Ansible.
  • Обеспечение отказоустойчивости и масштабируемости компонентов мониторинга: настройка sharding, репликации и резервного копирования ClickHouse и PostgreSQL.
  • Организация процессов управления конфигурацией.

    4. Настройка наблюдаемости и алертинга:

  • Разработка метрик и дашбордов: выбор ключевых SLI/SLO, настройка качественных графиков и таблиц.
  • Формирование и тестирование правил алертов в движке: описание условий, временные окна и подавление шумовых уведомлений.
  • Мониторинг производительности платформы мониторинга и логирование собственных сервисов: настройка self-monitoring.

    5. Документирование и аналитика:

  • Участие в подготовке и аналитике пользовательских историй для On-call, DevOps и SRE-команд.
  • Постоянное обновление документации по архитектуре, процессам CI/CD, правилам алертинга и best practices.

Требования:

  • Глубокие знания Linux и понимание сетей:
    •Практический опыт администрирования ОС Linux (умение работать в командной строке, диагностировать проблемы, анализировать логи, понимание системы инициализации, прав доступа).
    •Понимание сетевой модели OSI/TCP-IP на практическом уровне (настройка firewall, диагностика сетевых соединений, понимание работы протоколов TCP/UDP, DNS, HTTP/S).
    •Чёткое понимание концепции контейнеризации (namespace, cgroups), отличий контейнеров от виртуальных машин.
  • Опыт работы с Kubernetes (K8s):
    •Практический опыт развертывания и управления приложениями в Kubernetes.
    •Понимание ключевых концепций: Pods, Deployments, StatefulSets, Services, Ingress, ConfigMaps, Secrets.
    •Опыт работы в облачной среде.
  • Экосистема CI/CD:
    •Глубокое понимание принципов CI/CD.
    •Опыт настройки и поддержки пайплайнов в GitLab CI/CD или в аналогичной системе.
  • Автоматизация и кодирование:
    •Умение писать скрипты для автоматизации на Bash.
    •Навыки программирования на Python/golang или любом другом языке.
  • Инфраструктура как код (IaC):
    •Опыт работы с Ansible для управления конфигурациями.
    •Знание и применение одного из инструментов для описания инфраструктуры: Terraform (крайне желательно) или CloudFormation.
  • Мониторинг и наблюдаемость:
    •Опыт работы с экспортерами для Prometheus (написание, настройка, понимание их метрик).
    •Базовое понимание кода на Python/Go для возможности анализа и модификации экспортеров.
  • Общие навыки:
    •Опыт работы с системами контроля версий Git.

Условия:

  • Уверенность в будущем. Мы чтим ТК РФ: у нас стабильный и прозрачный "белый" доход.
  • Забота о здоровье. Оформим полис ДМС со стоматологией.
  • Спорт — это про нас. У нас многие увлекаются сноубордом, лыжами, дайвингом, бегом и пр. – найти кого-то для afterwork-активности не проблема. Мы спонсируем тренировки футбольной и волейбольной команд, поддерживаем инициативы по киберспорту и приходим на турниры по настольному футболу просто поболеть.
  • Конкурентная заработная плата.
  • Добираться легко. Гибрид.