Технический аудитор надёжности

Дата размещения вакансии: 03.02.2026
Работодатель: DatsTeam
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Наша распределенная команда Dev насчитывает более 800 специалистов и разрабатывает собственные продукты с 2012 года – рекламные платформы, игровые сервисы и платформы, мобильные игровые и развлекательные приложения, финтех-продукты и решения.

Сейчас мы ищем специалиста, который будет проводить технические аудиты сервисов и команд: опрашивать владельцев и участников команд, фиксировать архитектуру сервисов (C4), проверять наличие и качество базовых практик надёжности (бэкапы, мониторинг, DR, логирование, on-call и др.) и оценивать уровень зрелости по единой методике.

Обязанности:

  • Проведение аудита технической зрелости сервисов и проектов по чек-листам и шкалам.
  • Организация и проведение интервью и анкетирования с командами разработки, эксплуатации и DevOps.
  • Сбор и оформление архитектурного описания сервисов (C4 Context/Container/Component, зависимости, окружения, точки отказа).
  • Проверка наличия и состояния практик надёжности (бэкапы, восстановление и DR, мониторинг, алертинг, логирование, трассировки).
  • Анализ процессов эксплуатации и инцидентов (on-call, runbooks, постмортемы, статистика).
  • Оценка процессов изменений и релизов (деплой, rollback, контроль рисков в продакшене).
  • Анализ практик безопасности и управления доступами (секреты, доступы, audit trail).
  • Формирование отчётов по сервисам с оценкой зрелости, рисками и рекомендациями.
  • Сравнение и рейтинг сервисов и проектов.
  • Поддержка и развитие методологии аудита (чек-листы, критерии, веса, шаблоны).

Требования:

  • Опыт работы в ролях SRE, DevOps, OPS, Production Engineering или архитектуры.
  • Умение разбираться в устройстве сервисов и задавать корректные технические вопросы.
  • Опыт документирования архитектуры и понимание модели C4.
  • Практическое понимание надёжности сервисов (бэкапы, DR, мониторинг, логирование, релизы, rollback, инциденты).
  • Развитые коммуникационные навыки и опыт проведения интервью.
  • Умение формулировать выводы и фиксировать факты.
  • Навыки работы с доказательной базой (дашборды, репозитории, конфигурации, регламенты).

Будет плюсом:

  • Опыт проведения технических аудитов и разработки чек-листов.
  • Опыт создания и внедрения внутренних стандартов.
  • Опыт работы с Prometheus, Grafana, ELK/OpenSearch, Kubernetes, CI/CD.
  • Понимание SLI, SLO и Error Budget.

Условия:

  • Оформление в штат компании или международный контракт. Несколько способов выплат;

  • Full remote или гибридный офис, работа из любой страны с удобным часовым поясом;

  • Соц.пакет: ДМС, корпоративный английский, льготная система по отпускам и больничным;

  • Гибкий график - лояльное начало дня с 9.00 до 11.00 по МСК, 8 часов рабочий день;

  • Возможность выбрать привычное оборудование с доставкой на дом;
  • Performance review;

  • Развитая культура коммуникаций: турниры онлайн и оффлайн, тех комьюнити, митапы, co-working дни, встречи и пати на летней веранде, тимбилдинги;

  • Офис с панорамой на Москву-реку и летняя веранда с гамаками и пиццей для тех, кто работает в Москве и локальные тимбилдинги в других городах и странах для удаленщиков.