SRE в команду эксплуатации продуктовых проектов

Дата размещения вакансии: 24.02.2025
Работодатель: VK
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
Более 6 лет

Команда эксплуатации продуктовых проектов обеспечивает бесперебойную работу VK Музыки, VKGid, Маруси и многих других продуктов.

Стек: Ansible, nginx, Haproxy, PostgreSQL, ClickHouse, MongoDB, MySQL, Kafka (высоконагруженные, проходит до 5 миллионов сообщений в секунду), Elasticsearch, Redis, Memcached, etcd, Kubernetes (как сервис).

Как построена работа в нашей команде:

  • сейчас нас 8 человек;
  • большая часть команды живет в Москве, но мы работаем в комбинированном или удалённом формате в рамках России;
  • крупные сервисы поделены на ответственных исполнителей;
  • выделяется время на разработку, внедрение и анализ новых архитектурных решений;
  • поощряется ведение документации, передача опыта коллегам, саморазвитие.

Мы гордимся, что у нас:

  • разнообразная инфраструктура;
  • ответственная и дружелюбная команда;
  • выбор технологий, с которыми интересно работать;
  • технологии, которые сложно пощупать самостоятельно;
  • высоконагруженные и большие по объёму базы;
  • многие автоматизированные процессы через специальные системы;
  • централизованный мониторинг;
  • своя централизованная система установки ОС на серверы.

Приходите к нам в команду продуктовых проектов, чтобы получить опыт с разнообразным стеком технологий!

Стратегические задачи:

  • Бесперебойная работа всех сервисов;
  • резервирование всех сервисов между ДЦ;
  • исключение ручного труда (автоматизация);
  • минимизация времени деплоя;
  • повышение отказоустойчивости.

Повседневные задачи:

  • Регулярный запуск новых проектов и дальнейшая эксплуатация;
  • организация деплоя и мониторинга работоспособности наших сервисов;
  • разработка новых архитектурных решений для оптимизации затрат и повышения надёжности сервисов;
  • поддержка релизного цикла сервисов;
  • плотное взаимодействие с разработкой по вопросам доработок, деплоя, исправления сервисов и необходимой оптимизации;
  • работа по событиям мониторинга и участие в решении критических инцидентов в зоне ответственности.

Требования:

  • Linux Internals — понимание на хорошем уровне;
  • БД — PostgreSQL или ClickHouse на уровне администратора: построение отказоустойчивых кластеров, репликации, оптимизации, тюнинг БД;
  • сети — базовое понимание.

Будет плюсом:

  • Ansible — написание плейбуков;
  • GitLab — написание пайплайнов;
  • знание Go, Python, Bash.