SRE в команду эксплуатации продуктовых проектов

Дата размещения вакансии: 24.02.2025

Работодатель: VK

Уровень зарплаты:

з/п не указана

Город:

Москва

Требуемый опыт работы:

Более 6 лет

Команда эксплуатации продуктовых проектов обеспечивает бесперебойную работу VK Музыки, VKGid, Маруси и многих других продуктов.

Стек: Ansible, nginx, Haproxy, PostgreSQL, ClickHouse, MongoDB, MySQL, Kafka (высоконагруженные, проходит до 5 миллионов сообщений в секунду), Elasticsearch, Redis, Memcached, etcd, Kubernetes (как сервис).

Как построена работа в нашей команде:

сейчас нас 8 человек;
большая часть команды живет в Москве, но мы работаем в комбинированном или удалённом формате в рамках России;
крупные сервисы поделены на ответственных исполнителей;
выделяется время на разработку, внедрение и анализ новых архитектурных решений;
поощряется ведение документации, передача опыта коллегам, саморазвитие.

Мы гордимся, что у нас:

разнообразная инфраструктура;
ответственная и дружелюбная команда;
выбор технологий, с которыми интересно работать;
технологии, которые сложно пощупать самостоятельно;
высоконагруженные и большие по объёму базы;
многие автоматизированные процессы через специальные системы;
централизованный мониторинг;
своя централизованная система установки ОС на серверы.

Приходите к нам в команду продуктовых проектов, чтобы получить опыт с разнообразным стеком технологий!

Стратегические задачи:

Бесперебойная работа всех сервисов;
резервирование всех сервисов между ДЦ;
исключение ручного труда (автоматизация);
минимизация времени деплоя;
повышение отказоустойчивости.

Повседневные задачи:

Регулярный запуск новых проектов и дальнейшая эксплуатация;
организация деплоя и мониторинга работоспособности наших сервисов;
разработка новых архитектурных решений для оптимизации затрат и повышения надёжности сервисов;
поддержка релизного цикла сервисов;
плотное взаимодействие с разработкой по вопросам доработок, деплоя, исправления сервисов и необходимой оптимизации;
работа по событиям мониторинга и участие в решении критических инцидентов в зоне ответственности.

Требования:

Linux Internals — понимание на хорошем уровне;
БД — PostgreSQL или ClickHouse на уровне администратора: построение отказоустойчивых кластеров, репликации, оптимизации, тюнинг БД;
сети — базовое понимание.

Будет плюсом:

Ansible — написание плейбуков;
GitLab — написание пайплайнов;
знание Go, Python, Bash.

Откликнуться

SRE в команду эксплуатации продуктовых проектов

Похожие вакансии: Москва