Системный администратор / SRE в OneCloud

Дата размещения вакансии: 12.11.2024
Работодатель: VK
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет
OneCloud — внутреннее облако VK, в котором мы запускаем сервисы, базы данных и серверы очередей.
Основанное на открытых решениях, облако обеспечивает высокую доступность сервисов и ускоряет запуск проектов.
Сейчас мы в команде эксплуатации решаем задачи, связанные с укрупнением облака — автоматизируем рутину и предотвращаем инциденты.
Ищем специалиста, который поможет нам поддерживать бесперебойную работу сервиса и внедрять новые решения для задач бизнеса.
Задачи:
  • эксплуатировать парк серверов облака — более 10 000 хостов;
  • постоянно обновлять парк серверов — мы стараемся эффективнее использовать каждый юнит в дата-центрах;
  • управлять инцидентами — в связке с командами мониторинга и разработки устранять сбои и предотвращать их повторение;
  • автоматизировать процессы эксплуатации и оркестрации — при наших объёмах задачи решаются через код;
  • участвовать в разработке и внедрении новой функциональности облака.
Требования:
Middle:
  • вы не менее трёх лет работали с парком bare-metal серверов (обязательно) и с серверной инфраструктурой на базе Linux;
  • понимаете принципы работы с сетью — iptables, BGP, VRRP;
  • использовали SCM — Puppet, Salt, Ansible;
  • автоматизировали рутину с помощью скриптов на bash и Python.
Senior:
  • вы управляли большим парком bare-metal серверов;
  • умеете решать задачи на Python и используете PyPi;
  • знаете, как эксплуатировать и проектировать высокодоступные кластеры;
  • готовы обсуждать и ставить ТЗ команде разработки;
  • знакомы с эксплуатацией сервисов на Java и не боитесь in-house решений.
Будет плюсом:
  • вы работали с системами на базе RHEL;
  • работали с веб-хостингом — nginx, MySQL, Postgress;
  • использовали CFEngine, Cassandra, Zabbix и Vault;
  • знаете Go и Java.​​​​