Site Reliability Engineer в команду Baremetal Yandex Cloud

Дата размещения вакансии: 07.01.2025
Работодатель: Яндекс
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Yandex Cloud предоставляет клиентам возможность арендовать не только виртуальные сущности, но и физические серверы. Наша команда разрабатывает и поддерживает инфраструктуру, на которой работает эта технология. Ищем инженера DevOps/SRE, который готов помочь нам в развитии сервиса.

Какие задачи вас ждут:

Деплой программного обеспечения в облаке
Вам предстоит разворачивать и поддерживать программное обеспечение по «выдаче» серверов клиентам в облачном Kubernetes, разворачивать и поддерживать отдельные инсталляции Kubernetes «на железе» — там, где облачные технологии уже не работают, диагностировать проблемы сервисов и сети в этих облаках, а также мониторить ПО и серверы, на которых оно работает.

Мы ждем, что вы:

  • Хорошо понимаете устройство ОС Linux и её взаимодействие с сервером
  • Понимаете, как устроено оборудование серверов
  • Разбираетесь в устройстве сетей и умеете диагностировать их проблемы
  • Умеете и любите автоматизировать процессы на Python или Golang
  • Умеете диагностировать проблемы не только по логам приложения
  • Имеете опыт эксплуатации сервисов 24×7

Будет плюсом, если вы:

  • Проектировали и разрабатывали новые сервисы
  • Знаете k8s, умеете не только запускать сервисы внутри, но и сам k8s
  • Имели дело с Yandex Cloud и понимаете, как в нём работают виртуальные серверы
  • Понимаете, чем отличается BIOS от BMC, а UEFI-загрузка от Legacy