Yandex Cloud предоставляет полный спектр облачных сервисов для клиентов. Наша задача — помочь бизнесам применять облачные технологии для повышения эффективности их деятельности, используя инфраструктуру и уникальные технологии Яндекса. Мы ищем руководителя в команду Customer Reliability Engineers (CRE).
CRE — важная роль в клиентской организации Yandex Cloud. Его основная задача — работа с наиболее важными клиентами и оказание им помощи в вопросах надёжности и отказоустойчивости критичных информационных систем (ИС), развёрнутых в Yandex Cloud. CRE должен обладать глубокими технологическими знаниями облачных сервисов и руководствоваться практиками Site Reliability Engineering (SRE) при работе.
Какие задачи вас ждут
Управление командой CRE
Вам предстоит выстраивать процессы в команде и обеспечивать выполнение метрик, достигать KPI по удовлетворённости клиентов поддержкой и надёжностью информационных систем в Yandex Cloud, разрабатывать меры по улучшению качества обслуживания. Необходимо взаимодействовать с командами внутри Yandex Cloud (специалистами техподдержки, архитекторами, разработчиками, аккаунт-менеджерами), чтобы решать клиентские проблемы и устранять технические блокеры при использовании сервисов Yandex Cloud.
Взаимодействие с командами клиента: от отделов эксплуатации, DevOps, SRE до топ-менеджмента
Вы будете помогать команде в организации проработки эскалаций и решать клиентские инциденты в роли инцидент-менеджера, организовывать war-room с командами клиента и Yandex Cloud. Предстоит помогать команде разбирать инциденты с командами клиентов, готовить Root Cause Analysis (RCA) и список Action Items (AI) для предотвращения инцидентов. Также нужно будет выступать на отчётных клиентских мероприятиях в рамках трека «Статистика проблем и повышение надёжности клиентских ИС».
Мы ждём, что вы
- Работали руководителем группы эксплуатации IT-систем или команды SRE
- Работали с облачными технологиями
- Решали проблемы в Kubernetes-кластерах в PROD-среде, понимаете внутреннее устройство отказоустойчивого кластера Kubernetes
- Знакомы с методами построения архитектуры прикладных решений
- Умеете выстраивать взаимодействие в команде и со смежными направлениями
- Можете создавать комфортную рабочую атмосферу
- Понимаете методологию и стандарты управления IT-сервисами
- Знаете стек протоколов модели OSI, основы маршрутизации, умеете диагностировать сетевые проблемы
- Понимаете, как работают сервисы в ОС Linux, знаете основные команды диагностики
- Хорошо разбираетесь в устройстве СУБД PostgreSQL, MySQL, MongoDB, ClickHouse, Greenplum
- Не боитесь общаться с клиентами и объяснять, что вы им предлагаете
Будет плюсом, если вы
- Поддерживали продакшн ИС, построенных на платформе Yandex Cloud
- Участвовали в реализации IT-проектов с крупными компаниями в технической роли
- Умеете приоритизировать задачи в зависимости от степени влияния на бизнес
- Понимаете современные технологические и бизнес-задачи различных индустрий