Работу сервисов Яндекса обеспечивают несколько новейших датацентров — компания строит их по собственному проекту. Дата-центры — это, с одной стороны, инженерное оборудование, с другой — сотни тысяч серверов, которые мы проектируем и собираем совместно с крупными производителями.
Поддерживать серверное оборудование в работе 24/7 - сложная задача, требующая определенных навыков от всех линий поддержки. Группа второй линии поддержки инфраструктуры датацентров отвечает за решение сложных инцидентов и системных проблем, возникающих в процессе работы оборудования.
Мы ищем специалиста, который имеет опыт тестирования, ремонта, сборки или настройки серверов, умеет концентрироваться на поиске корневых причин проблем.
Вам предстоит:
-
обрабатывать входящие инциденты, поступающие от группы поддержки датацентров, системных администраторов и сетевых инженеров;
-
исследовать и вырабатывать решения по предотвращению массовых проблем с ИТ оборудованием, взаимодействовать по решению проблем со смежными подразделениями в компании;
-
валидировать обновление микрокода BIOS, BMC;
-
тестировать и валидировать накопители информации, ОЗУ, GPU-карты.
Мы ждем, что вы:
- имеете опыт работы в ИТ-сфере, с серверным оборудованием на позиции старшего/ведущего инженера
- глубоко знаете устройство серверов, принципы работы и технические характеристики серверных компонентов
- имеете опыт работы с ОС Linux (сбор и анализ логов, работа в командной строке, обработка объёмных файлов — JSON, CSV), умеете работать с API сторонних сервисов
- умеете расставлять приоритеты и решать задачи в заданный срок, чётко выражаете свои мысли устно и письменно
- умеете искать аналогичные возникающим в продакшене проблемы и способы их решения в интернете (Stack Overflow, форумы с поддержкой вендоров и т.п.).
Будет плюсом, если вы:
- имеете навыки анализа данных;
- знаете сетевой стек;
- знаете и умеете читать схемотехнику;
- знаете английский язык на уровне Intermediate и выше.