Обязанности:
Группа занимается устранением и расследованием аварийных ситуаций Linux-серверов, а так же мероприятиями по их недопущению.
Задачи:
- Предотвращение аварийных ситуаций, проработка мероприятий по их недопущению.
- Решение аварийных ситуаций связанных с серверной ОС, в рамках инцидент менеджмента.
- Выявление и устранение проблем связанных со снижением производительности в том числе с пограничными службами: СХД, СУБД, СРК, Сетевая инфраструктура и другие.
- Взаимодействие с вендорами, в том числе анализ и регистрация общений.
Чем придётся заниматься:
- Оперативная диагностика ОС, применение известных и формирование новых решений, по устранению аварийной ситуации в качестве 3-тей линии поддержки.
- Оценка производительности ОС, в том числе профилирование (разбитие операций на отдельные фрагменты с оценкой времени их выполнения), отладка и тестирование. Выдача рекомендаций, по улучшению производительности.
- Исследование отдельных системных\сервисных служб\компонентов, последующая тонкая настройка.
- Создание и улучшение внутренних инструкций и документаций.
Требования:
- Опыт работы: от 5 лет по направлению ОС Linux на уровне не ниже эксперт
- Образование высшее (IT/техническое)
- Опыт в управлении ролевой моделью предоставления доступов, гранулярное разграничение прав
- Экспертные знания семейства ОС Linux, в том числе для Высоконагруженных систем
- Понимание принципов администрирования серверных операционных систем Linux (RHEL, UBUNTU, Debian), в том числе ОС Импортозамещенного стека.
- Обладание компетенциями в обеспечении безопасности в части серверных ОС
- Умение решать задачи по поиску проблем и узких мест производительности ОС семейства Linux
- Опыт работы с инструментами отладки и профилирования perf gdb strace bpftool wireshark
- Навыки автоматизации рутинных задач администрирования серверов с помощью Ansible, Saltstack, Bash и Python, написание и поддержка пайплайнов Gitlab CI
- Развитие сервисов системы автоматизации и внедрение новых инструментов, подготовка шаблонов виртуальных машин и образов развертывания физических серверов
- Понимание принципов DevOps и опыт совместной работы с разработчиками и инженерами
- Знания принципов работы базовых инфраструктурных сервисов (DNS NTP LDAP DHCP и т.д.)
- Знание сетевых протоколов, стека TCP/IP, умение решать проблемы и устранять неисправности
- Навыки работы с контейнеризацией, в том числе Podman, Docker и Kubernetes
- Опыт работы с системами виртуализации (OpenStack, KVM, Vmware)
- Опыт работы с системами централизованного управления конфигурациями (ansible, SaltStack, Puppet, и пр.)
- Опыт работы с базами данных, системами кэширования и обмена сообщениями (Scilla, Redis, Kafka, Artemis, PostgreSQL)
Условия:
- Оформление по ТК РФ;
- Заработная плата обсуждается с успешным кандидатом;
- Оплата мобильной связи, ДМС;
- График работы 5/2