Наша команда занимается совершенствованием и повышением стабильности IT-инфраструктуры, поиском точек для повышения производительности и сокращения затрат на складские операции, а также внедрением цифровых инструментов в рамках концепции Индустрия 4.0.
Какие задачи вас ждут:
Мониторинг состояния систем и своевременное реагирование на инциденты
Поддерживать актуальность данных в системе мониторинга, редактировать метрики, а также реагировать на возникающие инциденты и участвовать в устранении неисправностей и их причин.
Автоматизация рутинных задач (Bash/Python/Golang)
Разрабатывать новые и поддерживать/дорабатывать существующие скрипты и правила автоматизации таких процессов, как реагирование на инциденты (алармы / эскалация / запуск скриптов устранения), автоматическое резервирование и восстановление виртуальных машин и сервисов, подготовка образов АРМ и пр.
Доработка и развитие сервисов (Golang/Python)
Вам предстоит разобраться в исходных кодах (написанных преимущественно на Golang), а затем заниматься задачами устранения различных багов (если таковые находятся) и разработки новых фич для этих сервисов.
Мы ждём, что вы:
- Работали SRE- или DevOps-инженером от двух лет
- Администрировали Linux и СУБД (PostgreSQL)
- Взаимодействовали с системой виртуализации KVM/QEMU (обязательно) и с системой печати CUPS
- Писали код на Bash, Python или Gо
- Умеете разрабатывать и согласовывать метрики мониторинга приложений
- Знаете сетевые протоколы (TCP/IP, DNS, HTTP), Git, CI/CD-пайплайны, Docker, Ansible, Salt
Будет плюсом, если вы:
- Работали с Kubernetes, Terraform
- Знаете Kafka, RabbitMQ