Продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных компаний, основная часть которых представляет собой B2B решения развлекательной, игровой и спортивной тематики, находится в поисках Site Reliability Engineer (SRE).
Чем предстоит заниматься:
-
Улучшать систему и процессы мониторинга, повышать Observability системы;
-
Проектировать, внедрять и поддерживать метрики для мониторинга;
-
Улучшать процессы инцидент-менеджмента;
-
Участвовать в устранении сбоев и расследовании их причин;
-
Поддерживать бесперебойную работу сервисов;
-
Договариваться с коллегами и находить лучшие решения для проекта.
Какие навыки нужны:
-
Умеешь в Linux на уровне системного администратора;
-
Уверенно владеете одним из языков программирования: Go, C#, Python, Java и другие;
-
Понимание принципов работы сетей и протоколов взаимодействия; приложений, навыки диагностики проблем с ними;
-
Работали с системами контроля версий Git;
-
Работали с системами мониторинга и алертинга Prometheus и Grafana, агрегаторами логов;
-
Работали с системами контейнеризации и оркестрации Docker и k8s;
-
Высокий уровень самостоятельности.
Что компания может предложить:
- Возможность развивать свои компетенции и применять знания на практике;
- Возможность поработать на крупных проектах;
- Компания заинтересована в развитии своих сотрудников: готовы привлекать наставников и оплачивать курсы для повышения квалификации;
- Отсутствие бюрократии, быстрое согласование необходимых вещей;
- Оплачиваемые отпускные и больничные;
- Премия по итогам года до 1-го оклада;
- Компенсация спортзала;
- Частичная компенсация английского языка или психолога (на выбор);
- Компания поддерживает сотрудника в важные периоды жизни;
- Предоставляем 4 day-off в год за счет компании;
- ДМС после испытательного срока;
- Пересмотр заработной платы по результатам работы;
- Удаленный/офисный/гибридный формат работы.