Москва
Твои задачи на этой позиции:
- обеспечение стабильности, отказоустойчивости и производительности систем;
- разработка и поддержка инструментов для автоматизации процессов (развертывание, мониторинг, резервное копирование и т.д.);
- оптимизация инфраструктуры для повышения эффективности и экономии ресурсов;
- мониторинг состояния системы, выявление проблем и их устранение;
- коммуникации с разработчиками для улучшения процессов развертывания и обслуживания ПО;
- планирование и проведение масштабирования инфраструктуры в соответствии с потребностями бизнеса;
- участие в разработке стратегии обеспечения безопасности системы;
- документирование процессов и решений для последующего использования коллегами.
Пожелания к твоему опыту:
- опыт в области системного администрирования и/или разработки программного обеспечения;
- знания операционных систем (Linux, Unix) и сетевых технологий;
- знание инструментов мониторинга и логирования (например, Prometheus, Grafana, ELK Stack, Graylog);
- навыки автоматизации задач с использованием скриптов (например, Bash, Python);
- знание инструментов автоматизации Ansible, Terraform, Gitlab-ci;
- понимание DevOps-практик и инструментов CI/CD (helm);
- знания Kubernetes.
Будет плюсом:
- базовые знания баз данных Postgre, Mongo, Clickhouse;
- навыки thouble-shoting (strace, atop, sentry, APM);
- знание систем передачи сообщений RabbitMQ, Kafka;
- знания Redis и Memcache;
- глубокие знания Kubernetes и его компонентов (CNI, CSI);
- знание операторов Kubernetes;
- опыт работы с облачными платформами (например, AWS, Google Cloud, Azure, Yandex и др.);
- опыт работы с ArgoCD, werf;
- опыт работы с Victoria Metrics;
- базовые знания go, php, python, nodejs;
- опыт работы с GlusterFS и Minio (S3).