Москва
Вместе с нами ты будешь:
- Обеспечивать доступность инфраструктурных компонентов публичного облака в режиме 24/7/365 в соответствии с принятыми SLA;
- Заниматься настройкой, мониторингом, автоматизацией и дальнейшим улучшением существующей инфраструктуры;
- Активно взаимодействовать с командами разработки, тестирования, эксплуатации и поддержки.
Какие знания и навыки для нас важны:
- Фундаментальные знания устройства Linux-систем;
- Фундаментальные знания сетевого стека TCP/IP (TCP, UDP, NAT/PAT, HTTP, DNS и т.д.);
- Опыт работы с инструментами балансировки и их «тюнинг» (LVS\IPVS, HAProxy и др);
- Опыт работы с контейнерными средами и платформами их оркестрации (Docker\Podman, Kubernetes\OpenShift);
- Опыт работы с инфраструктурой в VMware (жизненный цикл ВМ, настройка EDGE – Nat, Firewall, VPN);
- Понимание принципов CI/CD и подхода к описанию инфраструктуры Infrastructure as Code;
- Уверенную работу с системами управления конфигурациями Ansible, Terraform;
- Опыт работы с платформой мониторинга и логирования на базе Victoria Metrics (или Prometheus), Alert Manager, Grafana, Zabbix, EFK (EVK), в том числе настройка сборщиков метрик, получения логов от приложения и настройка на их основе дашбордов, создание модификация дашбордов в Grafana\Kibana;
- Понимание, что такое SLA-OLA, и как c ним работать;
- Опыт контроля работы L1 линии, в том числе разработка/модификация инструкций.
- Большой плюс, если есть навыки по «тюнингу» СУБД (PostgreSQL, Cassandra, ElasticSearch/OpenSearch, Redis).