Краснодар
Чем предстоит заниматься
- Обеспечивать бесперебойную работу аналитических сервисов, оценивать, планировать и координировать работу по устранению сбоев
- Идентифицировать, документировать и анализировать сбои в работе сервисов, контролировать устранение сбоев смежными подразделениями
- Коммуницировать с заказчиками сервисов на предмет сроков восстановления систем и решения проблем заказчика с сервисом
- Обеспечивать своевременное информирование пользователей о плановых и внеплановых работах, затрагивающих аналитические сервисы
- Обеспечивать восстановление интеграционных потоков от систем-источников
- Своевременно реагировать на мониторинги и предпринимать меры по устранению причин срабатывания мониторингов
- Обеспечивать конфигурирование и постановку новых моделей в продуктив
- Принимать участие в формировании бэклога задач, исходя из текущего и прогнозируемого уровня нагрузки сервисов и потребностей команды
Что для этого нужно
- Знание Unix-подобных OS
- Понимание CNI, k8s, опыт диагностики проблем сетевого стека
- Опыт работы с системами мониторинга, желательно prometheus
- Опыт работы с базами данных (Oracle/MySQL/PostgreSQL/MariaDB/MSSQL/Hive и т п)
- Уверенные знания shell/bash, Python и/или других скриптовых языков