з/п не указана
Екатеринбург
От 1 года до 3 лет
В этой роли вы будете отвечать за сопровождение и развитие инфраструктуры в закрытых контурах, участвовать в проектировании и обновлении систем, обеспечивать надежную работу сервисов на всех этапах их жизненного цикла - от идеи до промышленной эксплуатации.
Основные обязанности:
- Поддержка ML-сервисов на уровне 3-й линии (инциденты, изменения, оптимизация).
- Сопровождение инфраструктуры по проектам со стороны заказчика/потребителя ресурсов.
- Участие в релизных процессах, процессах разработки, тестирования и сопровождения.
- Проектирование и обновление систем с учетом требований надежности и масштабируемости.
- Проведение инфраструктурных ревью, оптимизаций и экспертиз.
- Взаимодействие с командами разработчиков, аналитиков, DevOps и информационной безопасности.
- Описание и документирование процессов интеграции и взаимодействия со смежными системами.
- Сопровождение ML-решений на протяжении всего жизненного цикла.
Требования:
- Знание архитектурных паттернов (монолит, SOA, микросервисы, event-driven и др.).
- Опыт сопровождения высоконагруженных систем.
- Опыт работы с контейнеризацией (Docker, Kubernetes).
- Глубокое понимание сетевых протоколов, баз данных и принципов безопасности.
- Умение составлять техническую документацию.
- Опыт работы с баг-трекерами (Jira, Redmine, Mantis).
- Понимание принципов CI/CD.
- Опыт работы с системой контроля версий Git.
Будет плюсом:
- Опыт проектирования и сопровождения инфраструктуры в средах с повышенными требованиями к безопасности (закрытые контуры, финансовая сфера).
- Знание принципов построения отказоустойчивых и масштабируемых систем (High Availability / Fault Tolerance, кластеризация, балансировка, резервирование).
- Опыт работы с системами мониторинга и логирования (Prometheus, Grafana, ELK/EFK, Zabbix).
- Навыки работы с инструментами управления конфигурациями и IaC (Terraform, Ansible, Helm, Kustomize).
- Опыт взаимодействия с системами очередей и стриминговой обработки (Kafka, RabbitMQ).
- Понимание принципов Observability (метрики, логи, трейсы).
- Навыки оптимизации производительности приложений и инфраструктуры (в том числе GPU/CPU/RAM ресурсы в Kubernetes).
- Умение формализовать и документировать технические решения, готовить архитектурные схемы и спецификации.
- Опыт работы с BigData-технологиями
- Опыт работы с корпоративными хранилищами данных и понимание принципов их построения
Основные задачи, которые предстоит решать сотруднику.
Прикладное сопровождение ML-сервисов и инфраструктуры в рамках 3ЛС