Задачи, которые будут в твоих руках:
Инфраструктура и платформа
-
Развивать cloud-native инфраструктуру на AWS (EKS, RDS, MSK, S3 и смежные сервисы)
-
Строить и поддерживать Internal Developer Platform: сервисные шаблоны, self-service инструменты, GitOps-процессы
-
Управлять IaC-слоем (Terraform): стейт, модули, окружения (dev/staging/prod)
-
Обеспечивать надёжность и SLA продакшн-систем — кредитный конвейер, платёжные интеграции, realtime-скоринг
AI-инфраструктура (ключевое направление)
-
Поддерживать и развивать инфраструктуру для AI/ML-рабочих нагрузок: деплой LLM, GPU-узлы, векторные БД
-
Строить и обслуживать LLMOps/MLOps-пайплайны совместно с командой разработки
-
Интегрировать AI-инструменты в операционные процессы команды
Команда и процессы
-
Руководить командой инфраструктуры: найм, развитие, 1-2-1, целеполагание
-
Выстраивать и поддерживать процессы мониторинга, алертинга, инцидент-менеджмента
-
Управлять CI/CD: скорость деплоя, надёжность пайплайна, rollback-стратегии
-
Вести бюджет инфраструктуры, отвечать за FinOps: rightsizing, резервирование, waste-репорты
Безопасность и соответствие
-
Внедрять security-by-default: secrets management (Vault), network policies, RBAC, zero-trust
-
Обеспечивать соответствие требованиям финансовых регуляторов (Индия/ Казахстан / Узбекистан)
-
Проводить архитектурные ревью новых решений с позиции безопасности и надежности
Вендоры и документация
-
Управлять отношениями с облачными провайдерами и SaaS-вендорами
-
Вести актуальную архитектурную документацию; поддерживать runbook-культуру в команде
Что для этого нужно:
-
5+ лет в DevOps / инфраструктуре, из них 2+ года в роли тимлида или руководителя
-
Уверенный Kubernetes: продакшн-эксплуатация, troubleshooting, безопасность кластера
-
Опыт с AWS на уровне архитектора (EKS, RDS, MSK, VPC, IAM, CloudWatch)
-
Infrastructure as Code: Terraform или Pulumi в продакшн-масштабе
-
CI/CD: GitOps (ArgoCD / Flux), GitHub Actions / GitLab CI
-
Понимание принципов Platform Engineering и опыт построения внутренних инструментов для разработчиков
-
Наблюдаемость: OpenTelemetry, Prometheus, Grafana, централизованный logging (ELK / Loki)
-
Безопасность: zero-trust, Vault, secrets rotation, сетевые политики
Желательные
-
Опыт деплоя и эксплуатации LLM-сервисов
-
Опыт в финтехе, понимание требований к надёжности и compliance финансовых систем
-
FinOps-практики: AWS Cost Explorer, Spot Instances, Savings Plans
Личные качества
-
Думает системно: видит инфраструктуру как продукт, а не набор серверов
-
Умеет расставлять приоритеты в условиях неопределённости
-
Открыт к AI-инструментам: использует Claude, AI-ассистенты и автоматизацию в ежедневной работе
-
Хорошо коммуницирует технические решения на уровне бизнеса