Есильский район, улица Акмешит 1блок1
Обязанности:
- Архитектура и устойчивость эксплуатации
• Участие в анализе архитектуры low-code BPM-платформы и микросервисных решений с точки зрения эксплуатации, отказоустойчивости и сопровождаемости;
• Формирование и предоставление рекомендаций по улучшению архитектуры сервисов, интеграций и инфраструктурных решений с целью повышения стабильности и масштабируемости;
• Анализ архитектурных решений при внедрении новых компонентов, интеграций и изменений в продуктивной среде;
• Участие в разборе архитектурных причин инцидентов и деградаций производительности;
• Оценка технических и операционных рисков при изменениях архитектуры и конфигураций
• Содействие внедрению best practices эксплуатации, мониторинга и логирования распределённых систем.
- Сопровождение, поддержка и эксплуатация
• Обеспечение сопровождения тестовых и продуктивных сред low-code BPM-платформы;
• Анализ и устранение сложных и критических инцидентов 3-й линии поддержки в микросервисной архитектуре;
• Диагностика проблем на уровне:
• backend-сервисов (Java / Spring Boot),
• интеграций и API,
• очередей сообщений (Kafka),
• баз данных (PostgreSQL, Oracle),
• поисковых систем (Elasticsearch);
• Анализ логов и трассировок с использованием централизованных систем логирования (ELK);
• Анализ метрик, алертов и показателей производительности в системах мониторинга (Grafana);
• Участие в релизах, деплое и сопровождении изменений в рамках CI/CD и GitOps-процессов (ArgoCD);
• Контроль стабильности сервисов в Kubernetes-среде, анализ состояния ресурсов и окружений;
• Проведение анализа первопричин инцидентов (RCA), подготовка корректирующих и предупреждающих мероприятий;
• Взаимодействие с командами разработки, DevOps и 1–2 линией поддержки для устранения системных проблем;
• Участие в стабилизации платформы после релизов и внедрений.
- Взаимодействие и документация
• Консультирование и методологическая поддержка специалистов 1–2 линий и менее опытных инженеров 3-й линии поддержки;
• Участие в обучающих сессиях, разборе инцидентов и внутрикомандных технических встречах;
• Взаимодействие с архитекторами, разработчиками, DevOps и другими подразделениями для обеспечения устойчивой эксплуатации платформы;
• Взаимодействие с подразделениями информационной безопасности по вопросам эксплуатации и устранения уязвимостей;
• Подготовка и актуализация эксплуатационной документации, инструкций и runbook’ов;
• Ведение и развитие базы знаний по инцидентам, типовым проблемам и решениям;
• Документирование причин инцидентов, технических ограничений и рекомендаций по улучшению эксплуатации;
• Участие в формировании стандартов и регламентов поддержки и сопровождения.
Требования:
- Знание основных бизнес-процессов Банка и автоматизированных систем, обеспечивающих их поддержку;
- Знание принципов микросервисной архитектуры, межсервисного взаимодействия и интеграции с внутренними и внешними системами;
- Знание архитектуры low-code BPM-платформ и принципов исполнения бизнес-процессов;
- Знание принципов работы распределённых систем, очередей сообщений и асинхронных взаимодействий (Kafka);
- Знание принципов работы и эксплуатации контейнеризированных приложений и оркестрации (Kubernetes);
- Знание принципов мониторинга, логирования и трассировки распределённых систем (ELK, Grafana);
- Знание принципов построения и анализа метрик производительности и доступности сервисов;
- Знание принципов CI/CD и GitOps-подходов (в том числе ArgoCD);
- Знание принципов безопасного хранения и использования секретов (Vault);
- Знание принципов работы реляционных баз данных (PostgreSQL, Oracle), включая транзакционность, блокировки и производительность;
- Знание принципов работы поисковых систем и индексации данных (Elasticsearch);
- Знание архитектуры и принципов работы backend-приложений на базе Java / Spring Boot на уровне чтения и анализа кода;
- Знание основ сетевого взаимодействия, протоколов и API (REST);
- Знание методологий анализа причин инцидентов (Root Cause Analysis).
- Умение работать с логами распределённых систем, выявлять причинно-следственные связи и системные проблемы;
- Умение анализировать метрики и алерты, выявлять деградации производительности и потенциальные риски;
- Умение диагностировать проблемы в микросервисной архитектуре, включая взаимодействие сервисов, очередей сообщений и баз данных;
- Умение читать и анализировать код backend-приложений (Java / Spring Boot) для понимания логики ошибок и поведения системы;
- Умение работать с Kubernetes-окружением (анализ состояния сервисов, ресурсов, конфигураций);
- Умение анализировать и сопровождать процессы CI/CD и деплоя приложений;
- Умение работать с SQL-запросами и анализировать проблемы производительности баз данных.
Став частью команды Forte, ты получишь:
- Конкурентную заработную плату и бонусы за персональную эффективность.
- График работы 5/2 с 9:00-18:00 в комфортном офисе;
- Жизнь внутри компании с ее корпоративными мероприятиями: тимбилдинги, челленджи, спортивные турниры, благотворительные акции;
- Заботу о здоровье с медицинским страхованием, а также DayOff в честь дня рождения и за выслугу лет;
- Выгодную рассрочку в крупные фитнес-клубы;
- Доступ к корпоративной библиотеке для непрерывного обучения и саморазвития.