SRE/Site Reliability Engineer

Дата размещения вакансии: 08.10.2025
Работодатель: Айкон Про
Уровень зарплаты:
от 370000 RUR
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Команда iCon PRO предоставляет широкий спектр услуг в сфере ИТ-разработок и финансового консультирования, имеет аккредитацию в сфере ИТ.

Мы существуем и развиваемся для того, чтобы помогать современным компаниям увеличивать производительность и эффективность своей деятельности, путем применения и развития современных информационных технологий.

Наша команда состоит из грамотных консультантов и высококвалифицированных специалистов широкого профиля, которые найдут нужный подход в решении задач любой сложности.

Один из проектов компании – разработка «с нуля» системы по приему и обработке запросов клиентов на финансовую консультацию, которая будет обеспечивать интерактивное общение сотрудников и клиентов. Сейчас мы ищем сотрудника на должность SRE в нашу команду.

Чем предстоит заниматься:

Обеспечение надежности и производительности систем:
Мониторинг и прогнозирование потенциальных проблем
Оптимизация инфраструктуры для повышения эффективности
Работа с доступностью (availability) и надежностью (reliability)
Работа с отказоустойчивостью

Автоматизация процессов:

  • Разработка инструментов для автоматизации задач
  • Внедрение практик CI/CD

Инцидент-менеджмент:

  • Оперативное реагирование на инциденты.
  • Проведение пост-инцидентного анализа.
  • Внедрение мер по предотвращению повторных инцидентов.

Применение современных практик:

  • Внедрение и поддержка лучших практик DevOps и SRE.
  • Использование подходов GitOps и инфраструктуры как код.

Сотрудничество с командами разработки:

  • Совместное проектирование архитектуры сервисов.
  • Участие в код-ревью и обмен знаниями.

Мы ждем от кандидата:

Технические навыки:

Контейнеризация и оркестрация: Опыт работы с Docker и Kubernetes
Автоматизация и конфигурация: владение инструментами управления конфигурацией , умение создавать и поддерживать CI/CD конвейеры (Jenkins, GitLab CI/CD)
Мониторинг и логирование: настройка и поддержка систем мониторинга (Prometheus, Grafana, Alert Manager), работа с системами логирования (ELK Stack)
Сетевые технологии: знание протоколов TCP/IP, DNS, HTTP/HTTPS, опыт настройки балансировщиков нагрузки
Инцидент-менеджмент: опыт управления инцидентами и восстановления после сбоев, навыки проведения пост-инцидентного анализа
Современные практики: знание и применение принципов DevOps и SRE, опыт работы с инфраструктурой как код (IaC), понимание и использование подходов GitOps, знание методологий Agile и Scrum
Скриптинг и программирование: владение языками скриптования (Bash, Python), опыт работы с системами контроля версий (Git)
Алертинг

Опыт работы:

  • Стаж работы: От 3 лет в сфере SRE
  • Проектный опыт: Работа с высоконагруженными и распределенными системами, опыт в микросервисной архитектуре.

Мы предлагаем:

  • Оформление в соответствии с ТК РФ
  • Достойную заработную плату по результатам собеседования
  • ДМС
  • Работу в дружной команде профессионалов
  • Удаленный формат работы

​​​​