проспект Вернадского 41
РТЛабс создаёт и развивает масштабные цифровые сервисы Госуслуг — портал, мобильные приложения, социально значимые услуги, системы электронного правительства
Сейчас мы ищем Главного инженера Devops в Аналитическую платформу Big Data
О команде
Мы — Аналитическая платформа. Наша команда отвечает за хранение, обработку и предоставление данных о госуслугах и множестве других сервисов, работающих в инфраструктуре электронного правительства. Мы разрабатываем разные решения, от витрин данных, до сервисов real-time аналитики, которые выявляют аномалии в действиях пользователей.
Наш стек
Greenplum, ClickHouse, Postgres
Airflow
Hadoop, Spark, Flink
Python, Java
VictoriaMetrics, Grafana
Kubernetes
Ansible
Чем предстоит заниматься
- Координировать техническую работу DBA, DevOps, Информационная безопасность и других инженерных команд в части эксплуатации платформы
- Управлять сложными инцидентами и критическими деградациями, обеспечивать их быстрое расследование и устранение
- Принимать архитектурные и технические решения по сетевой инфраструктуре production-среды
- Оценивать влияние релизов на production, согласовывать релизные окна и контролировать процесс деплоя критических изменений;
- Обеспечивать взаимодействие со смежными отделами (разработка, информационная безопасность, смежные команды) в части эксплуатационных вопросов
- Автоматизировать рутинные процессы эксплуатации
- Планировать и контролировать процессы жизненного цикла платформы: вывод устаревших баз и сервисов, миграция данных, обновление ПО
- Сопровождать проверки систем на соответствие требованиям аттестации и сертификации
- Закрывать пробелы в технической компетентности команды: наставничество, проведение разборов инцидентов и формирование best practices
- Участвовать в стратегическом планировании развития платформы и инфраструктуры
- Разрабатывать и внедрять стандарты эксплуатации, SLA и процедуры обеспечения отказоустойчивости
Для нас важно
- Опыт работы в роли технического лидера, главного инженера или аналогичной роли от 5+ лет
- Глубокое понимание архитектуры распределенных систем, принципов отказоустойчивости и масштабирования
- Экспертиза в эксплуатации высоконагруженных production-сред (СУБД, Big Data платформы, микросервисные архитектуры)
- Понимание сетевых технологий и опыт принятия решений по production-сетям
- Навыки координации кросс-функциональных команд (DBA, DevOps, Security, разработка)
- Опыт планирования и проведения миграций, обновлений и вывода legacy-систем из эксплуатации
- Знание практик SRE/DevOps и опыт построения observability-стека (метрики, логи, трейсы)
- Умение оценивать технические риски и принимать взвешенные решения в условиях неопределенности
- Опыт работы с требованиями безопасности и прохождения аттестаций ГИС
Что мы предлагаем:
- Роль технического лидера с влиянием на архитектуру и стратегию развития платформы
- Работу над критически важной инфраструктурой, обслуживающей миллионы пользователей
- Возможность формировать эксплуатационные практики и стандарты для всей платформы
- Сильную команду профессионалов и современный технологический стек
- Гибридный формат работы в Москве
- Конкурентную заработную плату (оклад + квартальный бонус);
- ДМС + стоматология и международная страховка;
- Кафетерий льгот (компенсация расходов на выбор: от КАСКО и фитнес-абонементов до билетов на концерты, покупку авиа/жд билетов;