Кутузовский проспект 32
Мы СберАналитика — инновационная IT-компания в экосистеме Сбера. Мы создаём современную облачную CRM-систему SberCRM — флагманский SaaS-продукт, который уже меняет рынок.
Что мы предлагаем:
- Работу над амбициозным проектом с нуля в команде профессионалов
- Использование передовых технологий и современного технического стека
- Возможность влиять на развитие продукта уровня Salesforce, HubSpot и ZohoCRM
- Создание масштабируемой системы для управления продажами, маркетингом и клиентским сервисом
Наша технология:
- Гибкая платформа с двухуровневой дизайн-системой
- Модульная архитектура shell app
- Инновационные решения для бизнеса
Ищем в команду талантливого SRE-инженера, готового присоединиться к созданию прорывного продукта и расти вместе с нами!
Присоединяйтесь к команде лидеров — помогите создать будущее российского SaaS!
Чем предстоит заниматься:
Автоматизация операций
- Разработка скриптов и инструментов: Автоматизация рутинных задач, таких как деплоймент, мониторинг, резервное копирование и восстановление данных.
- Оптимизация процессов: Постоянное улучшение существующих процессов и внедрение лучших практик автоматизации.
2. Мониторинг и диагностика
- Настройка и поддержка систем мониторинга: Установка и настройка инструментов мониторинга (например, Prometheus, Grafana), которые отслеживают производительность и доступность систем.
- Анализ логов и метрик: Анализ данных мониторинга для выявления аномалий и проблем, влияющих на надежность и производительность системы.
3. Устранение инцидентов
- Диагностика инцидентов: Быстрое реагирование на инциденты, определение причин сбоев и принятие мер по устранению проблем.
- Создание и ведение документации: Подготовка и актуализация документации по инцидентам, процедурам восстановления и планам отказоустойчивости.
- Координация команд: Координация усилий различных команд (разработчиков, администраторов) для быстрого разрешения инцидентов.
- Пост-мортемы: Проведение пост-анализа инцидентов, выявление корневых причин и разработка рекомендаций по улучшению системы.
4. Обеспечение надежности и отказоустойчивости
- Оценка рисков: Оценка текущих рисков и слабых мест в инфраструктуре, разработка планов по их устранению.
- Тестирование отказоустойчивости: Организация и проведение тестов на отказоустойчивость, чтобы проверить способность системы восстанавливаться после сбоев.
- Обслуживание и модернизация: Планирование и реализация улучшений инфраструктуры, направленных на повышение надежности и устойчивости системы.
- Анализ производительности: Анализ производительности системы, выявление узких мест и предложение решений для оптимизации.
- Масштабируемость: Проектирование и внедрение решений, обеспечивающих горизонтальную и вертикальную масштабируемость системы.
- Планирование: Прогнозирование потребностей в ресурсах и планирование необходимых изменений в инфраструктуре.
Наши ожидания:
- Опыт работы по специальности от 1 года.
- Опыт администрирования Linux (CentOS, Red Hat, Ubuntu).
- Знание технологий контейнеризации и оркестрации: Docker, Kubernetes, OpenShift.
- Опыт работы с платформами виртуализации.
- Понимание принципов работы каких-либо из перечисленных серверных технологий: Tomcat, Kafka/RabbitMQ, Redis, Debezium, Camunda, PostgreSQL (включая backup, restore), NoSQL, Nginx, ELK.
- Опыт настройки каких-либо из перечисленных систем логирования: Zabbix, Grafana, ElasticSearch, Kibana, Logstash, Loki, Filebeat.
- Понимание работы CI/CD-конвейеров с использованием инструментов: Ansible, Terraform, Jenkins, DevOps-tools.
- Понимание основ сетевых технологий.
- Понимание принципов работы протоколов SSL/TLS.
Что мы предлагаем:
-
Формат работы: гибрид (Москва, Московская область).
- Оформление в штат по ТК РФ.
- Работа в аккредитованной ИТ-компании, сопутствующие льготы.
- Ежегодный бонус по итогам работы.
- ДМС с первого месяца, ДМС для родных по программе со-оплаты.
- Скидки и льготы от партнёров Экосистемы.