Ведущий специалист систем мониторинга (observability-инженер)

Дата размещения вакансии: 02.09.2024
Работодатель: Честный знак.рф
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

О компании

Мы создаем единую распределенную систему масштаба страны, которая преобразит опыт совершения покупок, а именно позволит "оцифровать" каждую единицу товара уже к 2025 году.

Это позволит каждому покупателю быть уверенным в качестве и происхождении товара, а производителям и продавцам - не только уменьшить долю неоригинальной продукции на рынке, но и оптимизировать производственно-логистические процессы и сократить издержки за счет возможностей аналитической подсистемы. Уже сейчас система обрабатывает миллиарды транзакций ежедневно и оперирует петабайтами данных на скоростях десятки тысяч запросов в секунду.

О мониторинге:

Сама система мониторинга в настоящее время строится на стеке: Kubernetes, Prometheus + Victoria metrics; Clickhouse; ELK; Graylog; Grafana. Обрабатываем до 1 млн. метрик в секунду. Обрабатываем логов до 180 000 лог сообщений в секунду. Наша задача построить и развивать централизованную систему мониторинга, включающую в себя мониторинг инфраструктуры (ЦОД) и нескольких высоконагруженных информационных систем.

Чем предстоит заниматься:

Построение, внедрение и развитие высоконагруженных многокомпонентных систем мониторинга:

  • Постановка на мониторинг инфраструктуры, приложений и бизнес показателей. Для всех стендов, включая разработку и тестирование;

  • Развитие централизованной системы мониторинга;

  • Создание и маршрутизация оповещений, включая предиктивную аналитику;

  • Консультации разработчиков по созданию метрик и сущностей мониторинга(сервис мониторы);

  • Интеграция систем мониторинга с другими системами компании;
  • Автоматизация процессов мониторинга;
  • Создание и построение комплексных экранов систем мониторинга;
  • Внедрение CI/CD для компонентов мониторинга;
  • Разработка системы логирования для приложений;
  • Обеспечение отказоустойчивости и быстродействия создаваемой системы;
  • Разработка приложений для нужд мониторинга в случаях, когда готового решения не существует.

От успешного кандидата мы ожидаем:

  • Опыт работы с Kubernetes (уверенный пользователь, опыт в развертывании и обслуживании будет большим плюсом);
  • Опыт администрирования ОС семейства Linux (Debian-based);
  • Знания устройства и принципов работы docker;
  • Опыт в работе с SQL; умение писать простые запросы; понимание, для чего нужны JOIN;
  • Опыт внедрения и построения многокомпонентных систем мониторинга (Prometheus-like стек, VictoriaMetrics, Graylog, Zabbix);
  • Опыт поддержки высоконагруженных систем мониторинга;
  • Опыт настройки и администрирования Grafana, ELK, Prometheus;
  • Знание скриптовых языков, Python, Bash, знание ЯП будет большим плюсом;
  • Умение читать и понимать чужой код (В основном Python, Go. Плюсом будет Java);
  • Опыт работы с системами виртуализации и Linux-контейнерами;
  • Опыт в работе с Helm(написание простых чартов, понимание принципов работы helm-template);
  • Уверенный пользователь систем версионирования кода (Предпочтительно Git);
  • Опыт работы с Gitlab CI;
  • Умение работать с системами управления автоматического развертывания конфигураций (Предпочтительно Ansible);

Что вам точно понравится:

  • Сложные и интересные задачи, работа с современным востребованным стеком;

  • Экспертная, увлеченная и талантливая команда, у которой можно многому научиться, культура открытости и взаимопомощи;

  • Конкурентная ЗП, оформление по ТК РФ;

  • ДМС со стоматологией после испытательного срока, ДМС для семьи с корпоративными скидками;

  • Страхование жизни и здоровья;

  • Предоставляем всю необходимую технику для работы;

  • Возможность работать удаленно/частично удаленно;

  • “Кафетерий” льгот (возмещение расходов на любое самообразование, спорт, ДМС для членов семьи, доступ к ИТ сервисам и т.д).