2-й Полянский переулок
RWB (Объединённая компания Wildberries и Russ) — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT‑компании Wildberries и оператора наружной рекламы Russ.1
Команда SRE отвечает за надежность, доступность, отказоустойчивость и производительность информационных систем в production-среде. Основной фокус роли — обеспечивать стабильную работу инфраструктуры, развивать автоматизацию, снижать риски системных сбоев и помогать командам разработки и эксплуатации работать эффективнее.
Вам предстоит:
— Разрабатывать и внедрять архитектурные решения, снижающие вероятность системных сбоев;
— Обеспечивать надежность, доступность, отказоустойчивость и производительность production-систем;
— Работать в рамках SLI, SLO и Error Budgets;
— Автоматизировать рутинные и типовые операции в инфраструктуре;
— Проводить оперативную диагностику, локализацию и устранение неисправностей, а также участвовать в Post-mortem-анализе;
— Участвовать в проектировании новой инфраструктуры, крупных модернизациях и развитии стандартов устойчивой разработки.
Формат работы — по договоренности с руководителем.
Вы нам подходите, если:
— Имеете уверенный опыт работы с Kubernetes, VMware и KVM;
— Владеете Go или Python для разработки инструментов автоматизации и внутренних сервисов;
— Используете Bash для администрирования систем;
— Работаете с Git, Argo CD и умеете настраивать сложные CI/CD-пайплайны;
— Имеете опыт настройки автомасштабирования HPA, мониторинга Prometheus/Grafana, Terraform и Ansible;
— Понимаете TCP/IP, DNS, HTTP/S и принципы балансировки нагрузки L4/L7.
Будет плюсом:
— Работали с Redis или DragonflyDB;
— Понимаете принципы работы Service Mesh.