Мы ищем системного администратора / DevOps-инженера для поддержки и развития инфраструктуры проекта fooddvor.ru и связанных с ним сервисов.
Проект находится в продакшене, имеет выраженные пиковые нагрузки и активно развивается в сторону экосистемы взаимосвязанных продуктов. Нам нужен специалист, который поможет стабилизировать текущую архитектуру и выстроить более надёжное и автономное решение.
О проекте
Основной продукт
-
Интернет-каталог / магазин на WordPress
-
Пиковые нагрузки в дни продаж (массовый наплыв пользователей)
-
В пике сайт не только отдает контент, но и активно нагружает серверную часть (PHP / MySQL)
Экосистема
-
Python-боты (Telegram)
-
n8n (автоматизация, интеграции)
-
Контейнеризация (Docker)
-
Часть сервисов сейчас работает на тестовой ВМ, которая также испытывает нагрузку
Инфраструктура
-
Yandex Cloud
-
1 основная ВМ (prod)
-
1 тестовая ВМ
-
MySQL сейчас на той же машине
-
В пиковые периоды временно увеличиваем CPU / RAM, затем откатываем назад
Ключевая проблема, которую нужно решить
-
Массовый наплыв пользователей приводит к:
-
забитым пулам PHP-FPM
-
высокой CPU-нагрузке
-
деградации или падению приложения
-
-
Текущее временное решение — вертикальное масштабирование —:
-
дорого
-
не решает причину
-
требует ручного участия
-
Есть гипотеза и желание:
-
внедрить балансировку
-
разгрузить приложение за счёт кэшей, выноса статики, БД
-
сделать систему более автономной и предсказуемой
Обязанности
-
Поддержка и сопровождение продакшен-инфраструктуры
-
Администрирование и диагностика:
-
Linux
-
Nginx
-
PHP-FPM
-
MySQL
-
-
Анализ нагрузки (CPU / RAM / I/O), поиск узких мест
-
Работа с логами и инцидентами
-
Оптимизация инфраструктуры под пиковые нагрузки
-
Поддержка docker-окружения
-
Поддержка Python-ботов и связки с n8n
-
Работа с Yandex Cloud
-
Поддержка и развитие тестового стенда
-
Участие в проектировании и внедрении новой архитектуры
Задачи по развитию (приоритеты)
-
Стабилизация WordPress под пиковые нагрузки
-
Настройка и внедрение:
-
Load Balancer
-
Object Storage (S3) для статики
-
Кэширование (Redis / page cache / fastcgi cache)
-
-
Возможный вынос базы данных (managed DB или отдельная ВМ)
-
Разделение нагрузки между сервисами (prod / боты / n8n)
-
Снижение CPU-нагрузки и стоимости инфраструктуры
-
Настройка полноценной аналитики:
-
мониторинг
-
алерты
-
понятная картина, «что и почему ломается»
-
Дежурства и формат работы (важно)
-
Формат работы: удалённый
-
В обычное время — работа в свободном режиме
-
Период повышенной нагрузки:
-
понедельник с 10:00
-
вторник до ~16:00
-
-
В это время важно:
-
быть на связи
-
уметь быстро подключиться и устранить проблему
-
желательно физически находиться рядом с компьютером
-
Пример: при одном из инцидентов сайт был недоступен менее 10 минут — быстро подключились, всё почистили и восстановили работу.
Цель — уйти от ручных действий и экстренных перезапусков за счёт нормальной архитектуры.
Наши ожидания
-
Уверенный опыт работы с Linux
-
Понимание web-стека: Nginx, PHP-FPM, MySQL
-
Опыт работы с Docker
-
Навыки анализа производительности
-
Опыт работы с облаками (Yandex Cloud — плюс)
-
Способность не просто «перезапускать», а разбираться в причинах
Будет плюсом
-
Опыт оптимизации WordPress под нагрузку
-
Опыт работы с Redis
-
Настройка балансировки и горизонтального масштабирования
-
Опыт работы с мониторингом (Prometheus, Grafana и аналоги)
-
Опыт построения инфраструктуры «без ручного героизма»
Условия
-
Частичная занятость
-
Удалённая работа
-
Оплата: от 30 000 ₽ / месяц (обсуждается)
-
Возможность реально повлиять на архитектуру и качество проекта
-
Адекватные ожидания со стороны бизнеса и готовность вкладываться в инфраструктуру