от 200000 до 300000 RUR
Москва
От 1 года до 3 лет
Вакансия компании: ООО "КОМБЛОК"
О проекте:
Разработка экосистемы ИИ-сервисов для автоматизированного анализа контента и аудитории в мессенджерах. Продукт включает в себя модули real-time парсинга данных, семантического анализа, генерации ИИ-отчетов, а также высоконагруженные ML-модели (LLM, RAG).
Мы предлагаем:
- Стабильный доход: конкурентоспособная заработная плата. Выплаты 2 раза в месяц по 50% или 1 раз в месяц (согласовывается с сотрудником).
- Гибкий формат: график 5/2. На старте (первые 2 месяца) - работа в офисе для глубокого погружения в инфраструктуру, далее возможен переход на гибридный формат.
- Сложные задачи: реальный опыт построения AI-инфраструктуры с нуля на собственном железе без ограничений облачных вендоров.
- Профессиональную среду: мотивированная команда, отсутствие бюрократии, возможность самостоятельно принимать архитектурные решения.
Обязанности:
- Миграция и развертывание: перенос существующих сервисов проекта из облачной инфраструктуры Docker во внутренний контур Bare Metal.
- Управление GPU: развертывание, конфигурация и обеспечение доступности видеокарт NVIDIA для контейнеров (CUDA, NVIDIA Container Toolkit).
- Автоматизация: написание комплексных скриптов автоматизации, пайплайнов и внутренних тулингов на Python и Bash.
- Администрирование платформ: оркестрация контейнеров в Kubernetes/Docker Swarm, управление дисковыми хранилищами, базами данных и очередями.
- Эксплуатация: плановое обновление, масштабирование, мониторинг (метрики, логи, алерты) и быстрое реагирование на инциденты.
- Архитектурное планирование: сайзинг железа, проектирование отказоустойчивости bare-metal кластеров и документирование процессов.
Обязательные требования:
- Опыт миграции : успешный практический опыт переноса production-окружения из облаков на собственные сервера.
- Контейнеризация и оркестрация: глубокие знания Docker, Docker Compose и Kubernetes (архитектура, сеть, bare-metal ингрессы).
- GPU-инфраструктура: опыт проброса и оркестрации видеокарт NVIDIA в контейнеры, знание NVIDIA Container Runtime, мониторинг VRAM и Compute нагрузки.
- Работа с хранилищами (Диски/Storage): понимание работы дисковых подсистем на физических серверах (RAID, LVM, монтирование, оптимизация IOPS для БД и ML-моделей, Ceph/NFS как плюс).
- Продвинутая автоматизация: уверенное владение Python для написания системных скриптов, интеграций по API и автоматизации рутины (+ Bash).
- Инфраструктура как код и CI/CD: опыт работы с Ansible (управление конфигурациями серверов) и GitLab CI (построение пайплайнов деплоя).
- Системный уровень: понимание Linux, сетевой модели OSI, маршрутизации и безопасности закрытого контура.
- Базы данных: опыт эксплуатации и тюнинга PostgreSQL, Redis.
Желательные навыки:
- MLOps стеки: знакомство с инструментами оркестрации ML-пайплайнов (MLflow, Kubeflow) и реестрами моделей.
- Настройка мониторинга: опыт самостоятельного развертывания и настройки Prometheus, Grafana, VictoriaMetrics, Loki / ELK с нуля под задачи проекта.
- Резервное копирование: проектирование и автоматизация стратегий бэкапов.
Требуемый опыт:
- Не менее 3 лет в роли DevOps.
- Опыт работы с bare-metal серверами и поддержкой инфраструктуры в закрытых/собственных контурах.
- Способность самостоятельно принимать технические решения и доводить миграцию сервисов до production-статуса.