Обязанности:
-
Проектирование, разработка и поддержка масштабируемых бэкенд-сервисов преимущественно на основе FastAPI.
-
Разработка и внедрение эффективной архитектуры сервисов, обеспечивающей оптимальную производительность при генерации видео на основе AI и обработки естественного языка.
-
Интеграция моделей искусственного интеллекта в готовые к использованию сервисы, обеспечивая плавное развёртывание, масштабируемость и надёжность.
-
Лидирование в процессах рефакторинга существующей кодовой базы для повышения читаемости, производительности и удобства поддержки.
-
Настройка инфраструктуры и CI/CD-процессов с использованием таких инструментов, как Docker, Kubernetes, GitHub Actions, Jenkins или GitLab CI.
-
Реализация комплексных решений мониторинга (например, Prometheus, Grafana, ELK stack) для обеспечения надёжности и производительности сервисов.
-
Тесное взаимодействие с AI-инженерами, фронтенд-разработчиками и исследовательской командой для согласования технических стратегий и обеспечения бесшовной интеграции.
-
Продвижение лучших практик разработки программного обеспечения, качества кода и документации в команде.
Требования:
-
Уверенные знания Python и опыт разработки API с использованием FastAPI.
-
Практический опыт MLOps, включая развёртывание моделей, управление версиями, мониторинг и администрирование.
-
Опыт работы с облачными платформами (AWS, GCP, Azure), инфраструктурой как кодом (Terraform, Ansible) и системами оркестрации контейнеров (Kubernetes).
-
Подтверждённый опыт проектирования масштабируемых архитектур и руководства их реализацией.
-
Опыт настройки надёжных CI/CD-процессов для автоматического развёртывания.
-
Знание инструментов мониторинга и логирования (Prometheus, Grafana, Elastic Stack).
-
Будет плюсом:
-
Опыт работы с технологиями потоковой передачи видео (WebRTC, RTMP, HLS).
-
Знание фреймворков и библиотек, используемых для обработки видео (OpenCV, FFmpeg, GStreamer).
-
Опыт работы с GPU (CUDA, TensorRT) и техники оптимизации AI-моделей.