Санкт-Петербург
Мы занимаемся стартапом PrimeWay - Бессерверная MLOps платформа для GPU вычислений.
Управление GPU одна из самых актуальных проблем в мире AI.
Обязанности:
- Вывод ml приложений в продакшн
- Работа с vllm для деплоя и unsloth для дообучения
- Работа с kubernetes
- Написание кастомных load balancer и autoscaling через python/go код (имитация функциональности kubernetes)
- Создание интеграции с облачными провайдерами и git репозиториями
- Проведение всеобьемлющего тестирования различных частей, включая ALB, проверки состояния, и других модулей для бесшовного автоматического запуска ml проектов
- Создание и тестирование пайплайнов дообучения и деплоя моделей с lora, а также продолжение дообучения lora весов на новых данных
- Написание статей на хабр в виде примеров работы и документации
Требования:
- Знание kubernetes, python, mlops и devops практик
- Опыт с yandex cloud и другими облачными провайдерами
- Опыт по созданию пайплайнов дообучения и деплоя моделей с lora
- Хорошее понимание автомасштабирования и балансировщика нагрузки в kubernetes
- Хороше понимание MLOps и желание дальше развиваться и погружаться в нем
Условия:
- Работа 5/2, полный день, без совмещения с другими, устройство в качестве самозанятого на первые 2-3 месяца
- Возможность роста до тех. директора
- В отклике пожалуйста указывайте свои ожидания по зп