з/п не указана
Новосибирск
От 1 года до 3 лет
Чем предстоит заниматься:
- Развитие, эксплуатация и поддержка ML-платформы, полностью развернутой в Kubernetes-кластере;
- Поддержка и развитие ML-сервисов в Kubernetes: batch / online / streaming inference, участие в миграции Model Inference Service с MLServer на базу KServe;
- Эксплуатация и развитие Data Specialist Workspaces (на базе JupyterHub): управление рабочими средами, распределение ресурсов кластера (CPU / RAM / GPU), поддержка пользователей;
- Разработка и сопровождение ETL/ELT и ML-пайплайнов в Airflow;
- Поддержка и развитие Feature Store на базе Feast: offline-хранилище (PostgreSQL), интеграции, Feature Engineering Service (сервис по сборке датасетов и расчету признаков);
- Поддержка и развитие MLflow: трекинг экспериментов, хранение артефактов, метрик, интеграция с мониторингом и бизнес-показателями;
- Разработка и поддержка CI/CD пайплайнов (GitLab CI) для ML и data-сервисов;
- Контейнеризация, деплой и эксплуатация сервисов в Kubernetes;
- Настройка, поддержка и улучшение мониторинга ML-сервисов и пайплайнов (метрики, алерты, SLA);
- Участие в проектировании и улучшении A/B экспериментов;
- Консультирование команды разработки, участие в код-ревью;
- Актуализация и развитие документации по ML-процессам, инструментам и инфраструктуре;
- Поддержка и развитие уже существующих, задокументированных и мониторируемых сервисов в Production среде.
Что для нас важно:
- Уверенное владение Python, опыт разработки сервисов и API (FastAPI / Flask / Django);
- Практический опыт эксплуатации и разработки сервисов в Kubernetes;
- Понимание архитектуры Kubernetes: namespaces, deployments, services, ingress, resources, limits/requests;
- Опыт работы с Docker и Kubernetes как основной средой исполнения;
- Опыт настройки и поддержки CI/CD пайплайнов (GitLab CI);
- Понимание принципов MLOps и опыт работы с opensource-решениями: Airflow, MLflow, Feast (или аналогами);
- Знание основных алгоритмов Machine Learning и опыт работы с numpy, pandas, scipy, matplotlib;
- Практический опыт использования scikit-learn, XGBoost, LightGBM;
- Уверенное владение SQL и опыт работы с PostgreSQL;
- Опыт работы в Linux-среде, уверенное использование CLI-инструментов;
- Понимание различий и сценариев применения Kafka и RabbitMQ;
- Опыт версионирования данных и моделей (DVC или аналоги);
- Умение разбираться в чужом коде, оптимизировать и улучшать существующие решения;
- Готовность работать с production-системами, а не только с greenfield-разработкой.
Мы гарантируем:
- Атмосферу безопасности. Так как мы предлагаем трудоустройство в полном соответствии с ТК РФ.
-
Удаленный формат работы.
-
Чувство устойчивости в настоящем и будущем, даже когда времена вокруг нас меняются. Помогут тебе в этом наши оздоровительные и финансовые бенефиты.
-
Комфорт в деталях: отсутствие дресс-кода, оборудованное рабочее место и возможность отдыха в неформальной обстановке.
-
Динамику профессионального развития.