Мы — ML команда финансовых продуктов Wildberries. Создаем масштабные end-to-end ML решения и развиваем высоконагруженную ML-инфраструктуру для ежедневного и онлайн инференса по базе свыше 100 млн клиентов.
Мы ищем опытного Senior MLOps инженера в нашу команду.
Если ты готов решать сложные инфраструктурные задачи на стыке Big Data и MLOps, обеспечивать эффективность работы дата пайплайнов и offline ML-сервисов, выстраивать взаимодействие с MLE/backend и командами платформы DWH и DevOps — нам по пути!
Вам предстоит:
-
Разворачивать и поддерживать инфраструктуру ML/AI: Airflow/Kubeflow, MLFlow/ClearML, Triton, Langfuse, vLLM, Ray, Feast;
-
Настраивать и администрировать базы данных (PostgreSQL, Milvus или другие векторные БД);
-
Управлять ресурсами на кластерах с CPU и GPU;
-
Интегрировать ml и devops инфраструктуру;
-
Управлять ml инструментарием, обеспечивать надежность и доступность;
-
Настраивать мониторинг и алертинг инструментов mlops и ресурсов (Prometheus, Grafana);
-
Прорабатывать mlops процессы (ci\cd\retrain\drift detection.
Вы нам подходите, если:
-
Есть опыт работы в DevOps не менее 5 лет;
-
Знаете Linux, имеете отличное представление о работе kubernetes;
-
Имеете опыт деплоя инструментов ds, ml, genai инженеров (airflow/kubeflow, mlflow, clearml, triton, langfuse, vLLM);
-
Имеете опыт деплоя/администрирования баз данных (PostgreSQL, Milvus или других векторных БД);
-
Имеете опыт работы Grafana и OpenSearch\Elasticsearch;
-
Имеете опыт мониторинга инфраструктуры и ml сервисов;
-
Имеете опыт настройки архитектуры для ML (пайплайны данных, окружения для обучения и инференса, GPU-инфраструктура);
-
У вас есть понимание DataLake house архитектуры (Iceberg, DeltaLake, Hudi).