Команда Банка Ozon создаёт и развивает сервисы для покупателей и продавцов. Мы строим банк как современный IT-продукт — с передовыми технологиями и микросервисной архитектурой. Все самые сложные и важные системы банка реализуем сами: процессинг, учётное ядро, финансовый мониторинг, переводы через Систему быстрых платежей. Среди наших продуктов — виртуальная и пластиковая карта для выгодных покупок на Ozon и за его пределами, рассрочка, банк для юридических лиц и программы финансирования продавцов.
Ozon Банк расширяется, нам требуется все больше специалистов по работе с данными. Направление платформы данных автоматизирует ETL-процессы, разрабатывает компонентные решения для аналитиков, разрабатывает realtime-сервисы для работы с данными и помогает специалистам ML внедрять модели в прод. Все это необходимо, чтобы правильно и быстро реагировать на изменяющиеся потребности бизнеса, оптимизировать процессы, повышать доход и создавать мощную основу для принятия стратегических решений.
В команде MLOps вам предстоит разрабатывать ML-платформу для работы моделей в режиме реального времени. Вы не просто будете частью системы, а сможете принять участие в её развитии. Однако это накладывает большую ответственность и предъявляет высокие требования.
Наш стек: Python, GRPC, MLFlow, Airflow, Gitlab CI/CD, Kubernetes, Helm, Prometheus, Grafana, S3, NVIDIA Triton Inference Server, Hadoop (Spark, Yarn, Hive, HDFS)
Вам предстоит:
- Развитие компонентов ML-платформы в парадигме Model as a Service
- Развитие Observability сервисов ML-платформы
- Реализация и сопровождение сервисов на Python
- Покрытие кода тестами
- Документирование разрабатываемых решений
- Проведение Code Review
Мы ожидаем, что вы владеете знаниями:
- DevOps: понимание docker, k8s и gitlab ci-cd
- MLOps: oбщее понимание терминологии, концепций и составляющих архитектуры ML-инфраструктуры; oпыт разворачивания MLFlow и NVIDIA Triton Inference Server
- Python: realtime-сервисы и асинхронное программирование, юнит-тестирование и окружение для разработки (pyproject, poetry, environment, make-файлы, линтеры, форматеры)
- Airflow
- GRPC
Будет плюсом:
- Опыт построения промышленной ML-инфраструктуры (получение фичей, сервинг моделей, настройка Observability)
- Базовое знание Hadoop (Spark, Yarn, Hive, HDFS)
- Умение оптимизировать код для real-time работы.