DevOps-инженер/ ML (Трайб Data office)

Дата размещения вакансии: 06.09.2024
Работодатель: АО «ОТП Банк» (JSC «OTP Bank»)
Уровень зарплаты:
з/п не указана
Город:
Москва
Замоскворецкая линия метро Войковская
Требуемый опыт работы:
От 3 до 6 лет

Кого мы ищем:

Machine Learning (ML) платформа разработки – платформа, предназначенная для обеспечения полного MLOps цикла разработки моделей. Платформа предоставляет пользователям Data Scientists среду разработки с необходимыми окружением и инструментами, преднастроенными фреймворками анализа, обработки данных, мониторинга и прочими крутыми штуками.

Банк ищет DevOps-инженера на проект построения ML платформы на базе Kubernetes кластера и новейших технологий с проектированием отказоустойчивой архитектуры масштабируемых сервисов и их компонентов с нуля.

Наш стек:

  • Runtime: Kubernetes (self-hosted), Airflow, Spark, Hadoop (HDFS, YARN, Spark, Hive), Seldon, Kubeflow
  • БД и очереди: HDFS, PotgreSQL, Kafka
  • Управление инфраструктурой: Ansible, ArgoCD
  • CICD: Bitbucket, Teamcity, Nexus
  • Мониторинг: Grafana/Zabbix

Чем предстоит заниматься:

  • Проектирование, разработка и эксплуатация новой ML платформы на базе Kubernetes;
  • Разворачивание, развитие, поддержка работоспособности и отказоустойчивости сервисов и компонентов ML платформы (Jupyterhub, Kubeflow, и др.);
  • Создание и настройка CICD сборки и развертывания приложений;
  • Настройка мониторингов инфраструктуры и сервисов;
  • Проведение RnD, изучение нового open-source ПО.

Что мы ждём:

  • Опыт администрирования OC Linux (RHEL, CentOS) от 2-х лет;
  • Глубокие знания Kubernetes (k8s), самостоятельное разворачивание и обновления в закрытом контуре;
  • Опыт работы с GPU;
  • Опыт построения CI/CD pipelines;
  • Опыт использования скриптов для автоматизации (Python/Bash);
  • Опыт эксплуатации систем мониторинга (Prometeus, Grafana, Zabbix, ELK).