Москва
улица Клары Цеткин 4А
улица Клары Цеткин 4А
Кого мы ищем:
Machine Learning (ML) платформа разработки – платформа, предназначенная для обеспечения полного MLOps цикла разработки моделей. Платформа предоставляет пользователям Data Scientists среду разработки с необходимыми окружением и инструментами, преднастроенными фреймворками анализа, обработки данных, мониторинга и прочими крутыми штуками.
Банк ищет DevOps-инженера на проект построения ML платформы на базе Kubernetes кластера и новейших технологий с проектированием отказоустойчивой архитектуры масштабируемых сервисов и их компонентов с нуля.
Наш стек:
- Runtime: Kubernetes (self-hosted), Airflow, Spark, Hadoop (HDFS, YARN, Spark, Hive), Seldon, Kubeflow
- БД и очереди: HDFS, PotgreSQL, Kafka
- Управление инфраструктурой: Ansible, ArgoCD
- CICD: Bitbucket, Teamcity, Nexus
- Мониторинг: Grafana/Zabbix
Чем предстоит заниматься:
- Проектирование, разработка и эксплуатация новой ML платформы на базе Kubernetes;
- Разворачивание, развитие, поддержка работоспособности и отказоустойчивости сервисов и компонентов ML платформы (Jupyterhub, Kubeflow, и др.);
- Создание и настройка CICD сборки и развертывания приложений;
- Настройка мониторингов инфраструктуры и сервисов;
- Проведение RnD, изучение нового open-source ПО.
Что мы ожидаем от кандидата:
- Опыт администрирования OC Linux (RHEL, CentOS) от 2-х лет;
- Глубокие знания Kubernetes (k8s), самостоятельное разворачивание и обновления в закрытом контуре;
- Опыт работы с GPU;
- Опыт построения CI/CD pipelines;
- Опыт использования скриптов для автоматизации (Python/Bash);
- Опыт эксплуатации систем мониторинга (Prometeus, Grafana, Zabbix, ELK).