Новосибирск
Мы строим большую продуктовую компанию, в которой уже развиваются и еще будут множество продуктов. Все это для того, чтобы ежедневно 300 000 наших клиентов по всему миру радовались, получая вовремя и в нужном качестве свои важные и ценные посылки.
Основная цель специалиста, которого мы ищем, будет выстраивать и оптимизировать инфраструктуру для наших ML специалистов.
Предстоит:
- Настройка процессов CI/CD, настройка и поддержка приложений в кластере Kubernetes
- Настройка мониторинга продуктов (Prometheus и Grafana), настройка системы алертов, проведение регулярного анализа производительности систем
- Ведение и актуализация технической документации, включая инструкции по устранению проблем, настройке и обновлению программного обеспечения
- Администрирование серверов на ОС семейства Linux, автоматизация рутинных задач
- Внедрение решений для централизованного логирования (например, ELK-стек) и сбора метрик для анализа работы продуктов и быстрого выявления проблем
Мы ждем:
- Опыт работы с Ansible, Kubernetes, Helm, Prometheus, Grafana, GitLabCI
- Знания ОС Linux (процессы, файловая система, инструменты отладки, сети)
Будет плюсом:
- Опыт работы с облачными провайдерами, Kubeflow, RabbitMQ, Kafka, Python
- Понимание методологии DataOps и знание практик MLOps
- Опыт администрирования приложений на Java
- Установка, настройка и администрирование инструментов по работе с данными – Apache Spark, Apache Airflow, Apache Superset
Мы предлагаем:
- Оформление по ТД в аккредитованной компании
- Удаленный формат работы, гибкое начало/окончание рабочего дня
- Социальный пакет: ДМС, скидки на занятия иностранными языками
- Профессиональное развитие: у нас действует система грейдов и проводятся аттестации. Компенсацию обучения (курсы, митапы, конференции). Корпоративный университет. У нас есть ТехКомы, IT-пятницы