У меня есть вакансия в одну из крупнейших компаний в России.
Feature store для ML. Команда будет отвечать за работу хранилища признаков для ML- модели. Сейчас мы в поиске опытного играющего тренера команды хранилища признаков для моделей машинного обучения, нам нужен человек с реальным опытом разработки и внедрения хранилища признаков (Python, Go, Scala, знание backend must have) на платформе больших данных (Big data стек), с использованием современного ML стека.
Команда:
Team Lead, data engineers, back and front developers, QA.
Чем предстоит заниматься:
· Управлять командой;
· Разработка, доработка, оптимизация и тестирование функционала инструмента, как услуги, Feature store и метадатакатолог (DataHub);
· Доработка, разработка REST API, GRPC, SDK (Python, Golang);
· Интеграция с инфраструктурными элементами аутентификации, хранилищем данных (hdfs), ml конвейером в целом;
· Внедрение новых фич, формирование бэклога развития инструментов;
· Оптимизация процессов хранения и обработки фичей, включая доработку механизмов загрузки данных;
· Разработка сервисов пакетной и потоковой обработки данных (ETL\ELT на Apache Spark, Apache Spark Structured streaming\Flink).
Что мы ожидаем от тебя:
· Профильное образование: информационные технологии, прикладная информатика, математика;
· Опыт коммерческой разработки от 5 лет;
· Опыт управления командой от 2-х лет;
· Опыт работы с Feast, Hopsworks, Tecton или аналогичные (Feature Store);
· Глубокое понимание API\GRPC.
Машинное обучение:
Понимание принципов работы моделей машинного обучения: работа с признаками (feature engineering), валидация данных, подготовка и трансформация данных.
Опыт работы с Big Data технологиями:
Уверенное владение инструментами обработки больших данных: Apache Spark, Hadoop, Apache Kafka, HDFS;
Знание фреймворков и библиотек для работы с распределенными вычислениями (Spark MLlib, Dask, Ray);
Опыт с системами потоковой обработки данных\streaming (Apache Flink, Kafka Streams, Flink SQL).
Будет плюсом:
Опыт с системами MLOps для автоматизации, мониторинга и управления моделями (например MLflow, Kubeflow).
Что готовы предложить:
- Оформление по ТК РФ: оклад (готовы обсуждать)+ годовой бонус;
- Компания входит в реестр ИТ компаний;
- Удаленный формат работы. При желании можно работать в офисе класса А
- ДМС со стоматологией (с 1 рабочего дня + полис путешественника);
- Частичная компенсация фитнеса / обучения / доп. мед. услуг (лимит-25 тыс. рублей в год).
Как мы проводим собеседования:
- 15-20 минут - общение с рекрутером (tg аудио);
- 90 минут - техническое интервью;
- 45 минут - финальная встреча;
- СБ, 1-3 дня;
- Оффер, обсуждение даты выхода на работу.
По всем вопросам пишите мне в тг: @aines_hr