Data Engineer

Дата размещения вакансии: 20.01.2025
Работодатель: Navio (ООО Автотех)
Уровень зарплаты:
з/п не указана
Город:
Москва
проспект Андропова 10А
Требуемый опыт работы:
От 1 года до 3 лет

Чем предстоит заниматься:

Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и добавлять в них новый функционал.

Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Dagster, Spark и polars/pandas где объемы данных позволяют.

Примеры задач на первое время:

  • Реализовать пайплайн/шаг в существующем пайплайне в котором будет реализован алгоритм расчета метрики функции автономного вождения (качество удержания в полосе, качество локализации, дальность распознавания);
  • Оптимизировать обработку данных в существующем алгоритме путем перехода со Spark на Polars/Pyarrow с распараллеливанием обработки или оптимизации Spark запросов;
  • Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, Kubernetes, S3, Clickhouse, Metabase

Задачи:

  • Разработка пайплайнов обработки данных;
  • Формирование витрин с метриками;
  • Постановка на регламент алгоритмов расчета метрик функций беспилотного вождения.

Требования:

  • Разработка на языке Python
  • Хорошее знание SQL (на уровне джойнов и оконных функций)
  • Был опыт обработки данных с использованием Python (Pandas/Polars)
  • Знакомство со Spark и Airflow

Будет плюсом:

  • Опыт работы с Clickhouse
  • Опыт работы с Airflow/Luidgi/Dagster