Москва
проспект Андропова 10А
проспект Андропова 10А
Каждый день наши автономные машины создают терабайты данных, которые мы собираем, анализируем и тестируем для улучшения нашего ПО.
Мы ищем человека, который поможет нам в этой задаче и будет строить MVP-алгоритмы расчета различных метрик автономных машин.
Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Spark и polars/pandas .
Примеры задач:
- Выстраивать кросс-командную коммуникацию;
- Разрабатывать на SQL/pyspark алгоритмы расчета метрик;
- Документировать разработанные алгоритмы;
- Проверять качество метрик после установки на регламентный расчет Data инженерами;
- Создавать/дорабатывать новые математические модели под изменяющиеся условия среды и потребности бизнеса;
- Визуализировать метрики в BI системе.
Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, S3, Clickhouse, Metabase, Superset
Что мы ждем от кандидата:
- Опыт реализации проектов мат. моделирования;
- Навыки программирования для решения задач математического моделирования;
- Хорошее знание SQL (на уровне джойнов и оконных функций);
- Был опыт анализа данных с использованием Python (Pandas/Polars);
- Опыт работы хотя бы с одной из BI систем (Metabase/Superset/Tableau/DataLens);
- Знание классических алгоритмов машинного обучения.
Будет плюсом:
- Опыт работы со Spark;
- Опыт работы с catboost/xgboost/scikit-learn;
- Опыт работы с Clickhouse;
- Опыт работы с Airflow/Luidgi/Dagster.