Важно:
- Работа в офисе в Дубае (4 дня в неделю — в офисе)
Необходимые знания и навыки:
-
5+ лет коммерческого опыта на позиции, связанной с анализом данных (data-driven role)
-
2+ года практического опыта построения data pipelines в продакшене, а также умение работать с структурированными, полуструктурированными и неструктурированными данными
-
2+ года опыта в разработке ML pipeline для streaming/batch workflow
-
Умение писать чистый, поддерживаемый и надёжный код на Python
-
Понимание и знание концепций и лучших практик software engineering
-
Знание тестовых фреймворков и библиотек
-
Опыт в аналитике (descriptive, predictive, EDA), feature engineering, алгоритмах, обнаружении аномалий, оценке качества данных и визуализации на Python (например, matplotlib, seaborn и др.)
-
Уверенное использование ноутбуков и IDE для разработки — Jupyter, Pycharm/VScode
-
Практический опыт работы с технологиями, такими как Python, Spark/PySpark, Hadoop/MapReduce/HIVE, Pandas и др.
-
Знакомство с языками запросов и технологиями баз данных, CI/CD, а также тестированием и валидацией данных и ПО
-
Технологии и задачи, с которыми предстоит работать ежедневно:
Python
Spark (PySpark)
Jupyter
SQL и NoSQL СУБД
Git (для контроля версий и CI/CD)
Exploratory Data Analysis (EDA)
Data Linking / Cleansing
Feature Engineering
Apache Airflow / Jenkins — планирование и автоматизация
Преимущества:
- Возможность работать с передовыми технологиями в инновационной среде
- Динамичная и дружелюбная рабочая атмосфера
- Компенсация расходов на переезд
- Медицинская страховка