Москва
Чем нужно будет заниматься:
- Подключаться к источникам бизнеса (ERP/CRM/биллинги/лог-шины/API), консолидировать разрозненные данные.
- Строить и поддерживать надёжные конвейеры (батч/стриминг) с оркестрацией, мониторингом и алертингом.
- Готовить «ML-готовые» датасеты и фичи: схемы, слои, форматы, версионирование.
- Обеспечивать хранение: проектировать DWH/даталейк/лейкхаус, индексацию, партиционирование, компрессию.
- Настраивать data quality/контракты данных (валидации, тесты, SLA)
Требования:
- Уверенный SQL (аналитический, оконные функции, оптимизация) и Python для пайплайнов/утилит.
- Опыт с Airflow (DAG, зависимости, сенсоры, SLA, retries)
- Проектирование слоёв данных и форматов, S3-совместимые стораджи
- Практика data quality (тесты, профили, контракты)
Условия:
-
Возможность профессионального и карьерного роста в компании
-
Возможность поучаствовать в разных проектах
-
Опыт работы в распределенной команде профессионалов
-
Уровень заработной платы обсуждается индивидуально
-
Оформление в соответствии с ТК РФ в Bell Integrator
-
Формат работы Удаленно