Data Engineer

Дата размещения вакансии: 07.05.2026
Работодатель: edna
Уровень зарплаты:
з/п не указана
Город:
Москва
улица Ленинская Слобода 19
Требуемый опыт работы:
От 3 до 6 лет

Мы ищем Data Engineer, который поможет построить data-инфраструктуру с нуля: наладить ETL/ELT-процессы, организовать регулярную загрузку данных из Oracle и PostgreSQL, подготовить аналитические витрины для бизнеса и заложить основу для дальнейшего развития BI и ML-направлений.

Первоочередные задачи:

  • Разобраться в текущих источниках данных: Oracle, PostgreSQL, существующие таблицы, связи и бизнес-сущности;

  • Совместно с DBA определить безопасные способы регулярной выгрузки данных из production-баз;

  • Спроектировать и внедрить первые ETL/ELT-процессы;

  • Настроить регулярную загрузку данных из Oracle и PostgreSQL;

  • Построить staging-слой и первые аналитические витрины;

  • Подготовить данные для отчетности, BI-дашбордов и бизнес-аналитики;

  • Помогать бизнесу формулировать метрики, KPI и требования к данным;

  • Настроить базовые проверки качества данных: полнота, дубликаты, актуальность, сверки между источниками и витринами;

  • Документировать источники данных, пайплайны, таблицы и бизнес-логику;

  • Постепенно заложить основу для будущих ML-задач: подготовка датасетов, feature tables и регулярное обновление данных.

Мы ищем человека, который:

  • Имеет опыт работы Data Engineer / ETL Developer / DWH Developer / BI Data Engineer от 3 лет;

  • Уверенно знает SQL и имеет опыт работы с реляционными базами данных;

  • Имеет опыт работы с PostgreSQL;

  • Имеет опыт с Oracle (будет большим плюсом);

  • Уверенно знает Python для автоматизации, загрузки и обработки данных;

  • Понимает ETL/ELT-процессы и принципы построения DWH / ODS / data marts;

  • Имеет опыт создания аналитических витрин;

  • Понимает инкрементальные загрузки и безопасное извлечение данных из production-баз;

  • Умеет работать с большими таблицами без лишней нагрузки на операционные базы;

  • Имеет опыт работы с Git;

  • Имеет базовый опыт с Linux;

  • Умеет взаимодействовать с DBA, аналитиками, разработчиками и бизнес-заказчиками;
  • Готов работать в условиях, где data-инфраструктура только формируется.

Будет плюсом

  • Опыт с Airflow, Prefect, Dagster или другими инструментами оркестрации;
  • Опыт с dbt;
  • Опыт с BI-инструментами: Power BI, Tableau, Metabase, Superset, Looker;
  • Опыт построения DWH, ODS или аналитических витрин с нуля;
  • Опыт внедрения data quality-проверок;
  • Опыт с Docker и базовым CI/CD;
  • Понимание CDC, логической репликации PostgreSQL, Debezium, Oracle GoldenGate или аналогичных подходов;
  • Опыт подготовки данных для ML-моделей;
  • Базовое понимание ML: датасеты, признаки, обучение моделей, оценка качества;
  • Опыт с pandas, scikit-learn, XGBoost / LightGBM.

Мы предлагаем:

  • Возможен вариант работы: удаленно (в пределах РФ)/ частично удаленно/ офис
  • Компенсацию за переезд также из регионов в Москву
  • Конкурентную заработную плату, квартальные премии по результатам работы.