улица Раевского 4с1А
О проекте:
Проект по созданию платформы геопространственной осведомленности, задачей которой является получение, обработка, хранение данных из различных источников и предоставление результатов конечному потребителю в режиме, близком к реальному времени.
В рамках реализации проекта предстоит столкнуться с нетипичными задачами, для решения которых не существует готовых решений.
Обязанности:
-
Проектирование системы хранения и обработки данных (с применением ML моделей);
-
Подготовка рабочей документации;
-
Участие в разработке целостной архитектуры Платформы;
-
Оценка влияния новых источников и типов данных на Платформу;
-
Проработка процессов резервного копирования данных и их восстановления;
-
Проработка бизнес-требований, согласование функциональных и нефункциональных требований к системе;
-
Архитектурный надзор, проверка на соответствие целевой архитектуре;
-
Донесение целевой архитектуры до команд разработки, контроль соответствия этапов реализации задач;
-
Участие в создании архитектурной культуры компании (практики, принципы, процессы).
Требования:
-
Понимание принципов проектирования архитектуры для обработки данных;
-
Навыки разработки модели данных;
-
Знание методологий ETL/ELT и интеграции данных;
-
Понимание принципов работы систем оркестрации/виртуализации;
-
Знание и умение применять на практике методологии Data Governance, Data Quality;
-
Навыки организации инфраструктуры для реализации архитектурных решений;
-
Понимание жизненного цилка ML моделей;
-
Навыки трансформации бизнес-требований в архитектурные решения для нужд бизнеса;
-
Опыт работы с большими объемами данных и системами обработки данных от 5 лет;
-
Опыт работы с моделями машинного обучения и их внедрения в производственной среде;
-
Будет плюсом опыт работы с данными ДЗЗ.
Технические навыки:
- Знание языков программирования (SQL, Python, Java);
- Знание принципов работы SQL и NoSQL баз данных и умение их применять на практике;
- Навыки проектирования хранилищ данных на базе hdfs/s3 и знание форматов хранения;
- Знание технологий пакетной обработки данных (Hadoop MapReduce, Spark, Trino, Dremio);
- Знание технологий потоковой обработки данных (Flink, Spark Streaming) будет плюсом;
- Знание инструментов оркестрации обработки данных (NiFi, Airflow);
- Понимание принципов работы и построения инструментов анализа и визуализации данных (например, Tableau, Power BI).
Навыки в области архитектуры:
-
Понимание принципов проектирования архитектуры для обработки данных;
-
Навыки разработки модели данных;
-
Знание методологий ETL/ELT и интеграции данных;
-
Понимание принципов работы систем оркестрации/виртуализации;
-
Знание и умение применять на практике методологии Data Governance, Data Quality;
-
Навыки организации инфраструктуры для реализации архитектурных решений;
-
Понимание жизненного цилка ML моделей;
-
Навыки трансформации бизнес-требований в архитектурные решения для нужд бизнеса.
Коммуникационные навыки:
- Умение работать в команде и взаимодействовать с различными заинтересованными сторонами (разработчиками, аналитиками, менеджерами);
- Способность объяснять сложные технические концепции не техническим специалистам.
Условия:
- Официальное оформление с первого рабочего дня, полное соблюдение ТК РФ
- Оплата больничного
- Хороший пакет ДМС
- Дружный коллектив