Наш клиент, health приложение (10 млн пользователей в 130 странах и 180 тысяч пятизвездочных оценок в сторах) открывает позицию Ведущего Data инженера, который вместе с командой с нуля будет создавать data lakehouse с нетривиальным набором данных. У компании на сегодняшний день один из самых богатых дата сетов в мире, в области образа жизни людей.
Компания прибыльная, находится на 44 месте в категории Health&Fitness Top Grossing в США. Темпы роста компании за последние 4 года - 95% в год.
В компании работает больше 100 человек, сотрудники работают из 24 стран и говорят преимущественно на русском языке. 95% сотрудников которые работают более 1 года являются акционерами компании.
Ваши задачи:
- Вы будете одним из первых инженеров в команде, поэтому вам предстоит заниматься почти всем, что связано с полным циклом обработки данных, и активно участвовать в настройке процессов
- Вы будете строить и поддерживать внутренний Data Lakehouse, который будет обеспечивать другие команды легкодоступными и качественными данными
- Также вы будете разрабатывать пайплайны обработки данных для некоторых продакшен фич приложения, где требуется RT или NRT обработка и сервинг.
Какие ключевые технологии используются и опыт в чем обязателен: Python, Apache Spark, AWS, SQL и NoSQL базы данных.
Компания предлагает:
- Зарплата исходя из ваших ожиданий
- Свободный график и страна проживания
- Оформление по договору оказания услуг, у вас будет свобода в выборе дней для «перезагрузки» и переездов — дей–оффы за счет компании, компания не отслеживает количество дней вашего отпуска (безлимитный отпуск) , есть опционная программа
- В компании динамично, интересно, компания живет на пике технологий и инноваций
Для отклика на вакансию ответьте пожалуйста на несколько вопросов:
1. На какой уровень оплаты вы ориентируетесь
2. В какой стране вы живете
3. Был ли у вас опыт построения data lakehouse
Отметьте уровни владения по программам, от 1-5.
(1 знаю, 2 пробовал, 3 редко использовал, 4 использовал часто и знаю хорошо, 5 знаю на профессиональном уровне и могу обучать)
- Python
- Apache Spark
- AWS
- SQL и NoSQL базы данных