Data Engineer (Big Data)

Дата размещения вакансии: 19.09.2024
Работодатель: Платформа ОФД
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Платформа ОФД - продуктовая IT-компания, крупнейший в России оператор фискальных данных. Мы создаем полезные и удобные сервисы для предпринимателей, анализируем рынок российсого ритейла на данных из магазинных чеков.

Компания резидент Сколково, входит в Экосистему Сбера.

Что у нас есть:

  • Много данных: каждый 3-й чек, пробиваемый в России, находится на наших серверах. Мы принимаем до 60 млн чеков в день, имеем 2 млрд уникальных названий товаров в базе.
  • Развитая инфраструктура: есть несколько кластеров Hadoop, у DS есть несколько мощных машин, GPU делают бр-бр
  • Команда DE и сильная экспертиза
  • 80% кода мы пишем на Scala
  • Оформление только по ТК РФ, белая зп
  • ДМС с госпитализацией, скорой и стоматологией
  • Офис близко от м. Спортивная /Лужники. Можно работать из дома
  • Удобная кухня, релакс-зона с тренажером, массажным креслом, приставкой и караоке
  • Пицца-пати и корпоративные праздники за счет компании

Наш стек:

Hadoop, Spark, Hive, SCALA, Python, Java, PostgreSQL, ClickHouse, Zeppelin/IntelliJ, AirFlow, ElasticSearch, Apache Superset

GitLab, k8s, Docker, Jira, Confluence

Чем предстоит заниматься:

  • Разрабатывать ETL-процессы с использованием библиотеки Apache Spark на Scala
  • Анализировать, проектировать и создавать витрины данных в соответствии с требованиями конкретного проекта
  • Развивать инфраструктуру для обработки больших данных и кодовой базы Scala
  • Работать с DS для внедрения математических алгоритмов и ML-моделей в промышленные процессы

Откликайся, если ты:

  • От 2-х лет решаешь задачи в области сбора, хранения и анализа данных
  • Пишешь код на Scala
  • Отлично знаешь SQL
  • Применяешь в работе инструменты BigData: Airflow, Hadoop, Spark, Hive, Zeppelin
  • Будет плюсом опыт работы с Docker и k8s