Data Engineer

Дата размещения вакансии: 23.06.2026
Работодатель: PARI
Уровень зарплаты:
з/п не указана
Город:
Москва
Овчинниковская набережная 18/1с2
Требуемый опыт работы:
От 3 до 6 лет

ИЩЕМ ТИММЕЙТА В КОМАНДУ УПРАВЛЕНИЯ ДАННЫМИ

Ты будешь отвечать за проектирование и развитие отказоустойчивых пайплайнов потоковой обработки данных, влияя на скорость и качество решений внутренних команд.

С тебя — самостоятельность, инженерная глубина и готовность улучшать существующую платформу, с нас — сложные real-time-задачи, технологичная среда и свобода превращать экспертизу в решения, которыми пользуются аналитики, ML-специалисты и продуктовые команды.

В чем твой вызов?

— Проектировать, разрабатывать и поддерживать высоконагруженные пайплайны для обработки потоковых данных в режиме real time

— Развивать процессы для обработки данных и передачи результатов в целевые системы и внешние API

— Настраивать интеграции в связке Kafka, Flink и ClickHouse, обеспечивая стабильное движение данных между источниками и потребителями

— Очищать, фильтровать, трансформировать и обогащать сырые потоки данных для создания качественных витрин и датасетов.

— Проектировать быстрые витрины с минутными и другими оперативными срезами для аналитических и ML-сценариев

— Оптимизировать существующие потоковые и пакетные процессы, повышая их производительность, надежность и масштабируемость

— Разрабатывать переиспользуемые модули, шаблоны и кастомные расширения, которые помогут быстрее запускать новые процессы обработки данных

— Внедрять механизмы мониторинга, логирования и проверки целостности данных на всех этапах их движения

— Анализировать сбои и узкие места, находить причины проблем и повышать отказоустойчивость real-time-инфраструктуры

— Участвовать в code review и поддерживать единые инженерные стандарты внутри команды.

Три совпадения — и нам точно по пути:

— Ты можешь самостоятельно спроектировать, реализовать и вывести в эксплуатацию решение без постоянного контроля

— Тебе интересны сложные задачи на стыке потоковой обработки, высоких нагрузок и аналитических систем, где результат твоей работы напрямую влияет на скорость принятия решений

— Ты не ограничиваешься поддержкой уже работающих процессов: ищешь возможности для оптимизации, предлагаешь переиспользуемые решения и внимательно относишься к качеству данных и кода.

Какие скилы нам важны:

— Есть коммерческий опыт построения и оптимизации высоконагруженных систем потоковой обработки данных

— Уверенно работаешь с Apache Kafka и понимаешь принципы построения решений на базе брокеров сообщений

— Имеешь практический опыт работы с Apache Flink на уровне самостоятельной разработки и оптимизации production-процессов

— Хорошо знаешь ClickHouse и понимаешь, какие движки и архитектурные подходы использовать для обработки real-time-данных

— Уверенно владеешь Python и умеешь писать поддерживаемый production-код

— Работал с Airflow и понимаешь принципы оркестрации процессов. Глубокая экспертиза необязательна, но важно уверенно ориентироваться в инструменте

— Умеешь интегрировать стриминговые решения, брокеры сообщений, API и хранилища данных в единый технологический контур

— Проектировал решения с учетом масштабирования, производительности, стабильности и отказоустойчивости

— Умеешь настраивать мониторинг, логирование, алертинг и проверки качества данных

— Разрабатывал переиспользуемые модули, внутренние библиотеки или шаблоны для ускорения запуска новых пайплайнов

— Участвовал в code review и умеешь аргументированно предлагать улучшения в архитектуре и коде.

Что дальше, если случился мэтч?

→ Рекрутер

→ Техническое интервью

→ Бизнес кейсы (интервью в офисе)

→ СБ и офер