Data Engineer/ ML Engineer

Дата размещения вакансии: 21.10.2025
Работодатель: Технопарк
Уровень зарплаты:
от 250000 RUR
Город:
Нижний Новгород
улица Октябрьской Революции 43
Требуемый опыт работы:
От 3 до 6 лет

ГК «Технопарк» — производитель и поставщик оборудования для нефтехимической и атомной промышленности. С 2003 года работаем с корпоративным сегментом; среди клиентов — «Росатом», «Газпром», «Роснефть», «Сибур», «Норильский никель» и др. Запускаем систему CPQ и аналитическую платформу для производственного бизнеса — усиливаем команду ML/данными.

О проекте

Создаём систему автоматизированного расчёта коммерческих предложений (CPQ) и аналитическую платформу. Проект сочетает ML, инженерные расчёты и промышленную аналитику; работаем с разнородными источниками и «тяжёлыми» инженерными данными.

Обязанности

Работа с данными

  • Сбор, очистка и агрегирование данных из разных источников.
  • Настройка ETL-пайплайнов (Airflow/dbt, Python).
  • Формирование обучающих выборок по изделиям, материалам, срокам и ценам.
  • Участие в проектировании DWH (ClickHouse / PostgreSQL).

Разработка ML-моделей

  • Обучение моделей для:
    • расчёта стоимости изделий;
    • прогнозирования сроков и вероятности выигрыша тендера;
    • подбора аналогов и оптимальных вариантов по атрибутам.
  • Использование CatBoost / LightGBM / PyTorch / scikit-learn.
  • Разработка и улучшение пайплайнов обучения (MLflow, DVC, EvidentlyAI).
  • Мониторинг качества моделей и дрейфа данных (MLOps).

Интеграция и поддержка

  • Подготовка ML-сервисов (FastAPI/gRPC) для интеграции с CPQ/CRM.
  • Участие в A/B-тестах моделей (legacy vs new).
  • Формирование отчётности по точности и влиянию моделей на бизнес-метрики.

Tech Stack

  • Python 3.11, Pandas / NumPy
  • CatBoost / LightGBM / PyTorch / scikit-learn
  • ClickHouse / PostgreSQL
  • Airflow / dbt • MLflow / DVC / EvidentlyAI
  • FastAPI / Docker
  • GitLab CI/CD

Обязательно

  • 3+ лет в роли Data Scientist / ML Engineer.
  • Уверенное владение Python, pandas, scikit-learn, CatBoost/LightGBM.
  • Опыт построения ETL и пайплайнов на Airflow или аналогах.
  • Понимание MLOps (MLflow, модели в проде, мониторинг и дрейф данных).
  • Навыки работы с ClickHouse / PostgreSQL / SQL.

Желательно

  • Опыт работы с инженерными данными / CAD-файлами (DWG, STEP).
  • Опыт OCR / NLP (тендеры, PDF, технические задания).
  • Интеграция ML-сервисов в production.
  • Понимание полного цикла ML: данные → обучение → инференс → мониторинг.
  • Участие в проектах по прогнозированию себестоимости или сроков.

Soft skills

  • Уважение к инженерии, документации и проверке гипотез данными.
  • Готовность к коммуникации с аналитиками и инженерами без ML-бэкграунда.
  • Способность работать автономно и держать фокус на результате.
  • Баланс между «идеально» и «работает».

Мы предлагаем

  • Участие в создании новой промышленной платформы («мозг производства», а не просто сайт).
  • Полное владение жизненным циклом промышленного ML-продукта.
  • Возможность выстроить архитектуру с нуля (новый продукт).
  • Роль на стыке ML, инженерии данных и продакшн-поддержки.
  • Работа с реальными физическими моделями и инженерными расчётами.
  • Оформление по ТК РФ, наставничество, оборудованное рабочее место, корпоративная связь.
  • Пятидневка, гибкое начало дня 8:00–10:00.