улица Октябрьской Революции 43
ГК «Технопарк» — производитель и поставщик оборудования для нефтехимической и атомной промышленности. С 2003 года работаем с корпоративным сегментом; среди клиентов — «Росатом», «Газпром», «Роснефть», «Сибур», «Норильский никель» и др. Запускаем систему CPQ и аналитическую платформу для производственного бизнеса — усиливаем команду ML/данными.
О проекте
Создаём систему автоматизированного расчёта коммерческих предложений (CPQ) и аналитическую платформу. Проект сочетает ML, инженерные расчёты и промышленную аналитику; работаем с разнородными источниками и «тяжёлыми» инженерными данными.
Обязанности
Работа с данными
- Сбор, очистка и агрегирование данных из разных источников.
- Настройка ETL-пайплайнов (Airflow/dbt, Python).
- Формирование обучающих выборок по изделиям, материалам, срокам и ценам.
- Участие в проектировании DWH (ClickHouse / PostgreSQL).
Разработка ML-моделей
- Обучение моделей для:
- расчёта стоимости изделий;
- прогнозирования сроков и вероятности выигрыша тендера;
- подбора аналогов и оптимальных вариантов по атрибутам.
- Использование CatBoost / LightGBM / PyTorch / scikit-learn.
- Разработка и улучшение пайплайнов обучения (MLflow, DVC, EvidentlyAI).
- Мониторинг качества моделей и дрейфа данных (MLOps).
Интеграция и поддержка
- Подготовка ML-сервисов (FastAPI/gRPC) для интеграции с CPQ/CRM.
- Участие в A/B-тестах моделей (legacy vs new).
- Формирование отчётности по точности и влиянию моделей на бизнес-метрики.
Tech Stack
- Python 3.11, Pandas / NumPy
- CatBoost / LightGBM / PyTorch / scikit-learn
- ClickHouse / PostgreSQL
- Airflow / dbt • MLflow / DVC / EvidentlyAI
- FastAPI / Docker
- GitLab CI/CD
Обязательно
- 3+ лет в роли Data Scientist / ML Engineer.
- Уверенное владение Python, pandas, scikit-learn, CatBoost/LightGBM.
- Опыт построения ETL и пайплайнов на Airflow или аналогах.
- Понимание MLOps (MLflow, модели в проде, мониторинг и дрейф данных).
- Навыки работы с ClickHouse / PostgreSQL / SQL.
Желательно
- Опыт работы с инженерными данными / CAD-файлами (DWG, STEP).
- Опыт OCR / NLP (тендеры, PDF, технические задания).
- Интеграция ML-сервисов в production.
- Понимание полного цикла ML: данные → обучение → инференс → мониторинг.
- Участие в проектах по прогнозированию себестоимости или сроков.
Soft skills
- Уважение к инженерии, документации и проверке гипотез данными.
- Готовность к коммуникации с аналитиками и инженерами без ML-бэкграунда.
- Способность работать автономно и держать фокус на результате.
- Баланс между «идеально» и «работает».
Мы предлагаем
- Участие в создании новой промышленной платформы («мозг производства», а не просто сайт).
- Полное владение жизненным циклом промышленного ML-продукта.
- Возможность выстроить архитектуру с нуля (новый продукт).
- Роль на стыке ML, инженерии данных и продакшн-поддержки.
- Работа с реальными физическими моделями и инженерными расчётами.
- Оформление по ТК РФ, наставничество, оборудованное рабочее место, корпоративная связь.
- Пятидневка, гибкое начало дня 8:00–10:00.