ML/NLP-инженер

Дата размещения вакансии: 02.02.2026
Работодатель: Группа компаний Экзон
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Экзон Групп — ведущий разработчик и интегратор инновационных IT-решений в сфере строительства. Мы разрабатываем облачную платформу EXON, предназначенную для автоматизации и оптимизации строительных процессов.

Наша миссия — объединить всех участников строительного процесса на одной платформе, обеспечивая прозрачность и ясность на каждом этапе работы.

Ищем специалиста по большим языковым моделям для продукта в сфере ИИ.

Обязанности:

- Разрабатывать и оптимизировать продакшен-конвейер транскрипции аудио/видео: VAD, сегментация, диаризация, постобработка, разметка таймкодов, сбор агрегированных метрик по коммуникациям.

- Внедрять и поддерживать пайплайн извлечения знаний из текстов и транскриптов: лемматизация, NER, нормализация сущностей, сентимент/эмоциональная окраска, тематическое моделирование, классификация коммуникативных ролей и типов взаимодействий.

- Проектировать доменно-ориентированные модели/правила под корпоративный контекст: сущности «организация/проект/площадка/документ/задача/персона/роль», устойчивые словари и нормализацию терминов, работу с шумными данными (чат, переговоры, совещания).

- Разрабатывать модели и метрики риск-скоринга для команд и процессов: выгорание/конфликтность, эскалации, деградация коммуникаций, а также поддерживающие объяснения (факторы, вклад признаков, доказательная база).

- Строить автоматизированные quality gates для моделей и пайплайнов: датасеты, протоколы валидации, ROC AUC/PR-AUC/Precision/Recall/F1, устойчивость к дрейфу данных, регресс-тесты качества на ключевых сценариях.

- Организовывать MLOps-жизненный цикл: версионирование данных и моделей, воспроизводимость экспериментов, MLflow/DVC, CI для ML (юнит/интеграционные тесты, контроль качества данных и артефактов, релизные чек-листы).

- Оптимизировать инференс на GPU/CPU: батчинг, half-precision, квантование/ONNX при необходимости, профилирование и устранение узких мест.

- Совместно с Backend-инженером интегрировать результаты аналитики в контуры продукта: запись в хранилища (raw/silver/gold), публикация событий, подготовка API-контрактов, участие в код-ревью, повышение производительности и надёжности сервиса.

- Участвовать в разработке агентных сценариев: подготовка признаков/эмбеддингов, retrieval по векторным/графовым индексам, оценка качества на типовых сценариях.

Требования:

- Продвинутое владение Python с упором на научный стек (NumPy, pandas, Jupyter), умение писать поддерживаемый продакшен-код.

- Практический опыт настройки и инференса STT/диаризации на своих данных: подготовка датасетов, оценка качества, обработка шумов и разных доменов речи.

- Опыт обучения/дообучения трансформеров под прикладные задачи: NER, классификация, тематическое моделирование, retrieval-эмбеддинги.

- Понимание и практический опыт тематического моделирования (LDA, HDBSCAN + SBERT/эмбеддинги), интерпретация тем и устойчивость результатов.

- Навыки оптимизации инференса: батчинг, mixed precision, профилирование, понимание ограничений GPU/CPU и стоимости вычислений.

- Опыт упаковки ML в сервисы (REST/gRPC), работа с контрактами, схемами данных и интеграцией в backend.

- Опыт построения CI для ML-задач: тесты качества моделей, проверки датасетов, контроль дрейфа и регрессий, воспроизводимость экспериментов.

- Понимание принципов A/B-валидации, мониторинга в проде (качество, дрейф, задержки, ресурсы), алертинг.

- Желательно: опыт с графовыми/векторными хранилищами, построением индексов для поиска и последующей аналитики; опыт с event-driven архитектурой (Kafka).

​​​​​​​- Важно: аккуратная работа с чувствительными данными сотрудников (анонимизация/псевдонимизация, контроль доступа, минимизация данных, этичность метрик).

Условия:

  • Официальное трудоустройство с "белой" заработной платой;
  • Ценим права наших сотрудников, поэтому предоставляем полный соцпакет по ТК РФ;
  • Удаленный формат работы;
  • Достойный уровень зарплаты, обсуждается по итогам собеседования;
  • Открытая корпоративная культура, где ваши идеи могут стать реальностью;
  • А ещё у нас активная корпоративная жизнь!