Экзон Групп — ведущий разработчик и интегратор инновационных IT-решений в сфере строительства. Мы разрабатываем облачную платформу EXON, предназначенную для автоматизации и оптимизации строительных процессов.
Наша миссия — объединить всех участников строительного процесса на одной платформе, обеспечивая прозрачность и ясность на каждом этапе работы.
Ищем специалиста по большим языковым моделям для продукта в сфере ИИ.
Обязанности:
- Разрабатывать и оптимизировать продакшен-конвейер транскрипции аудио/видео: VAD, сегментация, диаризация, постобработка, разметка таймкодов, сбор агрегированных метрик по коммуникациям.
- Внедрять и поддерживать пайплайн извлечения знаний из текстов и транскриптов: лемматизация, NER, нормализация сущностей, сентимент/эмоциональная окраска, тематическое моделирование, классификация коммуникативных ролей и типов взаимодействий.
- Проектировать доменно-ориентированные модели/правила под корпоративный контекст: сущности «организация/проект/площадка/документ/задача/персона/роль», устойчивые словари и нормализацию терминов, работу с шумными данными (чат, переговоры, совещания).
- Разрабатывать модели и метрики риск-скоринга для команд и процессов: выгорание/конфликтность, эскалации, деградация коммуникаций, а также поддерживающие объяснения (факторы, вклад признаков, доказательная база).
- Строить автоматизированные quality gates для моделей и пайплайнов: датасеты, протоколы валидации, ROC AUC/PR-AUC/Precision/Recall/F1, устойчивость к дрейфу данных, регресс-тесты качества на ключевых сценариях.
- Организовывать MLOps-жизненный цикл: версионирование данных и моделей, воспроизводимость экспериментов, MLflow/DVC, CI для ML (юнит/интеграционные тесты, контроль качества данных и артефактов, релизные чек-листы).
- Оптимизировать инференс на GPU/CPU: батчинг, half-precision, квантование/ONNX при необходимости, профилирование и устранение узких мест.
- Совместно с Backend-инженером интегрировать результаты аналитики в контуры продукта: запись в хранилища (raw/silver/gold), публикация событий, подготовка API-контрактов, участие в код-ревью, повышение производительности и надёжности сервиса.
- Участвовать в разработке агентных сценариев: подготовка признаков/эмбеддингов, retrieval по векторным/графовым индексам, оценка качества на типовых сценариях.
Требования:
- Продвинутое владение Python с упором на научный стек (NumPy, pandas, Jupyter), умение писать поддерживаемый продакшен-код.
- Практический опыт настройки и инференса STT/диаризации на своих данных: подготовка датасетов, оценка качества, обработка шумов и разных доменов речи.
- Опыт обучения/дообучения трансформеров под прикладные задачи: NER, классификация, тематическое моделирование, retrieval-эмбеддинги.
- Понимание и практический опыт тематического моделирования (LDA, HDBSCAN + SBERT/эмбеддинги), интерпретация тем и устойчивость результатов.
- Навыки оптимизации инференса: батчинг, mixed precision, профилирование, понимание ограничений GPU/CPU и стоимости вычислений.
- Опыт упаковки ML в сервисы (REST/gRPC), работа с контрактами, схемами данных и интеграцией в backend.
- Опыт построения CI для ML-задач: тесты качества моделей, проверки датасетов, контроль дрейфа и регрессий, воспроизводимость экспериментов.
- Понимание принципов A/B-валидации, мониторинга в проде (качество, дрейф, задержки, ресурсы), алертинг.
- Желательно: опыт с графовыми/векторными хранилищами, построением индексов для поиска и последующей аналитики; опыт с event-driven архитектурой (Kafka).
- Важно: аккуратная работа с чувствительными данными сотрудников (анонимизация/псевдонимизация, контроль доступа, минимизация данных, этичность метрик).
Условия:
- Официальное трудоустройство с "белой" заработной платой;
- Ценим права наших сотрудников, поэтому предоставляем полный соцпакет по ТК РФ;
- Удаленный формат работы;
- Достойный уровень зарплаты, обсуждается по итогам собеседования;
- Открытая корпоративная культура, где ваши идеи могут стать реальностью;
- А ещё у нас активная корпоративная жизнь!