ML-инженер (middle)

Дата размещения вакансии: 25.05.2026
Работодатель: СОГАЗ
Уровень зарплаты:
з/п не указана
Город:
Москва
Серебряническая набережная 29
Требуемый опыт работы:
От 3 до 6 лет

Хотите стать частью увлекательного процесса цифровой трансформации?

Блок IT в СОГАЗ активно развивается и меняет подход к созданию продуктов. Мы создаем новые сервисы и решения, которые делают нашу работу более технологичной и эффективной.

Обязанности:

  • Разработка и развитие пайплайна автоматической обработки документов: от PDF-сканов до структурированных данных в XML;

  • Определение типа документа и извлечение нужных полей из печатного и рукописного текста;

  • Организация процесса разметки данных (Label Studio);

  • Подбор и интеграция open-source OCR-движков с учётом баланса скорость/качество под разные типы документов;

  • Обучение и дообучение ML-моделей под специфику документооборота компании на размеченных данных;

  • Обеспечение требуемой скорости и качества обработки для production-нагрузки;

  • Построение системы валидации извлечённых данных и мониторинга качества работы моделей;

  • Быстрое добавление новых типов документов в работающую систему без переделки всего пайплайна.

Требования:

  • Опыт построения production-пайплайнов на основе ML/DL моделей: от прототипа до промышленной эксплуатации;
  • Уверенное владение Python и современным стеком машинного обучения (PyTorch, HuggingFace);
  • Практический опыт работы с задачами компьютерного зрения и обработки естественного языка, в идеале - с документами (OCR, классификация, извлечение сущностей);
  • Опыт дообучения моделей под конкретный домен и понимание методов оценки качества;
  • Умение выбирать инструмент под задачу: где достаточно специализированной модели, а где оправдано применение более тяжёлых решений;
  • Понимание ограничений LLM/VLM и принципов построения надёжных систем извлечения данных.

Технологический стек: Python, PyTorch, HuggingFace Transformers, OpenCV, BERT / LiLT / LayoutLM, DiT и vision-трансформеры, PaddleOCR, VLM-OCR (PaddleOCR-VL, dots.ocr, Qwen-VL), PEFT (LoRA, QLoRA), vLLM, Triton Inference Server, ONNX, Docker, Label Studio.

Условия:

  • Оформление полностью в соответствии с ТК РФ, включая оплачиваемый отпуск 29 календарных дней (плюс 1 день отпуска);
  • ДМС в лучших клиниках города, страхование жизни и страхование от несчастных случаев и болезней + ДМС родственников с 75% скидкой;

  • Премиальные условия на всю продуктовую линейку группы компаний «СОГАЗ» для работников и их близких родственников (ОСАГО, каско, имущество, жизнь);
  • Социальный пакет и специальные предложения по страхованию, кредитованию и другие программы от наших партнёров;
  • Профессиональное развитие: курсы, тренинги, корпоративная библиотека;
  • Заботу компании о детях сотрудников: подарки на Новый год и скидки в детские лагеря.