Ищем ML Engineer для работы с мультимодальными моделями и развития антифрод-модуля
Обязанности:
-
OCR и модели
-
Исследование, обучение и fine-tuning VLM-моделей (InternVL, Qwen-VL и др.) под задачи document understanding.
-
Дообучение моделей (LoRA / Multi-LoRA) под специфику разных стран и языков.
-
Подготовка данных: сбор, разметка, аугментация датасетов по гео.
-
Оптимизация пайплайна инференса: квантование, batching, параллелизация.
-
Антифрод
-
Проектирование и разработка ML-модуля антифрода.
-
Разработка методов выявления мошенничества.
-
Разработка скоринговой модели подозрительности клиента (Supervised, Unsupervised подходы) с интеграцией в существующий OCR-пайплайн и callback API.
-
Мониторинг и адаптация моделей к новым схемам мошенничества, анализ false positive / false negative.
-
Участие в поддержке и развитии production-сервиса (API, мониторинг, деплой).
Требования:
Обязательно:
ML / Deep Learning
-
Опыт работы с PyTorch от 2 лет.
-
Практический опыт обучения и fine-tuning моделей компьютерного зрения (классификация, детекция, OCR).
-
Понимание архитектур трансформеров (Vision Transformer, encoder-decoder).
-
Опыт работы с техниками parameter-efficient fine-tuning (LoRA, QLoRA).
-
Умение проводить эксперименты, отслеживать метрики, сравнивать модели.
-
Computer Vision / NLP
-
Опыт работы с задачами OCR или document understanding.
-
Понимание пайплайнов обработки изображений (детекция текста, распознавание, постобработка).
-
Базовое понимание NLP-задач (извлечение сущностей, парсинг структурированных данных).
-
Антифрод / Anomaly Detection
-
Опыт или понимание задач anomaly detection / binary classification в условиях дисбаланса классов.
-
Понимание метрик fraud-систем: precision/recall trade-off, стоимость ошибок первого и второго рода в контексте финансовых операций.
-
Engineering
-
Python: уверенное владение, умение писать чистый production-код.
-
Опыт работы с GPU-инференсом (CUDA, управление VRAM, профилирование).
-
Опыт работы с Docker (контейнеры, docker-compose).
-
Linux: уверенная работа в терминале, SSH, базовое администрирование.
Будет плюсом:
-
Опыт работы с vLLM, SGlang или аналогичными inference-серверами.
-
Опыт работы с мультимодальными моделями (VLM: LLaVA, InternVL, Qwen-VL).
-
Опыт квантования моделей (GPTQ, AWQ, bitsandbytes).
-
Практический опыт fraud detection в финтехе или платёжных системах.
-
Опыт работы с image forensics / document forgery detection.
-
Опыт работы с EasyOCR, PaddleOCR, Tesseract или аналогами.
-
Опыт работы с LayoutLM / Document AI моделями.
-
Опыт разработки REST API (FastAPI / Flask).
Условия:
-
Стек: Python, PyTorch, vLLM, Docker, NVIDIA A100.
-
Работа с state-of-the-art моделями (InternVL2, Qwen3-VL, LayoutLMv2).
-
Задачи на стыке research и production: от экспериментов с моделями до разработки антифрод-системы в реальной платёжной системе.
-
Возможность влиять на архитектурные решения.
- Удаленный формат работы из любого города или страны
- График работы 5/2
- Отпуск - 28 календарных дней.