Наша практика специализируется на разработке комплексных решений для бизнеса на базе компьютерного зрения. Мы создаем системы потоковой видеоаналитики для трекинга персонала/оборудования и построения цифровых двойников промышленных объектов, разрабатываем собственные технологии OCR для извлечения метаданных из сложной инженерной документации, а также внедряем решения для интерпретации изображений (недвижимость, производство, авто) с использованием больших языковых моделей. С чем предстоит работать: Visual Language Models и обучение моделей детекции/классификации/генерации, включая fine-tuning и дистилляцию, разработка высокопроизводительных приложений на NVIDIA DeepStream, создание уникальных CV-алгоритмов, таких как обработка поврежденных сканов, мультикамерный трекинг и 3D-реконструкция сцен.
Чем предстоит заниматься:
- Реализация ИИ-проектов в области компьютерного зрения и оптического распознавания символов;
- Взаимодействие с заказчиками, продукт-менеджерами и смежными подразделениями (аналитика, разработка, инфраструктура) для обеспечения беспрепятственного хода проектов;
- Разработки ML-решений в области CV/OCR;
- Участие в формировании бэклога, оценка перспективных направлений и проектов.
Для нас важно:
- Высшее образование (математика, компьютерные науки, физика, инженерия или смежные области);
- Опыт работы в области машинного обучения от 3+ лет, включая практический опыт разработки и внедрения решений в области Computer Vision (CV) и Optical Character Recognition (OCR);
- Глубокое понимание принципов машинного обучения и их применения в CV/OCR: работа с изображениями, видео, распознавание текста, детекция объектов, сегментация и т.д.;
- Опыт работы с современными библиотеками и фреймворками для CV: OpenCV, TensorFlow, PyTorch, YOLO, Tesseract, PaddleOCR и др.;
- Навыки эффективной коммуникации с нетехническими стейкхолдерами (менеджмент, заказчики, инженеры). Умение объяснять сложные технические концепции простым и понятным языком;
- Опыт работы с MLOps-инструментами (ClearML, MLflow, Kubeflow, Airflow и др.) для автоматизации процессов разработки и эксплуатации моделей;
- Опыт работы с облачными платформами (AWS, GCP, Azure, Сбер, Яндекс, МТС) и их сервисами для ML и CV;
- Опыт контейнеризации решений (docker compose, containderd, k8s);
- Работа с VLM (vllm, QWEN-VL);
- Глубокое понимание python и библиотек OpenCV;
- Опты разработки и внедрения масштабируемых ML-решений в production;
- Опыт работы с PostgreSQL, Redis, Kafka.
- Готовность работать на территории РФ.
Будет плюсом:
- Опыт работы с процедурами авторазметки;
- Оптимизация прозиводительности кода на python (векторные вычисления, numba, cython);
- Знание методов оптимизации моделей CV/OCR, в том числе для работы на edge-устройствах (ONNX, TensorRT, квантование);
- Знание BigData-стека: опыт работы с Apache Spark, Hadoop, а также языками программирования Java/Scala;
- Опыт работы с DeepStream и знание C++.
- Опыт работы с real-time видеопотоками (RTSP, кодеки)
- Навыки эффективного использования LLM для разработки