Data Scientist (NLP/CV)

Дата размещения вакансии: 01.10.2025
Работодатель: ВСК, САО
Уровень зарплаты:
з/п не указана
Город:
Москва
Островная 4
Требуемый опыт работы:
От 3 до 6 лет

В нашей IT-команде уже больше 850 специалистов, которые постоянно совершенствуют свои навыки. Мы не стоим на месте — постоянно улучшаем процессы разработки (ATDD, CI/CD и другие), пробуем новые подходы и развиваем команду. Нам важно, чтобы каждый сотрудник продолжал расти, поэтому мы проводим внутренние митапы, хакатоны, развиваем гильдии по направлениям и поддерживаем обучение за пределами компании. У нас есть много возможностей для профессионального развития и не только.

О проекте: Сейчас мы ищем Data scientist в команду "Инновационные технологии". Команда помогает бизнесу автоматизировать ручные процессы, улучшать SLA, увеличивать показатель NPS, снижать убыточность и экономить на расходах, с помощью технологий: openRPA, Python 3.11+, OCR, NLU, NLP. А также команда занимается разработкой цифровых помощников (RPA), сервисов и различных пилотных проектов в направлении Финтеха и Инноваций.

Стек: Python, OpenCV, Ultralytics, PyTorch.

Чем предстоит заниматься:

  • Разработка и контроль качества решений на всех этапах проекта: анализ, проектирование, разработка, тестирование, документация;
  • Взаимодействие с бизнес-заказчиками и командой, согласование документации, постановка и проработка технических задач совместно с аналитиками и продакт-менеджерами;
  • Выбор архитектур, фреймворков и инструментов под задачи;
  • Сбор, разметка, очистка и аугментация данных для ML/CV;
  • Имплементация и поддержка backend-компонентов на Python для ML/CV-сервисов;
  • Анализ производительности и оптимизация решений для ускорения инференса, включая экспорт, сжатие и квантование моделей;
  • Оценка метрик качества моделей, анализ ошибок и доработка;
  • Написание технической документации, подготовка описаний пайплайнов и архитектуры, участие в код-ревью и обмене знаниями; оценка сроков и трудоемкости задач, отчетность о ходе работ и результатах;
  • Отслеживание современных трендов в ML/CV и тестирование новых подходов для повышения эффективности решений.

Что мы ждем:

  • Коммерческий опыт разработки на Python от 2 лет;
  • уверенное владение numpy, pandas, scikit-learn и PyTorch и/или TensorFlow;
  • Практический опыт в CV/OCR: препроцессинг изображений, аугментации, разметка;
  • Опыт решения задач классификации, детекции, сегментации и трекинга;
  • Навыки обучения, дообучения и внедрение моделей (CNN, трансформеры и др.), построения end-to-end пайплайнов;
  • Опыт подготовки/анализа данных, разметки, обучения/валидации/тест, деплой;
  • Инструменты: CVAT (администрирование приветствуется), OpenCV, Pillow, torchvision;
  • Опыт экспорта и оптимизации моделей — ONNX, TorchScript, TensorRT;
  • Опыт ускорения инференса, сжатия и квантования.