Data Scientist

Дата размещения вакансии: 06.02.2025
Работодатель: «Баланс-Платформа»
Уровень зарплаты:
з/п не указана
Город:
Москва
Тверская улица 9с7
Требуемый опыт работы:
От 1 года до 3 лет

Ищем сильного аналитика данных (computer vision, OCR, NLP) к нам в группу анализа данных. Команда сейчас состоит из 5 человек, которые покрывают полный цикл решения: от формализации бизнес-требований до деплоя и поддержки сервиса. Основная задача команды - автоматизировать процесс распознавания документов. Данных много, результат работы виден на бизнес-метриках компании. Команду отличает высокая самостоятельность в выборе подходов к решению поставленных задач.
Мы хотим усилиться в решении задач OCR (как по точности, так и по времени инференса):
- детекция и распознавание текста,
- извлечение key-value пар,
- извлечение структурированных данных из документов,
- детекция и распознавание таблиц.

Основной стек: Python, PyTorch, Tensorflow. С бэкэнд частью поможем, но ожидаем от кандидата крепкой базы в области разработки программного обеспечения.

Обязанности:

  • Решать задачи извлечения и структурирования текстовой информации из документов: OCR, key-value pairs extraction, tables extraction.

Требования:

  • Опыт в CV и NLP.

  • Умение корректно поставить эксперимент.

  • Умение писать код на Python.

  • Умение строить логические выводы.

  • Знания статистики и теории вероятности.

  • Знания классического ML.

  • Умение презентовать полученные результаты бизнес-заказчику.

Будет плюсом:

  • Опыт разработки систем распознавания документов для промышленной эксплуатации.

​​​​