Тверская улица 9с7
Ищем сильного аналитика данных (computer vision, OCR, NLP) к нам в группу анализа данных. Команда сейчас состоит из 5 человек, которые покрывают полный цикл решения: от формализации бизнес-требований до деплоя и поддержки сервиса. Основная задача команды - автоматизировать процесс распознавания документов. Данных много, результат работы виден на бизнес-метриках компании. Команду отличает высокая самостоятельность в выборе подходов к решению поставленных задач.
Мы хотим усилиться в решении задач OCR (как по точности, так и по времени инференса):
- детекция и распознавание текста,
- извлечение key-value пар,
- извлечение структурированных данных из документов,
- детекция и распознавание таблиц.
Основной стек: Python, PyTorch, Tensorflow. С бэкэнд частью поможем, но ожидаем от кандидата крепкой базы в области разработки программного обеспечения.
Обязанности:
- Решать задачи извлечения и структурирования текстовой информации из документов: OCR, key-value pairs extraction, tables extraction.
Требования:
-
Опыт в CV и NLP.
-
Умение корректно поставить эксперимент.
-
Умение писать код на Python.
-
Умение строить логические выводы.
-
Знания статистики и теории вероятности.
-
Знания классического ML.
-
Умение презентовать полученные результаты бизнес-заказчику.
Будет плюсом:
-
Опыт разработки систем распознавания документов для промышленной эксплуатации.