Ищем начинающего Python-разработчика для работы над проектом по оцифровке PDF-документов. Задача — доработка и создание обработчиков для различных типов PDF, настройка под конкретные шаблоны документов и решение возникающих задач. Базовые функции уже готовы, поэтому основная работа заключается в адаптации к новым типам документов.
Обязанности:
• Доработка и создание новых обработчиков для специфических типов PDF-документов.
• Оптимизация кода для повышения универсальности (использование одного обработчика для схожих шаблонов).
• Работа с OCR для распознавания текста на документах (например, с использованием Tesseract OCR).
• Версионное управление кодом через GitHub: загрузка изменений, ведение истории версий, совместная работа с командой.
• Совместное решение технических задач и обсуждение возникающих вопросов на регулярных созвонах.
Требования:
• Базовые знания Python и понимание основ ООП.
• Желателен опыт работы с библиотеками для работы с PDF и инструментами для распознавания текста.
• Навыки работы с Git и GitHub для совместной разработки и управления версиями.
• Навыки работы с регулярными выражениями для обработки текста.
• Ответственность и стремление развивать свои навыки.
• Знание
Условия работы:
• Сдельная оплата за каждый новый тип обработанного документа (все обработанные документы, включая схожие типы, оплачиваются по одинаковой ставке).
• Удаленная работа и гибкий график
• Еженедельные созвоны (2-3 раза), на которых обсуждаем прогресс, делимся инсайтами и совместно решаем задачи.
Что мы предлагаем:
• Реальный опыт работы в проекте, где можно развить навыки работы с данными, автоматизацией и обработкой документов.
• Перспектива роста до Junior Python Developer и участие в более сложных проектах, включая внедрение алгоритмов машинного обучения.
• При интересе к Машинному Обучению - подскажем трек развития и чего не хватает для того чтобы делать реальные проекты.