Находимся в поиске Data Scientist (CV, OCR)
Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный комплекс услуг по разработке и внедрению программных решений.
Каждый день на наших проектах задействовано 4200+ сотрудников, у нас 70+ направлений разработки различных решений. За 11 лет нашей работы мы успешно реализовали более 60 ИТ-продуктов.
Проект - ядровой сервис по распознаванию документов.
Мы предлагаем:
- Удаленную работу с гибким началом рабочего дня (на территории РФ);
- Оформление по ТК РФ в аккредитованной ИТ-компании;
- Оклад и годовая премия;
- Кафетерий льгот с возможностью выбора категорий (ДМС или компенсация затрат на медицинские услуги, спорт и т.д.).
Вам предстоит:
- Участвовать в разработке ядрового сервиса по распознаванию документов;
- Заниматься распознаванием объектов, сегментацией и классификацией изображений;
- Реализовывать OCR пайплайн для распознавания рукописного текста.
Нам важны:
- Опыт работы в роли Data scientist от 2 лет;
- Реализация и работа с OCR решениями;
- Знание основных подходов и метрик в OCR;
- Наличие опыта решения классических задач CV (Detection, Segmentation, Classification и т.д.);
- Опыт обучения с нуля/дообучения open-source/самописных моделей;
- Владение: git, docker, pytorch, transformers и одним из фреймворков для OCR.
Будет плюсом:
- Участие в соревнованиях по ML/DL;
- Практический опыт реализации OCR пайплайнов для распознавания рукописного текста, а также текстов на языках народов России (Татарский, Башкирский, Удмуртский и т.д.);
- Опыт в парсинге и редактировании разных форматов текстовых документов через python (word, xlsx, pptx, pdf и т.д.)
- Публикации по CV;
- Опыт работы с VLLM, задачами трекинга, image description, Image question answering и т.д.;
- Собственные проекты по CV.