Специалист по обработке источников (веб-скрейпинг/RSS, CSS-селекторы)

Дата размещения вакансии: 03.11.2025
Работодатель: Arevord
Уровень зарплаты:
от 50000 до 60000 RUR
Город:
Воронеж
Требуемый опыт работы:
не требуется

О продукте

Разрабатываем систему мониторинга новостных сайтов. Внутренняя админка позволяет настраивать парсинг: контейнер статьи, заголовок, дата, автор, контент, изображения; поддержку lazy-load, meta/time, исключения, куки/прокси/Puppeteer, RSS/Atom.

Задачи
  • Искать и подтверждать фиды: RSS/Atom/JSON Feed/сайтмапы, проверять валидность, периодичность обновлений.

  • Подбирать корректные CSS-селекторы/XPath, учитывать data-src/srcset, OpenGraph, itemprop, локальные форматы даты/времени и таймзоны.

  • Проверять результат в нашей админке, фиксировать комментарии, статус, частоту обхода, проблемы.

  • Ревизия существующих источников: чинить поломавшиеся селекторы, отмечать антибот/нужен Puppeteer/нужны прокси/куки.

  • Вести аккуратную отчётность.

  • KPI: ≥100 источников в сутки

Требования
  • Уверенное владение CSS-селекторами и DevTools (умение быстро найти нужный узел, использовать псевдоклассы :not, :nth-child, атрибутные селекторы и т. п.).

  • Понимание структуры HTML (семантика article, time, meta[itemprop], figure, OG-теги).

  • Опыт работы с RSS/Atom, базовая диагностика валидности фида.

  • Навык обхода lazy-loading изображений (data-src, srcset), извлечение content/datetime.

  • Грамотность, внимательность к мелочам, умение работать монотонно без падения качества.

Условия
  • Удалёнка (либо офис в Ереване), гибкий график.

  • Оплата: ставка или сдельно — по согласованным метрикам и скорости. Выплаты 2 раза в месяц.

  • Обучающие примеры, наставничество.

  • Договор ГПХ/самозанятый.