О продукте
Разрабатываем систему мониторинга новостных сайтов. Внутренняя админка позволяет настраивать парсинг: контейнер статьи, заголовок, дата, автор, контент, изображения; поддержку lazy-load, meta/time, исключения, куки/прокси/Puppeteer, RSS/Atom.
- 
Искать и подтверждать фиды: RSS/Atom/JSON Feed/сайтмапы, проверять валидность, периодичность обновлений.
 - 
Подбирать корректные CSS-селекторы/XPath, учитывать data-src/srcset, OpenGraph, itemprop, локальные форматы даты/времени и таймзоны.
 - 
Проверять результат в нашей админке, фиксировать комментарии, статус, частоту обхода, проблемы.
 - 
Ревизия существующих источников: чинить поломавшиеся селекторы, отмечать антибот/нужен Puppeteer/нужны прокси/куки.
 - 
Вести аккуратную отчётность.
 - 
KPI: ≥100 источников в сутки
 
- 
Уверенное владение CSS-селекторами и DevTools (умение быстро найти нужный узел, использовать псевдоклассы :not, :nth-child, атрибутные селекторы и т. п.).
 - 
Понимание структуры HTML (семантика article, time, meta[itemprop], figure, OG-теги).
 - 
Опыт работы с RSS/Atom, базовая диагностика валидности фида.
 - 
Навык обхода lazy-loading изображений (data-src, srcset), извлечение content/datetime.
 - 
Грамотность, внимательность к мелочам, умение работать монотонно без падения качества.
 
- 
Удалёнка (либо офис в Ереване), гибкий график.
 - 
Оплата: ставка или сдельно — по согласованным метрикам и скорости. Выплаты 2 раза в месяц.
 - 
Обучающие примеры, наставничество.
 - 
Договор ГПХ/самозанятый.