Садовническая улица 82
О команде
Наша команда строит систему модерации в Дзене с помощью модераторов и классификаторов, чтобы отлавливать спам, хейтспич, откровенный и другой нежелательный контент. Сейчас мы в поиске опытного Data Scientist, который поможет нам повысить уровень управляемости контента.
Вы будете:
-
строить ML-архитектуру управления контентом в Дзене — без вердиктов ваших моделей не будет работать ни один сервис внутри Дзена;
-
обучать модели, разделяющие миллионы видео и статей по тематикам, — именно ваши модели будут отделять полезный и вредный контент;
-
строить дашборды качества, скорости и точек роста системы модерации — того ML-каркаса, который вы вместе с командой будете выстраивать;
-
участвовать в создании и редактировании контентных политик Дзена.
С помощью таких инструментов, как:
-
Python — для написания сложных скриптов обработки данных, работы с API, аналитикой данных;
-
SQL — построения метрик и дашбордов;
-
Datalens — для визуализации метрик на графиках.
У нас всё сложится, если вы:
-
имеете высшее техническое или математическое образование;
-
уже работали в ML более трёх лет, а реализованные вами модели бинарной и многоклассовой классификации выводились в прод десятки раз;
-
владеете Python для анализа данных (Pandas, Numpy и Catboost — твои верные друзья);
-
понимаете основы теорвера и матстата;
-
всегда ищете системные подходы к задачам;
-
хотите расширить свою экспертизу до построения ML-сервисов E2E — от понимания требуемых данных до мониторинга своих обученных моделей в проде.
Будет здорово, если вы имеете опыт работы с краудсорсинговыми платформами, например с Толокой.