Senior Data Scientist в Know Your Employee [Trust and Safety]

Дата размещения вакансии: 06.10.2025
Работодатель: WILDBERRIES
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Wildberries и Russ — лидер рынков e-commerce и наружной рекламы в России и странах СНГ.
Ежедневно более 4 тысяч наших IT-специалистов создают цифровую экосистему, состоящую из сотен тысяч продуктов. На сегодня мы создали крупнейшую онлайн-платформу для покупки и продажи товаров в России и странах СНГ.

Вместе с масштабным развитием IT-направления мы формируем культуру Trust and Safety, гарантируя непрерывную безопасность и доверие между компанией, её сотрудниками, пользователями и клиентами.

Мы создаем платформу для оценки надежности кандидатов, сотрудников и исполнителей, работающих с компанией.
Наша цель - выявлять мошенничество и скрытые риски до того, как они нанесут финансовый и репутационный ущерб компании.
Ежедневно мы выполняем тысячи комплексных проверок, и этот объём растет наряду с одновременным расширением их типов и глубины анализа. Это рождает уникальные инженерные вызовы, включая создание гибкой архитектуры, поддерживающей безболезненное добавление новых сценариев, обеспечение стабильности компонентов системы и поддержание целостности данных в распределенной среде.
Для решения этой задачи мы используем самые современные технологии, включая ML и компьютерное зрение, а так же используем архитектурные паттерны для построения отказоустойчивых систем.
С результатом нашей работы напрямую взаимодействуют как кандидаты, так и сотрудники компании. Сейчас команда в поисках Senior Data Scientist-а.

Наши задачи:

• Исследование и прототипирование SOTA-подходов: fusion-архитектуры, self-/weak-/contrastive learning для аудио/видео/текста/метаданных
• Разработка и вывод в продакшн: подготовка данных и разметки, обучение, калибровка, A/B/AA-тесты, оптимизация latency/throughput
• Построение воспроизводимых ML-пайплайнов, работа с онлайновыми фичами и стримингом; мониторинг дрейфа/качества, план retraining
• Объяснимость и UX: интерпретация выводов (XAI), понятные фичи и артефакты для бизнес-пользователей
• Аналитика данных: генерация гипотез, поиск аномалий/паттернов, улучшение метрик и устойчивости к обходам

Необходимые опыт и навыки:

• 3-5+ лет в ML/DS, продакшн-опыт в задачах классификации/антифрода/поведенческой аналитики и/или в модальностях аудио/видео/текста
• Сильный Python/SQL; опыт с PyTorch/TF; трекинг экспериментов (MLflow/W&B); практики код-ревью и тестирования
• Навыки работы с имбалансом, cost-sensitive метриками, калибровкой вероятностей, контролем FP/FN
• Понимание privacy/compliance и аккуратная работа с чувствительными данными

Будет плюсом, если у тебя есть:

• Опыт антиспуфинга, speaker/face verification, VAD/качество аудио, OCR, графовые признаки и graph ML

• Реальный опыт real-time/stream processing (Kafka/Flink), feature stores, оптимизации инференса под CPU/GPU
• Практика adversarial evaluation, hard-negative mining, data-centric улучшений

Что мы предлагаем:

Полная удаленка или свободное посещение офисов в Москве и Санкт-Петербурге

IT-ипотека и оформление в аккредитованную IT-компанию

• Бесплатное питание в офисах, ДМС со стоматологией (после испытательного срока)
• Корпоративное обучение и IT-мероприятия

Наш процесс найма:

• 30-минутное HR интервью, чтобы рассказать о себе и узнать больше о вакансии
• Техническое интервью длительностью 1.5 часа
• Финальное интервью с лидом длительностью 1 час