Лесная улица 5
СберМобайл — это больше, чем оператор связи. Это цифровая экосистема внутри Сбера.
Мы меняем правила игры на телеком-рынке, предлагая умные сервисы и персонализированный подход.
Обязанности:
- Разработка и обучение моделей бинарной классификации текстов для выявления мошеннических действий и спама.
- Анализ и обработка больших объёмов текстовых данных, включая шумные и слаборазмеченные источники.
- Создание и оптимизация алгоритмов классификации и кластеризации текстов с использованием классических и современных NLP-подходов.
- Разработка метрик и методов оценки качества моделей с учётом бизнес-ограничений (false positives / recall).
- Интеграция разработанных моделей в production-среду и участие в end-to-end ML-пайплайнах.
- Постоянное улучшение моделей на основе новых данных, обратной связи и изменения сценариев.
- Взаимодействие с инженерами и аналитиками при развитии и поддержке ML-решений.
Требования:
- Опыт работы в области Data Science / Machine Learning от 3 лет.
- Практический опыт построения промышленных моделей на базе классических ML-алгоритмов (линейные модели, деревья решений, градиентные бустинги).
- Уверенное владение Python и библиотеками для анализа данных (Pandas, NumPy, Matplotlib или Seaborn).
- Базовые и уверенные знания NLP: предобработка текста, извлечение признаков, классификация текстов.
- Опыт работы с scikit-learn в прикладных и продакшн-задачах.
- Понимание принципов оценки качества моделей и компромиссов между метриками.
- Умение работать самостоятельно и в команде, готовность разбираться в существующих моделях и коде.
Будет плюсом:
- Опыт работы с современными NLP-моделями (BERT, GPT, T5 и их производные).
- Знание и практический опыт работы с библиотеками TensorFlow, PyTorch, Hugging Face Transformers, SpaCy, NLTK.
- Понимание принципов обучения и работы современных LLM, а также механизмов файнтюнинга (в том числе PEFT).
- Интерес к развитию в сторону языковых моделей, диалоговых систем и ML-агентов.
- Понимание принципов MLOps и опыт или интерес к инструментам деплоя моделей (Docker, MLflow, Kubernetes).
- Опыт или интерес к распределённым вычислениям (Spark, Hadoop).
- Знание или интерес к обработке аудиоданных и работе с ASR/TTS.
Условия:
- График: Гибридный формат работы (офис/удаленно). Начало рабочего дня — на выбор: 9:00, 9:30 или 10:00. В пятницу сокращенный день (на 1 час 15 минут короче).
-
Оплата труда: Конкурентная «белая» зарплата, обсуждается по итогам интервью. Ежегодный бонус по результатам.
-
Испытательный срок: 3 месяца.
-
Здоровье: Полный пакет ДМС (активируется после испытательного срока), включающий: поликлиническое обслуживание и ежегодную диспансеризацию, страхование для поездок за рубеж, возможность подключить родственников .
-
Развитие и спорт: Компенсация 50% стоимости занятий английским языком и фитнесом (после испытательного срока), оплата участия в спортивных мероприятиях.
-
Комфорт: Современный офис в 5 минутах от м. Белорусская, корпоративные мероприятия и тимбилдинги, дисконт-программы от партнеров (фитнес-клубы, страхование и др.).