Lead Data Scientist

Дата размещения вакансии: 17.11.2025
Работодатель: DCS
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

О компании

Мы — DCS, IT-компания, специализирующаяся на AI-консалтинге.
Обладаем сильной экспертизой в области машинного обучения, NLP и LLM-проектов.

Работаем с крупными российскими и международными заказчиками, создавая решения федерального уровня.

Основные задачи:

  • Руководство командой из 5 Data Scientist’ов, каждый из которых ведёт собственный проект.

  • Контроль качества решений: архитектура, код-ревью, метрики, reproducibility, безопасность.

  • Управление приоритетами и загрузкой команды совместно с проджект-менеджерами и техническими лидами.

  • Настройка инженерных процессов: CI/CD, тестирование, деплой, структура репозиториев и пайплайнов.

  • Обеспечение стандартов безопасности: контроль доступов, хранение секретов, управление зависимостями.

  • Ведение 1–2 ключевых проектов лично — от разработки фичей до внедрения модели и мониторинга в проде.

  • Проведение R&D-сессий, развитие внутренней экспертизы, формирование стандартов и обмена знаниями.

Типовые проекты направления:

  • Предиктивная аналитика: прогноз спроса, объёмов операций, нагрузки на инфраструктуру, временные ряды с продовым мониторингом и авто-ретрейнингом.

  • Классические модели рисков и скоринга: бинарные/мультиклассовые классификаторы, PD/LGD-подходы, интерпретируемость, строгий контроль метрик и drift-аналитика.

  • Оптимизационные задачи: планирование ресурсов, расписаний, логистики, подбор параметров под бизнес-ограничения.

  • Рекомендательные механики без LLM: коллаборативная фильтрация, матричная факторизация, градиентные модели, feature-store и офлайн/онлайн тестирование.

  • Качество данных и аномалистика: алерты, автопрофилирование, scoring-модели для детекта выбросов, работа с большими датасетами и пайплайнами подготовки.

Требования к опыту и знаниям:

Core Data Science / Machine Learning

  • Уверенное владение Python и библиотеками: NumPy, Pandas, SciPy, scikit-learn, CatBoost, LightGBM.

  • Опыт с PyTorch или TensorFlow, знание Statsmodels, MLflow, DVC.

  • Понимание ключевых ML-паттернов и принципов построения воспроизводимых экспериментов.

Инженерная часть / MLOps:

  • Опыт с GitLab CI, Docker, Airflow или Prefect, FastAPI, Pydantic.

  • Логирование (structlog, loguru), мониторинг (Prometheus, Grafana).

  • Работа с MLflow Registry, S3/MinIO или аналогичными системами хранения артефактов.

Работа с данными и инфраструктурой:

  • Отличное знание SQL (PostgreSQL, MSSQL).

  • Опыт работы с Dask, Polars или Spark — будет преимуществом.

  • Опыт использования Pandera, Great Expectations для валидации данных.

  • Базовое понимание Kafka, RabbitMQ.

Безопасность и стандарты разработки:

  • Управление секретами: Vault, GitLab secrets, RBAC, шифрование данных.

  • Опыт с SAST-инструментами (Bandit, SonarQube), управление зависимостями.

  • Знание архитектурных принципов: SOLID, DRY, KISS, паттернов Factory, Strategy, Repository, Dependency Injection.

Командная работа и процессы:

  • Опыт работы по Git flow, использование Jira/YouTrack, Confluence/Notion.

  • Проведение код-ревью, документирование решений, внедрение best practices.

  • Умение выстраивать коммуникацию с PM, DevOps, аналитиками, заказчиками.

Условия:

  • Полностью удалённый формат работы.

  • Участие в ML- проектах федерального уровня.

  • Работа в сильной команде экспертов, где ценится открытость, качество и развитие.