О компании
Мы — DCS, IT-компания, специализирующаяся на AI-консалтинге.
Обладаем сильной экспертизой в области машинного обучения, NLP и LLM-проектов.
Работаем с крупными российскими и международными заказчиками, создавая решения федерального уровня.
Основные задачи:
-
Руководство командой из 5 Data Scientist’ов, каждый из которых ведёт собственный проект.
-
Контроль качества решений: архитектура, код-ревью, метрики, reproducibility, безопасность.
-
Управление приоритетами и загрузкой команды совместно с проджект-менеджерами и техническими лидами.
-
Настройка инженерных процессов: CI/CD, тестирование, деплой, структура репозиториев и пайплайнов.
-
Обеспечение стандартов безопасности: контроль доступов, хранение секретов, управление зависимостями.
-
Ведение 1–2 ключевых проектов лично — от разработки фичей до внедрения модели и мониторинга в проде.
-
Проведение R&D-сессий, развитие внутренней экспертизы, формирование стандартов и обмена знаниями.
Типовые проекты направления:
-
Предиктивная аналитика: прогноз спроса, объёмов операций, нагрузки на инфраструктуру, временные ряды с продовым мониторингом и авто-ретрейнингом.
-
Классические модели рисков и скоринга: бинарные/мультиклассовые классификаторы, PD/LGD-подходы, интерпретируемость, строгий контроль метрик и drift-аналитика.
-
Оптимизационные задачи: планирование ресурсов, расписаний, логистики, подбор параметров под бизнес-ограничения.
-
Рекомендательные механики без LLM: коллаборативная фильтрация, матричная факторизация, градиентные модели, feature-store и офлайн/онлайн тестирование.
-
Качество данных и аномалистика: алерты, автопрофилирование, scoring-модели для детекта выбросов, работа с большими датасетами и пайплайнами подготовки.
Требования к опыту и знаниям:
Core Data Science / Machine Learning
-
Уверенное владение Python и библиотеками: NumPy, Pandas, SciPy, scikit-learn, CatBoost, LightGBM.
-
Опыт с PyTorch или TensorFlow, знание Statsmodels, MLflow, DVC.
-
Понимание ключевых ML-паттернов и принципов построения воспроизводимых экспериментов.
Инженерная часть / MLOps:
-
Опыт с GitLab CI, Docker, Airflow или Prefect, FastAPI, Pydantic.
-
Логирование (structlog, loguru), мониторинг (Prometheus, Grafana).
-
Работа с MLflow Registry, S3/MinIO или аналогичными системами хранения артефактов.
Работа с данными и инфраструктурой:
-
Отличное знание SQL (PostgreSQL, MSSQL).
-
Опыт работы с Dask, Polars или Spark — будет преимуществом.
-
Опыт использования Pandera, Great Expectations для валидации данных.
-
Базовое понимание Kafka, RabbitMQ.
Безопасность и стандарты разработки:
-
Управление секретами: Vault, GitLab secrets, RBAC, шифрование данных.
-
Опыт с SAST-инструментами (Bandit, SonarQube), управление зависимостями.
-
Знание архитектурных принципов: SOLID, DRY, KISS, паттернов Factory, Strategy, Repository, Dependency Injection.
Командная работа и процессы:
-
Опыт работы по Git flow, использование Jira/YouTrack, Confluence/Notion.
-
Проведение код-ревью, документирование решений, внедрение best practices.
-
Умение выстраивать коммуникацию с PM, DevOps, аналитиками, заказчиками.
Условия:
-
Полностью удалённый формат работы.
-
Участие в ML- проектах федерального уровня.
-
Работа в сильной команде экспертов, где ценится открытость, качество и развитие.