Data Scientist

Дата размещения вакансии: 28.03.2025
Работодатель: RDP.RU
Уровень зарплаты:
з/п не указана
Город:
Москва
Северный административный округ, улица 8 Марта 1с12
Требуемый опыт работы:
От 3 до 6 лет

RDP - ведущий российский производитель сетевых решений.

Мы специализируемся на разработке инновационного программного обеспечения и программно-аппаратных комплексов для высокопроизводительной обработки сетевого трафика. Продукция компании широко востребована в сетях операторского класса, крупных предприятиях и Госсекторе.

Одна из ключевых особенностей нашей компании – поставка масштабируемых решений на базе нашего оборудования, интеграция с системами Заказчика и доработка продуктов под поставляемые решения.

Сейчас мы находимся в поиске Data Science инженера в команду ML.

Команда занимается:

  1. Проверкой гипотез по детектированию приложений, сервисов в сетях оператора с использование ML подходов.
  2. Разработкой ML pipline-ов для автоматизации процессов создания/обучения моделей.
  3. Поиском и исследованием перспективных направлений в применение ML подходов для решения задач по детектированию трафика.

Задачи Data Science инженера:

  • Решение исследовательских задач и проверка гипотез в области анализа сетевого трафика, включая:
    1. Проведение исследовательского анализа данных (EDA) для выявления закономерностей и аномалий
    2. Генерация и отбор признаков (feature engineering) для повышения качества моделей машинного обучения;
    3. Разработка, обучение и валидация моделей машинного обучения;
    4. Оценка и оптимизация качества моделей с использованием метрик и методов.
  • Разработка, внедрение и поддержка моделей машинного обучения в production-среде для анализа сетевого трафика, в реальном времени в том числе;
  • Визуализация данных и подготовка отчетов с результатами анализа для различных заинтересованных сторон;
  • Участие в процессе улучшения качества данных, а также в выборе наиболее подходящих архитектур ML-кластеров и хранилищ данных.

Что мы ожидаем:

  • Опыт работы с Python и ключевыми библиотеками для Data Science, такими как: Pandas, NumPy, Scikit-learn, TensorFlow/Keras или PyTorch, Matplotlib/Seaborn;
  • Уверенное знание SQL и опыт работы с реляционными и нереляционными базами данных;
  • Глубокое понимание основных алгоритмов машинного обучения и методов машинного обучения, включая:
    1. Обучение с учителем (Supervised Learning): линейная и логистическая регрессия, деревья решений, метод опорных векторов (SVM), случайный лес (Random Forest);
    2. Обучение без учителя (Unsupervised Learning): кластеризация (k-средних, иерархическая кластеризация), снижение размерности (PCA, t-SNE);
    3. Потоковое обучение (Online Learning) и алгоритмы обнаружения изменений;
    4. Методы ансамблирования: бэггинг, бустинг (например, градиентный бустинг);
    5. Состязательное обучение (Adversarial Learning).
  • Опыт работы с большими данными и технологиями распределенной обработки, такими как Hadoop, Spark;
  • Знание английского языка на уровне, достаточном для чтения технической документации.

Будет плюсом:

  • Опыт работы с сетевым трафиком и понимание сетевых протоколов;
  • Опыт работы с системами мониторинга и анализа сетевого трафика;
  • Участие в проектах, связанных с обнаружением сетевых атак и аномалий;
  • Навыки работы с системами контроля версий (Git);
  • Опыт работы с Docker и Kubernetes.

Условия работы:

  • Работа в аккредитованной IT компании;
  • Трудоустройство в соответствии с ТК РФ;
  • Белая заработная плата (оклад обсуждаем с успешным кандидатом после прохождения технического интервью);

  • График работы: 5/2, гибкое начало рабочего дня (с 8:00 до 12:00);
  • Возможность работать удаленно или в гибриде;
  • Офис находится в БЦ "Трио" на метро Динамо (или мцд Гражданская);
  • И плюшки ниже :) ↴