Северный административный округ, улица 8 Марта 1с12
RDP - ведущий российский производитель сетевых решений.
Мы специализируемся на разработке инновационного программного обеспечения и программно-аппаратных комплексов для высокопроизводительной обработки сетевого трафика. Продукция компании широко востребована в сетях операторского класса, крупных предприятиях и Госсекторе.
Одна из ключевых особенностей нашей компании – поставка масштабируемых решений на базе нашего оборудования, интеграция с системами Заказчика и доработка продуктов под поставляемые решения.
Сейчас мы находимся в поиске Data Science инженера в команду ML.
Команда занимается:
- Проверкой гипотез по детектированию приложений, сервисов в сетях оператора с использование ML подходов.
- Разработкой ML pipline-ов для автоматизации процессов создания/обучения моделей.
- Поиском и исследованием перспективных направлений в применение ML подходов для решения задач по детектированию трафика.
Задачи Data Science инженера:
- Решение исследовательских задач и проверка гипотез в области анализа сетевого трафика, включая:
- Проведение исследовательского анализа данных (EDA) для выявления закономерностей и аномалий
- Генерация и отбор признаков (feature engineering) для повышения качества моделей машинного обучения;
- Разработка, обучение и валидация моделей машинного обучения;
- Оценка и оптимизация качества моделей с использованием метрик и методов.
- Разработка, внедрение и поддержка моделей машинного обучения в production-среде для анализа сетевого трафика, в реальном времени в том числе;
- Визуализация данных и подготовка отчетов с результатами анализа для различных заинтересованных сторон;
- Участие в процессе улучшения качества данных, а также в выборе наиболее подходящих архитектур ML-кластеров и хранилищ данных.
Что мы ожидаем:
- Опыт работы с Python и ключевыми библиотеками для Data Science, такими как: Pandas, NumPy, Scikit-learn, TensorFlow/Keras или PyTorch, Matplotlib/Seaborn;
- Уверенное знание SQL и опыт работы с реляционными и нереляционными базами данных;
- Глубокое понимание основных алгоритмов машинного обучения и методов машинного обучения, включая:
- Обучение с учителем (Supervised Learning): линейная и логистическая регрессия, деревья решений, метод опорных векторов (SVM), случайный лес (Random Forest);
- Обучение без учителя (Unsupervised Learning): кластеризация (k-средних, иерархическая кластеризация), снижение размерности (PCA, t-SNE);
- Потоковое обучение (Online Learning) и алгоритмы обнаружения изменений;
- Методы ансамблирования: бэггинг, бустинг (например, градиентный бустинг);
- Состязательное обучение (Adversarial Learning).
- Опыт работы с большими данными и технологиями распределенной обработки, такими как Hadoop, Spark;
- Знание английского языка на уровне, достаточном для чтения технической документации.
Будет плюсом:
- Опыт работы с сетевым трафиком и понимание сетевых протоколов;
- Опыт работы с системами мониторинга и анализа сетевого трафика;
- Участие в проектах, связанных с обнаружением сетевых атак и аномалий;
- Навыки работы с системами контроля версий (Git);
- Опыт работы с Docker и Kubernetes.
Условия работы:
- Работа в аккредитованной IT компании;
- Трудоустройство в соответствии с ТК РФ;
-
Белая заработная плата (оклад обсуждаем с успешным кандидатом после прохождения технического интервью);
- График работы: 5/2, гибкое начало рабочего дня (с 8:00 до 12:00);
- Возможность работать удаленно или в гибриде;
- Офис находится в БЦ "Трио" на метро Динамо (или мцд Гражданская);
- И плюшки ниже :) ↴