Data Scientist

Дата размещения вакансии: 06.04.2025
Работодатель: билайн
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Сегодня билайн — компания изменений, чутко реагирующая на потребности рынка и людей. А ещё билайн — это команда, объединённая общими ценностями и общей целью — быть лидером телеком и digital рынков, предоставляя нашим клиентам новейшие продукты и услуги, а также сервис самого высокого уровня.

Сейчас у вас есть возможность присоединиться к лучшей команде билайн в роли Data Scientist!

Итак, вам предстоит:

  • Участие в разработке ML-моделей на различных данных: табличные, графовые, геоданные, NLP и событийные последовательности для прогнозирования отказов и сбоев в оборудовании;
  • Участие в исследовании новых источников данных и развитии feature store;
  • Поддержка полного цикла разработки DS/ML-продуктов — от идеи до продакшена;
  • Возможность участвовать в создании и развитии AI-агента на базе LLM — от экспериментов до реального применения.

Мы будем рады рассмотреть вашу кандидатуру, если у вас есть:

  • Опыт в роли Data Scientist от 1 года (также учтем стажировки, pet-проекты, участие в хакатонах, соревнованиях kaggle, учебные работы);
  • Базовое понимание ML-алгоритмов и интерес к их практическому применению;
  • Отличное знание Python
  • Умение работать с БД (SQL), собирать и обрабатывать данные;
  • Уверенное понимание A/B-тестирования;
  • Готовность учиться, задавать вопросы и развиваться под руководством опытной команды;
  • Высшее техническое образование (или студент последних курсов).

Будет плюсом:

  • Опыт решения задач дискретной оптимизации;
  • Работа с MLOps-инфраструктурой (DVC, MLflow, Airflow и т.п.);
  • Опыт построения industrial ML (highload, near real-time);
  • Hadoop, Spark;
  • Опыт работы с deep learning, включая RNN-like архитектуры и трансформеры;
  • Опыт с LangChain, LangGraph, LLM и разработкой AI-агентов;
  • Agile-подходы и умение быстро проверять гипотезы.

Наш стек:

Язык и библиотеки:

  • Python, pandas, NumPy, scikit-learn, CatBoost, LightGBM, PyTorch, Transformers, LangChain, LangGraph

Обработка данных:

  • PySpark, PostgreSQL
  • MLOps и продакшен:
  • MLflow, DVC, Airflow, Docker, Kubernetes, FastAPI

Что мы предлагаем:

  • Возможность работать дистанционно на территории РФ;
  • Свободу в принятии решений, реальное влияние на процессы и результат;
  • Внутреннее DS/DA-сообщество (100+ специалистов): регулярные митапы, обмен опытом, развитие;
  • Ежегодный процесс ревью — прозрачный рост и развитие;
  • Доступ к десяткам Пбайт данных — от классических табличных до гео, графов, кликстримов, текстов и изображений;
  • Развитая MLOps-инфраструктура и мощный кластер с GPU;
  • Внутреннее и внешнее обучение, участие в конференциях, митапах и хакатонах;
  • У нас практикуется менторство и парная работа над задачами — вы не останетесь наедине с кодом.
  • Полис ДМС, обслуживание в лучших клиниках;
  • Корпоративные скидки на товары и услуги от партнёров;
  • Компенсация 30% стоимости спорта (бег, футбол, волейбол, плавание, йога);
  • Служебная сотовая связь;
  • Оформление в ПАО "ВымпелКом".