Data Scientist

Дата размещения вакансии: 10.12.2024
Работодатель: VK
Уровень зарплаты:
з/п не указана
Город:
Москва
Ленинградский проспект 39с79
Требуемый опыт работы:
От 1 года до 3 лет

Мы создаём продукты и сервисы для клиентов на основе предиктивных моделей с использованием методов машинного обучения и собственной платформы обработки больших данных.

Задачи:

  • построение классических ML-моделей, в основном в области геоаналитики: предсказание выручки, трафика для точек ретейла, предсказание цен на недвижимость;
  • дообучение и применение больших языковых моделей для задач client support, генерации креатива, семантического поиска (RAG-архитектура);
  • анализ больших данных, подготовка признаков для моделей и построение ETL-пайплайнов;
  • продуктивизация моделей и внедрение их в бэкенд сервисов VK;
  • построение AutoML-пайплайнов и развитие сервиса no-code AutoML.

Требования:

  • общая математическая культура (теория вероятностей и математическая статистика, линейная алгебра, теория оптимизации, классический ML, понимание архитектур глубоких нейронных сетей, особенно языковых моделей: Transformer, BERT, GPT);
  • культура программирования (чистый код, Git, Bash, Docker);
  • Python (NumPy, Pandas, Sklearn, LightGBM, CatBoost, PyTorch, Transformers, Sentence_Transformers, LangChain);
  • знакомство с экосистемой Hadoop (HDFS, Hive, Spark), чем плотнее, тем лучше;
  • знакомство Airflow/Luigi;
  • приятным бонусом будет знакомство с FastAPI.