Middle Data Scientist (NLP)

Дата размещения вакансии: 09.09.2024
Работодатель: Гринатом
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Какие задачи нужно будет решать:

  • Генерация и проверка гипотез, а также разработка продуктовых сервисов, связанных с поиском, рекомендательными системами, классификацией текстов и иными видами обработки естественного языка;
  • Разработка и тюнинг моделей машинного обучение;
  • Поддержка и документация разработанных решений;
  • Написание тестов.

Требования к вакансии:

  • Отличные знания Python;
  • Опыт с работы с DL-фреймворками (предпочтительно Pytorch, но возможно Keras, Tensorflow, etc.)
  • Математическая подготовка: понимание принципов работы машинного обучения, в частности, работы нейросетей;
  • Знание методов, алгоритмов и инструментов классического ML: Numpy, Pandas, Sklearn, методы снижения размерности, методы кластеризации, бустинги и т.д.
  • Глубокое понимание алгоритмов нормализации текстов, различных методов создания эмбеддингов, а также умение их использовать на практике;
  • Опыт работы с трансформерами и transfer learning;
  • Понимание как декомпозировать различные бизнес-кейсы на типовые задачи NLP;
  • Хорошие навыки работы в Linux;
  • Опыт работы с микросервисами Docker;

Будет плюсом:

  • Опыт работы с системами логирования, например стек ELK;
  • Опыт работы с backend - Fast API и тд;
  • Опыт работы с поисковыми движками - Faiss, ElasticSearch/OpenSearch, Milvus, Qdrant, PGVector и т.д.
  • Опыт работы MLOps инструментами - MLFlow, ClearML, WandB, стэк Iterative (dvc, mlem, cml) или другими;
  • Опыт работы/pet-проектов с LLM;