Middle/Middle+ Data scientist (NLP)

Дата размещения вакансии: 12.09.2024
Работодатель: Ecom.tech
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

О команде

Команда применения ИИ в производственных процессах. У нас стоят большие цели по автоматизации производственных процессов в компании. Наша команда разрабатывает на основе современных LLM ботов, которые сами стараются выполнять задачи в рамках, которые приняты в компании.

Сейчас в активной стадии автоматизация некоторых задач в направлениях: Разработка, Тестирование, Системная Аналитика, Тех Лид. Мы постоянно отслеживаем новые исследования в этой области и стремимся переиспользовать их или адаптировать под себя.

Чем нужно будет заниматься

  • Амбициозная задача автоматизации работы разработчиков, тестировщиков, техлидов и системных аналитиков. Наша цель, автоматически выполнять поставленные на них задачи, которые они уже в дальнейшем могут самостоятельно править или полностью принимать.
  • Автоматизация процессов: генерация названий товаров, анализ описания и состава товаров по фото, умный поиск информации во внутренней документации и т.д.

Что мы ждем от тебя

  • опыт продуктовой/исследовательской работы в DS от 2 лет;
  • фреймворки pytorch (jax), transformers, langchain, openai;
  • отличная теоретическая база по DL NLP (архитектуры, методы обучения и т.д.).
  • опыт разворачивания сервисов с использованием LLM (vLLM, SGlang, LLama.cpp, Tensor- RT LLM);
  • опыт решение широкого круга задач с использованием небольших моделей-трансформеров (BERT, GPT, T5, E5 и т.д.).
  • знания Python (C++, Rust) - Git, docker, dvc, aws, K8s.

Опыт работы с LLM

  • взаимодействие с различными open-source моделями и моделями по API;
  • понимание преимуществ и недостатков различных LLM;
  • использование базовых и продвинутых техник prompt engineering;
  • применение различных техник fine-tune LLM (PEFT, SFT, RLHF, ORPO).

Будет плюсом

  • опыт построения мультимодальных RAG;
  • опыт взаимодействия/создания LLM агентов;
  • опыт создания диалоговых систем;
  • медали на Kaggle, публикации и выступления на конференциях.