Москва
Ищем Data scientist'а в команду, комбинирующую применение бизнес-логики, классических моделей, NLP и LLM.
Обязанности:
- проведение исследований, проверка гипотез команды с использованием LLM;
- совершенствование LLM моделей, используя промт-инжиниринг;
- векторизация документов (для RAG сервиса);
- преобразование изображения текста в машиночитаемый формат (OCR);
- разработка и внедрение моделей (NLP\классический ML\графовые сети) в промышленные системы;
- поиск и обработка данных, создание эмбеддингов, внедрение в текущие процессы.
Требования:
- высшее математическое/техническое образование;
- понимание принципов работы с LLM;
- уверенное знание математики, статистики и машинного обучения;
- владение Python и опыт практического применения алгоритмов машинного обучения: нейронные сети, композиционные алгоритмы, NLP;
- уверенное владение SQL (оконные функции, регулярные выражения);
- опыт работы с Hadoop (HDFS, Hive/Impala), Spark;
- опыт работы с нейронными сетями на последовательностях.