Middle Data Scientist, NLP, Ozon Банк

Дата размещения вакансии: 05.06.2025
Работодатель: Ozon
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Ozon Банк — компания, в которой тесно переплетаются финансы и IT. Мы создаём новые для рынка продукты и сервисы для физических и юридических лиц. Гордимся атмосферой в командах: каждый сотрудник может влиять на процессы и пути к результату.

Сейчас мы ищем middle NLP DS в команду, которая занимается всеми NLP-задачами в компании. Мы создаём RAG для различных бизнес-направлений, чат-бот поддержки, реализуем speech-to-text решения, OCR с использованием LLM, кодогенерацию. А также работаем с любыми другими запросами от бизнеса, связанными с текстовыми данными.

Модели напрямую влияют на доходность компании и определяют итоговую прибыль. Мы развиваем мощности нашего ЦОД для прикладных и исследовательских задач и самостоятельно прорабатываем и запускаем решения в прод.

Наш стек: Vertica, PostgreSQL, Clickhouse, Labelstudio, pytorch + accelerate, tritonserver в k8s, QDrant, Elasticsearch, Langchain

Вам предстоит:

– Активно участвовать во всех проектах команды

– Решать задачи для чат-бота поддержки

– На первом этапе использовать модели для поддержки операторов (суммаризация, парафраз, RAG), затем — переходить к полной автоматизации с помощью LLM

– Развивать вместе с командой STT- и TTS-направления для обработки звонков

Мы ожидаем:

– Умение внятно излагать мысли и представлять результаты своей работы

– Уверенный Python, умение разбираться в чужом коде

– Понимание основных принципов, алгоритмов и метрик классического ML

– Опыт решения бизнес-задач с использованием классических и трансформерных NLP-моделей

– Понимание, какая NLP-модель для каких случаев подойдёт лучше

– LLM — понимание принципов работы, а также ограничений в применении тех или иных моделей

Будет плюсом:

- Навыки prompt engineering-а и использования structured outputs и function calling у моделей

– Потенциально будем разворачивать агентские системы, поэтому будет плюсом опыт работы с такими фреймворками — например, smolagents

– Опыт деплоя трансформерных моделей с использованием какого-либо фреймворка: vllm, sglang

– Понимание того, как работает в таких фрейворках обработка запросов и как её можно ускорить

– Опыт с tritonserver и tensorrt-LLM