улица Василисы Кожиной 1
РОМИР – лидер исследований в России в сферах психологии, социологии, маркетинга, демографии и статистики, работаем более чем в 60 странах мира. Более 30 лет мы занимаемся глубинными исследованиями в евразийском пространстве, развивая инновационные инструменты, опираясь на фундамент социальных наук.
Мы активно сотрудничаем с крупнейшими университетами, бизнесом и государственными организациями.
Если вы стремитесь к инновациям и хотите быть частью динамичной компании, то эта вакансия для вас!
Приглашаем присоединиться к нашей команде Data Science ассистента.
Ключевая задача: работа в команде Data Science над задачами в области аналитики и обработки больших объёмов данных. Основной фокус — реализация ML-гипотез по подготовленным ТЗ, эксперименты с моделями и подготовка данных для обучения. С предоставлением отчёта по каждой гипотезе с описанием реализуемых подходов на основании выбранных метрик качества на тестовой выборке.
Чем предстоит заниматься:
-
Работа с данными. Сборка выборок из корпоративных витрин (SQL) по поставленным ТЗ.
-
Разметка и валидация данных различными объёмами — для подготовки обучающих выборок, оценки качества моделей и контроля автоматической разметки.
-
Формирование сбалансированных датасетов для дальнейшего обучения.
Реализация ML-гипотез и LLM-пайплайнов. Имплементация поставленных гипотез: подготовка данных, обучение моделей, тестирование подходов (классический ML, эмбеддинги и векторные представления), построение пайплайнов на LLM через API и локально.
-
Снятие метрик, выполнение экспериментов по чек-листу на разных параметрах, сравнение подходов, фиксация результатов в воспроизводимом виде, оформление отчётов.
R&D. Участие в исследовательской части проектов: разбор актуальных статей и решений в области LLM и классического ML, поиск релевантных подходов под текущие задачи команды.
-
Подготовка кратких обзоров найденных методов с оценкой применимости.
-
Проверка перспективных подходов на пилотных выборках.
Требования:
-
Python: уверенное владение, знание основных библиотек (pandas, numpy, scikit-learn и пр,).
-
Классический ML: понимание основных алгоритмов (линейные модели, деревья, градиентный бустинг и пр.), умение корректно подбирать метрики под задачу и интерпретировать результаты.
-
Векторные представления: понимание эмбеддингов, умение работать с векторными моделями (sentence-transformers, embedding-модели), опыт работы с векторным поиском.
-
LLM: понимание принципов работы языковых моделей, опыт построения промптов, работа с локальными моделями; ориентация в актуальных подходах (RAG, few-shot, structured output)
-
SQL: уверенный пользователь.
-
API: опыт использования API
-
Git: базовая работа с ветками, коммитами, мерж.
Условия:
- Работа в одной из самых динамично развивающихся компаний на российском исследовательском рынке;
- Работа с молодой командой профессионалов, которые горят своим делом и нацелены на результат;
- Возможность участия в самых крупных российских исследовательских проектах;
- Оформление в соответствии с ТК РФ.
- Комфортный современный офис в шаговой доступности от ст. м. Багратионовская, м. Фили и Парк Победы;
- Уровень заработной платы обсуждается с успешным кандидатом на собеседовании.
- График работы с 9.30 до 18.00, 5/2 суббота и воскресенье выходные.