Data Scientist в области языковых моделей (Junior)

Дата размещения вакансии: 20.12.2024
Работодатель: ИНИТИ
Уровень зарплаты:
от 190000 RUR
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Мы, команда компании «ИНИТИ», предлагаем специалистам по профилю «Data Scientist в области языковых моделей (Junior)» присоединиться к числу своих сотрудников.

Компания состоит в реестре российских аккредитованных IT-компаний, что в числе прочего подразумевает под собой отсрочку от призыва на военную службу, а также льготную ипотеку.

Обязанности:

  • Сбор, предобработка и анализ текстовых данных для обучения моделей.
  • Помощь в дообучении языковых моделей (LLM) под специфические задачи компании.
  • Разработка пайплайнов для подготовки текстовых данных, включая очистку, токенизацию и создание пользовательских токенов.
  • Проведение экспериментов с различными моделями и конфигурациями для повышения качества.
  • Создание отчетов о результатах экспериментов.

Требования:

  • Опыт работы с текстовыми данными, включая предобработку
  • Уверенные знания Python, библиотек для работы с данными (pandas, numpy, matplotlib) и библиотек для обработки текста (transformers, Hugging Face).
  • Базовые знания методов машинного обучения
  • Знания классических и современных методов работы с текстовыми данными (например, TF-IDF, embeddings и т.п.).
  • Опыт работы с крупными текстовыми датасетами.

Приветствуется:

  • Опыт работы с языковыми моделями GPT, BERT или их аналогами.
  • Навыки разработки в распределенных системах обработки данных.
  • Знание современных подходов к обучению LLM.

Условия:

  • оформление по ТК
  • удаленный режим работы
  • график работы (09:00-18:00) (сб, вс - выходные)
  • возможно согласование рабочего графика (смещение рабочего дня, перенос рабочего дня на выходной)
  • дополнительная неделя отпуска
  • испытательный срок 1-3 мес
  • начальный уровень з/п определяется, исходя из результатов собеседования