ML / Data engineer практикант / стажер (неоплачиваемая практика)

Дата размещения вакансии: 18.02.2026
Работодатель: Газпром ЦПС
Уровень зарплаты:
з/п не указана
Город:
Санкт-Петербург
Университетская набережная 7-9-11к5
Требуемый опыт работы:
не требуется

Газпром ЦПС — аккредитованная ИТ-компания, реализующая цифровую и организационно-функциональную трансформацию компаний группы «Газпром».

Приглашаем действующих студентов 3-4 курса на практику в ML-проект по работе с инженерными текстами и подготовке данных для обучения моделей.

Это практика без оплаты, но с реальными задачами, наставником и возможностью получить системный опыт в ML/Data engineering на реальном проекте.

Чем предстоит заниматься:

  • разметка и подготовка данных
  • работа с Label Studio (обучим)
  • проверка ML-предсказаний
  • подготовка данных для обучения моделей
  • взаимодействие с ML-проектом
  • документирование
  • работа с ETL (обучим).

Дополнительные задачи (в случае заинтересованности):

  • тестирование различных нейросетевых моделей
  • сравнение качества моделей по готовым метрикам
  • участие в автоматизации с использованием LLM.

Кого мы ищем:

Учащихся 3-4 курса технических специальностей, близких к ML/Data engineering

Будет плюсом знание:

  • Python
  • Numpy/Pandas
  • базовое понимание ML
  • базовое знание SQL
  • PyTorch или Scikit-learn

Что вы получите:

  • наставника из команды проекта
  • реальный опыт работы на ML-research проекте
  • участие в создании дата-сетов и обучении моделей
  • опыт, который можно добавить в резюме/портфолио
  • возможность дальнейшего сотрудничества в перспективе.

Наши условия:

  • Неоплачиваемая практика (старт в марте 2026 с возможностью участия до декабря 2026)

  • Гибкий график (готовы обсуждать индивидуально)

  • Работа в просторном современном офисе.

Пожалуйста, в сопроводительном письме укажите:

  1. какой период и сколько дней в неделю/часов в день готовы присутствовать в офисе?
  2. почему вам интерсны ML и работа с данными?
  3. какие курсы/предметы по ML или анализу данных уже проходили?
  4. какие технологии пробовали на практике (Python, Pandas, SQL и др.)?
  5. ссылки на учебные или pet-проекты (по возможности)