Data Scientist (Стажёр)

Дата размещения вакансии: 06.05.2025
Работодатель: Лаборатория Касперского
Уровень зарплаты:
з/п не указана
Город:
Москва
Ленинградское шоссе 39Ас2
Требуемый опыт работы:
не требуется

Кто мы?

Мы создаем инновационные решения в сфере СМИ с использованием машинного обучения для автоматизации процессов обработки информации.

Наша цель — трансформировать работу информационно-аналитических агентств и средств массовой информации через:

  • автоматизацию процесса разметки текстовых документов;
  • интеллектуальную генерацию производной информации на основе текстовых документов;
  • разработку специализированных метрик измерения информационных свойств текстовых документов;
  • создание моделей машинного обучения на основе разработанных метрик;
  • масштабирование метрик и моделей на другие информационные сферы и языки.

Чем предстоит заниматься?

Сбор данных, исследования и эксперименты с метриками и моделями:

  • поиск, создание и генерация данных, необходимых для проведения исследований;
  • разметка большого числа текстовых материалов, в том числе на разных языках, под разные ML-задачи;
  • создание гипотез по решению задач на предоставляемых данных;
  • разработка и настройка prompts для различных задач;
  • автоматизация процессов разметки данных и создания специализированных наборов данных;
  • применение различных моделей машинного обучения и сопутствующих библиотек;
  • подготовка документации и инструкций по использованию результатов исследований и разработок;
  • тестирование и анализ результатов работы подготовленных метрик и моделей.

Для этого необходимо уметь?

  • уверенная работа с python: pandas, numpy, sklearn, PyTorch, matplotib и аналогов.
  • базовые знания SQL и NoSQL баз данных;
  • умение создавать запросы к базам данных и модифицировать их;
  • уверенное владения инструментами обработки текстовых и табличных данных (Word, Excel и т.д.).
  • умение предоставлять и представлять данные публично, объяснять сложное простыми словам (презентации PowerPoint).

Будет преимуществом:

  • аналитический склад ума и способность искать последовательности, схожие и отличительные признаки, структурировать данные;
  • умение формулировать промежуточные выводы, критически относиться к результатам своей деятельности;
  • интерес к актуальным исследованиям по вопросам машинного обучения;
  • усидчивость, аккуратность и целеустремленность безотносительно от объема данных, которые необходимо проанализировать.
  • языковая грамотность;
  • знание английского не ниже B1;
  • уверенное знание иностранного языка (помимо английского) будет плюсом.