Инженер по разметке данных

Дата размещения вакансии: 19.11.2024
Работодатель: ТАГАТ им. С.И.Лившица
Уровень зарплаты:
з/п не указана
Город:
Москва
Люблинско-Дмитровская линия метро Дубровка
Требуемый опыт работы:
От 1 года до 3 лет
ТАГАТ – машиностроительное предприятие, объединяющее в себе производственную площадку и многопрофильный инжиниринговый центр. Мы проектируем и производим новое оборудование, а также модернизируем существующие линии и цеха под ключ. ТАГАТ включён Минпромторгом России в перечень производителей российской промышленной продукции
АО «ТАГАТ» занимается проектированием и внедрением роботов-манипуляторов, проектами в области технического зрения и дефектоскопии.

Твои задачи:
Разметка данных:

  • Классификация объектов: определение категорий или меток для различных объектов в данных;
  • Аннотирование текстов: выделение ключевых слов, фраз или предложений в текстах;
  • Разметка изображений: определение и выделение объектов на изображениях, таких как лица, автомобили, животные и т.д.;
  • Разметка аудио: транскрибирование речи или выделение звуковых событий в аудиозаписях.
    Проверка и валидация данных:
  • Проверка точности разметки: убедиться, что все объекты и аннотации правильно классифицированы и выделены;
  • Валидация данных: использование различных методов и инструментов для проверки качества данных, таких как кросс-валидация и проверка на наличие дубликатов и ошибок;

  • Обратная связь: работа с командой для получения обратной связи и внесения необходимых исправлений и улучшений в разметку данных.

Сотрудничество с командой:

  • Регулярные встречи: участие в регулярных встречах команды для обсуждения прогресса, проблем и планов на будущее;
  • Документация: ведение документации по разметке данных, включая описание методов и инструментов, используемых в проекте;
  • Обучение и поддержка: обучение новых членов команды и предоставление поддержки и консультаций по вопросам разметки данных.

Наш идеальный кандидат:

  • Опыт работы в области анализа данных или машинного обучения от 2 лет;
  • Высшее образование;
  • Глубокое понимание методов и техник разметки данных;
  • Понимание доменной области: изучение литературы и консультации с экспертами для понимания контекста и специфики доменной области, в которой работает проект;
  • Опыт работы с инструментами разметки данных, такими как LabelMe, VGG Image Annotator, или аналогичными;
  • Навыки работы с библиотеками и фреймворками для машинного обучения (например, TensorFlow, PyTorch, Scikit-learn);
  • Опыт работы с системами управления версиями (Git);
  • Знание языков программирования Python, R или других языков, используемых для анализа данных;
  • Опыт работы с базами данных (например, MySQL, PostgreSQL);
  • Навыки работы с инструментами визуализации данных (например, Matplotlib, Seaborn).

С нашей стороны:

  • ДМС с расширенной программой!
  • Классная команда. Мы делимся знаниями и опытом, поддерживаем любые инициативы, любим своё дело и ценим чувство юмора);

  • Нет лишнего формализма и бюрократии. Мы нацелены именно на результат и гибко подходим к любой задаче;

  • Всё по-честному и в белую: официальное оформление по ТК РФ и уровень дохода выше рынка.

  • Гибридный формат работы главное — стабильное интернет-соединение, график работы 5/2, а для тех, кто любит офисную жизнь, — просторный офис бизнес-центре.

  • Профессиональное развитие. Всегда поддержим, если ты хочешь научиться чему-то новому. Возможность быстрого профессионального роста, прозрачный план развития с влиянием на заработную плату;

  • Корпоративная культура: тимбилдинги, онлайн и офлайн-встречи, корпоративы.

  • Если ты разделяешь наши ценности и подход к работе, то жми откликнуться, чтобы познакомиться с будущими коллегами!