О компании:
Glam AI — это быстрорастущий AI-стартап, мобильное приложение, которое позволяет загружать фото и видео, чтобы мгновенно примерить виртуальные образы и создавать трендовый контент, который становится виральным.
- $3M ARR и более 150, 000 лояльных пользователей в США и Европе;
- инвесторы с опытом создания ИИ приложений и вывода их на рынок (включая Looksery и AI Factory, которые в дальнейшем приобрела компания Snap);
- топовая команда топовой командой (экс-Lensa, Picsart, Viber, AIRI, Яндекс).
Эта вакансия вам идеально подойдёт если вас вдохновляет работа масштабными датасетами и выстраивание инфраструктуры на стыке ML-исследований и продуктовой разработки.
Готовы брать даже без опыта - главное, классно сделать тестовое, это отличная возможность стартовать свою карьеру!
Что необходимо делать:
-
Создавать и масштабировать пайплайны для сбора, фильтрации и подготовки визуальных датасетов (изображения, видео, 3D, подписи, метаданные) из открытых и лицензированных источников
-
Автоматизировать аннотацию, дедупликацию и аугментацию данных для обучения ML-моделей
-
Работать в тесной связке с ML-инженерами и ресёрчерами — адаптировать данные под задачи генеративных моделей (видео, изображение)
-
Развивать инструменты и процессы контроля качества, версионирования, мониторинга и соблюдения лицензий
-
Проектировать инфраструктуру для хранения и доступа к петабайтным объёмам данных в облаке (AWS/GCP)
-
Обеспечивать качество и разнообразие данных для обучения моделей нового поколения (Stable Diffusion, Vision Transformers и др.)
Будет супер если в профиле есть:
- опыт т 1 года опыта в роли data engineer / backend-инженера / ML infra-инженера (не критично, готовы рассматривать в т.ч. студентов без опыта)
- опыт работы с большими неструктурированными данными, особенно визуальными
- опыт работы с web scraping, API, media crawling
- опыт работы/понимание как работать с облаками (AWS / GCP), хранилищами (S3, BigQuery и др.)
- понимание метрик качества данных и валидации
Мастхев: отличное знание Python
Также, будет плюсом опыт с датасетами по типу LAION, COYO, OpenImages, а также с аннотацией и мультимедийной обработкой.
Условия:
-
Конкурентная зарплата + бонусы
-
Всё необходимое оборудование + Cloud Credits и GPU
-
Полная удалёнка из любой точки мира, гибкий график
-
Участие в разработке инновационных AI-продуктов в команде экспертов
Процесс отбора:
1. Тестовое задание
2. Техническое собеседование
3. Финальный созвон → презентация оффера
Если интересно - откликайся!
Присоединяйтесь к Glam AI и создавайте датасеты, которые станут основой самых креативных моделей ИИ будущего.