О нас:
Мы создаем продукты, которые упрощают практическое применение ИИ и позволяют получить быстрые результаты от внедрения.
Наша команда из более чем 70 экспертов в области голосовых технологий и генеративного ИИ разрабатывает решения, отличающиеся простотой, гибкостью и инновационностью.
Мы гордимся сотрудничеством с такими компаниями, как Билайн, Купер (СберМаркет), Яндекс, Авито, Самокат, Газпром, Ренессанс, Ростелеком, МТТ, РСХБ и еще 50+ клиентов.
Кого мы ищем:
Мы ищем сотрудника, который будет заниматься разметкой данных для обучения моделей синтеза и распознавания речи, больших языковых моделей.
Что нужно делать:
-
Размечать данные датасетов для базового обучения и дообучения (файн-тюнинга) нейросетевых моделей синтеза и распознавания речи. В данном случае подразумевается разметка пар аудио-текст.
-
Размечать данные датасетов для дообучения больших языковых моделей (только текст).
-
Участвовать в разработке пайплайнов генерации синтетических данных
-
Вырабатывать рекомендации для разработки методик оценки качества датасетов. Вы должны понимать потенциальные и реально выявленные проблемы имеющихся и создаваемых в компании датасетов
-
Принимать участие в оценке качества продуктов компании. Таких как система синтеза речи.
-
Искать открытые источники данных и готовых датасетов. Быть способным оценить качество и применимость таких датасетов под нужды компании.
-
Документировать результаты выполняемой работы в таск-трекере
Мы ожидаем что ты:
-
имеешь опыт разметки данных, в частности в виде пар текст-аудио;
-
способен подойти к рутинной работе со свежим взглядом;
-
имеешь пристрастие разбираться в деталях;
-
внимателен к деталям и не боишься рутинных задач;
-
активно используешь в своей работе ИИ-инструменты;
-
желаешь систематизировать результаты своей работы (чтобы и через 6 месяцев не составило сложности найти какие-то ранее размеченные данные)
-
принимаешь конструктивно обратную связь и готов изменять подходы к работе соответственно этой ОС
Условия:
-
оформление по ТК РФ
-
гибкий с 9:00 до 18:00, удаленный формат работы
-
з/п состоит из 2х частей: фиксированный оклад + квартальные премии
-
работа в аккредитованной ИТ-компании
-
обучение и поддержка
Присоединяйтесь к нам для работы над современным проектом!