Мы команда, которая занимается подготовкой данных для обучение GigaChat.
Обязанности
· писать и запускать код для сбора данных с разных платформ
· собирать параллельные корпусы текста для машинного перевода
· обрабатывать сырые данные из интернета
· оптимизировать объем данных для экономии ресурсов на обучение, удалять дубли и схожий контент
· использовать существующие или обучать новые языковые модели для решения различных задач.
Требования
· наличие диплома ШАДа по направлению Natural language processing.
Условия
· комфортный современный офис рядом с м. Кутузовская
· возможность выбрать удобный график – офис/гибрид
· годовая премия
· корпоративный спортзал и зоны отдыха
· более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
· расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
· ипотека для сотрудников выгоднее до 4%
· бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
· вознаграждение за рекомендацию друзей в команду Сбера.