з/п не указана
Москва
Походный проезд 3с1
Походный проезд 3с1
От 3 до 6 лет
IT-компания GNIVC - партнер государственных компаний и лидеров российского бизнеса, разработчик и системный интегратор крупнейших государственных информационных систем, а также коммерческих решений для налогового мониторинга.
- Компания входит в ТОП-100 лучших работодателей страны и на 9-м месте в категории «IT-компании» 2025 года по рейтингу работодателей hh.ru среди крупных компаний;
- Мы в 25% лучших по уровню счастья среди компаний отрасли IT и России 2025 по версии Happy Job;
- У нас есть ИИ-песочница - среда для экспериментов и реальных проектов на современных опенсорс-больших языковых моделях. Здесь можно применять ИИ для оптимизации своей работы, автоматизации процессов и реализации собственных идей от гипотезы до результата;
- Являемся аккредитованной ИТ-компанией.
Задачи:
- разработка и доработка классификатора названий товарных позиций на базе BERT-архитектур (включая предобучение, дообучение и оптимизацию моделей);
- организация и контроль процесса разметки данных: постановка задач разметчикам, контроль качества, автоматизация пайплайнов;
- подготовка датасетов: очистка, нормализация данных с использованием pandas, datasets (Hugging Face) и regex;
- проектирование и реализация архитектуры моделей: эксперименты с BERT, DistilBERT, кастомными головами, ensemble-методами;
- мониторинг производительности моделей в продакшене: метрики качества, drift-детекция, A/B-тестирование, автоматизированное дообучение;
- работа с PostgreSQL: создание таблиц, написание хранимых процедур и функций, оптимизация запросов (индексы, materialized views, EXPLAIN ANALYZE), ETL-пайплайны для данных моделей;
- интеграция моделей в production: Docker-контейнеризация, мониторинг GPU/CPU.
Требования:
- высшее образование (предпочтительно в области компьютерных наук, математики или смежных дисциплин);
- 2+ года опыта в NLP/ML, включая fine-tuning transformer-моделей (BERT/RoBERTa/DistilBERT);
- глубокий опыт с PyTorch, Hugging Face Transformers, pandas, datasets;
- опыт работы с PostgreSQL: SQL, создание/оптимизация схем, хранимые функции, производительность запросов;
- навыки организации разметки данных и data pipeline engineering (ETL, preprocessing);
- знание техник model optimization: quantization, layer-wise LR, custom loss functions;
- опыт production ML: monitoring, anomaly detection, model serving;
- уверенное владение Python, Git, Linux/Shell scripting.
Будет плюсом:
- опыт с классификацией текстов (продуктовые каталоги, поиск/рекомендации);
- работа с ONNX для inference, multi-GPU training (DDP).
Мы предлагаем:
- гибкие форматы работы: возможность работы в офисе, по гибридному графику или полностью дистанционно на территории РФ;
- рабочий график: пятидневная рабочая неделя (пн.–чт. с 09:00 до 18:00, пт. с 09:00 до 16:45);
- достойное вознаграждение: конкурентная заработная плата по результатам собеседования, а также премии за эффективную работу и достигнутые результаты;
- официальное трудоустройство: полное соблюдение требований ТК РФ, включая оплачиваемые отпуска (с дополнительной выплатой 50% от оклада после 11 месяцев работы в Компании) и выплату заработной платы дважды в месяц;
- заботу о здоровье:
- компенсация больничного листа продолжительностью до 7 дней с сохранением полной оплаты, эквивалентной рабочему дню,
- добровольное медицинское страхование (ДМС) по окончании испытательного срока, с широким перечнем ведущих медицинских учреждений, включая качественную стоматологию,
- возмещение до 50% затрат на занятия спортом;
- развитие и обучение:
- профессиональное обучение и сертификация за счет компании,
- организация внутренних и внешних митапов, хакатонов, конференций, семинаров и тренингов,
- партнерские программы по изучению иностранных языков и развитию профессиональных навыков от Skyeng и Skillbox,
- доступ к корпоративной библиотеке на платформе Alpina Digital;
- дополнительные выходные: возможность взять 5 дополнительных оплачиваемых выходных (ресурсных) дней в течение календарного года (с 1 января до 31 декабря) для сотрудников, проработавших в компании более 11 месяцев.