Data Scientist ИИ (LLM / Fine‑tuning)

Дата размещения вакансии: 13.05.2026
Работодатель: СМАРТА
Уровень зарплаты:
з/п не указана
Город:
Тверь
бульвар Шмидта 4А/22
Требуемый опыт работы:
От 3 до 6 лет

Компания «СМАРТА» — надежный партнер с многолетним опытом работы в сфере охраны труда. Мы объединяем передовые технологии, команду профессионалов и индивидуальный подход к каждому клиенту, чтобы обеспечить высокое качество и эффективность наших услуг.

За годы работы компания реализовала десять крупных проектов, получила отраслевые награды и построила долгосрочные партнерские отношения с ведущими организациями. Мы ценим доверие каждого клиента и подтверждаем его реальную репутацию

Преимущества и сильные стороны компании «СМАРТА»

Высококвалифицированная команда. В нашей компании работают только внимательные специалисты, способные решить задачи любой сложности в области охраны труда.

Комфортная рабочая среда. Мы создаем атмосферу «второго дома»: современный офис, удобное игровое пространство, отличный кофе и доброжелательная атмосфера.

Корпоративная культура. Каждую неделю мы проводим для сотрудников интерактивные мероприятия, командные игры и совместные встречи, заказываем пиццу и применяем неофициальное общение.

Поддержка и мотивация. Руководители всегда открыты к диалогу и представляют своих сотрудников во всех началах. В компании действует система поощрения ценными призами и бонусами за достижения. Инициативность ценится и поощряется, создавая атмосферу взаимного доверия и профессионального роста. Наша положительная репутация подтверждается успешно реализованными проектами и отзывами партнеров.

Инновационный подход. Мы разрабатываем и внедряем современные услуги и решения в сфере охраны труда, опираясь на последние достижения и потребности в этой области.

Сейчас мы в поиске: Data Scientist ИИ (LLM / Fine‑tuning)

Обязанности:

Чем предстоит заниматься

Создание и подготовка датасетов для дообучения LLM:
– парсинг, очистка, разметка, балансировка и аугментация данных
– разработка пайплайнов для сбора и хранения обучающих выборок

Самостоятельное обучение и дообучение моделей (fine‑tuning) на кастомных данных

Оценка качества обученных моделей: подбор метрик (BLEU, ROUGE, bertscore, человеческая оценка и др.), проведение A/B тестов

Работа с открытыми LLM (Llama, Mistral, Qwen, Yi и аналоги)

Внедрение RAG (Retrieval‑Augmented Generation): настройка векторных баз, оптимизация эмбеддингов и семантического поиска

Анализ ошибок и итеративное улучшение как датасетов, так и моделей

Наши пожелания к будущему коллеге:

Требования

Обязательные:
Опыт работы с LLM от 1 года (GPT, Claude, Llama и др.)

Опыт создания датасетов для ML / NLP: сбор, очистка, разметка, работа с несбалансированными данными

Опыт самостоятельного обучения ИИ (fine‑tuning на своих датасетах)

Владение Python на уровне, достаточном для обработки данных (pandas / numpy) и написания скриптов для API

Понимание метрик оценки генеративных моделей и умение их применять

Опыт работы с векторными базами данных (FAISS, Chroma, Qdrant, Pinecone или аналогами)

Будет плюсом:

Опыт работы с Hugging Face, PyTorch, Transformers

Знание LangChain, LlamaIndex

Умение разворачивать открытые модели локально (Ollama, vLLM, TensorRT)

Понимание эмбеддингов, методов семантического поиска и ранжирования

Мы предлагаем:

  • Полностью "Белая" ЗП
  • График работы с 9.00-18.00
  • Офисный формат работы;
  • Возможность карьерного роста
  • Зарплата обсуждается индивидуально с кандидатом.