Data Scientist LLM+NLP (Remote)

Дата размещения вакансии: 05.07.2024
Работодатель: WaveAccess
Уровень зарплаты:
з/п не указана
Город:
Кутаиси
Требуемый опыт работы:
От 3 до 6 лет

WaveAccess ищет Data Scientist для работы над инновационными проектами в сфере внедрения современных систем и подходов в обработке естественного языка. Эта роль включает работу с реальными данными бизнеса из различных доменных областей и использование возможностей NLP в целом и больших языковых моделей (LLM) в частности для получения значимых инсайтов, принятия решений и автоматизации процессов.

Обязанности:

  • Интеграция LLM: Разработка, настройка и внедрение систем на основе больших языковых моделей для анализа и обработки различных наборов текстовых и табличных данных.
  • Анализ данных: Проведение углубленного анализа реальных данных для извлечения значимых инсайтов и поддержки процессов принятия решений.
  • Извлечение информации из текста и NLP: Использование методов обработки естественного языка для извлечения релевантной информации из больших объемов текста, включая научную литературу, записи и другие текстовые данные.
  • Разработка моделей: Создание и валидация предсказательных моделей для решения ключевых задач в различных отраслях, таких как оценка эффективности, прогнозирование результатов и выявление аномалий.
  • Инновации: Следить за последними достижениями в области LLM и NLP и применять инновационные подходы для решения сложных задач в различных сферах.

Требования:

  • Минимум 4 года опыта на позиции Data Scientist
  • Глубокие знания нейронных сетей и архитектур для работы с последовательностями, в частности (RNN, LSTM, Transformers, CNN, attention).
  • Опыт работы с большими языковыми моделями (LLM) и их применением. Знание современных методов LLM, таких как Retrieval-Augmented Generation (RAG) и LLM-агенты.
  • Знакомство с концепциями Langchain, Llamaindex и векторными базами данных
  • Отличные навыки работы с Python
  • Опыт презентации достигнутых результатов

Технологии:

  • Python
  • Transformers
  • LLM and LLM models (GPT, LLama, mixtral, etc.)
  • ollama/vllm
  • Стандартный NLP стек
  • Знание общих подходов машинного обучения
  • Basic SQL
  • Git
  • Vector databases (Postgres+pgvector / Milvus/ Qdrant/ Faiss)

Желательно:

  • Английский — B2
  • huggingface/openllm
  • Знание математической статистики.
  • Опыт работы с AWS (EC2, S3)
  • Linux + bash, ssh
  • Опыт письменного и устного общения с бизнес-стейкхолдерами
  • Опыт работы с полным циклом разработки

Будет плюсом:

  • Опыт разработки RestAPI
  • Опыт с MLOps платформами
  • Snowflake
  • Docker
  • Понимание CI/CD
  • Java/C++/Другие языки

Мы предлагаем следующие условия:

  • Оформление по ТК, 100% оплату больничного и отпуска
  • Добровольное медицинское страхование (ДМС) со стоматологией
  • Работу с применением гибкой методологии разработки (Agile/Scrum)
  • Гибкое начало рабочего дня
  • Еженедельные семинары, участие в конференциях и митапах и оплачиваемые сертификационные экзамены.