Кутаиси
WaveAccess ищет Data Scientist для работы над инновационными проектами в сфере внедрения современных систем и подходов в обработке естественного языка. Эта роль включает работу с реальными данными бизнеса из различных доменных областей и использование возможностей NLP в целом и больших языковых моделей (LLM) в частности для получения значимых инсайтов, принятия решений и автоматизации процессов.
Обязанности:
- Интеграция LLM: Разработка, настройка и внедрение систем на основе больших языковых моделей для анализа и обработки различных наборов текстовых и табличных данных.
- Анализ данных: Проведение углубленного анализа реальных данных для извлечения значимых инсайтов и поддержки процессов принятия решений.
- Извлечение информации из текста и NLP: Использование методов обработки естественного языка для извлечения релевантной информации из больших объемов текста, включая научную литературу, записи и другие текстовые данные.
- Разработка моделей: Создание и валидация предсказательных моделей для решения ключевых задач в различных отраслях, таких как оценка эффективности, прогнозирование результатов и выявление аномалий.
- Инновации: Следить за последними достижениями в области LLM и NLP и применять инновационные подходы для решения сложных задач в различных сферах.
Требования:
- Минимум 4 года опыта на позиции Data Scientist
- Глубокие знания нейронных сетей и архитектур для работы с последовательностями, в частности (RNN, LSTM, Transformers, CNN, attention).
- Опыт работы с большими языковыми моделями (LLM) и их применением. Знание современных методов LLM, таких как Retrieval-Augmented Generation (RAG) и LLM-агенты.
- Знакомство с концепциями Langchain, Llamaindex и векторными базами данных
- Отличные навыки работы с Python
- Опыт презентации достигнутых результатов
Технологии:
- Python
- Transformers
- LLM and LLM models (GPT, LLama, mixtral, etc.)
- ollama/vllm
- Стандартный NLP стек
- Знание общих подходов машинного обучения
- Basic SQL
- Git
- Vector databases (Postgres+pgvector / Milvus/ Qdrant/ Faiss)
Желательно:
- Английский — B2
- huggingface/openllm
- Знание математической статистики.
- Опыт работы с AWS (EC2, S3)
- Linux + bash, ssh
- Опыт письменного и устного общения с бизнес-стейкхолдерами
- Опыт работы с полным циклом разработки
Будет плюсом:
- Опыт разработки RestAPI
- Опыт с MLOps платформами
- Snowflake
- Docker
- Понимание CI/CD
- Java/C++/Другие языки
Мы предлагаем следующие условия:
- Оформление по ТК, 100% оплату больничного и отпуска
- Добровольное медицинское страхование (ДМС) со стоматологией
- Работу с применением гибкой методологии разработки (Agile/Scrum)
- Гибкое начало рабочего дня
- Еженедельные семинары, участие в конференциях и митапах и оплачиваемые сертификационные экзамены.