ML-инженер

Дата размещения вакансии: 18.11.2024
Работодатель: Postgres Professional
Уровень зарплаты:
з/п не указана
Город:
Москва
улица Дмитрия Ульянова 7А
Требуемый опыт работы:
От 3 до 6 лет

Postgres Professional — разработчик самой популярной российской СУБД Postgres Pro на базе свободно распространяемой PostgreSQL. А еще мы — один из крупнейших в мире контрибьюторов открытой СУБД: каждый год отправляем в сообщество PostgreSQL более 100 патчей.
В Postgres Professional работают опытные эксперты в PostgreSQL — в нашей команде больше половины российских постгресистов, включая Major Contributors системы. Вместе мы решаем сложные задачи заказчиков, в том числе доработки в ядро PostgreSQL.

Мы верим, что связка СУБД + LLM это тот набор edge-технологий, который в ближайшие 3-5 лет перевернёт наши представления об интерфейсах доступа к данным.
Предлагаем присоединиться к нашей команде и, обкатав технологию на внутренних продуктах и сервисах, выпустить продукт, предоставляющий интерфейс взаимодействия с базой данных на естественном языке.

Задачи:

  • разработка пайплайнов на основе LLM: RAG по документации PostgreSQL, генератор SQL по запросу на естественном языке и DDL-схеме БД, генератор тестовых данных;

  • развитие интерфейсов взаимодействия с СУБД на естественном языке;

  • дообучение LLM под решение конкретных задач.

Мы ожидаем:

  • хорошее знания Python, включая использование библиотек для ML и работы с данными (например, NumPy, Pandas);

  • знание классического ML (моделей регрессии, классификации и ранжирования);

  • опыт работы с PyTorch и TensorFlow для разработки и дообучения моделей;

  • опыт использования библиотек для работы с LLM, таких как LangChain;

  • понимание архитектуры трансформеров (например, BERT, GPT, T5);

  • опыт работы с моделями seq2seq, attention mechanisms;

  • знание принципов fine-tuning и transfer learning;

  • знание методов оптимизации LLM для уменьшения задержек и затрат памяти (например, quantization, pruning);

  • опыт обработки текстовых данных, включая токенизацию, лемматизацию, стоп-слова;

  • опыт использования библиотек для работы с текстом (например, SpaCy, NLTK).

Мы предлагаем:

  • удалёнка, гибрид или офисы в Москве, Санкт-Петербурге, Новосибирске или Барнауле;

  • гибкое начало рабочего дня;

  • возможности для профессионального развития;

  • обучение – оплачиваем внешние обучающие программы и компенсируем затраты на посещение конференций;

  • медицинское страхование сотрудника (+1), компенсацию спортивных активностей и затрат на оборудование удаленного рабочего места, занятия английским языком, технику для работы, обеды в офисе и др.