Data Scientist (NLP)

Дата размещения вакансии: 21.11.2024
Работодатель: СимбирСофт
Уровень зарплаты:
з/п не указана
Город:
Санкт-Петербург
Требуемый опыт работы:
От 1 года до 3 лет

SimbirSoft на рынке разработки более 20-ти лет. За это время мы зарекомендовали себя как профессионалы IT рынка! Нам доверяют свои проекты такие компании, как Mail.ru, CarPrice, ЦИАН, QIWI, Lamoda, Ferrero, SKB_Lab, Дом.ру и многие другие. Сейчас мы в поиске талантливого Data Science.

Чем предстоит заниматься:

  • Разработка и внедрение семантического поиска, включая ранжирование поисковых ответов, саммаризацию, использование RAG, NER, сегментацию доступов и персонализацию.
  • Проектирование и разработка AI-решений для улучшения качества обработки данных;
  • Реализация и настройка алгоритмов и методов для обработки больших объемов данных и текстовой информации;
  • Оценка эффективности решений и оптимизация процессов с использованием технологий машинного обучения.

Что нужно от тебя:

  • Глубокие знания в области обработки естественного языка (NLP), включая классические методы и методы на основе эмбеддингов;
  • Уверенные знания Python, а также опыт работы с SQL.
  • Теория и практика исследовательского анализа данных в контексте задач обработки естественного языка.
  • Умение разрабатывать и применить алгоритмы и метрики для классификации и регрессии, включая методы регуляризации моделей.
  • Опыт кластерного анализа данных, включая анализ векторных представлений текстов.
  • Опыт в проектировании и создании систем машинного обучения, включая перевод бизнес-метрик в машинные метрики и формулировку задач обучения.
  • Опыт работы с глубоким обучением, включая модели семейства RNN, LSTM и Transformers.
  • Владение статистическими методами, включая описательную статистику, семплирование и проверку гипотез.
  • Умение работать с инструментами Python для анализа данных и обработки текстов (Pandas, Numpy, SciPy, scikit-learn, nltk и другие).

Будет плюсом:

  • Опыт работы с технологическими решениями, такими как LangChain, VLLM, OpenAI API, Qwen, FAISS, Retrieval-Augmented Generation (RAG).
  • Знания в области технологии ONNX.
  • Опыт с инструментами автоматизации и DevOps в области машинного обучения.
  • Опыт работы с AirFlow, PySpark.

Мы предлагаем:

  • Работу в команде экспертов.

  • Широкий технологический стек, сотни проектов.
  • Гибкий график работы, который позволяет высыпаться и выделять время на хобби.
  • Льготы и меры господдержки, предусмотренные для IT-компаний (аккредитованы Минцифры*)
  • Возможность разрабатывать IT-решения для разных отраслей, пробовать новые технологии.
  • У нас выстроены процессы удаленной работы, при этом есть просторные офисы с зонами коворкинга, где можно с комфортом пообщаться, поиграть в настолки или в тишине обдумать рабочие задачи.
  • Возможность прокачаться во всех интересующих направлениях: стать тимлидом, архитектором, разработчиком full-stack.
  • Развитую систему менторства, сертификацию за счёт компании, участие в конференциях, изучение английского языка.
  • Активный обмен опытом, внутренние и внешние митапы по разработке, хакатоны, доклады по развитию hard и soft skills.
  • 40+ клубов по интересам и профессиональных сообществ внутри компании.
  • Уютный мерч.
  • Полный соцпакет и «белую» зарплату.
  • Корпоративную базу знаний и социальную сеть для удобства общения с каждым из 1500+ сотрудников.
  • Гибкую систему бонусов, которая настраивается под индивидуальные потребности: различные уровни ДМС, оплата обучения и занятий любыми видами спорта.

Приходи в SimbirSoft за прокачкой хард-скилов и интересными проектами!

Знаешь кого-то, кто идеально сможет подойти? Расскажи им о нашей вакансии!

* Решение Министерства цифрового развития, связи и массовых коммуникаций РФ о предоставлении государственной аккредитации организации, осуществляющей деятельность в области информационных технологий от 10.03.2022