Ленинградский проспект 72к3
Команда ГИД-ДАТА создает ML-решения, широко востребованные на российском рынке. Мы успешно совершенствуем SaaS для поиска и рекомендаций для лидерских проектов рунета.
Спроси себя, хочешь ли ты:
- обрабатывать миллионы видео со стриминговых сервисов;
- предоставлять пользователям релевантный контент;
- искать структуры в неструктурированных данных;
- бороться за каждую миллисекунду скорости;
- делать продукт, который сделает лучше пользовательский опыт?
Наша команда растет и мы ищем Middle+ / Senior ML инженера (Search Engine).
Наш стек:
- Language: Python;
- ML: pytorch, CatBoost, Nltk, PyMorphy и многое другое;
- DB: PostgreSQL, QDrant, ClickHouse, Redis, OpenSearch; - Data Processing: Spark;
- Queue: Kafka;
- Orchestration: K8s;
- DevOps: Docker, Helm;
- Services: Dagster, ClearML, MLFlow, GitLab;
- Log: ELK (под OpenSearch стек);
- Monitoring: Grafana, Prometheus.
С чем можно будет поработать:
- Работа с большими данными и высокой нагрузкой;
- С Machine Learning сервисами, которые приносят людям пользу =) ;
- Общение с экспертами в области разработки и ML из разных областей.
Чем предстоит заниматься:
- Разрабатывать в рамках развития единой поисковой платформы Navigator модели для поиска, ранжирования, рекомендаций в топовых видеосервисах;
- Дизайнить и проводить A/B-эксперименты;
- Внедрять в существующие сервисы новые модели и алгоритмы;
- Исследовать данные контента, строить и внедрять вместо с дата-инженерами pipeline-ы для их обработки;
- Улучшать качество и скорость работы существующих алгоритмов.
Что ожидаем от кандидата:
- Знание и применение базовых и ML алгоритмов;
- Опыт построение NLP-сервисов от постановки бизнес задачи до внедрения сервиса в production;
- Опыт разработки и внедрения моделей для NLP-задач, поиска, ранжирования, рекомендаций в production-сервисы;
- Знание и применение Python в production от 3х лет;
- Умение определить, где нужен DL, а где достаточно регулярки =) ;
- Навыки работы с SQL и NoSQL базами данных.
Будет замечательно, если есть:
- Опыт работы с перечисленным выше стеком;
- Победы в соревнованиях на kaggle, ML-хакатонах и т. п.;
- Успешные внедрения высоконагруженных сервисов;
- Публикации в области NLP, поиска, ранжирования, рекомендаций; - Опыт участия в развитии open-source библиотек.
Что мы можем предложить:
- Формат работы - офис в Москве или Питере/гибрид/удаленка по РФ;
- График работы 5/2, гибкое начало дня до 11 утра;
- Мы - аккредитованная в Минцифре IT-компания.