О нас
DataLouna — киберспортивная аналитика нового поколения. Уже 4 года наша команда превращает сырые данные CS2 и Dota 2 в уникальную статистику, предсказания и эксклюзивные беттинг-линии.
Мы часть крупного IT/киберспортивного холдинга, работаем с топовыми букмекерами.
Отличие от HLTV и Dotabuff: не агрегируем публичные данные, а создаём собственные метрики вместе с профессиональными аналитиками и тренерами. На этой базе строим B2B-решения: API, предиктивные модели, уникальные линии.
Цель: стать HLTV 2.0 в аналитике и главным поставщиком данных для беттинг-индустрии.
Слово от CEO
У нас есть то, чего нет у других — уникальная база данных, собранная за годы работы с профессиональными аналитиками. Теперь нужен человек, который раскроет её потенциал.
Мир ML развивается стремительно. Мы не знаем заранее, какой инструмент даст лучший результат — трансформеры, гибридные модели или что-то совсем новое. Поэтому ищем того, кто умеет и любит экспериментировать.
Задачи-вызовы, которые ждут:
- Создать уникальную линию для топового букмекера
- Построить LLM-аналитика для киберспорта
- Найти подходы, которые вытащат максимум из наших данных
Нам не нужен человек, который будет ждать готовых ТЗ. Нужен тот, кто сам предложит гипотезу, проверит её и придёт с результатом.
О роли
Домен — киберспорт: рекомендательные и скоринговые системы для CS2 и Dota 2.
Ты будешь работать в связке с ML-инженером, который специализируется на классических методах (CatBoost, XGBoost, деревья). Твоя зона — современные архитектуры: трансформеры, нейросети, новые подходы.
Бэкенд-команда готовит инфраструктуру. Профессиональные аналитики помогут разобраться в тонкостях CS2 и Dota 2, вместе будете придумывать фичи.
Чем будешь заниматься
Разработка моделей
- Трансформеры для табличных данных: TabTransformer, FT-Transformer, TabNet
- Модели для последовательностей: Temporal Fusion Transformer, Informer, PatchTST
- Эксперименты с адаптацией LLM-подходов к структурированным данным
- Гибридные архитектуры (нейросети + классика) для устойчивости
Работа с данными
- Проектирование признаков вместе с аналитиками: эмбеддинги, временная динамика, контекстные фичи
- Representation learning, contrastive learning
- Сбор и структурирование исторических данных
Что важно
Обязательно:
- Высшее техническое/математическое образование или 5+ лет подтверждённого опыта в ML
- Глубокое понимание трансформеров — не "использовал библиотеку", а "могу модифицировать под задачу"
- PyTorch (предпочтительно) или TensorFlow
- Python: numpy, pandas, scikit-learn как базовые инструменты
- Опыт с градиентным бустингом (CatBoost / LightGBM / XGBoost)
- Опыт обучения и файнтюнинга нейросетей: оптимизаторы, регуляризация, scheduling
- Понимание temporal validation, data leakage, data drift
Будет плюсом:
- Участие в ML-соревнованиях с нейросетевыми подходами
- Опыт с MLOps: Spark, Airflow, ClickHouse
Условия
- 💰 400 000 – 600 000 ₽ (обсуждается по опыту)
- 📍 Удалённая работа
- ⏰ Гибкий график
Как проходит отбор
Скрининг (15-20 мин) — знакомство, пара вопросов
Техническое интервью (1.5-2 часа) — обсуждение опыта, подходов к задачам
Оффер
Как откликнуться
Пришли резюме и ссылки на GitHub / Kaggle / публикации (если есть).
В сопроводительном расскажи: последнюю ML-задачу, которую решал — какую бизнес-проблему закрывала, какие подходы использовал, какой результат получил.