Data Scientist (Аудиоаналитика)

Дата размещения вакансии: 01.06.2026
Работодатель: Робот Мия
Уровень зарплаты:
з/п не указана
Город:
Новосибирск
Советский район, микрорайон Академгородок, Разъездная улица 12
Требуемый опыт работы:
От 3 до 6 лет

Привет!

Robotmia – продуктовая IT-компания, специализирующаяся на технологиях машинного обучения, искусственного интеллекта и понимания естественного языка. На рынке больше 7 лет и каждый год растет минимум в 2 раза.

Основные продукты – "Голосовой ассистент" и "Модуль определения автоответчиков". С их помощью наши клиенты кратно увеличивают качество обслуживания своих пользователей и в разы сокращают расходы. А с операторов call-центров снимают скучную и рутинную работу.

Наши клиенты — российские компании из самых разных сфер (логистика, медицина, банковский сектор и другие). Многих из них ты можешь найти в ежегодном рейтинге Forbes “ТОП-200 крупнейших частных компаний России”.

Кого мы ищем:
Нам нужен Data Scientist, нацеленный на бизнес-результат.

Мы не занимаемся исследованиями ради исследований. Ты должен понимать: модель ценна только тогда, когда приносит прибыль или сокращает издержки. Ждем прагматика и энтузиаста, который умеет быстро проверять гипотезы и доводить решения до продакшна.

Чем предстоит заниматься:

  • Анализировать большие объемы аудиоданных (работа с ClickHouse) и проводить EDA для поиска неочевидных закономерностей;

  • Формулировать гипотезы, жестко привязанные к бизнес-метрикам (снижение операционных расходов, рост точности детекта);

  • Работать с сильным дисбалансом классов при классификации аудио;

  • Настраивать и применять алгоритмы кластеризации данных для выявления скрытых паттернов;

  • Исследование и применение современных архитектур нейронных сетей (CNN, RNN, LSTM, TCN и др.);

  • Работать над задачами коррекции аудио (шумоподавление) с применением современных архитектур;

  • Управлять ML-экспериментами через ClearML, обеспечивая воспроизводимость результатов.

Мы ожидаем от тебя:

  • Опыт в DS/ML от 3 лет, с фокусом на результат, а не на процесс;

  • Умение работать с большими базами данных (ClickHouse) и писать сложные аналитические запросы;

  • Опыт кластеризации данных (K-Means, DBSCAN, иерархические методы) и настройки этих алгоритмов;

  • Умение выбирать и настраивать архитектуры нейронных сетей для задач классификации (CNN, RNN, LSTM, Transformer и др.);

  • Опыт решения задач классификации с сильным дисбалансом классов (sampling, weighted loss, синтетические данные);

  • Python, Pandas/NumPy, Scikit-learn, PyTorch/TensorFlow;

  • Библиотеки для аудио: Librosa, torchaudio;

  • Опыт работы с ClearML (MLflow, Weights & Biases — как альтернатива, но плюсом именно ClearML);

  • Опыт разработки систем автоматического алертинга (мониторинг дрифта, аномалий, падения метрик в проде с автореакцией);

  • Git, Docker, Kubernetes (понимание CI/CD для ML).

Будет плюсом:

  • Опыт с архитектурами RNN, LSTM, TCN, Transformer, WaveNet;

  • Решения задач Source Separation или шумоподавления;

  • Участие в Kaggle с задачами классификации небалансированных классов;

  • Опыт работы с потоковыми данными и реальными production-системами.

Мы предлагаем:

  • Официальное трудоустройство в аккредитованной IT-компании;

  • Гибкий рабочий график 5/2, гибридный формат работы;

  • Стабильную зарплату 2 раза в месяц, отпуска и больничные;

  • Персонального наставника;

  • Креативную дружную команду, готовую помочь, научить и поддержать;

  • Удобный офис в Академгородке (2 мин. от станции Сеятель);

  • Уютную атмосферу и классные корпоративы;

  • Корпоративное обучение и карьерный рост.

Мы не корпорация, наша стратегия основана на доверии и долгосрочных отношениях. Если ты согласен с фразой “Ты – причина всех своих решений” - нам точно по пути!
Ждем твой отклик.