Серпуховско-Тимирязевская линия
IEK GROUP – один из ведущих производителей на рынке электротехнического оборудования. Мы разрабатывает и производим инновационные решения для энергетики, промышленности и инфраструктуры. В рамках цифровой трансформации бизнеса мы расширяем команду аналитиков данных и ищем талантливого Data Scientist.
Вам предстоит работать в Лаборатории Данных - Data Science отделе офиса Данных компании IEK. Отдел - 5 человек с прямым подчинением CDO. 2 daily в неделю по 30 минут + полчаса на работу с тасктрекером.
Прямое подчинение CDO, 2 дня в неделю по 30 минут + полчаса на работу с тасктрекером. Удаленка, любые часовые пояса. Подразделения, отвечающие за данные, находятся с вами в одной структуре, data set-ы вам соберут/помогут собрать. За работу с репозиторием и развертывание решений отвечаете сами. Сервера свои, развернуты локально модели (oss-120b, qwen3-235b, gemma3-27b…) и мощности доступны для расчетов ML моделей.
Чем предстоит заниматься:
разрабатывать Аналитические и Дата Ассистенты (TextToSQL/RAG для информации по рынкам/конкурентам и т.п.), сервисами работы с данными (классификация данных, разметка, идентификация персональных данных и т.п.), поисковые сервисы для отчетности и каталога данных.
От кандидата ожидаем, что есть релевантный опыт, если не в полностью аналогичных проектах, то с похожим стеком. Дообучение приветствуется и поощряется, но надо быть готовым сразу с работой по проектам.
Наши ожидания:
Hard Skills (LLM & NLP):
- Уверенный опыт работы со стеком NLP/LLM (Transformers, LangChain, LlamaIndex).
- Практический опыт реализации RAG-систем и Agentic-пайплайнов.
- Глубокое понимание SOTA моделей (как проприетарных, так и Open Source) и методик их дообучения/адаптации.
Особое преимущество: опыт реализации Text-to-SQL решений (знание фреймворков класса Vanna.ai)
Data Engineering & Toolset:
- Отличное владение Python и профильными библиотеками (Pandas, NumPy, PyTorch/TensorFlow).
- Уверенное знание SQL (MSSQL, PostgreSQL) и понимание архитектуры баз данных.
- Опыт работы с Docker и Git.
- Знание инструментов оркестрации данных (Airflow).
Аналитика и математика:
- Сильный математический бэкграунд (статистика, линал, тервер).
- Желателен опыт интеграции ML-решений с BI-системами (Power BI, Superset и др.).
- Умение проводить качественный EDA и глубоко аргументировать выбор архитектуры решения.
- опыт работы с git, docker, python, SQL, BI, NLP, transformers, langchain, airflow, фреймворки класса vanna.ai
Мы предлагаем
- Удаленный график работы
- Достойный уровень дохода (зависит от профессиональных компетенций)
- Расширенный социальный пакет: ДМС, дополнительные отпускные дни, оплата больничного листа, материальная помощь в критических ситуациях, бесплатные оздоровительные/спортивные мероприятия
- Правительственные льготы – мы аккредитованная IT-компания
- Комфортная, доброжелательная рабочая атмосфера
- Корпоративные традиции и праздники, коллективные мотивационные программы