Senior/Middle Data Scientist
Прямой работодатель Магнит ( magnit.ru )
Опыт работы от 1 года до 3х лет
Мы развиваем собственный Аналитический центр Data Science и Machine learning , и приглашаем в команду Data Scientist на ключевые проекты.
Работа ведется в командах до 15 человек, включает в себя бизнес-аналитиков, data scientist, data engineer, руководитель направления.
Наши задачи:
- Разработка статистических моделей/алгоритмов и их реализация на R, Python;
- Оптимизация инструментов и подходов к решению задач;
- Прогнозирование промо продаж компании до различных разрезов;
- Прогнозирование регулярных продаж компании до различных разрезов;
- Разработка рекомендательных систем на основе данных карт лояльности компании.
Ожидания:
- Умение писать понятный и воспроизводимый код;
- Опыт работы с данными (на примере минимум 3х библиотек python);
- Опыт работы с данными посредством SQL (на примере одной СУБД: Teradata, MS SQL, Postgres, Oracle);
- Опыт работы с распределенными системами (HADOOP, Azure) посредством Spark, Kafka;
- Опыт создания классов, декораторов и функций в Python;
- Опыт работы с данными и оперирования ими, оптимизация и сжатие данных, опыт работы с матрицами;
- Опыт тюнинга моделей машинного обучения и подбора функций потерь, оптимизатора и функций активации в рамках решения задач машинного обучения;
- Опыт использования блендинга, стекинга и ансамблирования различных моделей машинного;
- Опыт использования сложных структур нейросетей, в том числе сверточных и рекурентных;
- Опыт сокращения времени обучения моделей с минимальной потерей точности;
- Умение делегировать/дробить проект на задачи для других участников команды проекта;
- Понимание устройства нейросетей и опыт использования простых моделей нейросетей (плюсом будет использование одной из реализаций нейросетей от Google);
- Понимание функций потерь, оптимизаторов в моделях машинного обучения;
- Понимание функций обратного вызова для оптимизации моделей машинного обучения;
Мы предлагаем:
- Огромный масштаб бизнеса: торговля (более 20 тыс. объектов, 4 формата), логистика (>6000 машин, >35 РЦ), производства, почти 300 тыс. сотрудников. Партнерства с почтой, фармдистрибуцией и пр;
- Уникальная кросс-форматная программа лояльности (внедрение): данные по 15-20% всех расходов половины населения РФ. Коллаборации с партнерами;
- Современная платформа данных: Teradata, SPSS, стек Hadoop, Tableau, QlikView;
- Объемы основных транзакционных данных 120+ ТБ;
- Объемы в Hadoop (в разработке) 1,5 ПБ;
- Прототипы аналитики в реальном времени, высоконагруженные сервисы;
- Участие в разработке цифровых продуктов (моб. приложение, оборудование в магазинах и пр.);
- Возможность работы в облаках для прототипирования решений;
- Возможность выбора задач;